Текст
                    COBMECTHOE H3/(AHHE
MOCKOBCKOrO
TOCyflAPCTBEHHOrO yHHBEPCHTETA
HMEHH M.B. JIOMOHOCOBA
H CO0>HHCKOrO yHHBEPCHTETA
HMEHH KJIHMEHTA OXPH/JCKOrO,
HAnHCAHHOE B COOTBETCTBHJH
C E^HHOH nPOTPAMMOH
no MATEMATHHECKOMy AHAJIH3y


В.А. Ильин, В.А. Садовничий, Бл.Х. Сендов МАТЕМАТИЧЕСКИЙ АНАЛИЗ НАЧАЛЬНЫЙ КУРС Под редакцией академика А.Н. Тихонова ИЗДАНИЕ ВТОРОЕ, ПЕРЕРАБОТАННОЕ Допущено Министерством высшего и среднего специального образования СССР в качестве учебника для студентов вузов, обучающихся по специальностям „Математика", „Прикладная математика" ИЗДАТЕЛЬСТВО МОСКОВСКОГО УНИВЕРСИТЕТА 1985
УДК 517 Ильин В. А. и др. Математический анализ. Начальный курс/В. А.Ильин, В. А. Садовничий, Бл. X. Сендов. Под ред. А. Н. Тихонова.— 2-е изд., пёрераб.— М.: Изд-во МГУ, 1985.— 662 с. Учебник представляет собой первую часть трехтомного курса математического анализа для высших учебных заведений СССР, Болгарии и Венгрии, написанного в соответствии с соглашением о сотрудничестве между Московским, Софийским и Будапештским университетами. Книга включает в себя теорию вещественных чисел, теорию пределов, теорию непрерывности функций, дифференциальное и интегральное исчисления функций одной переменной и их приложения, дифференциальное исчисление функций многих переменных и теорию неявных функций. Рецензент: Кафедра математики МИФИ (зав. кафедрой проф. А. И. Прилепко) 1702050000—150 ~ .. И 95—85 © Издательство 077(02)—&5 Московского университета, 1985 г.
ПРЕДИСЛОВИЕ ТИТУЛЬНОГО РЕДАКТОРА В настоящее время прогресс в математике в большой степени связан с развитием электронно-вычислительных средств. Математические методы исследования проникают во все области человеческой деятельности. Все это повышает интерес к математике со стороны смежных наук, использующих различный объем математических знаний, и ставит новые задачи в изучении самой математики. В связи с этим возникает потребность в написании учебника по математическому анализу, учитывающего указанные закономерности. То обстоятельство, что решение математических задач реализуется на ЭВМ с помощью вычислительных алгоритмов, предъявляет повышенные требования к четкости алгоритмического уровня изложения математических дисциплин. Однако такое изложение должно базироваться на классических концепциях математики и не должно их затемнять. Эти общие принципы вместе с задачей четкого, ясного и доступного изложения и положены в основу написания предлагаемой читателю книги. Книга написана с учетом согласованней между Московским и Софийским университетами программы преподавания первой части математического анализа. В предлагаемом учебнике уделено большое внимание вопросам оптимизации, играющим в математике и ее приложениях большую роль. В частности, в книге впервые в учебной литературе в законченном виде излагается алгоритм отыскания как внутреннего, так и краевого экстремума функции. В учебнике уделено значительное внимание изучению вопроса об исходной информации, доступной при решении задачи. Так, например, для отыскания экстремума функции одной переменной авторы предлагают алгоритм, базирующийся на информации только о значениях функции в точках области ее задания. Предлагаемое решение не опирается на знание значений производной в точках области задания и пригодно для отыскания экстремума недифференцируе- мых функций.- Такая постановка типична при решении задач об оптимизации производственных процессов. При выборе метода изложения авторы отправляются от того, что выбор алгоритма решения задачи зависит от того, какая информация из постановки этой задачи может быть использована. Так, например, при введении понятия определенного интеграла
6 Предисловие титульного редактора Римана авторы отправляются от концепции изложения, базирующейся на использовании значений функции в точках сегмента. Эта концепция, несомненно, является более предпочтительной по сравнению с концепцией введения определенного интеграла Римана с помощью первообразной, ибо она отвечает идее численных методов вычисления определенного интеграла, используемых на ЭВМ. В заключение хочу высказать уверенность, что предлагаемая книга будет способствовать повышению математической культуры читателей с различными запросами к объему математических знаний. А. Тихонов Москва, сентябрь 1978 г.
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ Во втором издании книга подверглась существенной переработке и сокращению в целях максимального приближения ее материала к тому курсу, который реально может быть прочитан студентам первого года обучения. Особенно существенной переработке были подвергнуты разделы, посвященные теории вещественных чисел, теории множеств и теории метрических, топологических и нормированных пространств. В книге сохранены три уровня изложения (облегченный, основной и повышенный). Так .же, как и в первом издании, текст повышенного уровня выделен в книге двумя вертикальными чертами, текст основного уровня — одной вертикальной чертой, а остальной текст книги относится к облегченному уровню изложения. Проведенные во втором издании переработки улучшили возможности использования книги на указанных трех различных уровнях изложения. Авторы выражают благодарность сотрудникам кафедры математического анализа механико-математического факультета МГУ и сотрудникам кафедры общей математики факультета вычислительной -математики и кибернетики МГУ за критические замечания по первому изданию этой книги. Авторы благодарят также В. М. Говорова, В. Н. Денисова, И. С. Ломова и В. В. Тихомирова за помощь при подготовке второго издания этой книги. Особую благодарность авторы приносят А. И. Прилепко, прочитавшему рукопись второго издания и сделавшему критические замечания, способствующие ее улучшению. Москва, февраль 1985 г.
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Настоящая книга является учебником по математическому анализу по согласованной между Московским и Софийским университетами единой программе первого года обучения. Она полностью охватывает материал первого года обучения, предусмотренный программой для студентов университетов СССР и НРБ, обучающихся по специальностям «математика», «механика» и «прикладная математика». Особенностью этой книги является то, что она содержит три четко отделяемых друг от друга уровня изложения: облегченный, основной и повышенный, причем для понимания материала облегченного уровня не требуется чтения материалов основного и повышенного уровней, а для понимания материала основного уровня не требуется чтения материала повышенного уровня. Облегченный уровень отвечает программе технических вузов СССР с углубленным изучением математического анализа; основной уровень изложения отвечает программе специальностей «прикладная математика» и «физика» университетов СССР; материал повышенного уровня дополняет материал основного уровня разделами, обычно излагаемыми на механико-математических факультетах университетов. Текст, выделенный в книге двумя вертикальными чертами, относится к повышенному уровню изложения; текст, выделенный одной вертикальной чертой, — к основному уровню изложения; остальной текст книги составляет содержание облегченного уровня изложения. Книга содержит вводную главу, разъясняющую возникновение основных понятий математического анализа и облегчающую восприятие последующего материала. В книге нашла отражение возросшая роль вычислительных методов и содержится ряд примеров применения аппарата математического анализа для вычисления элементарных функций, интегралов и отыскания корней уравнений и точек экстремума. В настоящее время в СССР и НРБ имеется целый ряд учебников по математическому анализу, среди которых особенно удачными, по нашему мнению, являются учебники, написанные Л. Д. Кудрявцевым и С. М. Никольским в СССР и Я. Тагамлиц- ким в НРБ.
Предисловие к первому изданию 9 Авторы настоящей книги, несомненно, испытали влияние этих прекрасных учебников. При написании этой книги авторы использовали часть материала книги В. А. Ильина и Э. Г. Позняка «Основы математического анализа», а также опыт преподавания математического анализа в университетах. Авторы выражают глубокую благодарность титульному редактору этой книги академику 'А. Н. Тихонову за большое количество ценных советов и замечаний. Авторы благодарят также Л. Д. Кудрявцева, И. И. Ляшко, В. Л. Макарова, Д. Б. Дойчинова и Т. Боянова, критические замечания которых способствовали улучшению этой книги. Особой благодарностью авторы отмечают труд В. М. Говорова и Г. Христова, который намного превзошел рамки обычного редактирования. София, март 1978 г.
Глава 1 ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОГО АНАЛИЗА В настоящей главе, не претендуя на точность формулировок и отправляясь от простейших задач механики, мы постараемся обрисовать основной круг понятий и проблем математического анализа. 1. Начнем наше рассмотрение с выяснения тех математических понятий, которые неизбежно возникают при описании самого простейшего вида движения — движения материальной точки вдоль прямой линии. Если материальная точка движется вдоль оси Оу, а х обозначает время, отсчитываемое от некоторого начального момента, то для описания указанного движения необходимо знать правило, посредством которого каждому значению времени х ставится в соответствие координата у движущейся точки в момент времени х. В механике такое правило называют законом движения. Абстрагируясь от конкретного механического смысла переменных х и у и рассматривая в качестве х и у две совершенно произвольные переменные величины, мы придем к понятию функции, являющемуся одним из важнейших понятий математического анализа. Если известно правило, посредством которого каждому значению одной переменной х ставится в соответствие определенное значение другой переменной у, то говорят, что переменная у является функцией переменной х, и пишут у=у(х) или у=[(х). При этом переменную х называют аргументом или независимой переменной, а переменную у — функцией аргумента х. Букву ^ в записи У = ?(х) обычно называют характеристикой рассматриваемой функции, а значение у—${х) называют частным значением функции в точке х. Совокупность всех частных значений функции принято называть о б - ластью изменения этой функции. Отметим сразу же, что приведенная формулировка понятия функции требует уточнения, ибо в этой формулировке ничего не говорится о том, из какого множества берутся значения независимой переменной х. Множество, состоящее из тех и только тех чисел, которые являются значениями независимой переменной х, обычно называют
11 областью задания функции. Описание областей задания функции требует развития теории числовых множеств. Отметим еще, что понятие функции (так же, как и понятие числа, множества и переменной величины) естественно считать начальным понятием (т. е. таким понятием, которое можно описать, но нельзя строго определить, ибо любая попытка дать строгое определение указанного понятия неизбежно сведется к замене определяемого понятия ему эквивалентным). Таким образом, вместо термина «определение функции» естественнее упр- треблять термин «понятие функции». Отметим, наконец, что для обозначения аргумента функции и ее характеристики могут употребляться различные буквы. Так, например, запись л:=ф(^) обозначает, что переменная х является функцией аргумента ^, причем характеристика этой функции .обозначена через ф. При одновременном рассмотрении нескольких функций одного аргумента I для обозначения характеристик этих функций необходимо употреблять различные символы. 2. Часто приходится рассматривать такую функцию у=}(х), аргумент х которой сам является функцией вида #=ф(^) некоторой новой переменной (. В таком случае говорят, что переменная у представляет собой сложную функцию аргумента (, а переменную х называют промежуточным аргументом. Указанную сложную функцию называют также суперпозицией функций !, и ф. Для обозначения указанной сложной функции естественно использовать символ у = }[ч>(1)]- Рассмотрим простой пример, иллюстрирующий возникновение понятия сложной функции. Предположим, что материальная точка М равномерно с постоянной угловой скоростью со вращается но окружности радиуса К. Найдем закон движения проекции М' точки М на некоторую ось Оу, проходящую через центр О окружности и лежащую в ее плоскости (рис. 1.1). При этом естественно предположить, что в начальный момент времени /=0 движущаяся точка М находилась в точке Мо пересечения окружности с осью Оу. Обозначим через у координату проекции М' точки М на ось Оу, а через х угол М0ОМ, на который повернется точка М за время I. Очевидно, что у=Ясозх, х=Ы, и мы получим, что координата у проекции М' представляет собой сложную функцию времени I вида у=Ясоъх, где х=Ы. Эту сложную функцию можно записать в виде #=#сози^. Отметим, что движение по закону у=КсозЫ в механике принято называть гармоническим колебанием.
12 Гл. 1. Основные понятия математического анализа 3. Из курса физики известно, что важной характеристикой движения материальной точки является ее мгновенная скорость в каждый момент времени х. Если материальная точка движется вдоль оси Оу по закону у = 1(х), то, фиксировав произвольный момент времени х и какое угодно приращение времени Ах, мы можем утверждать, что в момент времени х движущаяся точка имеет координату $(х), а в момент времени х-\-Ах — координату !(х+Ах). Таким образом, число Ау = }(х-\-Ах)—}(х) представляет собой путь, пройденный движущейся точкой за промежуток времени от х до х-\-Ах. Отсюда вытекает, что отношение Ау = Цх + Ах) — }{х) „ ^ Д х Ах обычно называемое разностным отношением, представляет собой среднюю скорость движущейся точки за промежуток времени от х до х-\-Ах. Мгновенной скоростью (или просто скоростью) движущейся точки называется предел, к которому стремится средняя скорость (1.1) при стремлении к нулю промежутка времени Ад;. Если использовать известный из курса средней школы символ предела, то можно записать следующее соотношение для мгновенной скорости V(x) в момент времени х: а(л:) = 11т —— = Ьт '*■ —-—'-^—. (1.2) дх->-о А* д*-»о Ах Физическое понятие мгновенной скорости приводит к фундаментальному математическому понятию производной. Абстрагируясь от механического смысла рассмотренной выше функции у= = ?(*)> мы назовем производной произвольной функции у= = /(*) в данной фиксированной точке х предел, стоящий в правой части (1.2) (при условии, конечно, что этот предел существует) . Используя для обозначения производной функции у = {(х) в точке х символ ?'(х) или у'(х), мы можем по определению записать следующее равенство: Г (х) = Игл -^ = Нт Пх + ьр-п*) ^ дх-»0 Д* дх-»о Ах Операцию нахождения производной договоримся называть дифференцированием. Наше рассмотрение показывает, что при вычислении производной фундаментальную роль играет понятие предела функции.
"13 Предварительное представление о понятии предела функции (да и о^самом понятии производной) дается в курсе средней школы. Однако строгое и последовательное изучение понятия предела возможно лишь на базе строгой теории вещественных чисел. Так, например, без строгой теории вещественных чисел невозможно установить существование двух следующих важных пределов: Пт-!!!^ и Пт (! + ,)»/', <-»о ^ <-»о неизбежно возникающих, как мы увидим ниже, при вычислении производных функций у = &тх и у=\о%ах. Итак, проведенное нами рассмотрение показывает, что вопрос о существовании и вычислении производной упирается в необходимость развития строгой теории вещественных чисел и на ее базе теории пределов. 4. Займемся теперь вычислением производных двух конкретных элементарных функций у=5тх и у=\о%ах и выясним, какие математические проблемы неизбежно возникают при этом. Сначала вычислим производную функцию (/=5т* в любой фиксированной точке х. Для этой функции разностное отношение (1.1), очевидно, имеет вид Ах 81П А</ = в1п(х+&х)—&тх _сод / _Д*_\ 2 _ Л* Ах \ 2 ) _Дх_ 2 Таким образом, производная функции у=втх в точке х по определению равна пределу Ах 81П • Нт {соз | х + Д* Х 2 д*-»о \ 2 / Ах (1.3) (при условии, что этот предел существует). Можно ожидать, что Нт соз (х Н — | = созл:. (1.4) дх-о \ 2 / Заметим, однако, что не для всякой фуйкции [(х) справедливо равенство Ит/(* + -^Л =/(*). (1.5) д*->о V 2 / Функция }(х), для которой в данной точке х справедливо равенство :..'■(!.5), называется' непрерывной (в точке х). Поня-
14 Гл. 1. Основные понятия математического анализа тие непрерывности функции является одним из важнейших математических понятий и будет основательно изучаться в систематическом курсе математического анализа. В частности, в систематическом курсе будет доказано, что функция у — со&х является непрерывной в каждой точке х, т. е. в каждой точке х справедливо равенство (1.4). Заметим теперь, что для вычисления предела (1.3) недостаточно доказать справедливость соотношения (1.4). Для этого необходимо еще вычислить следующий предел: |^=*М (1.6) В систематическом курсе анализа будет строго доказано, что предел (1.6), часто называемый первым замечательным пределом, существует и равен единице. Только после того, как будет установлена непрерывность функции г/==созд; (т. е. равенство (1.4)) и вычислен первый замечательный предел (1.6), мы сможем, опираясь еще на то, что предел произведения равен произведению пределов сомножителей, строго утверждать, что предел (1.3) существует и равен созл: или, что то же самое, производная функции у = 5тх существует и равна соз*. Перейдем теперь к вычислению производной функции у = = \о§ах, считая, что 0<аф1, и фиксировав произвольную точку х>0. Для этой функции разностное отношение (1.1) имеет вид Ау _ Ьёо (* +'Ах) — 1о§а х Ах Ах (Дх^М) и выбирается так, что х+Дх>0). Таким образом, производная функции у = \о%ах в любой точке х>0 по определению равна пределу НГП 1о§а (* + Ах) — 10§а X ^ ~ д*-»о Ах (при условии, что этот предел существует). Преобразуем дробь, стоящую в (1.7), проделав следующие операции: 1) заменим разность логарифмов логарифмом частного; 2) произведем умножение и деление на одну и ту же величину х>0\ 3) внесем множитель, стоящий перед логарифмом, под знак логарифма, сделав его показателем степени. В результате получим, что предел (1.7) равен Ню {-^10^.(1+^.)}=Нш {^108,(1-+-^)) = дх-»0 ( А* V х I \ дх-+о ( х Ах \ ■ х I ) Пт ■ Д*-»-0 Ах Ах ~~2~
15 1->0 = Пт Дж-»0 — 1оь X ±ъи 0+') 1 + Ах \ д* х ]} *=™-*0]. (1.8) Рассмотрим отдельно предел при *->0 выражения, заключенного в правой части последнего равенства в квадратные скобки: 1 Шп[(1+ *)']• (1.9) Этот предел часто называют вторым замечательным пределом. В систематическом курсе анализа будет установлено, что этот предел равен иррациональному числу е, которое с точностью до пятнадцати знаков после запятой имеет вид е= = 2,718281828459045... Кроме того, в систематическом курсе будет доказана непрерывность функции у=\о&ах в каждой точке х>0 и, в частности, в точке х—е. Но тогда из существования равного е предела (1.9) будет следовать, что 1 1нп1о&,[(1 + 0 < ] = 1о&е. Последнее соотношение и соотношение (1.8) позволяют утверждать, что предел (1.7) равен Нш Ю§а(* + А*)-1оеа* =Л10§ае. д*->о Ах х Таким образом, после того как будет вычислен второй замечательный предел и установлена -непрерывность функции у= = \о§ах в точке е, мы сможем строго утверждать, что логарифмическая функция имеет производную, причем (1о&,х)' = — 1од0 е при 0 < а Ф 1, х > 0. X 5. В курсе средней школы кроме двух рассмотренных нами функций у=$\пх и у=\о8а.х изучались еще следующие функции: у=созх, у=^х, у = с{&х, у = ха (а— вещественное число), у = — ах (0<а=т^1), у = агс&тх, г/ = агссозл:, у = агс1§х, у = агсс^х. Все перечисленные функции принято называть простейшими элементарными. Замечательным является тот факт, что при вычислении производных всех простейших элементарных функций не возникает никаких новых трудностей, кроме тех, с которыми мы встретились при вычислении производных функций у=$тх и у=\о§ах. Не-
16 Гл. 1. Основные понятия математического анализа трудно проверить, что для вычисления производных всех простейших элементарных функций требуются лишь арифметические свойства операции предельного перехода, два замечательных предела и факт непрерывности каждой из этих функций в точках областей их задания. Отмеченное обстоятельство дает нам право без дальнейших разъяснений привести таблицу производных всех простейших элементарных функций. 1°. (ха)'=<1Ха~1 (л:>0, а — вещественное число). 2°. (\оёаХу = -±-\о$0е ..ф<аф1, х>0). х В частности, при а = е 1 (1о&*)' = - 3°. (ахУ=а*\о%еа (0<а=тЧ). В частности, при а = е X (ех)'=ех 4°. (зтл:)' = со5л:. 5°. (С05Х)' = — ЗШХ 6°. (1ех)' = —-— (хф — + пл, где п = 0, ±1, ±2, ..Л. соз2лс \ 2 / 7°. Шх)'= \— (хфпп, где п = 0, ±1, ±2,...). 511Г X 8°. (агентх)'= г Х ■ (1*|< 1). 9°. (агс соз х)', = Д= (| х |< 1). 10°. (ак\%х)' Х IV. (агсс4е*)' = 1 + *2 1 1+*а Строгое обоснование приведенной таблицы является одной из важных задач той части математического анализа, которую принято называть дифференциальным исчислением. Традиционной задачей классического дифференциального исчисления является и несколько более общая задача — вычисление производной любой функции /(*), которая получается из перечисленных выше простейших элементарных функций путем конечного числа суперпозиций и конечного числа четырех арифметических действий (сложения, умножения, вычитания и деления). Такую функцию /(х) принято называть просто элементарной. Итак, элементарной называется функция, которая получается из простейших элементарных функций путем конечного числа суперпозиций и четырех арифметических действий.
17 Примером элементарной функции может служить функция /(*).== 2 1««+2/. Для вычисления производной любой элементарной функции? следует присоединить к выписанной нами таблице производных простейших элементарных функций два правила: 1) правило- дифференцирования сложной функции, 2) правило дифференцирования суммы, разности, произведения и частного функций. Правило дифференцирования сложной функции у = }(и)> где ц=ср(л:), имеет следующий вид: если функция и=щ>{х) имеет производную в данной точке Хо, а функция у = }(и) имеет производную в соответствующей точке ио=<р(хо), то сложная функция у = }[ц>(х)] имеет производную в точке хо, причем эта производная (обозначим ее через у') равна 0'=Пф(*о)]«р'(*о), (1.10} т. е. равна произведению производной функции у = }(и) в точке и0=ф(*о) на производную функции и=у(х) в точке хо. Справедливость для производной сложной функции формулы (1.10) легко оправдать с помощью наводящих соображений, но> строгий вывод формулы (1.10) не является простым и будет приведен в систематическом курсе математического анализа. Гораздо проще устанавливаются правила дифференцирования суммы, разности, произведения и частного двух функций, которые имеют вид [и{х) ±ь{х)У = иг(х) ±у'{х), [и (х) V(x)У=и' (х) V (х) +и (х) V' (х), ' и(х) ' ' __ и' (х) V (х) — и (х) у' (х) «й ^ у*(х) (в последней формуле требуется необращение в нуль функции о(х) в рассматриваемой точке х). Подводя итог, мы можем заключить, что одной из важных задач части математического анализа, называемой дифференциальным исчислением, является строгое обоснование таблицы производных простейших элементарных функций и правил дифференцирования сложной функции, а также суммы, разности, произведения и частного функций. Это обоснование позволит вычислить производную любой элементарной функции /(*), т. е. любой функции {(х), получающейся из простейших элементарных путем конечного числа суперпозиций и четырех арифметических действий. При этом оказывается, что производная любой элементарной функции представляет собой также элементарную функцию, т. е. операция дифференцирования не выводит нас из класса элементарных функций.
18 Гл. 1. Основные понятия математического анализа Отмеченное обстоятельство оправдывает введение класса элементарных функций как традиционного объекта классического анализа. 6. Еще раз обратимся к рассмотрению механической задачи о движении материальной точки вдоль прямой линии — оси Оу, но :на этот раз предположим, что для любого момента времени х нам задана мгновенная скорость }(х) движущейся точки и требуется найти закон движения этой точки. Поскольку мгновенная скорость ?(х) является производной ■функции у = Р(х), определяющей закон движения, то задача сводится к разысканию по данной функции {(х) такой функции Р(х), производная Р'(х) которой равна 1(х). Отвлекаясь от механического смысла функций }(х) и Р(х), мы придем к математическим понятиям первообразной и неопределенного интеграла. Первообразной функции }(х) называется такая функция Р{х), производная которой Р'{х) равна {(х). . Это определение требует уточнения: следует четко оговорить, «а каком множестве должно быть справедливо равенство Р'{х) = = /(*). Отмеченное обстоятельство еще раз подчеркивает необходимость развития теории множеств. Уточнение понятия первообразной будет дано в систематическом курсе. Заметим, что если функция Р(х) является первообразной ■функции /(*), то и функция Р(х)-\-С, где С — произвольная по- -стоянная, также является первообразной функции /(х) (в силу того, что производная постоянной С равна нулю). Более трудным является обратное утверждение: любые две первообразные одной и той же функции }(х) на интервале (а, Ь) могут отличаться лишь постоянным слагаемым. Доказательство этого утверждения требует развитого аппарата математического анализа и будет проведено в систематическом курсе анализа. Опираясь на указанное утверждение, мы можем констатировать следующий факт: если функция Р(х) является одной из первообразных функции 1(х), то любая первообразная функции [(х) имеет вид Р(х)-\-С, где С — постоянная. Совокупность всех первообразных данной функции {(х) называется неопределенным интегралом от функции ?(х) и обозначается символом Только что отмеченный нами факт позволяет утверждать, что если Р(х)—одна из первообразных функции Нх)> то неопределенный интеграл от функции {(х) равен ишх=р(х)+с, где С — любая постоянная. Возвратимся к поставленной нами задаче об отыскании закона движения материальной точки вдоль оси Оу по известной
19 мгновенной скорости ^(л;) этой точки. Мы теперь можем утверждать, что искомый закон движения определяется функцией г/ = = Р(х)+С, где Р(х) —любая первообразная функция ^(х), а С — постоянная. Как мы видим, без дополнительных условий закон движения по мгновенной скорости определяется неоднозначно: с точностью до постоянного слагаемого С. Для определения постоянной С должно быть привлечено дополнительное условие, обычно заключающееся в задании координаты г/о движущейся точки в некоторый момент времени хо. Используя это условие, мы получим соотношение уо = Р(х0)-\-С, из которого С=уо— Р(хо), так что окончательно искомый закон движения имеет вид у=Р(х)+у0 — Р(х0). 7. Рассмотрим вопрос об отыскании первообразных и неопределенных интегралов от некоторых элементарных функций. Так как функция }(х)=со&х является производной функции Р(х) = = 51пд;, то функция Р(х)=5\пх является одной из первообразных функции }(х) =со8х, и потому любая первообразная функции ^(л;)=со5л; имеет вид зтлг+С, где С — постоянная. Таким образом, Г сов хйх = зт х + С. Только что проведенное рассуждение имеет общий характер.. Можно утверждать, что любая формула дифференциального исчисления Р'(х) ={(х), утверждающая, что функция }(х) является производной функции Р(х), порождает эквивалентную ей формулу интегрального исчисления *)[(х)йх=Р(х)-\-С, утверждающую,, что неопределенный интеграл от функции {(х) равен Р(х)-{-С,„ где С — любая постоянная. Таким образом, выписанная выше таблица производных простейших элементарных функций порождает эквивалентную ей таблицу важных неопределенных интегралов, которую мы приводим ниже. ) а+1 г 2°. Г— = 1о§елН-С (х>0). 3°. Са*Лс = ——+С (0<аф\). ^ 1о& а В частности, при а = е Г еЧх = ех-}-С 4°. Г зт хйх = —соз х + С. 5°. ГсозМк = зт х+ С.
20 Гл. 1. Основные понятия математического анализа 6° 7° 8° 9° \ —-— = 1§л; + С [—— + лп< х<— + пп, где п = 0, ± 1, Л «к2* \ 2 2 \ = —с!§л:+С (лл < х<Сл + пп, где гс = 0, ±1, ±2, ...). ^ 81П2 Л Г-^====- = агс5Шл: + С (|х1<1). Приведенная таблица в систематическом курсе анализа будет дополнена двумя важнейшими правилами интегрирования (интегрированием посредством замены переменной и интегрированием шо частям). Здесь мы не будем приводить формулировку этих правил, а лишь отметим, что написанная таблица вместе с этими правилами составляет важный вычислительный аппарат той части математического анализа, которую принято называть интегральным исчислением. Следует, однако, сразу же подчеркнуть, что для вычисления многих важных неопределенных интегралов этого аппарата оказывается недостаточно. Например, этого аппарата недостаточно для вычисления неопределенного интеграла 2 Ах, (1.11) играющего важную роль в теории вероятностей и в других разделах точных наук. Интеграл (1.11) служит примером интеграла от элементарной функции, не являющегося элементарной функцией. Таким образом, в отличие от операции дифференцирования, операция интегрирования выводит нас из класса элементарных функций. Это обстоятельство подчеркивает условность самого понятия элементарной функции как традиционного объекта классического анализа. Недостаточность описанного нами аппарата ставит на повестку дня задачу о существовании и о вычислении первообразной и неопределенного интеграла от любой функции !(х), только непрерывной в каждой точке х области своего задания. Оказывается, такую задачу можно решить при помощи друго- то подхода к проблеме интегрирования функции, к выяснению которого мы сейчас и перейдем. 8. Снова предположим, что функция {(х) представляет собой мгновенную скорость движущейся вдоль оси Оу материальной точки. Поставим цель — вычислить путь, пройденный этой точкой за промежуток времени от х=а до х = Ъ.
21 Для облегчения рассуждений будем считать, что скорость {(х) неотрицательна для всех значений времени х. Для решения поставленной задачи разобьем промежуток времени на малые промежутки, ограниченные моментами времени а = дг0<л;1<л;2< ... <хп-\<хп = Ь. Естественно считать, что на каждом малом промежутке времени от хп-\ до хь (&/=1, 2,...,«) скорость }(х) меняется мало (что заведомо будет иметь место всякий раз, когда [(х) является непрерывной в каждой точке х). Но тогда приближенно можно считать скорость 1(х) постоянной на каждом промежутке [яь-ъ хи] и равной значению /\(Ы, где |& — некоторое значение времени из промежутка [х^-и Хк\- Таким образом, путь 8[хи-1, Хъ), пройденный движущейся точкой за промежуток времени от х%-\ до х&, приближенно можно считать равным произведению ЦЫ) на длину Ахъ = Хи— хь_1 промежутка [хъ-\, Хи] ■ Итак, 5[*а-ь хк] *=>1(1к)кхк. В таком случае путь* 5 [а, Ь], пройденный материальной точкой за весь промежуток времени от х=а до х=&, будет приближенно равен сумме 5 [С, &]*«ЫД*1+МБ2)Д*2 + ... + К1п)Д*„. (1.12) Сумму, стоящую в правой части (1.12), принято называть интегральной суммой. Естественно ожидать, что точное значение пути 5 [а, Ь] мы получим, переходя в интегральной сумме, стоящей в правой части (1.12), к пределу при стремлении к нулю наибольшей из длин Ахк (при этом, конечно, общее число п частичных промежутков будет неограниченно возрастать). Используя символ предела и обозначая через й наибольшее из чисел Ахь Дхг,..., Ахп, получим, что $М] = Пт{/(?1)Д*1 + /(уДх2+... + /(уДхл}. (1.13) Разумеется, требует уточнения вопрос о том, что мы понимаем под пределом интегральной суммы, стоящим в правой части (1.13). На этот раз операция предельного перехода встречается в новой и более сложной форме, чем при вычислении обычного предела функции Нт/(#). х-+х0 Строгое определение и изучение свойств предела вида (1.13) будет дано в систематическом курсе анализа. Здесь же мы укажем,; что в математике предел, стоящий в правой части (1.13),
22 Гл. 1. Основные понятия математического анализа называется определенным интегралом от функции /(х) в пределах от а до Ь и обозначается символом ь [Цх)йх. (1.14> а Итак, определенный интеграл (1.14) равен пути 5 [а, Ь], пройденному движущейся со скоростью {(х) материальной точкой за? промежуток времени от х = а до х — Ь. Вместе с тем очевидно, что интегральная сумма, стоящая в- правой части (1.12), геометрически представляет собой сумму площадей прямоугольников, основаниями которых служат отрезки Ахк, а высотами — отрезки длины ^(|ь). Иными словами, интегральная сумма, стоящая в правой части (1.12), равна площади ступенчатой фигуры, обведенной на Рис. 1.2 Рис. 1.3 рис. 1.2 жирной линией. Естественно ожидать, что при стремлении к нулю длины й наибольшего из чисел Ахк площадь указанной ступенчатой фигуры будет стремиться к площади криволинейной фигуры, лежащей под графиком функции у = ${х) на отрезке а^х^Ь (на рис. 1.2 эта фигура заштрихована). Эту фигуру принято называть криволинейной трапецией. Таким образом, определенный интеграл (1.14) равен площади указанной криволинейной трапеции. Конечно, проведенные нами наглядные рассуждения требуют уточнения. В частности, в систематическом курсе анализа надлежит уточнить само понятие площади криволинейной трапеции и вообще площади плоской фигуры. Итак, с понятием определенного интеграла (1.14) связаны две фундаментальные задачи: физическая задача о вычислении пути, пройденного движущейся со скоростью /(х) материальной точкой за промежуток времени от х = а до х = Ь, и геометрическая задача о вычислении площади криволинейной трапеции. 9. Теперь настало время заняться вопросом о связи определенного интеграла (1.14) с введенным ранее неопределенным инте-
23 градом (или с первообразной), а также вопросом о способах вычисления определенного интеграла. Обозначим через Р(х) определенный интеграл от функции ?{х) в пределах от а до х, где а — некоторое фиксированное значение аргумента, а х — переменное значение. Иными словами, положим* ^(*) = //(0#- (1Л5) а С геометрической точки зрения этот интеграл, как это показывает проведенное выше рассмотрение, равен площади криволинейной трапеции, лежащей под графиком функции у = {(х) на сегменте [с, х]. На рис. 1.3 эта криволинейная трапеция обведена жирной линией. Используя наглядные геометрические соображения, убедимся в том, что введенная нами функция (1.15) является одной из первообразных функции ?(х), т. е. убедимся в том, что Р'{х) = =Нх). Пусть Ад; — некоторое достаточно малое приращение аргумента х. Очевидно, разность Р{х-\-Ах)—Р(х) представляет собой площадь «узкой» криволинейной трапеции, заштрихованной на рис. 1.3. С другой стороны, если функция {(х) непрерывна в каждой точке х, т. е. если значение этой функции при малом изменении аргумента меняется мало, то указанная площадь «узкой» криволинейной трапеции мало отличается от площади Цх) Ах прямоугольника с основанием Ах и высотой ?(х). Отсюда следует, что при малом Ах разностное отношение Г(х + Ах) — Р(х) „ 16, \х мало отличается от высоты 1(х) указанного прямоугольника, т. е. предел при Ах-^-0 разностного отношения (1.16) обязан быть равен /(х). Вместе с тем, по определению, указанный предел равен производной Р'{х). Итак, мы убедились в том, что Р (х) = I (х), т. е. функция (1.15) является одной из первообразных функции 1(х). Но тогда любая первообразная функции ${х) равна ф{х) = ^[Ц)сИ+С, (1.17) а где С — постоянная. Проведенные нами рассуждения имеют предварительный характер, но при наличии развитого аппарата математического ана- * Переменную под знаком определенного интеграла мы обозначаем через (, чтобы не путать ее с верхним пределом интегрирования х.
24 Гл. 1. Основные понятия математического анализа лиза им легко придать строгий характер и строго доказать, что у любой функции 1(х), только непрерывной в каждой точке х, существует первообразная (а значит, и неопределенный интеграл), причем любая первообразная этой функции определяется равенством (1.17). Равенство (1.17), в свою очередь, позволяет установить связь ь между определенным интегралом \[{х)йх и любой первообраз- а ной Ф(х) функции /(*)■ Для установления такой связи возьмем в равенстве (1.17) в качестве верхнего предела интегрирования сначала число Ь, а затем число а. При этом получим ь ь ФФ)= [/(/)Л + С= Г/(*)й* + С,- (1.18) а а а Ф(а)=[/(0Л + С = С (1.19) а а (ибо интеграл Г/(^)Л, очевидно, равен нулю). а Вычитая из равенства (1.18) равенство (1.19), мы получим, знаменитую формулу Ньютона — Лейбница ь \}(х)0х = Фф) — Ф{а), а сводящую вопрос о вычислении - определенного интеграла ъ Г/ {х)Лх к вычислению разности значений любой первообразной а Ф(х) функции {(х) в точках Ь и а. Строгое обоснование формулы Ньютона — Лейбница является одной из важных задач математического анализа. 10. Заметим, однако, что точное аналитическое выражение для первообразной можно получить лишь для узкого класса функций. Поэтому наличие формулы Ньютона — Лейбница не снимает вопроса о приближенных способах вычисления определенного интеграла. Простейший способ приближенного вычисления определенного интеграла (так называемый метод прямоугольников) ъ основан на замене вычисляемого интеграла \[(х\^х интеграль- а ной суммой, стоящей в правой части (1.12), у которой все точки
25 5& являются серединами соответствующих сегментов [х^-1, хк\, а длины всех указанных сегментов, т. е. все числа А.хк=хк— х^-1, равны друг другу. В систематическом курсе анализа будет доказано, что при определенных требованиях на функцию }{х) ошибка, совершае- ь мая при замене интеграла Г/(л:)Л<; указанной специальной инте- о тральной сумкой, имеет порядок п~ъ, где п — число частичных сегментов. Замечательным является то обстоятельство, что метод прямоугольников (как и многие другие методы приближенного вычисления определенного интеграла) допускает удобную реализацию на ЭВМ. Это обстоятельство и равенство (1.17) делают эти методы эффективным средством вычисления первообразных и неопределенных интегралов. Ниже мы приводим результат вычисления на ЭВМ по методу прямоугольников так называемого интеграла Пуассона 6 для значения х из сегмента 0^х^1. Результаты вычислений собраны нами в табл. 1, в которой в первой колонке стоит аргумент х интеграла Пуассона, во второй колонке указана длина К частичного сегмента (или шага), в третьей колонке приведен результат вычисления, а в четвертой колонке указано число п частичных сегментов *. Таким образом, для интеграла Пуассона, не являющегося, как указано выше, элементарной функцией, с помощью ЭВМ и простейших приближенных методов без труда могут быть составлены таблицы его значений, делающие использование этого интеграла столь же доступным, как и использование любой элементарной функции. 11. Наряду с приближенными методами вычисления интегралов важную роль в современной математике играют приближенные методы отыскания корней различных уравнений. Рассмотрим простейшее уравнение !(х)=0. (1.20) В систематическом курсе анализа будет доказано, что при опре- * При этом следует учитывать ошибки округления, возникающие при переводе чисел, взятых в десятичной системе счисления, в двоичную систему ЭВМ и обратном переводе чисел, полученных в двоичной системе счисления, в десятичную. Вследствие указанных ошибок округления из десяти выписанных после запятой десятичных знаков можно гарантировать правильность первых шести знаков (остальные четыре знака в табл. 1 взяты в скобки).
26 Гл. 1. Основные понятия математического анализа Таблица 1 X 0,0999999642 0,1999999285 0,2999998927 0,3999998569 0,4999998212 0,5999997854 0,6999997497 0,7999997139 0,8999996781 0,9999996424 0,0999999642 0,1999999285 0,2999998927 0,3999998569 0,4999998212 0,5999997854 0,6999997497 0,7999997139 0,8999996781 0,9999996424 А 0,0099999964 0,0099999964 0,0099999964 0,0099999964. 0,0099999964 0,0099999964 0,0099999964 0,0099999964 0,0099999964 0,0099999964 0,0009999996 0,0009999996 0,0009999996 0,0009999996 0,0009999996 0,0009999996 0,0009999996 0,0009999996 0,0009999996 0,0009999996 Р[Х) 0,039827 (9885) 0,079260 (0074) 0,117911 (8581) 0,155422 (3028) 0,191463 (1319) 0,225747 (6439) 0,258037 (1805) 0,288145 (4843) 0,315940 (7870) 0,341345 (6679) 0,039827 (8248) 0,079259 (6848) 0,117911 (3861) 0,155421 (6952) 0,191462 (4058) 0,225746 (8192) 0,258036(2789) 0,288144 (5284) 0,315939 (7992) 0,341344 (6698) п 10 20 30 40 50 60 70 80! 90 100 100 200 300 400 500 600 700 800 900 1000 деленных требованиях, налагаемых на функцию 1(х), корень х— = с уравнения (1.20) может быть найден как предел последовательности итераций хп (л=1, 2, 3,...), первая из которых хх берется из некоторого достаточно широкого диапазона, а все последующие шаг за шагом определяются по формуле ^+1=хл-^-(п= 1,2,3, ...)• (1-21) Указанный метод приближенного вычисления корня уравнения (1.20) называется методом Ньютона (или методом касательных). Этот метод допускает очень удобную реализацию на ЭВМ. В качестве конкретного примера рассмотрим уравнение (1.20) с функцией }(х) вида }(х)=хк — а, где а — положительное вещественное число, а &>2 — целое положительное число. Для такой, функции ?(х) положительным корнем уравнения (1.20) будет яв- к>— ляться число у о, (т. е. корень степени к из положительного вещественного числа а). Формула (1.21), определяющая последовательные приближения метода Ньютона, на этот раз принимает вид Ха+1 = ±=±.Хп + —±—(п=1,2,3,...). (1-22) к кхк~х (Чтобы убедиться в этом, достаточно учесть, что 1'(х) = кхк~1.)
27 Формула (1.22) представляет собой эффективный легко реализуемый на ЭВМ алгоритм вычисления корня степени к из положительного числа а. Приведем пример вычислений, проведенных на ЭВМ по этой чрормуле. Всякое положительное вещественное число а представимо (и притом единственным способом) в виде а = 21х, где / — целое число, а х удовлетворяет неравенствам 1/2^х<1. Будем каждой раз выбирать за первое приближение х\ число х\ = 211,к\ где к— степень извлекаемого корня, а символ [1/к] обозначает целую часть числа 1/к. Результаты вычислений собраны нами в приводимую ниже табл. 2, в которой в первой колонке стоят числа а, из которых извлекается корень, во второй колонке указаны степени к извлекаемых корней, в третьей колонке приведен результат вычислений, а в четвертой колонке указано число сделанных итераций. Таблица 2 а 2 3 4 2 3 4 2 3 4 к 2 2 2 5 5 5 10 10 10 к г — У а 1,41423181 1,732049942 1,999999046 1,148697853 1,245730400 1,319507599 1,071773529 1,116123199 1,148697853 п 4 5 5 5 5 6 5 6 6 12. Мы рассмотрели постановку важнейших задач математического анализа, отправляясь от простейшей механической модели— движения материальной точки вдоль прямой линии. Такая модель естественно привела нас к необходимости построения дифференциального и интегрального исчисления функции [(х) одной независимой переменной. При описании более сложных задач естествознания возникает понятие функции нескольких независимых переменных Х\, хг,..., хт. Так, например, температура и нагреваемого тела представляет собой функцию четырех независимых переменных: трех координат х\, Х2, хз точки этого тела и времени I. Эту функцию естественно обозначить символом и = 1{х\, Х2, хг, ^). Для функции нескольких независимых переменных естественно ввести понятие производной по каждой из переменных (такую производную называют частной производной по данной переменной).
28 Гл. 1. Основные понятия математического анализа Важной задачей для последующего развития математического анализа является построение дифференциального и интегрального исчислений функций нескольких переменных. Наконец, математический анализ, понимаемый в совсем широком смысле, включает в себя теорию так называемых дифференциальных уравнений (т. е. уравнений, содержащих искомые функции под знаками производных). В последние десятилетия широкое развитие получили теории, исходящие из обобщенной трактовки самого понятия функции, понятия производной и понятия решения дифференциального уравнения, связывающего производные функции. Создание математического анализа является одним из величайших достижений человеческого разума. Оно позволило от рассмотрения отдельных разрозненных физических и геометрических задач (таких, как падение тела под действием силы тяжести, вычисление площади, лежащей под параболой) перейти к развитию общих методов решения больших классов задач. Развитие математического анализа, в свою очередь, оказало огромное влияние на прогресс науки и техники. Классический математический анализ представляет собой очень удобную идеализированную модель, основанную на том, что мы располагаем точными значениями всех исходных величин и можем найти точные значения всех вычисляемых величин. Заметим вместе с тем, что, отправляясь от этой модели, мы, как правило, можем оценить погрешность, возникающую вследствие того, что исходные величины заданы нам с некоторой ошибкой и все вычисления могут быть проведены лишь с определенной точностью. Таким образом, аппарат математического анализа может быть использован для построения численных методов и оценки погрешностей. Подводя итог, систематизируем первоочередные и наиболее важные проблемы, выявившиеся в результате проведенного нами предварительного рассмотрения. 1. Уточнение понятий вещественного числа, множества и функции. 2. Развитие теории пределов и связанного с этой теорией понятия непрерывности функции. 3. Построение аппарата дифференциального и интегрального исчислений. 4. Построение теории определенного интеграла как предела сумм специального вида. 5. Развитие приближенных методов вычисления определенных интегралов и приближенных методов решения уравнений. 6. Выяснение некоторых геометрических понятий (таких, как площадь плоской фигуры, длина дуги).
Г л ава 2 ВЕЩЕСТВЕННЫЕ ЧИСЛА В предыдущей главе мы убедились в том, что развитие теории вещественных * чисел необходимо для строгого и последовательного изучения понятия предела, являющегося одним из важнейших понятий математического анализа. Необходимая нам теория вещественных чисел, излагаемая в этой главе, включает в себя определение операций упорядочения сложения и умножения этих чисел и установление основных свойств указанных операций, а также доказательство существования точных граней у множеств чисел, ограниченных сверху илю снизу. В конце главы дается представление о дополнительных вопросах теории вещественных чисел, не являющихся необходимыми" для построения теории пределов и вообще курса математического анализа (полнота множества вещественных чисел в смысле Гильберта, аксиоматическое построение теории вещественных чисел, связь между различными способами введения вещественных: чисел). Самый последний параграф главы посвящен элементарным вопросам теории множеств, близко примыкающих к теории вещественных чисел. § 1. МНОЖЕСТВО ЧИСЕЛ, ПРЕДСТАВИМЫХ БЕСКОНЕЧНЫМИ ДЕСЯТИЧНЫМИ ДРОБЯМИ, И ЕГО УПОРЯДОЧЕНИЕ 1. Свойства рациональных чисел. Понятие рационального числа и основные свойства рациональных чисел известны из курса средней школы. В настоящем пункте мы даем систематизацию* хорошо известных из курса средней школы вопросов теории рациональных чисел. Рациональным называется число, представимое (хотя бы одним способом) в виде отношения двух целых чисел, т. е. в* виде дроби т/п, где тип — целые числа и пФО. * Вместо термина «вещественное число» часто употребляют термин «действительное число».
30 Гл. 2. Вещественные числа Рациональные числа обладают следующими 16 основными свойствами *. (При формулировке этих свойств мы вместо термина «рациональное число» употребляем более краткий термин •«число».) 1°. Любые два числа а и Ь связаны одним и только одним из трех знаков >, < или =, причем если а>Ь, то Ь<а. Иными -словами, существует правило, позволяющее установить, каким из указанных трех знаков связаны два данных числа. Это правило называется правилом упорядочения**. 2°. Существует правило, посредством которого любым числам <а и Ь ставится в соответствие третье число с, называемое их суммой и обозначаемое символом с = а + &***. Операция нахождения суммы называется сложением. 3°. Существует правило, посредством которого любым числам а и Ъ ставится в соответствие третье число с, называемое их произведением и обозначаемое символом с = а-Ь ****. Операция нахождения произведения называется умножением. Правило упорядочения обладает следующим свойством: 4°. Из а>Ь и Ь>с вытекает, что а>с (свойство транзитивно- -сти знака >); из а = Ъ и Ъ = с вытекает, что а = с (свойство транзитивности знака =). Операция сложения обладает следующими четырьмя свойствами: 5°. а-\-Ь = Ь-\-а (коммутативность или перестановочное свойство). 6°. (а-{-Ь)-)-с = а-\-(Ь-\-с) (ассоциативность или сочетательное свойство). 7°. Существует число 0 такое, что а+0=а для любого числа а (особая роль нуля). 8°. Для каждого числа а существует противоположное ему число а' такое, что а+а' = 0. Аналогичными четырьмя свойствами обладает операция умножения: * Все приводимые нами свойства рациональных чисел могут быть получены из свойств целых чисел. ** Правило упорядочения рациональных чисел формулируется так: два неотрицательных числа а=тх1п\ и Ь=т2/Я2> у которых Л1>0 и /г2>0, связаны тем же знаком, что и два целых числа т.\-п2 и т2-Пй два неположительных числа а и Ь связаны тем же знаком, что и два неотрицательных числа \Ь\ и \а\; если а неотрицательно, а Ь отрицательно, то а>Ь. *** Правило образования суммы двух рациональных чисел а=т.\1п\ и тх пц, т1-л2+та-П1 л = т2/п2 определяется равенством -( = , которое получается с помощью известного приема приведения к общему знаменателю. **** Правило образования произведения двух рациональных чисел <з = гпх т-2 яу/па = т.\1п\ и о = т2/л2 определяется равенством • = — •
§ 1. Множество чисел, представимых бесконечными дробями 31 9°. а-Ъ = Ь-а (коммутативность). 10°. (а-Ь) -с = а- (Ь-с) (ассоциативность). 11°. Существует число 1 такое, что а-\=а для любого числа а (особая роль единицы). 12°. Для каждого числа афО существует обратное ему числа а' такое, что а-а'=\. Операции сложения и умножения связаны следующим свойством: 13°. (а+Ь) -с=а-с-\-Ъ-с (дистрибутивность или распределительное свойство умножения относительно суммы). Следующие два свойства связывают операцию упорядочения с операцией сложения или соответственно умножения: 14°. Из а>Ъ вытекает, что а-{-с>Ь-\-с. 15°. Из а>Ь и с>0 вытекает, что а-с>Ь-с. Особая роль принадлежит последнему свойству. 16°. Каково бы ни было число а, можно число 1 повторить слагаемым столь раз, что сумма превзойдет а *. Перечисленные 16 свойств называют основными потому, что все другие алгебраические свойства, относящиеся к операциям сложения и умножения и к сочетанию равенств и неравенств, могут быть извлечены как логические следствия из указанных 16 свойств. Так, например, из основных свойств вытекает следующее часто используемое в дальнейшем свойство, позволяющее почленно складывать неравенства одного знака: если а>Ь и с>й, то а+с>Ъ-\-й. В самом деле, из неравенств а>Ь и с>й и из свойств 14° и 5° вытекает, что а-\-с>Ь-\-с и Ъ-\-с>Ъ-\-й, а из двух последних неравенств и свойства 4° вытекает, что а-\-с>Ь-\-й. 2. Недостаточность рациональных чисел для измерения отрезков числовой оси. Договоримся называть числовой осью прямую, на которой выбраны определенная точка О (начало отсчета), масштабный отрезок ОЕ, длину которого мы принимаем равной единице, и положительное направление (обычно от О к Е). Очевидно, каждому рациональному числу соответствует на числовой оси определенная точка. В самом деле, из курса средней школы известно, как построить отрезок, длина которого составляет 1/л часть длины масштабного отрезка ОЕ (п — любое целое положительное число). Следовательно, мы можем построить и отрезок, длина которого относится к длине масштабного отрезка как т/л, где гп и п — любые целые положительные числа. Отложив такой отрезок вправо (влево) от точки О, мы получим точку М\ (М2), соответствующую рациональному числу пг/п (—т/л)' (рис. 2.1). * Это свойство часто называют аксиомой Архимеда.
32 Гл. 2. Вещественные числа Заметим теперь, что не каждой точке М числовой оси соответствует рациональное число. Так, например, если точка М выбрана так, что длина отрезка ОМ равна диагонали квадрата, стороной которого служит масштабный отрезок ОЕ, то поскольку длина масштабного отрезка ОЕ равна единице, по теореме Пифагора длина х отрезка ОМ является корнем уравнения х2 = 2 и, как показано в курсах средней школы, не является рациональным числом. Но это и означает, что указанной точке М не соответствует рациональное число. а„ с? _0 о I ' I о I ■ 0 9- -О ' I ■ 1 1 ' I ■ « О о' ' ' ' ' '<Х) ' > %*) О Е. *,(*) ' * » Р*. Рис. 2.1 Рис. 2.2 Естественно, возникает потребность расширить множество рациональных чисел и ввести в рассмотрение более широкое множество чисел так, чтобы каждой точке числовой оси соответствовало некоторое число из этого более широкого множества (или, что то же самое, чтобы с помощью этого более широкого множества чисел можно было выразить длину любого отрезка ОМ числовой •оси). Убедимся в том, что посредством измерения отрезка ОМ каждой точке М числовой оси можно поставить в соответствие вполне определенную бесконечную десятичную дробь. Пусть М — любая точка числовой оси. Ради определенности 'Предположим, что точка М лежит направо от О. Проведем процесс измерения отрезка ОМ при помощи масштабного отрезка ОЕ. Сначала выясним, сколько раз целый масштабный отрезок уложится в отрезке ОМ*. Могут представиться два случая: 1) Отрезок ОЕ укладывается в отрезке ОМ целое число а0 раз •с некоторым остатком ЫМ, меньшим ОЕ (рис. 2.2). В этом случае целое число ао представляет собой результат измерения по недостатку с точностью до числа 1. 2) Отрезок ОЕ укладывается в отрезке ОМ целое число а0 раз без остатка. В этом случае процесс измерения можно считать законченным и целое рациональное число ао считать длиной отрезка ОМ. Формально мы можем утверждать, что в этом •случае точке М соответствует бесконечная десятичная дробь .ао.ООО..., которая отождествляется с целым рациональным числом ао- * В силу аксиомы Архимеда для отрезка, каковы бы ни были два отрезка АВ и Си, повторив один из этих отрезков слагаемым достаточно большое число раз, мы получим отрезок, длина которого превосходит длину второго «отрезка.
§ 1. Множество чисел, представимых бесконечными дробями 33 В первом случае процесс измерения следует продолжить и выяснить, сколько раз 1/10 часть масштабного отрезка ОЕ укладывается в отрезке ММ (являющемся остатком измерения с помощью целого отрезка ОЕ). Снова могут представиться два случая: 1) 1/10 часть ОЕ укладывается в отрезке ЫМ а\ раз с некоторым остатком РМ, меньшим 1/10 части ОЕ (см. рис. 2.2). В этой случае рациональное число ао, сц представляет собой результат измерения ОМ по недостатку с точностью до числа 1/10. 2) 1/10 часть ОЕ укладывается в отрезке ММ целое число а.\ раз без остатка. В этом случае процесс измерения можно считать законченным и рациональное число ао, а\ считать длиной отрезка ОМ. Формально мы можем утверждать, что в этом случае точке М соответствует бесконечная десятичная дробь ао^ООО..., отождествляемая с рациональным число йо.йь Продолжая указанные рассуждения далее, мы придем к двум возможностям: 1) либо описанный процесс измерения оборвется на п-м шаге вследствие того, что точке М соответствует рациональное число а0,а\а2... ап (в этом случае точке М соответствует бесконечная десятичная дробь ао,а\а2 ••■ ап000..., которую мы отождествляем с рациональным числом ао,а\а2...ап)\ 2) либо описанный процесс измерения никогда не оборвется и мы получим бесконечную последовательность рациональных чисел а0; ао,'а1; ...; а0,а1а2... ап; ..., (2.1) представляющих собой результат измерения по недостатку отрезка ОМ с точностью до 1, , ... , , .... 10 10" Каждое из чисел последовательности (2.1) может быть получено обрыванием на соответствующем знаке бесконечной десятичной дроби а0, а\а2...ап.... (2.2) Таким образом, в случае 2) точке М числовой оси отвечает вполне определенная бесконечная десятичная дробь (2.2). Можно сказать, что и в случае 1) точке М отвечает бесконечная десятичная дробь (2.2), но в этом случае у этой дроби все- десятичные знаки с номером, большим п, равны нулю, т. е. указанная дробь в случае 1) имеет вид ао, а\а2... ап000 .... Приведенные нами рассуждения применимы и для случая, когда точка М лежит левее точки О, только в этом случае естественно считать, что все элементы последовательности (2.1) и бесконечная дробь имеют отрицательный знак.. Итак, мы убедились, что описанный нами процесс измерения позволяет поставить в соответствие каждой точке М числовой оси вполне определенную бесконечную десятичную дробь. Это об- 2 Зак. 72
34 Гл. 2. Вещественные числа стоятельство естественно приводит нас к необходимости рассмотрения чисел, представимых бесконечными десятичными дробями. Замечание. Конечно, описанный нами процесс измерения отрезка ОМ можно видоизменить так, что он будет приводить к рассмотрению не бесконечных десятичных, а, например, бесконечных двоичных или бесконечных троичных дробей. Желание рассматривать бесконечные десятичные дроби вызвано лишь той особой ролью, которую традиционно играет десятичная система счисления. Развитие электронной вычислительной техники повысило роль двоичной и троичной систем счисления, ибо (в силу конструктивных особенностей ЭВМ) эти системы счисления более удобны в практике использования ЭВМ. 3. Упорядочение множества бесконечных десятичных дробей. Во вводной главе мы уже отмечали, что понятие числа относится к так называемым начальным понятиям (т. е. к понятиям, которые могут быть разъяснены, но не могут быть строго определены, ибо всякая попытка дать строгое определение такого понятия неизбежно сведется к замене определяемого понятия ему эквивалентным). Мы введем понятие вещественных чисел, отправляясь от множества бесконечных десятичных дробей. Рассмотрим множество всевозможных бесконечных десятичных дробей (как положительных, т. е. взятых со знаком +, так и отрицательных, т. е. взятых со знаком —). Мы будем придерживаться следующего плана. Для множества всех чисел, представимых бесконечными десятичными дробями, мы введем операцию упорядочения. После этого мы убедимся, что для введенной нами операции упорядочения остается справедливым то же самое свойство 4°, которое сформулировано в п. 1 для рациональных чисел (т. е. свойство транзитивности знаков > и =). Наличие только одного этого свойства позволит нам доказать замечательную теорему о том, что у множества чисел, представимых бесконечными десятичными дробями и ограниченных сверху (или соответственно снизу), существует число, пред ставимое бесконечной десятичной дробью и являющееся точной верхней (или соответственно точной нижней) гранью указанного множества чисел. После этого вводятся операции сложения и умножения чисел, представимых бесконечными десятичными дробями. Это дает нам возможность ввести вещественные числа как такие числа, которые представимы бесконечными десятичными дробями и для которых указанным нами способом определены операции упорядочения, сложения и умножения. Доказанная нами теорема о существовании точных граней позволит доказать существование суммы и произведения двух любых вещественных чисел, а также справедливость для этих чисел тех же самых 16 основных свойств, которые сформулированы в п. 1 для рациональных чисел.
§ 1. Множество чисел, представимых бесконечными дробями 35 Приступим к реализации указанного плана. В этом пункте мы введем для чисел, представимых бесконечными десятичными дробями, операцию упорядочения и установим, что эта операция обладает свойством 4°, сформулированном в п. 1 для рациональных чисел (т. е. свойством транзитивности знаков > и =). Рассмотрим произвольное число, представимое бесконечной десятичной дробью, отличной от 0,000.... Это число мы будем называть положительным, если оно представимо бесконечной десятичной дробью, взятой со знаком +, и отрицательным, ■если оно представимо бесконечной десятичной дробью, взятой со знаком —. Числа, не являющиеся положительными, мы будем называть неположительными, а числа, не являющиеся отрицательными,— неотрицательными. Сразу же отметим, что все рациональные числа относятся к множеству чисел, представимых бесконечными десятичными дробями. Представление данного рационального числа бесконечной десятичной дробью можно получить двумя способами: 1) взяв точку М, отвечающую данному рациональному числу на числовой оси, и произведя измерение отрезка ОМ с помощью масштабного отрезка способом, указанным в п. 2; 2) взяв обыкновенную дробь пг/п, представляющую данное рациональное число, и поделив числитель т на знаменатель п «столбиком» *. Мы представляем читателю убедиться в том, что оба эти способа эквивалентны друг другу. Так, при любом из указанных способов рациональному числу 1/2 ставится в соответствие бесконечная десятичная дробь 0,5000..., рациональному числу 4/3 — ■бесконечная десятичная дробь 1,333.... Прежде чем перейти к формулировке правила упорядочения чисел, представимых бесконечными десятичными дробями, рассмотрим вопрос о представлении в виде бесконечных десятичных дробей тех рациональных чисел, которые представимы в виде конечной десятичной дроби. Заметим, что такие рациональные числа допускают два представления в виде бесконечных десятичных дробей. Например, рациональное число 1/2 = 0,5 можно представить в виде двух бесконечных десятичных дробей: 1) 1/2 = 0,5000..., 2) 1/2 = 0,4999.... Вообще, рациональное число а = а0,а1а2...а„, где апфО, можно записать в виде двух бесконечных десятичных дробей: 1) а = а0,й1а2...ап000..., 2) а = а0,а{а2...ап-1(ап —1)999.... * В курсе средней школы доказывается, что при таком делении получается обязательно периодическая бесконечная десятичная дробь. 2*
36 Гл. 2. Вещественные числа Естественно, мы должны отождествить указанные две бесконечные десятичные дроби (т. е. считать, что они представляют одно и то же вещественное число). Рассмотрим теперь два произвольных вещественных числа а и Ъ и предположим, что эти числа представляются бесконечными десятичными дробями а = ±йо, а\а2... а„ ..., Ь = ±Ъ0,ЬхЬ2...Ьп..., (2.3) где из двух знаков + и — в каждом представлении берется какой-то один. Исключим уже рассмотренный выше случай, когда обе бесконечные десятичные дроби в (2.3) имеют одинаковые знаки и служат двумя различными представлениями одного и того же рационального числа, представимого конечной десятичной дробью. После исключения этого случая договоримся называть два числа а и Ъ равными, если их представления в виде бесконечных десятичных дробей (2.3) имеют одинаковые знаки и если справедлива бесконечная цепочка равенств а0 = Ь0, а{ = Ьи а2 = Ъ2,...,ап = Ъп,.... (2.4) Итак, мы называем два числа а и Ъ равными, если их представления в виде бесконечных десятичных дробей (2.3) имеют одинаковые знаки и если либо справедлива цепочка равенств (2.4), либо бесконечные десятичные дроби в (2.3) служат двумя представлениями одного и того же рационального числа, представимого конечной десятичной дробью. Пусть даны два неравных числа а и Ъ, представимых бесконечными десятичными дробями. Установим правило, позволяющее заключить, каким из двух знаков, > или <, связаны эти числа. Договоримся называть модулем числа а, представимого бесконечной десятичной дробью, число, представимое той же самой бесконечной десятичной дробью, что и число а, но всегда взятой со знаком +. Модуль числа а будем обозначать символом \а\. Число \а\ всегда является неотрицательным. Рассмотрим отдельно три возможных случая: 1) случай, когда а и Ъ оба неотрицательны; 2) случай, когда оба числа а и & отрицательны; 3) случай, когда одно из чисел а и Ъ неотрицательно, а другое отрицательно. 1) Пусть сначала а и Ь оба неотрицательны и имеют представления а = а0,аха2...\ Ь = Ь0,Ь1Ь2.... Так как числа а и Ъ не являются равными, то нарушается хотя бы одно из равенств (2.4). Обозначим через к наименьший из номеров п, для которого нарушается равенство а„ = Ь„, т. е. предположим, что а0 = Ь0, а\ = Ьи ..., аь_1 —Ьй_1, аифЬк.
§ 1. Множество чисел, представимых бесконечными дробями 37 Тогда мы будем считать, что а>Ь, если ан>Ъь, и будем считать, что а<Ъ, если аъ.<Ьк. 2) Пусть теперь оба числа а я Ь отрицательны. Тогда мы будем считать, что а>Ь, если |&|>|а|, и а<Ь, если \Ь\< <\а\*. 3) Пусть, наконец, одно число (например, а) неотрицательно, а другое число (Ь) отрицательно. Тогда, естественно, мы будем считать, что а>Ь. Итак, мы полностью сформулировали правило упорядочения чисел, представимых бесконечными десятичными дробями. Чтобы сделать, сформулированное правило безупречным с логической точки зрения (или, как говорят в математике, корректным), докажем следующую лемму. Лемма. Если а = а0,а\а2....ап...— произвольное неотрицательное число, а Ь' = Ь0, Ьф2.... Ьп_фп000... и Ь" = Ь0,Ь1Ь2... ... Ьп-1 (Ьп—1)999... при Ь«>0 — два различных представления одного и того же рационального числа Ь0, Ь\Ь2... Ъп, то условие а<Ъ' эквивалентно условию а<Ь", а условие а~>Ъ' эквивалентно условию а>Ь". Эта лемма позволяет при упорядочении двух неравных чисел не заботиться о том, какое из двух возможных представлений в виде бесконечной десятичной Дроби взято для числа, представи- мого конечной десятичной дробью. Доказательство. Для полного доказательства леммы следует доказать четыре утверждения: 1) из а<Ь' вытекает а<Ъ"; 2) из а<Ъ" вытекает а<Ь'; 3) из а>Ь' вытекает а>Ъ"; 4) из а>Ь" вытекает а>Ь'. Мы ограничимся доказательством утверждений 1) и 2), ибо утверждения 3) и 4) доказываются аналогично. Пусть а<Ь'. Тогда по правилу упорядочения найдется номер к такой, что а0 = Ь0, а1 = Ьи.:.,аь.-1 = Ьь-1, ак<Ьк (2.5). (в этих соотношениях следует считать все Ьп+\, Ьп+2,... равными нулю). Сразу же заметим, что к<п, ибо при к>п неравенство ак<Ьк не может выполняться, так как О^а^Э, а &ь = 0. ,. Если при этом к<п, то, поскольку при к<п все десятичные знаки до порядка к у Ь' и Ъ" совпадают, условия а<Ъ' и а<Ъ", очевидно, эквивалентны. Остается рассмотреть случай к = п. В этом случае соотношения (2.5) принимают вид ао = Ь0, а\ — Ьи..., а-„_1 = Ь„_1, ап<Ьп. Самое последнее неравенство эквивалентно неравенству ап^Ьп—1. Если при этом ап<Ьп—1, то по правилу упорядочения а<Ъ". * При этом мы учитываем, что для неотрицательных а и Ь правило упорядочения уже определено (см. случай 1)).
38 Гл. 2. Вещественные числа Если же в указанном последнем неравенстве ап = Ъп—1, то все десятичные знаки у чисел а и Ь" до порядка п совпадают. Поскольку у числа Ь" все десятичные знаки порядка, большего п, равны девяти, то и в этом случае а<Ь", ибо у числа а все десятичные знаки порядка, большего п, не могут быть равны девяти (в силу того, что а не равно Ь'). Итак, утверждение 1) доказано. Перейдем к доказательству утверждения 2). Предположим, что а<Ь". Договоримся о следующих обозначениях бесконечных десятичных дробей, представляющих числа Ъ' и Ъ". Ь' = Ъ0', ЬХ'Ъ2'... Ь„'..., Ъ" = Ьа", ЬХ"Ъ2"... Ьп" .... В этих представлениях Ь0' = Ьо" = Ь0, Ь1,=Ь1" = Ьи...,Ь/п-1 = Ь"п-1 = ^-ь Ь„' = ЬП, Ъп" = Ъп—\. Иными словами, справедлива цепочка соотношений Ь0' = Ь0", Ь1'=Ь1",...,Ь'п-1 = Ь"п-1, Ъп'>Ъп". С другой стороны, поскольку а<Ъ", найдется номер к такой, что справедлива цепочка соотношений а0 = Ь0", а1 = Ь1",...,ак-1 = Ь"к-и ак<Ък". Обозначим через т наименьший из двух номеров пик и сопоставим между собой две последние цепочки соотношений. Используя свойства транзитивности знаков > и = для целых чисел, мы получим при этом следующую цепочку соотношений: ао=Ьо', а\ = Ъ\ , ...,ат-.\ — Ъ'т-\, ат<.Ь'т. Полученные соотношения на основании правила упорядочения вещественных чисел устанавливают справедливость неравенства а<Ъ'. Тем самым утверждение 2) также доказано. Еще раз подчеркнем, что доказанная лемма позволяет при упорядочении двух чисел, представимых бесконечными десятичными дробями, пользоваться любым из двух представлений в виде бесконечной десятичной дроби для рациональных чисел, представимых конечной десятичной дробью. Легко убедиться в том, что сформулированное правило упорядочения в применении к двум рациональным числам, представленным в виде бесконечных десятичных дробей, приводит к тому же результату, что и прежнее правило упорядочения рациональных чисел, представленных в виде отношения двух целых чисел. В самом деле, достаточно рассмотреть случай двух неотрицательных рациональных чисел а и Ь. Пусть а>Ь согласно прежнему правилу упорядочения рациональных чисел, и пусть а = ао,а1а2...ап...; Ь = Ь0,ЬХЬ2 ...Ьк.... Отложив рациональные числа а и & на числовой оси, мы получим отвечающие
§ 1. Множество чисел, представимых бесконечными дробями 39 им точки М\ и М2, причем, поскольку а>Ь, отрезок ОМг больше отрезка ОМ2. Из описанного в п. 2 процесса измерения отрезка числовой оси вытекает, что целое число аоа\а2...ак показывает, сколько раз 10-* часть масштабного отрезка ОЕ укладывается в отрезке ОМи а целое число Ъф\Ь2...Ъп показывает, сколько раз 10~й часть ОЕ укладывается в отрезке ОМ2. Поскольку отрезок ОМ\ больше отрезка ОМ2, то найдется номер к такой, что а0а\...а&—1 = 6о&1 ... Ь&-ь а ао«1 ...ак>Ьфх... Ьк, но это и означает, что а>Ь согласно правилу упорядочения чисел, представимых бесконечными десятичными дробями. Докажем теперь, что для сформулированного нами правила упорядочения чисел, представимых бесконечными десятичными дробями, остается справедливым свойство 4°, приведенное в п. 1 для рациональных чисел, т. е. докажем, что для любых трех чисел а, Ь и с, представимых бесконечными десятичными дробями, из справедливости неравенств а>Ъ и Ъ>с вытекает справедливость неравенства а>с (свойство транзитивности знака >), а из справедливости равенств а=Ь и Ь = с вытекает справедливость равенства а = с (свойство транзитивности знака =). Свойство транзитивности знака = сразу же вытекает из справедливости соответствующего свойства для целых чисел. Докажем свойство транзитивности знака >. Пусть а>Ъ, Ь>с. Требуется доказать, что а>с. Рассмотрим три возможных случая: 1) с неотрицательно; 2) с отрицательно, а неотрицательно; 3) с отрицательно и а отрицательно. 1) Пусть сначала с неотрицательно. Тогда Ь также неотрицательно, ибо если бы Ь было отрицательно, то в силу правила упорядочения мы получили бы, что с>Ь, и это противоречило бы условию Ь>с. Далее, повторяя те же рассуждения, мы получим, что и а неотрицательно (ибо в противном случае мы получили бы, что Ь>а, и это противоречило бы условию а>Ь). Итак, в рассматриваемом случае все три числа а, Ь и с неотрицательны. Записав представления этих чисел бесконечными десятичными дробями а = ао,а\а2...\ Ь = Ьа,Ьф2...\ с=Сц,С\С2..., мы получим, что в силу условия а>Ъ найдется номер к такой, что а0 = Ь0, а\ = Ъи...,ак-1 = Ьк-и ак>Ьк. (2.6) Аналогично в силу условия &>с найдется номер р такой, что Ь0 = с0, Ъх = си ..., Ьр-1 = ср_1, Ьр>ср. (2.7) Обозначим через т наименьший из двух номеров к пр. Тогда, очевидно, из соотношений (2.6) и (2.7) и из справедливости свойства транзитивности знаков > и = для целых чисел вытекает, что Оо=с0, ау = си ..., ст_1 = ст_ь ат>ст, а это и означает (по правилу упорядочения), что а>с.
40 Гл. 2. Вещественные числа 2) Пусть теперь с отрицательно, а неотрицательно. Тогда (независимое от знака числа Ъ) неравенство а>с справедливо в силу правила упорядочения. 3) Рассмотрим, наконец, случай, когда оба числа а и с отрицательны. Заметим, что в этом случае и Ь отрицательно (ибо в противном случае мы получили бы из правила упорядочения, что Ь>а, и это противоречило бы условию а>Ь). Итак, в рассматриваемом случае все три числа а, Ь и с отрицательны. Но в таком случае (в силу правила упорядочения) не- авенства а>Ь, Ь>с эквивалентны неравенствам |Ь|>|а| и с|>|Ь|. Из последних двух неравенств (в силу свойства транзитивности знака >, уже доказанного нами в случае 1) для неотрицательных чисел) вытекает, что |с|>|а|, а это и означает (в силу правила упорядочения отрицательных чисел а и с), что а>с. Тем самым доказательство свойства транзитивности знака > полностью завершено. § 2. ОГРАНИЧЕННЫЕ СВЕРХУ (ИЛИ СНИЗУ) МНОЖЕСТВА ЧИСЕЛ, ПРЕДСТАВИМЫХ БЕСКОНЕЧНЫМИ ДЕСЯТИЧНЫМИ ДРОБЯМИ 1. Основные понятия. Рассмотрим совершенно произвольное множество {х} чисел, представимых бесконечными десятичными дробями. Отдельные числа, входящие в состав множества {х}, мы будем называть элементами этого множества. Всюду в этом параграфе мы будем требовать, чтобы рассматриваемое множество {л:} содержало хотя бы один элемент (такое множество принято называть непустым). Введем важное понятие ограниченности множества сверху (или соответственно снизу). Определение 1. Множество {х} чисел, представимых бесконечными десятичными дробями, называется ограниченным сверху (соответственно ограниченным с низ у), если существует такое представимое бесконечной десятичной дробью число М (соответственно такое представимое бесконечной десятичной дробью число пг), что каждый элемент х множества {х} удовлетворяет неравенству х^М (соответственно х^т). (2.8) При этом число М (число т) называется верхней гранью (нижней гранью) множества {х}. Конечно, любое ограниченное сверху множество {х} имеет бесконечно много верхних граней. В самом деле, если число М — одна из верхних граней множества {х}, то любое число М', большее числа М, также является верхней гранью множества {х} (ибо из
§ 2. Ограниченные множества 4! справедливости неравенства (2.8) будет следовать, что х^М'). Аналогичное замечание можно сделать в отношении нижних граней ограниченного снизу множества {х}. Так, например, множество всех представимых бесконечными десятичными дробями отрицательных чисел ограничено сверху. В качестве верхней грани М такого множества можно взять любое неотрицательное число. Множество всех целых положительных чисел 1, 2, 3,... ограничено снизу. В качестве нижней грани" этого множества можно взять любое число т, удовлетворяющее неравенству т^1. Естественно, возникает вопрос о существовании наименьшей из верхних граней ограниченного сверху множества и наибольшей из нижних граней ограниченного снизу множества. Определение 2. Наименьшая из всех верхних граней ограниченного сверху множества {х) называется г очной верхней гранью этого множества и обозначается символом х = = зир{л:}*. Наибольшая из всех нижних граней ограниченного снизу множества {х} называется точной нижней гранью этого множества и обозначается символом х=Ш{х}**. Определение 2 можно сформулировать и по-другому, а именно: Число х (число х) называется точной верхней (точной нижней) гранью ограниченного сверху (снизу) множества {х}, если выполнены следующие два требования: 1) каждый элемент х множества {х} удовлетворяет неравенству х^х (х^х); 2) каково бы ни было число х', меньшее х (большее х), найдется хотя бы один элемент х множества {х}, удовлетворяющий неравенству х> >х'(х<х'). В этом определении требование 1) утверждает, что число х (число х) является одной из верхних (нижних) граней, а требование 2) говорит о том, что эта грань является наименьшей (наибольшей) и уменьшена (увеличена) быть не может. 2. Существование точных граней. Существование у любого ограниченного сверху (снизу) множества точной верхней (точной нижней) грани не является очевидным и требует доказательства. Докажем следующую основную теорему. * Основная теорема 2.1. Если Множество {х} чисел, представимых бесконечными десятичными дробями, ограничено сверху (соответственно снизу) и содержит хотя бы один элемент, то у этого множества существует точная верхняя (соответственно точная нижняя) грань. * зир — первые три буквы латинского слова зиргетит («супремум»), которое переводится как «наивысшее». ** Ш — первые три буквы латинского слова тПггшт («инфимум»), которое переводится как «наинизшее».
42 Гл. 2. Вещественные числа Доказательство. Мы остановимся лишь на доказательстве существования точной верхней грани у любого ограниченного сверху множества, ибо существование точной нижней грани у любого ограниченного снизу множества доказывается совершенно аналогично. Итак, пусть множество {х} ограничено сверху, т. е. существует такое число М, что каждый элемент х множества {х} удовлетворяет неравенству х^М. Могут представиться два случая: 1°. Среди элементов множества {х} есть хотя бы одно неотрицательное число. 2°. Все элементы множества {х} являются отрицательными числами. Эти случаи мы рассмотрим отдельно. 1°. Рассмотрим лишь неотрицательные числа, входящие в состав множества {х}. Каждое из этих чисел представим в виде бесконечной десятичной дроби и рассмотрим целые части этих десятичных дробей. В силу неравенства х^Л1 все целые части не превосходят числа М, а поэтому найдется наибольшая из целых частей, которую мы обозначим через х0. Сохраним среди неотрицательных чисел множества {х} те, у которых целая часть равна х0, и отбросим все остальные числа. У сохраненных чисел рассмотрим первые десятичные знаки после запятой. Наибольший из этих знаков обозначим через х\. Сохраним среди неотрицательных чисел множества {я} те, у которых целая часть равна х0, а первый десятичный знак равен х\, и отбросим все остальные числа. У сохраненных чисел рассмотрим вторые десятичные знаки после запятой. Наибольший из этих знаков обозначим через х2. Продолжая аналогичные рассуждения далее, мы последовательно определим десятичные знаки некоторого числа х: ■ Х = Х0, ХуХ% . . . Хп . . . . (■^•6) Докажем, что это число х и является точной верхней гранью множества {х}. Для этого достаточно доказать два утверждения: 1) каждый элемент х множества {х} удовлетворяет неравенству х^х; 2) каково бы ни было число х', меньшее х, найдется хотя бы один элемент х множества {х}, удовлетворяющий неравенству х>х'. Докажем сначала утверждение 1). Так как х по построению является неотрицательным числом, то любой отрицательный элемент х множества {х} заведомо удовлетворяет неравенству х<х. Поэтому нам достаточно доказать, что любой неотрицательный элемент х множества {х} удовлетворяет неравенству х^х. Предположим, что некоторый неотрицательный элемент х= = хо,х\Х1 ...Хп... не удовлетворяет неравенству х^х. Тогда х>х и по правилу упорядочения найдется номер к такой, что х0 = х0, х1 = х1, ... ,ха_1=хй_1, хк>хк. Но последние соотношения про-
§ 2. Ограниченные множества 43 тиворечат тому, что в качестве хъ. берется наибольший из десятичных знаков хп тех элементов х, у которых целая часть и первые к—1 знаков после запятой соответственно равны Хо,х\,... ...,хк-\. Полученное противоречие доказывает утверждение 1). Докажем теперь утверждение 2). Пусть х' — любое число, удовлетворяющее условию х'<х. Требуется доказать, что существует хотя бы один элемент х множества {х}, удовлетворяющий неравенству х>х'. Если число х' является отрицательным, то неравенству х>хг заведомо удовлетворяет неотрицательный элемент х множества {х} (по предположению хотя бы один такой элемент существует). Остается рассмотреть случай, когда число х', удовлетворяющее условию х'<х, является неотрицательным. Пусть х'=х0', х/... ... Хп — ■ Из условия х'<х и из правила упорядочения вытекает, что найдется номер т такой, что Хо -= Х0, Х\ = Х-у, • • ■ , Хщ— 1 == Хт—Ь Хт V. Хт. (2. Ю) С другой стороны, из построения числа (2.9) вытекает, что для любого номера т найдется неотрицательный элемент х=Хо,Х\Х2... ...хп— множества {х} такой, у которого целая часть и все первые т знаков после запятой те же, что у числа х. Иными словами, для номера т найдется элемент х такой, для которого х0 = Х(), х1 = х1, ... , хт—\ = хт—\, хт = хт. (.2.11) Сопоставляя (2.10) и (2.11), мы получим, что Хд = Хо, Ху = Х\, . . . , Хт—1 = Хт—1> Хт ,> Хт, а это и означает (в силу правила упорядочения), что х>х'. Утверждение 2), а с ним и вся теорема для случая 1° доказаны. 2°. Аналогично доказывается существование точной верхней грани и во втором случае, когда все элементы х множества {х} являются отрицательными числами. В этом случае мы представим все элементы х отрицательными бесконечными десятичными дробями и обозначим через х0 наименьшую из целых частей этих дробей, через х\ — наименьший из первых десятичных знаков тех дробей, целая часть которых равна Хо, через х2 — наименьший из вторых десятичных знаков тех дробей, целая часть_ и первый десятичный знак которых соответственно равны х0 и Х\ и т. д. _ Таким_образом мы определим неположительное число X = ЛГ0, Ху л2 . . • Хп .... В полной аналогии со случаем Iе доказывается, что это число х является точной верхней гранью множества {х}, т. е. доказывается справедливость утверждений 1) и 2), сформулированных при рассмотрении случая 1°. Теорема доказана.
44 Гл. 2. Вещественные числа § 3. ПРИБЛИЖЕНИЕ ЧИСЕЛ, ПРЕДСТАВИМЫХ БЕСКОНЕЧНЫМИ ДЕСЯТИЧНЫМИ ДРОБЯМИ, РАЦИОНАЛЬНЫМИ ЧИСЛАМИ Докажем три леммы о приближении чисел, представимых бесконечными десятичными дробями, рациональными числами. Сначала убедимся в том, что произвольное число а, предста- вимое бесконечной десятичной дробью, можно с наперед заданной точностью приблизить рациональными числами. Ради определенности будем считать а неотрицательным и представим его дробью а=ао, а\а%... ап .... Обрывая указанную дробь на п-м знаке после запятой, мы получим рациональное число ао, а\а2... ап, причем из правила упорядочения чисел, представимых бесконечными десятичными дробями, сразу же вытекает, что ао, а\й2... Яп^я. Увеличив указанное рациональное число на- 10_", мы получим другое рациональное число а0, а^... ап+10~п, которое (в силу правила упорядочения) обязано удовлетворять неравенству а<а0, а\а-1... ап+10-п. Итак, для любого номера п мы нашли два рациональных числа оц = ао, а\а<1...ап и а2=а0, а1а2...ап+1(Уп такие, что еи<а<а2 и а2—а1 = 10~п. Убедимся в том, что для любого наперед взятого положительного рационального числа е, начиная с некоторого номера п, справедливо неравенство 10_,г<е. В самом деле, в силу аксиомы Архимеда найдется лишь конечное число натуральных чисел, не превосходящих чисел 1/е. Значит, лишь для конечного числа номеров п справедливо неравенство 10"<1/е, или 10~п>е. Для всех остальных номеров п справедливо противоположное неравенство 10~"<е, что и требовалось доказать. Мы приходим к следующему утверждению. Лемма 1. Для любого представимого бесконечной десятичной дробью числа а и любого наперед взятого положительного рационального числа е найдутся два рациональных числа <ц и аг такие, что а1<а<аг и аг—а1<е. Докажем еще две леммы, характеризующие густоту распределения рациональных чисел среди произвольных чисел, представимых бесконечными десятичными дробями. Лемма 2. Каковы бы ни были два представимых бесконечными десятичными дробями числа а и Ь такие, что а>Ъ, найдется рациональное число а, заключенное между ними, т. е. такое, что а>а>Ь (а следовательно, найдется и бесконечное множество различных рациональных чисел, заключенных между а и Ъ).
§ 3. Приближение чисел 45 Доказательство. Достаточно рассмотреть случай, когда оба числа а и Ь неотрицательны, ибо случай, когда а и Ь неположительны, сводится к указанному случаю посредством перехода к модулям, а случай, когда Ь отрицательно, а а положительно, тривиален (в качестве а можно взять нуль). Итак, пусть а>Ь и оба числа а и Ь неотрицательны. Предположим, что а = а$, а\а2 ...ап...; Ь = Ьо, Ьф2 ...Ь„..., причем в случае, если а является рациональным числом, представимым конечной десятичной дробью, договоримся брать представление а десятичной дробью, заканчивающейся бесконечным числом девяток. Так как а>Ь, то найдется номер к такой, что а0 = Ьо, сц = Ьи ..., ак-1 = Ьк-\, ак>Ък. В силу принятой нами договоренности все десятичные знаки ап при п>к не могут быть равны нулю. Обозначим через р наименьший из номеров п, больших к, для которых ап=т^0. Тогда число а можно записать в виде а = а0, аха2 ... аК00 ... 0ар... (ар>0). С помощью правила упорядочения легко проверить, что рациональное число а = а0, а1а2...ак00 ...0(ар—1)999 ... удовлетворяет неравенствам а>а>Ь. Лемма доказана. Лемма 3. Пусть Х\ и х2 — два заданных числа, представимых бесконечными десятичными дробями. Пусть далее для любого положительного рационального числа е найдутся два рациональных числа у\ и у2 такие, что У1<л:1<у2; У1<*2<:у2; 72—Л'1<е- Тогда числа х\ и х2 равны. Доказательство. Допустим противное, т. е. предположим, что ххФх2. Не ограничивая общности, будем считать, что Х\<х2. В силу леммы 2 найдутся два рациональных числа си и а2 такие, что *1<а1<а2<х2. Пусть теперь у\ и Уг— какие угодно рациональные числа, удовлетворяющие неравенствам ук^-^уг, у1<*2<у2- Из написанных выше неравенств и свойства транзитивности знаков > И = ПОЛУЧИМ У1<а1<02<'У2- Но ТОГДа у2—У1>(Х2 СП, ЧТО противоречит тому, что разность у2—у] может быть сделана меньше любого наперед взятого положительного рационального числа е. Лемма доказана.
46 Гл. 2. Вещественные числа § 4. ОПЕРАЦИИ СЛОЖЕНИЯ И УМНОЖЕНИЯ. ОПИСАНИЕ МНОЖЕСТВА ВЕЩЕСТВЕННЫХ ЧИСЕЛ 1. Определение операций сложения и умножения. Описание понятия вещественных чисел. Хорошо известно, как складывают два числа, представимых бесконечными десятичными дробями, когда требуется вычислить их сумму на практике. Для того чтобы сложить два таких числа а и Ь, заменяют их с требуемой точностью рациональными числами и за приближенное значение суммы чисел а и Ъ берут сумму указанных рациональных чисел. При этом совершенно не заботятся о том, с какой стороны (по недостатку или по избытку) взятые рациональные числа приближают а и Ь. Фактически указанный практический способ сложения чисел,, представимых бесконечными десятичными дробями, предполагает,, что чем точнее рациональные числа аир приближают (с любой стороны) числа а и Ь соответственно, тем точнее сумма а + р приближает то представимое бесконечной десятичной дробью число,. которое должно являться суммой чисел а и Ь. Желание оправдать указанный практический способ сложения естественно приводит к следующему определению. Определение 1. Суммой двух представимых бесконечными десятичными дробями чисел а и Ъ называется такое представимое бесконечной десятичной дробью число х, которое для любых рациональных чисел си, а2, Рь Рг, удовлетворяющих соотношениям а1<а<а2, Р1<Ь<р2, удовлетворяет неравенствам а1 + Р!<х<а2 + Р2- Это число х обозначают символом а + Ь. В п. 2 будет доказано, что такое число х существует и притом только одно. Там же будет установлено, что таким числом является точная верхняя грань множества {(Х1 + Р1} сумм всех рациональных чисел сп и рь удовлетворяющих неравенствам ежа,. $1<Ь, или точная нижняя грань множества {аг + Рг} сумм всех рациональных чисел «2 и р2, удовлетворяющих неравенствам а<а2,, ь«р2. В п. 2 будет доказано также, что в применении к двум рациональным числам данное нами определение приводит к тому же результату, что и старое определение суммы рациональных чисел.. Перейдем теперь к определению произведения двух чисел, представимых бесконечными десятичными дробями. Сначала определим произведение двух положительных чисел а и Ь. Определение 2. Произведением двух представимых положительными бесконечными десятичными дробями чисел а и Ъ называется такое представимое бесконечной десятичной дробью' число х, которое для любых рациональных чисел си, а2, Рь Рг*
§ 4. Операции сложения и умножения 47 удовлетворяющих соотношениям 0<<Х1<а<а2, 0<Р1<&«:Р2, удовлетворяет неравенствам а1-Р1<х<а2-Рг- Это число х обозначают символом а-Ь. В п. 2 будет установлено, что такое число х существует и притом только одно. Таким числом х является точная верхняя грань множества {сц • РЛ произведений всех рациональных чисел <ц и Рь удовлетворяющих неравенствам 0<а!<а, 0<Р1<Ь, или точная нижняя грань множества {аг-Рг} произведений всех рациональных чисел (хг и р2, удовлетворяющих неравенствам а<аг, 6<:Р2. Произведение чисел любого знака определяется по следующему правилу: 1) для любого представимого бесконечной десятичной дробью числа а полагают, что 2) для произвольных отличных от нуля и представимых бесконечными десятичными дробями чисел а и Ь полагают , ( |а| • |Ь|, если а и Ь одного знака, 1 —\а\ • \Ь\, если а и Ь разных знаков. В п. 2 будет установлено, что в применении к двум рациональным числам данное нами определение произведения приводит к тому же результату, что и прежнее определение произведения рациональных чисел. Теперь мы располагаем всем тем, что необходимо для описания понятия вещественных чисел. Договоримся называть вещественными числа, представь мые бесконечными десятичными дробями, при условии, что для этих чисел указанным выше способом определены три операции: упорядочения, сложения и умножения. Так как все изложенное в § 2 и 3 (и, в частности, основная теорема 2.1 и леммы 1—3) справедливо для произвольных чисел, представимых бесконечными дробями, для которых определена только одна операция упорядочения, то все изложенное в этих параграфах справедливо и для произвольных вещественных чисел. В дальнейшем будут рассматриваться числа, представимые ■бесконечными десятичными дробями, для которых кроме операции упорядочения определены также и операции сложения и умножения. Такие числа в соответствии со сформулированным нами понятием мы в дальнейшем будем называть вещественными. 2. Существование и единственность суммы и произведения вещественных чисел. Теорема о существовании суммы вещественных чисел. Для любых вещественных чисел а и Ъ существует вещественное число х, являющееся их суммой.
Гл. 2. Вещественные числа Доказательство. Фиксируем произвольные рациональные числа ог и Вг, удовлетворяющие неравенствам а<аг, Ь<р2, и рассмотрим всевозможные рациональные числа ей и 6ь удовлетворяющие неравенствам ежа, р1<Ь- Убедимся в том, что множество {011 + 61} всех сумм си + Вь отвечающих указанным выше всевозможным рациональным сп и рь ограничено сверху. В силу свойства транзитивности знаков > и = из неравенств а<а2 и а!<а вытекает, что сжесг, а из неравенств &<Рг и ^1<Ь вытекает, что Р1<Рг. Но два неравенства сжаг и Р1<Рг одного знака, связывающие рациональные числа, можно складывать почленно (см. конец п. 1 § 1). Значит, справедливо неравенство а1 + Р1<а2 + р2, которое и доказывает ограниченность множества {04 + 61} сверху и тот факт, что число аг+рг является одной из верхних граней этого множества. По основной теореме 2.1 (см. § 2) у множества {01 + 61} существует точная верхняя грань, которую мы обозначим через х. Остается убедиться в том, что это вещественное число х и является суммой чисел а и Ь, т. е. удовлетворяет неравенствам а1 + Р1< <х<а2 + Рг- Справедливость левого неравенства а1 + Р1<х вытекает из того, что х является верхней гранью множества {СС1 + Р1}, а справедливость правого неравенства х^аг + Рг вытекает из того, что число а2 + Рг является одной из верхних граней множества {(Х1 + Р1}, а число х является точной, т. е. наименьшей, верхней гранью этого множества. Теорема доказана. Аналогично можно было бы доказать, что в качестве х можно взять точную нижнюю грань множества {аг + Рг} сумм аг+рг всевозможных рациональных чисел аг и Рг, удовлетворяющих неравенствам а<а2) Ь<Рг- Теорема единственности суммы двух вещественных чисел. Может существовать только одно вещественное число х, являющееся суммой двух данных вещественных чисел а и Ъ. Доказательство. Предположим, что существуют два вещественных числа хх и хг, удовлетворяющие неравенствам «1 + р1<х1<а2 + р2, (2.12) а1 + Рг < х2 < а2 + Рг для всевозможных рациональных чисел си, аг, Рь р2, удовлетворяющих неравенствам а1<а<а2, Р1<&<р2. (2.13) Фиксируем произвольное положительное рациональное число е. В силу леммы 1 из § 3 для положительного рационального числа
§ 4. Операции сложения и умножения 49 е/2 и для данного вещественного числа а найдутся такие рациональные числа ах и а2, что а1<а<а2, причем а2—а1<е/2. Аналогично для указанного е/2 и для данного вещественного^ числа Ъ найдутся такие рациональные числа р1 и р2, что Р1<Ь<р2„ причем В2—В1<е/2. Если взять в неравенствах (2.13) указанные аь аг, 01 и 62, то мы получим, что оба числа Х\ и х2 удовлетворяют неравенствам. (2.12), которые можно переписать в виде \>1<*1<у2, У1<^2<У2, ПОЛОЖИВ У1 = а1 + Вь У2 = а2 + В2. Учитывая, что мы получим, что оба числа х\ и х2 заключены между рациональными числами ух и у2, разность между которыми меньше наперед, взятого положительного рационального е. В силу леммы 3 из § 3 мы получим, что Х\ = х2. Теорема доказана. Следствие. В применении к двум рациональным числам а и Ь данное нами определение суммы вещественных чисел приводит к тому же результату, что и прежнее определение суммы рациональных чисел. В самом деле, пусть а и Ъ — два рациональных числа, а + Ь — их сумма согласно прежнему определению, аь. а2, р1 и 62 — какие угодно рациональные числа, удовлетворяющие неравенствам; (2.13). Тогда, очевидно, справедливы неравенства* а1 + В1<а + Ь<а2 + 62, (2.14) причем, согласно теореме единственности число а + Ь является единственным вещественным числом, удовлетворяющим неравенствам (2.14). Совершенно аналогично доказывается существование и единственность произведения двух данных вещественных чисел. Ясно, что достаточно доказать существование и единственность, произведения двух положительных чисел а и Ь. Для доказательства существования произведения фиксируем произвольные рациональные числа а2 и р2, удовлетворяющие неравенствам а<«2, 6<р2, и рассмотрим всевозможные рациональные числа а! и Рь удовлетворяющие неравенствам 0<а1<:а, 0<р1«:Ь. Легко убедиться в том, что множество {агР1} всех произведений а1-Р1 ограничено сверху, причем число а2-р2 является одной из верхних граней этого множества. * Ибо для рациональных чисел неравенства одного знака можно складывать почленно (см. конец п. 1 § 1).
$0 Гл. 2. Вещественные числа По основной теореме 2.1 существует точная верхняя грань этого множества х, которая, как легко проверить, удовлетворяет неравенствам агР1<л;<:а2-Р2, т. е. является произведением чисел .а и Ъ. Аналогично можно было бы доказать, что произведением положительных чисел а и Ь является точная нижняя грань множества {аг-Рг} произведений аг-Рг всевозможных рациональных чисел «2 и 02, удовлетворяющих неравенствам а<аг, Ь<гр2- Для доказательства единственности* произведения двух положительных вещественных чисел а и Ь предположим, что существуют два вещественных чиола XI и х2, удовлетворяющие нера- шенствам агР1<л:1<а2-Р2. агР1<лг2<а2'Р2 (2.15) для всевозможных рациональных а\, аг, 01 и р2 таких, что * 0<а1<а<а2<М, 0<Р1<Ь<р2<М. (2.16) Фиксировав любое положительное рациональное число е, мы -с помощью леммы 1 найдем для данных вещественных чисел а и Ь такие рациональные числа сц, аг, 01 и р2, удовлетворяющие неравенствам (2.16), для которых а?—а\<г/2М и р2—Р1<е/2Л1. Но тогда в силу (2.15) оба числа х\ и хч будут заключены между рациональными числами аг-02 и агРь разность между которыми «V р2 — аг р1 = а2 (р2—рх) + рх (а2—ах) < 2М • -^- = е. В силу леммы 3 из § 3 получаем, что Х\ = х2. С помощью теоремы единственности так же, как и для суммы, доказывается, что в применении к двум рациональным числам ^данное нами определение произведения вещественных чисел приводит к тому же самому результату, что и прежнее определение произведения рациональных чисел. § 5. СВОЙСТВА ВЕЩЕСТВЕННЫХ ЧИСЕЛ 1. Свойства вещественных чисел. В этом пункте мы убедимся в справедливости для произвольных вещественных чисел всех основных свойств, перечисленных в п. 1 § 1 для рациональных чисел. Справедливость для вещественных чисел свойств 1°—4° уже установлена выше. Таким образом, нужно выяснить лишь вопрос о справедливости для вещественных чисел свойств 5°—16°. Легко убедиться в справедливости для вещественных чисел свойств 5°—8° и 14°, связанных с понятием суммы. Справедливость свойств 5°—8° непосредственно вытекает из определения * В качестве М можно взять, например, число М=2 (а+Ь).
§ 5. Свойства вещественных чисел 51 суммы вещественных чисел и из справедливости указанных свойств для рациональных чисел. Остановимся на доказательстве свойств 14°, т. е. докажем, что если а, Ъ и с — любые три вещественных числа и а>Ь, то а+с>- >Ь + с. Так как а>Ь, то в силу леммы 2 из § 3 найдутся рациональные числа си и р2 такие, что а>а\>$2>Ъ. Для вещественного числа с и для положительного рационального числа е = сц—р2 найдутся- рациональные числа уч и у2 такие, что •у1^:с<У2, причем у2—\1<г= = аг—§2 (см. лемму 1 § 3). Пусть, далее, аг и 01 — любые рациональные числа, удовлетворяющие неравенствам а2>а, Ь^>§\. Тогда по определению суммы вещественных чисел а2+У2>а + с>а1 + уь р2 + У2>Ь + с> §\ + у\. Для доказательства того, что а+с>Ь + с, в силу транзитивности знака > достаточно доказать, что (ц+у1>02+72) но это непосредственно вытекает из неравенства уг—У1<сц—(32- Заметим, что вопрос о вычитании вещественных чисел как » действии, обратном сложению, полностью исчерпывается на основании свойств 5°—8°. Назовем разностью вещественных чисел а и Ь вещественное число с такое, что с + Ь = а. Убедимся в том, что таковой разностью является число с — = а + Ь', где Ь' — число, противоположное Ъ. В самом деле, используя свойства 5°—8°, можем записать с+Ь= {а + Ь') +Ь = а+ (Ь'+Ь) = а + 0=а. Убедимся в том, что существует только одно вещественное число, являющееся разностью двух данных вещественных чисел. Предположим, что кроме указанного выше числа с = а + Ь'" существует еще одно число й такое, что й+Ь — а. Тогда, с одной стороны, (й + Ь) +Ь' = а+Ь' — с, с другой стороны, (й + Ь)+Ь' = = а+ {Ь + Ъ') =й+0 = й, т. е. с = а. Из определения разности и из свойства 8° вытекает, что число а', противоположное а, равно разности 0—а. Это число обычно записывают в виде —а. Не вызывает затруднения перенесение на случай вещественных чисел свойств 9°, 10°, 11°, 12°, 13° и 15°, связанных с понятием произведения. Отметим лишь в отношении свойства 12°, что если а — положительное вещественное число, а а] и ог — какие угодно рациональные числа, удовлетворяющие неравенствам 0<а1<а<а2, то число а', обратное для а, определяется как единственное вещественное число, удовлетворяющее не- 1 1 * равенствам <а < . а2 ах * В качестве числа а' может быть взята точная верхняя грань множества всех рациональных чисел {1/аг}.
:52 Гл. 2. Вещественные числа Свойства 9°—12° позволяют заключить, что для любых двух вещественных чисел а и Ь (ЪфО) существует и притом только одно вещественное число с, удовлетворяющее условию с-Ь = а. Это число с называется частным чисел а и Ь. Из определения частного и из свойства 12° вытекает, что число а', обратное числу а, равно частному На. Заметим, наконец, что на случай вещественных чисел переносится и последнее, 16-е, свойство рациональных чисел, а именно: Каково бы ни было вещественное число а, можно число 1 повторить слагаемым столько раз, что полученная сумма превзойдет а *. Докажем это свойство. В случае а<0 доказательства не требуется, ибо \>а. Пусть а>0, а = ао, а\ач ••• • В силу того, что определение суммы вещественных чисел в применении к сумме рациональных чисел совпадает с определением суммы рациональных чисел, повторив число 1 слагаемым п раз, получим целое число п. "Таким образом, достаточно доказать, что для числа а найдется целое число п такое, что /г>а. Но это очевидно: достаточно взять .п = а0 + 2. Таким образом, на случай вещественных чисел переносятся все основные свойства, сформулированные для рациональных чисел в п. 1 настоящего параграфа. Следовательно, для вещественных чисел сохраняют силу все правила алгебры, относящиеся к арифметическим действиям и к сочетанию равенств и неравенств. 2. Некоторые часто употребляемые соотношения. Докажем справедливость для любых вещественных чисел а и Ъ следующих двух соотношений: \а-Ь\ = \а\-\Ъ\, (2.17) |а + й|<|а| + |й|. (2.18) Соотношение (2.17) непосредственно вытекает из-определения произведения двух вещественных чисел. Докажем соотношение (2.18). На основании определения модуля и правила упорядочения для любых вещественных чисел а и Ъ справедливы неравенства — |а|<а<]а|, —|Ь|<&<|&|. В силу справедливости основных свойств для вещественных чисел можно почленно складывать неравенства одного знака (это доказано в конце п. 1 § 1). Поэтому -(\а\ + \Ь\)<а + Ь<(\а\ + \Ь\). Используя в случае а + Ь>0 правое, а в случае а + &<0 левое из последних неравенств, мы получим неравенство (2.18). 3. Некоторые конкретные множества вещественных чисел. В дальнейшем нам часто придется иметь дело с различными мно- * Заметим, что это свойство называют аксиомой Архимеда.
§ 5. Свойства вещественных чисел 53 жествами вещественных чисел. Будем обозначать произвольное множество вещественных чисел символом {х}, а числа, входящие в состав этого множества, будем называть элементами или точками этого множества. Мы будем говорить, что точка х\ множества {х} отлична от точки х2 этого множества, если вещественные числа Х\ и х2 не равны друг другу. Если при этом справедливо неравенство х\>х2 {х\<х2), то мы будем говорить, что точка х\ лежит правее (левее) точки х%. Рассмотрим некоторые наиболее употребляемые частные виды множеств вещественных чисел. 1°. Множество вещественных чисел х, удовлетворяющих неравенствам а<л;<&, где а<Ь, будем называть сегментом и обозначать символом [а, Ь]. При этом числа а и Ь мы будем называть граничными точками или концами сегмента [а, Ъ\ а любое число х, удовлетворяющее неравенствам а<х<Ь, будем называть внутренней точкой сегмента [а, Ь]. 2°. Множество всех вещественных чисел х, удовлетворяющих неравенствам а<х<Ь, будем называть интервалом и обозначать символом (а, Ь). 3°. Интервал (а—е, а + е), где е>0, будем называть б - о к р е- стностью точки а. 4°. Любой интервал, содержащий точку а, будем называть окрестностью точки а. 5°. Множество всех вещественных чисел х, удовлетворяющих неравенствам а<х<& (или а<х*сЬ), будем называть полусегментом и обозначать символом [а, Ь) (или (а, Ь]). 6°. Множество всех вещественных чисел будем называть числовой (бесконечной) прямой и обозначать символом (,—оо, +оо). 7°. Множество вещественных чисел х, удовлетворяющих неравенству х>-а (или ж&), будем называть полупрямой и обозначать символом [а, +оо) (или (.—со, Ь]). 8°. Множество всех вещественных чисел х, удовлетворяющих неравенству х>а (или х<Ь), будем называть открытой полупрямой и обозначать символом (а, +оо) (или (—оо, а)). Произвольное множество {х} будем называть плотным в себе, если в любой окрестности каждой точки х этого множества содержится хотя бы одна точка множества, отличная от х. Примером плотного в себе множества может служить любое из определенных выше множеств 1°—8°. Другим примером плотного множества может служить множество всех рациональных чисел, входящих в состав любого из множеств 1°—8°. В изложенном нами материале содержатся сведения, необходимые для построения аппарата математического анализа. В следующих параграфах этой главы будут рассмотрены некоторые дополнительные вопросы теории вещественных чисел и элементы теории множеств.
54 Гл. 2. Вещественные числа § 6. ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ ВЕЩЕСТВЕННЫХ ЧИСЕЛ Выше, для того чтобы ввести вещественные числа, были использованы бесконечные десятичные дроби. Для множества бесконечных десятичных дробей были определены правила упорядочения, сложения и умножения и было установлено, что эти правила удовлетворяют 16 основным свойствам (перечисленным в- п. 1 § 1 для рациональных чисел). Описанный метод введения' вещественных чисел, хотя и обладает несомненными эвристическими и методическими достоинствами, не является единственно возможным. Вещественные числа можно было бы ввести с помощью бесконечных двоичных дробей, с помощью так называемых дедекиндовых сечений в области рациональных чисел*, с помощью последовательностей рациональных чисел ** и другими способами. Чтобы выяснить взаимосвязь между различными методам» введения вещественных чисел, привлечем некоторые новые понятия и установим еще одно важное свойство множества изученных выше вещественных чисел. 1. Полнота множества вещественных чисел. Пусть А и В — два произвольных множества. Будем говорить, что между множествами А и В установлено взаимно однозначное соответствие, если каждому элементу множества А отвечает единственный элемент множества В, каждый элемент множества В сопоставлен некоторому элементу множества А и разным элементам множества А отвечают разные элементы множества В. Назовем два множества, для элементов каждого из которых определены правила упорядочения, сложения и умножения, изоморфными друг другу относительно этих правил, если между элементами этих множеств можно установить взаимна однозначное соответствие так, что если элементам а и Ъ первого множества соответствуют элементы а' и Ь' второго множества, то 1) элементы а' и Ь' связаны тем же знаком (>, < ил» = ), что и элементы а и Ъ\ 2) элементу а + Ь соответствует элемент а'+Ъ'; 3) элементу а-Ь соответствует элемент а'-Ь'. Аналогично можно было бы говорить не о правилах упорядочения, сложения и умножения, а о каких-либо других правилах, характеризующих соотношения между элементами, и вве- * Введение вещественных чисел с помощью дедекиндовых сечений изложено, например, в гл. 1 книги Ф. Франклина «Математический анализ» или в гл. 1 книги Г. М. Фихтенгольца «Основы математического анализа». ** Этот способ введения вещественнмх чисел принадлежит Кантору. Его изложение можно, например, найти в книге В. В. Немыцкого, М. И. Слудской и А. Н. Черкасова «Курс математического анализа», т. I, гл. II, а также в книге Я. Тагамлицкого «Дифференсиално смятане» (София, 1971).
§ 6. Дополнительные вопросы 55 сти понятие множеств, изоморфных друг другу относительно указанных правил. Примером двух множеств, изоморфных друг другу относительно правил упорядочения, сложения и умножения, служит множество рациональных чисел, введенных в виде отношения целых чисел, с соответствующими (см. п. 1 § 1) правилами упорядочения, сложения и умножения и множество рациональных \ чисел, записанных в виде бесконечных дробей с обычными правилами упорядочения, сложения и умножения вещественных чисел. Рассмотрим более внимательно два множества: множество всех рациональных чисел и множество всех вещественных чисел. Для каждого из этих множеств определены правила упорядочения, сложения и умножения и справедливы остальные из 16 основных свойств. Вместе с тем ясно, что множество всех вещественных чисел является более «широким», чем множество всех рациональных чисел, ибо в целом множество всех вещественных чисел не изоморфно относительно правил упорядочения, сложения и умножения множеству всех рациональных чисел *, I но в множестве вещественных чисел можно выделить часть, изоморфную относительно указанных правил множеству рациональных чисел. Естественно, возникает вопрос, нельзя ли и для множества всех вещественных чисел построить более «широкое» множество объектов, обладающее такими свойствами: 1) в этом более «широком» множестве определены правила упорядочения, сло- | жения и умножения и справедливы остальные из 16 основных ! свойств; 2) в целом более «широкое» множество не изоморфно относительно указанных правил множеству всех вещественных чисел; 3) в более «широком» множестве можно выделить часть, изоморфную относительно указанных правил множеству всех вещественных чисел. Мы докажем, что такого более «широко- | го» множества не существует, т. е. множество всех веществен- ' ных чисел является полным относительно правил упорядочения, ; сложения и умножения и остальных 16 основных свойств. I Вообще, произвольное множество объектов, для которого определены некоторые правила и справедливы некоторые свойства, называется полным относительно этих правил и свойств, если нельзя построить более «широкое» множество объектов такое, чтобы 1) в этом более «широком» множестве были опре- \ делены те же правила и справедливы те же свойства; 2) в целом это более «широкое» множество не было изоморфно данно- \ му относительно указанных правил; 3) в этом более «широком» * Это вытекает из того, что между множеством всех рациональных чисел -и всех вещественных чисел нельзя установить взаимно однозначное соответствие. В п. 3 § 7 будет доказано, что такого соответствия нет между рациональными числами и вещественными числами сегмента [0, 1]. Отсюда и вытекает требуемое утверждение.
56 Гл. 2. Вещественные числа множестве существовала часть, изоморфная данному множеству относительно указанных правил. Можно утверждать, что множество всех рациональных чисел не является полным относительно правил упорядочения, сложения и умножения и остальных 16 основных свойств, ибо существует более «широкое» множество (множество вещественных; чисел), удовлетворяющее требованиям 1), 2) 3) из только что сформулированного определения. Докажем теперь, что множество всех вещественных чисел является полным относительно правил упорядочения, сложения и умножения и остальных 16 основных свойств. Предположим противное, т. е. предположим, что существует более «широкое» множество объектов {х'} такое, что выполнены требования 1), 2), 3) из сформулированного выше определения, и обозначим через {х'} ту часть множества {х'}, котораяг изморфна относительно правил упорядочения, сложения и умножения множеству {л:} всех вещественных чисел. Заметим прежде всего, что у множества {х'} существует единственная пара элементов 0' и Г, играющих особую роль нуля и единицы*. Далее можно утверждать, что элементы 0' и V входят в состав множества {х'} и находятся во взаимно однозначном соответствии с вещественными числами 0 и 1 **. Пусть, а' — какой-либо элемент множества {х'}, не принадлежащий множеству {х'}. В силу правила упорядочения мы можем разбить все элементы множества {х'} на два класса — верхний и нижний, отнеся к верхнему классу все элементы х', удовлетворяющие неравенству х'>а', а к нижнему классу все элементы х', удовлетворяющие неравенству х'<а'. Оба эти класса не являются пустыми. В самом деле, докажем, например, что верхний класс не пуст. Повторив элемент Г слагаемым достаточное число раз, мы, в силу свойства 16°, получим элемент п' множества {х'}, удовлетворяющий неравенству п'~>а', т. е. принадлежащий верхнему классу. Из свойства 4° вытекает, что каждый элемент ниж- | него класса меньше любого элемента верхнего класса. * Если бы нашлись два элемента 0-1 и 02', играющие особую роль нуля, то- в силу свойства суммы мы получили бы 01,=01'+02'=02/+01'=02''> т. е. 02' = 0/. Аналогично доказывается единственность элемента Г, играющего особую роль единицы. ** Докажем, например, что нулевой элемент 0' множества {х'} принадлежит множеству {х'} и находится в соответствии с вещественным числом 0. Обозначим через 9 тот элемент множества {х'}, который находится в соответствии с вещественным числом 0, и заметим, что сумма 0+9 отвечает вещественному числу 0+0=0, и потому 9+9 = 9. С другой стороны, 0'+9=9 (па определению нулевого элемента (У). Из двух последних равенств заключаем, что 0+9 = 0'+ 9. Прибавляя к обеим частям полученного равенства элемент 9'. противоположный 0, и учитывая, что 9+9' = 0', получим 9+0'=0'+0', или (в силу свойства нулевого элемента) 9=0'. Аналогично проводятся рассуждения для единичного элемента.
§ 6. Дополнительные вопросы 57 В силу изоморфизма множества {х'} и множества {х} всех вещественных чисел можно утверждать, что множество всех вещественных чисел разбивается на два класса, причем каждое число из нижнего класса меньше любого числа из верхнего класса. Но что означает, что нижний класс вещественных чисел ограничен сверху и имеет (в силу теоремы 2.1) точную верхнюю грань М, а верхний класс имеет точную нижнюю грань т. Из определения точных граней вытекает, что обе грани рг и М заключены между вещественными числами, как угодно близкими между собой, а поэтому /га=М. Так как число т=М является одним из вещественных чисел, то оно принадлежит одному из классов, т. е. существует либо наименьший элемент в верхнем классе, либо наибольший элемент в нижнем классе. Докажем, что оба эти утверждения абсурдны. Пусть, например, существует наименьший элемент в верхнем классе вещественных чисел. Тогда существует наименьший элемент чп' и в верхнем классе, отвечающем разбиению множества {х'}. По определению верхнего класса т'>а'. Согласно свойствам суммы существует разность т'—а', причем согласно этим свойствам т'—а'ХУ. Но тогда в силу свойства 12° для элемента /га'—а' существует обратный, который в силу свойств произведения равен частному \'1{т'—а'). Согласно свойству 16° элемент V можно повторить слагаемым столько раз, что полученный при этом «целый» элемент га' будет принадлежать {х'} и удовлетворять неравенству л'>Г/(/га'—а). Из последнего неравенства в силу свойств произведения и суммы получим* /га' — >а\ (2.19) п' Так как элементы га', 1' и га' принадлежат множеству {х'}, то и элемент (/га' —) также принадлежит этому множеству и, I' очевидно, удовлетворяет неравенству /га' - </га'. Но тогда п' неравенство (2.19) означает, что в верхнем классе имеется элемент,- меньший /га', т. е. гаг" не является наименьшим элементом. Полученное противоречие доказывает полноту множества вещественных чисел **. 2. Аксиоматическое введение множества вещественных чисел. Для введения вещественных чисел мы использовали множество бесконечных десятичных дробей. Определив для множества этих дробей правило упорядочения и операции сложения и ум- * Эти свойства обеспечивают применимость всех правил алгебры. ** При доказательстве этой теоремы использовалась идея так называемого дедекиндова сечения. Дедекиндовым сечением в области рациональных чисел называется разбиение множества всех рациональных чисел на два непустых подмножества А и В таких, что любой элемент А меньше любого элемента В.
58 Гл. 2. Вещественные числа ножения, мы установили, что элементы этого множества обладают 16 основными свойствами и, кроме того, свойством полноты относительно 16 основных свойств. Описанный способ введения вещественных чисел, хотя и обладает несомненными эвристическими и методическими достоинствами, не является единственно возможным и целесообразным с научной точки зрения. Для окончательного оформления и полного логического завершения наших представлений о вещественных числах более предпочтительным является аксиоматический метод введения этих чисел. Этот метод заключается в следующем. Множество вещественных чисел вводится как совокупность объектов*, удовлетворяющих 17 аксиомам, в качестве которых берутся 16 основных свойств и аксиома о полноте относительно 16 указанных свойств. Впредь мы будем называть упомянутые 17 аксиом аксиомами вещественного числа. Конкретной реализацией совокупности объектов, удовлетворяющих 17 аксиомам вещественного числа, и является изученное нами выше множество бесконечных десятичных дробей. Возможны и другие реализации указанной совокупности объектов. Имеет место следующее замечательное утверждение: Любая реализация совокупности объектов {х'}, удовлетворяющих 17 аксиомам вещественного числа, изоморфна изученному выше множеству {х} бесконечных десятичных дробей. Доказательство этого утверждения можно найти в книге В. А. Ильина и Э. Г. Позняка: «Основы математического анализа», ч. 1 (М., Наука, 1982, с. 608—612), а также в книге В. А. Ильина, В. А. Садовничего и Бл. X. Сендова «Математический анализ» (М., Наука, 1979, с. 65—69). Подчеркнем, что аксиоматический метод и понятие изоморфных (в различных смыслах) совокупностей объектов широко, используются в разнообразных разделах современной математики и физики (при построении геометрии, теории вероятностей, классической механики, статистической физики, квантовой механики** и др. разделов). В заключение заметим, что в геометрии множество точек прямой вводится как совокупность объектов, удовлетворяющих некоторым аксиомам, среди которых фундаментальную роль играет аксиома о полноте этой совокупности относительно остальных аксиом. Упомянутые аксиомы позволяют установить * При этом ничего не предполагается о природе этих объектов. ** Так, квантовая механика первоначально возникла в виде двух внешне различных теорий: «матричной механики» Гейзенберга и «волновой механики» Шредингера. Позже было доказано, что эти две теории используют две изоморфные друг другу конкретные реализации одной общей совокупности объектов, вводимой аксиоматически и называемой абстрактным гильбертовым пространством.
§ 7. Элементы теории множеств 59 г взаимно однозначное соответствие между множеством точек ; прямой и множеством всех вещественных чисел *. Это соответствие позволяет изображать вещественные числа точками на прямой (числовой оси), чем мы будем широко пользоваться в | иллюстративных целях. § 7. ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ 1. Понятие множества. В предыдущих параграфах при изучении теории вещественных чисел важным понятием являлось понятие множества. Подчеркнем, что множество мы рассматривали как начальное понятие, неопределяемое через другие. В этом параграфе мы будем изучать множества произвольной природы, или, как говорят, абстрактные множества. Это означает, что объекты, составляющие данное множество, или, как говорят, элементы данного множества, уже не обязаны быть вещественными числами. Элементами абстрактного множества могут быть, например, функции, буквы алфавита, фигуры на плоскости и т. д. В математике обычно вводят множество как совокупность объектов любой природы, обладающих определенным свойством. Множества мы будем обозначать прописными буквами А, В, ... или X, У, ... и т. п., их элементы — малыми буквами а, Ь, ... или х, у,... и т. п. Утверждение «элемента принадлежит множеству Л» будем записывать в виде аеЛ, если же элемент а н е принадлежит множеству А, то будем писать, что оеА или а^А. Если рассматриваются два произвольных множества Л и В и известно, что все элементы множества В содержатся в множестве Л, то В называется подмножеством множества Л и обозначается этот факт так: ВсЛ. При этом говорят, что множество В включается в множество Л. (Заметим, что при этом возможен случай В = А, т. е. случай, когда каждый элемент множества В принадлежит множеству А и, наоборот, каждый элемент множества Л принадлежит множеству В.) В дальнейшем удобно будет рассматривать множества, являющиеся подмножествами некоторого фиксированного множества Е. Если множество вводится как совокупность объектов, обладающих некоторым свойством, причем оказывается, что объектов, обладающих указанным свойством, не существует, то множество называется пустым и обозначается символом 0. Таким образом, пустое множество — это множество, не содержащее ни одного элемента. Пустое множество является подмножеством любого множества. Заметим, что когда речь идет о некотором выборе элементов, для которых ранее было введено обозначение, скажем, о наборе * См. книгу В. А. Ильина и Э. Г. Позняка «Аналитическая геометрия» (М., Наука, 1981; приложение в конце книги).
60 Гл. 2. Вещественные числа элементов х, то данная совокупность или данное множество может обозначаться и так {х} (говорят —«множество элементов «икс»). Далее, если X — какое-то множество, а Р — определенное свойство, то запись {х^Х:Р(х)} или {х^Х\Р(х)} обозначает множество элементов х, обладающих свойством Р. Например, если обозначить через Й = {х} множество натуральных чисел: 1, 2, 3, ..., то запись {х^Ы : х2—4=0} означает множество корней уравнения х2—4 = 0, являющихся натуральными числами. В данном случае это множество состоит из одного элемента: 2. Таким образом, {х^Ы:х2—4 = 0} = 2. Множество всех тех вещественных чисел {х}, которые одновременно удовлетворяют двум условиям: х<1 и 2<х, является пустым. Пустым является и множество {х^Е.хФх}. 2. Операции над множествами. Суммой (или объединением) двух множеств А и В называется третье множество С, состоящее из элементов, принадлежащих хотя бы одному из множеств А и В. Сумма двух множеств обозначается так: С^=А[}В. Аналогично определяется сумма А любого числа множеств Аа. В этом случае пишут А = {]Аа, что и означает, что множество А состоит из а элементов, принадлежащих хотя бы одному А,,;. Заметим, что не следует путать понятие суммы двух множеств с понятием суммы двух вещественных чисел. Например, если мы рассматриваем множества Л = {1}, В = {2}, т. е. множества, состоящие всего из одного элемента: в первом случае из единицы, во втором из числа два, то С = А[}В = {1; 2} есть множество, состоящее из двух элементов — чисел 1 и 2. Ясно, что при этом 1 + 2 = 3 не является даже элементом множества С. Пересечением двух множеств А и В называется третье множество С, состоящее из элементов, принадлежащих как множеству А, так и множеству В, т. е. из элементов, общих для множеств А и В. Пересечение С двух множеств А и В обозначается так: С=А(]В. Аналогично определяется пересечение С произвольного числа множеств Аа: С=(]Аа, т. е. множество С, состоящее из элементов, принадлежащих, каждому множеству Аа. Разностью С=А\В двух множеств А и В называется множество, состоящее из элементов А, не принадлежащих В. Заметим, что если рассматриваемые множества являются подмножествами некоторого фиксированного множества Ё, то разность А' = Е\А называется дополнением множества А или дополнением до Е множества А. Подчеркнем также, что понятие разности двух множеств также не следует путать с понятием разности двух вещественных чисел. Дополнительные сведения о свойствах операций над множествами и понятие отображения множеств будут даны в п. 4 в конце настоящего параграфа.
§ 7. Элементы теории множеств 6Р 3. Счетные и несчетные множества. Несчетность сегмента [0, 1]. Мощность множества. Важным вопросом при изучении множеств» является вопрос о том, как сравнивать между собой два множества, имея в виду «количество» элементов, в них содержащихся. Если мы имеем два множества, каждое из которых содержит конечное число элементов, то элементы в этих множествах мы можем просто каким-нибудь способом занумеровать. При этом может- оказаться, что в первом и втором множествах содержится одина* ковое число элементов. Назовем такие два множества, содержащие конечное и одинаковое число элементов, эквивалентными. Если в одном из рассматриваемых множеств элементов окажется больше, то мы будем говорить, что оно имеет большую» мощность, чем другое из рассматриваемых множеств. Обратимся теперь к множествам, состоящим из, вообще говоря, бесконечного числа элементов. Примерами таких множеств являются множество рациональных чисел или множество вещественных чисел, лежащих на сегменте [0, 1]. Назовем два множества А и В эквивалентными, если между ними существует взаимно однозначное соответствие, т. е. каждому элементу аеЛ отвечает единственный элемент ЬеВ, каждый, элемент Ь^В сопоставлен некоторому элементу а^А и разным элементам множества А отвечают разные элементы множества В. Взаимно однозначное соответствие называют иногда биективным соответствием. В частности, множества, содержащие конечное число элементов, эквивалентны тогда и только тогда, когда они содержат одинаковое число элементов; Эквивалентность множеств А и В обозначается так: А~В. Покажем, например, что множество Я = {г} рациональных чисел и множество Л^={«} натуральных чисел эквивалентны. Заметим сначала, что для любого целого кфО два рациональных числа гп/п и пгк/пк являются одинаковыми (здесь я=И=0). Поэтому всякое- рациональное число г можно записать в виде г= — (^ > О)* я и дробь считать несократимой. Число 0 будем считать записанным одним способом: 0 = —. Назовем число к=\р\+д высотой рационального числа р/д.. Ясно, что рациональных чисел г, имеющих данную высоту, конечное число. Будем нумеровать натуральными числами 1, 2, 3, ■ .... рациональные числа по возрастанию высоты, т. е. сперва занумеруем все рациональные числа высоты Л=1. Такое число только- одно: 0. Этому рациональному числу припишем индекс 1, т. е.- поставим ему в соответствие натуральное число 1. Затем занумеруем рациональные числа высоты Н = 2. Таких чисел два: 1 =
"62 Гл. 2. Вещественные числа -и 1 = . Первому из них поставим в соответствие натуральное число 2 (т. е. занумеруем его индексом 2), второму — число 3. После этого занумеруем рациональные числа высоты 3 и т. д. Ясно, что при этом мы установим взаимно однозначное соответствие между всеми рациональными числами и всеми натуральными числами, т. е. Н~М. Введем понятие счетного множества. Определение 1. Множество называется счетным, если оно эквивалентно множеству натуральных чисел. Согласно этому определению и рассуждениям, проведенным гвыше, мы получаем, что множество рациональных чисел является •счетным множеством. Докажем следующие два простых утверждения о счетных множествах. Утверждение 1. Всякое непустое подмножество счетного множества является или множеством, состоящим из конечного числа элементов, или множеством счетным. Доказательство. Пусть А — исходное счетное множество, т. е. А ~ Л^ — множеству натуральных чисел. Это означает, что элементы множества А можно занумеровать каким-нибудь способом. 'Расположим элементы множества А в виде последовательности: и\, а% ..., ап, .... Пусть В — непустое подмножество множества А. Рассмотрим последовательно элементы аи а2, аз, — множества А. "Если а^В, то этот элемент мы обозначим через Ь\\ если а^В, мы переходим к рассмотрению элемента а2. При рассмотрении •элемента а2 могут представиться две возможности: а) элемент а,2^В; если при этом было выполнено, что и а\<=В, то элемент а2 ?мы обозначим через Ь2; если же а^еВ, то элемент аа обозначается через Ь\\ б) элемент а^В, тогда переходим к рассмотрению элемента а3 и т. д. Ясно, что при этом может случиться, что все элементы множества В будут расположены в виде конечной последовательности: Ь\, Ьч Ьм (М<оо). В этом случае множество В ^состоит из конечного числа элементов. Если этого не случится, то мы выпишем все элементы множества В в виде бесконечной последовательности элементов Ь\, Ь% ..., Ьп, ..., откуда следует, что множество В счетное. Утверждение доказано. Утверждение 2. Сумма любой конечной или счетной совокупности счетных множеств есть множество счетное. Доказательство. Рассмотрим, например, случай, когда шмеется счетная совокупность счетных множеств. Пусть А\, А2, А3, ...—совокупность множеств, каждое из которых счетно. Расположим элементы множеств А\, А% Аъ, ... в виде последователь- щостей:
§ 7. Элементы теории множеств 63? А) - {а„ , а,2 , а„, . . .], Л2 = \а21 } агг ; о23, . . #|; А» = 1%; , о,2 ,- а„, . . .}, 00 Пусть Л = у Л„. Произведем нумерацию элементов а множена ства А = {а) следующим образом*: С1 = аи, а2=а2ь аз=а12, а4=а3ь а5=а22, «6=013 и т. д. У некоторых множеств Л, и Л/ могут оказаться общие элементы- (при 1Ф}). В этом случае мы их учитываем только один раз. Таким образом, элементы множества Л можно занумеровать* т. е. поставить во взаимно однозначное соответствие с множеством натуральных чисел N. т. е. Л счетно. Утверждение доказано. Возникает вопрос: существуют ли бесконечные несчетные мно-. жества, т. е. такие бесконечные множества, которые нельзя поставить во взаимно однозначное соответствие с множеством натуральных чисел? Ответ содержится в доказываемой ниже теореме. Теорема 2.2. Множество всех точек сегмента [О, 1] несчетно. Доказательство. Рассмотрим интервал (О, 1). Очевидно,, что если мы докажем, что интервал (0,1) несчетен, то и сегмент- [О, 1] будет несчетен, так как множество точек сегмента [О, 1] отличается от множества точек интервала (0,1) всего двумя точками: О и 1. Итак, докажем, что множество точек интервала (0, 1) несчетно. Допустим противное, т. е. предположим, что все вещественные числа интервала (0, 1) можно занумеровать. Записывая все числа интервала • (0, 1) в виде бесконечных: десятичных дробей, получим, что ^1 = 0, апа\2...а\п..., *2 = 0, 021022 — аоп ... , Хп — I), (1п\Оп2 ... Опп ■■• , Рассмотрим на интервале (0,1) вещественное число х=0, Ьф2... ... Ьп..., где Ь\ — любая цифра, отличная от ап, 0 и 9; Ь2 — любая* цифра, отличная от йгг, 0 и 9; и т. д.; Ъп — любая цифра, отличная от аПп, 0 и 9. Достаточно доказать, что число х не совпадает ни с одним из чисел Х\, х% ..., хп, .... Число х не содержит после запятой нулей и девяток, т. е. это число не принадлежит классу ра- * В записи всех элементов множеств А\, Аг приведенной выше, стрелки? указывают порядок, в котором мы производим нумерацию.
«64 Гл. 2. Вещественные числа циональных чисел, представимых двумя способами в виде бесконечных десятичных дробей. В таком случае число х допускает единственное представление в виде бесконечной десятичной дроби и оно отлично от всех чисел х\, х% ..., хп, ■■■, ибо совпадение чис- ,ла х с каким-либо числом хп означало бы совпадение Ъп и апп- Таким образом, интервал (0, 1), а вместе с тем и сегмент [0, 1] несчетен. Теорема доказана. Определение 2. Множество, эквивалентное- множеству точек сегмента [0, 1], называется множеством мощности континуума. Из доказанной теоремы 2.2 следует, что множества мощности континуума и счетные множества не являются эквивалентными между собой множествами. В частности, из теоремы 2.2 следует, что существуют иррациональные числа, так как уже на сегменте :[0, 1] не все числа рациональны: в противном случае их можно было бы перенумеровать. Из теоремы 2.2 также следует, что иррациональных чисел несчетное множество, так как если бы их было счетное множество или конечное число, то по утверждению 2 и всех чисел — рациональных и иррациональных — было бы счетное множество. Рассмотрим два произвольных множества А и В. Если эти множества являются эквивалентными, то мы будем говорить, что они имеют одинаковую мощность или являются равномощными. Для обозначения равномощности множеств А и В используют следующую символику: т(А)=ш(В)*. Если множество А эквивалентно некоторому подмножеству множества В и при этом множество А не содержит подмножест- ва, эквивалентного множеству В, то будем говорить, что мощность множества А меньше мощности множеств а В. Для обозначения того, что мощность множества А меньше мощности В, используют следующую символику: пг(А)<т(В). Например, из данного выше определения множества мощности континуума, из теоремы 2.2 и из утверждения 1 о счетных множествах следует, что мощность счетного множества меньше мощности множества сегмента [0, 1], т. е. мощности континуума. Итак, нами введено сравнение мощностей двух множеств. Л.огически возможны еще два случая: * Величину т(А), представляющую собой общую характеристику класса всех эквивалентных множеству А множеств, принято называть кардинальны м ч и с л о м. В частности, если А состоит из конечного числа элементов, то т(А) равно количеству элементов этого множества.
§ 7. Элементы теории множеств 65 следовательность точек а) Множество Л содержит подмножество, эквивалентное множеству В, а множество В содержит подмножество, эквивалентное Л. б) Множества Л и В не эквивалентны, и ни одно из них не содержит подмножества, эквивалентного другому множеству. Нетрудно доказать, что в случае а) множества Л и В будут эквивалентны. Случай же б) на самом деле невозможен. Заметим еще, что трудной проблемой оказался вопрос о существовании множества промежуточной мощности между мощностью счетных множеств и мощностью континуума. Оказалось, что утверждение как о существовании, так и об отсутствии множества промежуточной мощности не противоречит аксиомам теории множеств и не может быть выведено из них. Тем самым это утверждение является одной из аксиом аксиоматической теории множеств. В заключение докажем, что сегмент [0, 1] и интервал (0, 1) — эквивалентные или, что то же, равномощные множества. Для этого установим взаимно однозначное соответствие между их элементами. Выберем на сегменте [0, 1] и интервале (0, 1) по- ±. ± _!_ 1 2 ' з"""' « '•""Г Точке 0 сегмента [0, 1] поставим в соответствие точку — интервала (0, 1), точке 1 сегмента [0, 1] поставим в соответствие точку — интервала (0, 1), далее точке— сегмента [О, 1] поставим в соответствие точку — интервала (0, 1) точке — сегмента [0, 1] поставим в соответствие точку п интервала (0, 1), л>2. Всем остальным точкам сегмента (т. е. точкам, отличным от 0,1 и не принадлежащим-выбранной последовательности) ставятся в соответствие те же точки иНт тервала, т. е. точки, имеющие те же абсциссы. Таким образом, взаимно однозначное соответствие между сегментом [0, 1] и интервалом (0, 1) установлено. 4. Свойства операций над множествами. Отображение множеств. Отметим ряд свойств, введенных выше операций над множествами. Отношение включения двух множеств обладает следующими свойствами: 1°) Ас:А; 2°) если АаВ и ВаА, то А = В; 3°) если ВаА и ЛсгС, то ВаС; 4°) 0с=Л для любого множества Л. 3 Зак. 72
66 Гл. 2. Вещественные числа Операции суммы (объединения) и пересечения множеств обладают следующими, непосредственно проверяемыми свойствами: 5°) ([}Аа)[\В = [}(Аа(]В) (дистрибутивность пересечения); а а 6°) (Г\Аа)[)В — (](Аа1}В) (дистрибутивность объединения); а а 7°) АаВ эквивалентно условиям А\]В = В или А[\В=А. Напомним, что для подмножеств {А} некоторого фиксированного множества Е мы ввели операцию дополнения Л' = =.Е\Л. Очевидно эта операция удовлетворяет следующим свойствам: 8°) АЦА' = Е, А()А' = 0; 9°) 0'=Е, Е' = 0; Ю°) №*)' = №; 11°) (ПЛ„)' = 1)Ла. а а Последние два свойства суть правила де Моргана *. Симметрической разностью двух множеств А и В назовем множество С(А{]В)\(А(]В). Симметрическая разность множеств А я В обозначается символом ААВ. Легко видеть, что ААВ =(А\В)[)(В\А). Важнейшим понятием в анализе является понятие отображения одного множества в другое. Пусть X и У—какие-то множества. Если в силу некоторого закона I каждому элементу х^Х соответствует элемент (/=/(х)еУ, то говорят, что задано отображение / множества X в множество У. Записывают этот факт в виде /:Х->У или Х-+У. В этом случае элемент у = Цх) называют образом элемента х или значением / на элементе х, а элемент х — прообразом или одним из прообразов элемента у. Часто элемент хеХ называют переменным или аргументом отображения /. Образом множества ЛсХ при отображении /: Х-»У называют множество всех таких элементов из У, которые являются образами элементов жеЛ. Это множество обозначается символом /(Л). Если ВсгУ, то прообразом (или полным прообразом) множества В называют совокупность всех элементов х^Х таких, что Дх)еВ. Прообраз множества В обозначается символом /-' (В). Отображение /:Х->-У иногда удобно называть функцией с областью определения X и областью (или множеством) значений /(Х)сУ. В некоторых разделах математики в зависимости от природы множеств X и У и свойств ^ отображение I называется оператором, функционалом и т. д. * А. де Морган — шотландский математик (1806—1871).
§ 7. Элементы теории множеств 67 Про отображение $:Х-+У говорят, что оно сюръективно (или является отображением X на У), если ДХ)=У; инъективно (или является вложением), если для любых элементов х\, Х2 множества X из условия /(*0 =/(*а) вытекает, что Х[ = х2, т. е. различные элементы имеют различные образы; биективно (или взаимно однозначно), если оно сюръективно и инъективно одновременно. Если отображение {:Х->У биективно, то, как мы отмечали в п. 3, множества X и У называются эквивалентными (или равномощными). В случае биекции /: Х-+-У можно определить обратное отображение /~' : У-уХ по правилу: если при отображении } элементу х^Х соответствует элемент г/еУ, то /~'(#) полагается равным элементу х. Для любого у^У в силу сюръективности отображения / элемент /-1(У) всегда существует, а ввиду инъективности отображения / этот элемент/-1 (у) единственен. 3*
Глава 3 ТЕОРИЯ ПРЕДЕЛОВ В гл. 1 уже указывалось, что одной из основных операций математического анализа является операция предельного перехода и что эта операция встречается в курсе анализа в различных формах. В настоящей главе изучаются простейшие формы операции предельного перехода. Мы начинаем с изучения самой простейшей формы операции предельного перехода, основанной на понятии предела так называемой числовой последовательности. Понятие предела числовой последовательности облегчит нам введение и другой весьма важной формы операции предельного перехода, основанной на понятии предельного значения (или, короче, предела) функции. В конце главы дается общее определение предела функции по базе. § 1. ПОСЛЕДОВАТЕЛЬНОСТЬ И ЕЕ ПРЕДЕЛ 1. Понятие последовательности. Арифметические операции над последовательностями. Понятие числовой последовательности известно из курса средней школы. Примерами числовых последовательностей могут служить: 1) последовательность всех элементов арифметической или геометрической прогрессии; 2) последовательность периметров правильных л-угольников, вписанных в данную окружность; 3) последовательность рациональных чисел «1 = 0,3, #2 = 0,33, л:з = 0,333, ..., приближающих число 1/3. Если каждому значению п из натурального ряда чисел 1, 2, ... ..., п, ... ставится в соответствие по определенному закону некоторое вещественное число хп, то множество занумерованных вещественных чисел Х\, Х2, ... , Хп, — (3-1) мы и будем называть числовой последовательностью или просто последовательностью. Отдельные числа хп мы будем называть элементами или членами последовательности (3.1). Для сокращенной записи последовательности (3.1) будем использовать символ {хп}. Так, например, символ |—— | обозначает последовательность 1, 1/22, 1/32, ..., 1/л2, ..., а символ {1 + (—1)"} обозначает последовательность 0, 2, 0, 2
§ 1. Последовательность и ее предел 69 Рассмотрим наряду с последовательностью (3.1) еще одну последовательность Уи У2, ..., Уп, ... ■ (3.2) Назовем последовательность Х1 + у\, Х2+У2, —, хп+Уп, ... суммой последовательностей (3.1) и (3.2), последовательность х\—Уи Х2—г/г, — , хп—уп, ... — разностью последовательностей (3.1) и (3.2), последовательность х\-уи х2-у2, ..., хп-Уп, •••— произведением последовательностей (3.1) и (3.2) и, наконец, последовательность ——, ——, .... ——, ... — частным последо- У\ Уг Уп вательностей (3.1) и (3.2). Конечно, при определении частного последовательностей (3.1) и (3.2) необходимо требовать, чтобы все элементы последовательности (3.2) были отличны от нуля. Заметим, однако, что если у последовательности {уп} обращается в нуль лишь конечное число элементов, то частное I—— I можно определить с того номера, ( Уп ) начиная с которого все элементы уп отличны от нуля. 2. Ограниченные, неограниченные, бесконечно малые и бесконечно большие последовательности. Совокупность всех элементов произвольной последовательности {хп} образует некоторое числовое множество. Отправляясь от понятий ограниченного сверху, снизу или с обеих сторон множества, мы приходим к следующим определениям. Определение 1. Последовательность {хп} называется ог- р а ничейной сверху (с низ у), если существует вещественное число М (вещественное число пг) такое, что каждый элемент этой последовательности хп удовлетворяет неравенству Хп^М (д:п>/и). При этом число М (число пг) называется верхней гранью (нижней гранью) последовательности {хп}, а неравенство х„«:М (х„»т) называется условием ограниченности этой последовательности сверху (снизу). Отметим, что любая ограниченная сверху последовательность имеет бесконечное множество верхних граней * и что в условии ограниченности последовательности сверху хп<М в качестве М может браться любая из верхних граней. Аналогичное замечание относится и к нижним граням ограниченной снизу последовательности. Определение 2. Последовательность {хп} называется ограниченной с обеих сторон (или просто ограниченной), если она ограничена и сверху, и снизу, т. е. если существуют два * В самом деле, если число М — одна из верхних граней, то в силу свойства транзитивности знаков >и = и любое.яисло М*, большее М, является верхней гранью.
70 Гл. 3. Теория пределов вещественных числа Мит такие, что каждый элемент этой последовательности хп удовлетворяет неравенствам т<хп<М. (3.3) При этом числа т и М называются соответственно нижней и верхней гранями последовательности {хп}, а неравенства (3.3) называются условием ограниченности последовательности {Хп}- Подчеркнем, что в условии ограниченности (3.3) могут фигурировать любая нижняя и любая верхняя грани последовательности. Определение ограниченности последовательности требует существования хотя бы одной пары вещественных чисел т и М таких, что для любого элемента последовательности хп справедливы неравенства (3.3). Заметим, что условие ограниченности последовательности можно записать не только в форме удовлетворения неравенствам (3.3), но и в другой эквивалентной форме: последовательность {хп} является ограниченной тогда и только тогда, когда существует положительное вещественное число А такое, что каждый элемент последовательности хп удовлетворяет неравенству Ы<А. (3.4) В самом деле, если каждый элемент хп удовлетворяет неравенству (3.4), то, положив т = —А, А[=+А, мы получим, что хп удовлетворяет неравенствам (3.3). Если, наоборот, каждый элемент хп удовлетворяет неравенствам (3.3), то, обозначив через А наибольшее из двух чисел \т\ и |Л1|, мы можем утверждать, что хп удовлетворяет неравенству (3.4). В соответствии с определением 2 ограниченной последовательности и условием ограниченности, взятым в форме (3.4), мы можем определить понятие неограниченной последовательности. Последовательность {хп} называется неограниченной, если для любого положительного вещественного числа А * найдется хотя бы один элемент последовательности хп, удовлетворяющий неравенству \хп\>А. (3.5) С точки зрения этого определения всякая последовательность, которая ограничена только сверху или только снизу, является неограниченной. Так, например, последовательность 1, 2, 1, 4, ..., 1, 2га, ... ограничена только снизу и является неограниченной: какое бы положительное вещественное число А мы ни взяли, найдется элемент этой последовательности с четным номером, удовлетворяющий неравенству (3.5). * Сколь бы большим, мы ни взяли это число.
§ 1. Последовательность и ее предел 71 Последовательность | — I, очевидно, является ограниченной: каждый элемент этой последовательности удовлетворяет неравенствам (3.3) при любых т<0 и Л1>1. Введем теперь понятия бесконечно большой и бесконечно малой последовательностей. Определение 3. Последовательность {хп} называется бесконечно большой, если для любого положительного вещественного числа А* найдется номер N такой**, что при всех п>-Ы элементы хп этой последовательности удовлетворяют неравенству (3.5). Очевидно, что всякая бесконечно большая последовательность является неограниченной, ибо определение бесконечно большой последовательности требует, чтобы для любого Л>0 неравенству (3.5) удовлетворяли все элементы последовательности, начиная с некоторого номера Ы, а определение неограниченной последовательности требует, чтобы для любого Л>0 неравенству (3.5) удовлетворял хотя бы один элемент последовательности. Вместе с тем не всякая неограниченная последовательность является бесконечно большой. Так, например, рассмотренная выше последовательность 1, 2, 1, 4, ..., 1, 2п, ..., будучи неограниченной, не является бесконечно большой, ибо для любого Л>1 неравенство (3.5) не имеет места для элементов хп со сколь угодно большими нечетными номерами п. Определение 4. Последовательность {а„} *** называется бесконечно малой, если для любого положительного вещественного числа е **** найдется номер N такой*****, что при всех п>>Ы элементы а„ этой последовательности удовлетворяют неравенству |а„|<е. (3.6); Докажем, что последовательность ц, а2, ..., цп, ... является бесконечно большой при \а\~>\ и бесконечно малой при М<1. Пусть сначала |<7|>1. Тогда |<7| = 1+6\ где 6>0. Используя формулу бинома Ньютона, можем записать |<7|Л'= (1 + 6)^=1+N6 + (положительные члены). Отсюда следует неравенство М">бЛГ. (3.7) * Сколь бы большим мы ни взяли это число. ** Так как этот номер N. вообще говоря, зависит от А, то иногда пишут: N=N(А). *** Элементы бесконечно малых последовательностей мы будем стремиться обозначать греческими буквами. **** Сколь бы малым мы ни взяли это число. ***** Так как этот номер N. вообще говоря, зависит от 8, то иногда пишут: #=Ще).
72 Гл. 3. Теория пределов Фиксируем произвольное положительное число А и выберем по нему номер N такой, чтобы было справедливо неравенство 8Ы>А. (3.8) Убедимся в том, что по любому А>0 можно выбрать номер Ы, удовлетворяющий неравенству (3.8). Договоримся обозначать символом [х] целую часть положительного вещественного числа х. А Поскольку неравенство (3.8) эквивалентно неравенству N > —, то этому неравенству заведомо будет удовлетворять номер Ы, выбранный из условия N — — + 1 = —| + 1. Заметим теперь, что поскольку |<7|>1, то из свойств произведения вещественных чисел мы получим, что при всех л>ЛГ |<7|«>|<7|». (3.9) Сопоставляя неравенства (3.7), (3.8) и (3.9), мы получим, что для любого Л>0 найдется номер такой, что при всех /г>ЛГ |<Г|Ч<7|">А. Это и доказывает, что при |^|>1 последовательность {<7П} является бесконечно большой. Рассмотрим теперь случай |?|<1. Мы должны доказать, что в этом случае последовательность {^п} является бесконечно малой. Исключая тривиальный случай <7 = 0, положим =1 + 6, где \я\ 6>0. Используя, как и выше, бином Ньютона, мы вместо (3.7) получим неравенство -1>6#, или |<7^<-1_. (3.7') \Ч\ . «7^ Фиксируем произвольное положительное число е и выберем по нему номер N такой, чтобы было справедливо неравенство <е. (3.8') 6# В силу того, что неравенство (3.8') эквивалентно неравенству N > ——, для выбора указанного номера достаточно положить N = еб + 1 = \Я\ + 1. Далее, поскольку, в силу е(1-М) ] ;стве :тво \Ч\П<\Ч\", (3-9') свойств произведения вещественных чисел, при |?|<1 для всех п>Ы справедливо неравенство
§ 1. Последовательность и ее предел 73 то из сопоставления неравенств (3.7'), (3.8') и (3.9') мы получим, что для любого е>0 найдется номер N = — —— + 1 I е(1 — |?|) . такой, что при всех п>-Ы справедливо неравенство |<Г| = |<7|я<в. Это и доказывает, что при | ц | < 1 последовательность является бесконечно малой. 3. Основные свойства бесконечно малых последовательностей. Теорема 3.1. Сумма {ап + М двух бесконечно малых последовательностей {ап} и {рп} представляет собой бесконечно малую последовательность. Доказательство. Фиксируем произвольное положительное число е. Так как последовательность {ап} является бесконечно малой, то для положительного числа е/2 найдется номер Л^ такой, что при я>Л^ справедливо неравенство |ап|<в/2. (3.10) Аналогично, так как последовательность {[}„} является бесконечно малой, то для положительного числа е/2 найдется номер .Л/г такой, что при л>Лг2 справедливо неравенство |Р»|<е/2. (3.11) Обозначим через N наибольший из двух номеров ЛГ1 и Ы2. Тогда при га>Л/ будут справедливы оба неравенства (3.10) и (3.11). Учитывая, что модуль суммы двух чисел не превосходит суммы их модулей, мы получим, что для всех номеров п>-Ы |ая + ря|<|ай| + |р«|. (3.12) Из соотношений (3.12), (3.10) и (3.11) вытекает, что при п^Ы справедливо неравенство |а„ + рп|<е. Это и означает, что последовательность {ап + Р«} является бесконечно малой. Теорема доказана. Теорема 3.2. Разность {ап—Р«} двух бесконечно малых последовательностей {ап} и {рп} представляет собой бесконечно малую последовательность. Доказательство этой теоремы отличается от "доказательства теоремы'3.1 только тем, что вместо неравенства (3.12) следует взять неравенство |а„—р«|<|ап| + |рл|. Следствие. Алгебраическая сумма любого конечного числа бесконечно малых последовательностей представляет собой бесконечно малую последовательность.
74 Гл. 3. Теория пределов Теорема 3.3. Произведение ограниченной последовательности на бесконечно малую последовательность представляет собой бесконечно малую последовательность. Доказательство. Пусть {хп} — ограниченная и {а„} — бесконечно малая последовательности. По определению ограниченной последовательности найдется вещественное число Л>0 такое, что для всех элементов хп справедливо неравенство \хп\<А. (3.13) Фиксируем произвольное положительное число е. Так как последовательность {ап} является бесконечно малой, то для положительного числа г/А найдется номер N такой, что при п>-Ы справедливо неравенство |а„|<е/А (3.14) Учитывая, что модуль произведения двух чисел равен произведению модулей этих чисел, мы получим с помощью неравенств (3.13) и (3.14), что для всех л>Л/1 \Хп-ап\ = \хп\-\ап\<А-— =е. Это и означает, что последовательность {хп-ап} является бесконечно малой. Теорема доказана. Теорема 3.4. Всякая бесконечно малая последовательность является ограниченной-. Доказательство. Пусть {ап} — бесконечно малая последовательность. Фиксируем некоторое положительное число е. По определению бесконечно малой последовательности найдется отвечающий этому е номер N такой, что |ап|<е для всех номеров п^>N. Обозначим через А наибольшее из следующих Л/1 чисел: е, |«1|, | а,21, ..., |а^-1|. Тогда очевидно, что |а„|<Л для всех номеров п, а это и означает ограниченность последовательности {ап}. Теорема доказана. Следствие из теорем 3.3 и 3.4. Произведение двух (и любого конечного числа) бесконечно малых последовательностей представляет собой бесконечно малую последовательность. Теорема 3.5. Если все элементы бесконечно малой последовательности {ап} равны, одному и тому же числу с, то с = 0. Доказательство. Допустим, что сфО. Обозначим через е положительное число е=|с|. По определению бесконечно малой последовательности для указанного е=|с| найдется номер N такой, что |ап|<|с| при всех п>ЛЛ Но неравенство |ап|<|с| (в силу того, что все ап равны с) превращается в заведомо абсурдное неравенство |с|<|с|. Следовательно, наше допущение сФО не имеет места, и теорема доказана. Теорема 3.6. Если {хп} — бесконечно большая последовательность, то, начиная с некоторого номера п, определено частное
§ 1. Последовательность и ее предел 75 ш двух последовательностей {1} * и {хп}, которое представляет собой бесконечно малую последовательность. Если все элементы бесконечно малой последовательности {ап} отличны от нуля, то частное I 1 двух последовательностей {1} и {ап} представляет I а„ ) собой бесконечно большую последовательность. Доказательство. Докажем сначала первую часть теоремы. Заметим, что у бесконечно большой последовательности {хп} лиш» конечное число элементов может быть равно нулю. В самом деле, по определению- бесконечно большой последовательности для числа А = \ найдется номер К* такой, что |#Л|>Л=1 для всех п>Ы*. Значит, при л>М* все элементы хп не обращаются в нуль, и мы можем, начиная с номера И*, рассматривать частное | \ [ хп I последовательностей {1} и {хп}- Докажем, что это частное является бесконечно малой последовательностью. Фиксируем произвольное положительное число е. По определению бесконечно большой 1 последовательности для положительного числа — найдется но- 8 мер N (этот номер мы возьмем таким, чтобы он превосходил ЛР) такой, что \х„\ >— при п^Ы или, что то же самое, 8 ХП = < е при л>Л/. Это и означает, что последовательность \хп\ I — 1 является бесконечно малой. I *п ) Для доказательства второй части теоремы предположим, что все элементы бесконечно малой последовательности {ап} отличны от нуля. Фиксируем произвольное положительное число А. Так как {ап} является бесконечно малой последовательностью, то для положительного числа — найдется номер N такой, что |а„| < — А А при п^Ы или, что тоже самое, 1 ап >Л при п>Ы. |ал| Это и означает, что последовательность | — 1 является бесконечно (<*п> большой. Теорема доказана. 4. Сходящиеся последовательности и их свойства. Введем фундаментальное понятие сходящейся последовательности и ее предела. Определение 1. Последовательность {х„} называется сходящейся, если существует такое вещественное число а, что последовательность {хп—а} является бесконечно малой. При этом ве- * -Символ {1} обозначает последовательность, все элементы которой равны 1.
76 Гл. 3. Теория пределов щественное число а называется пределом последовательности {ХП}*. Если последовательность {хп} является сходящейся и имеет своим пределом число а, то символически это записывают так: Игл хп = а или хп-*-а при я-*-оо. П-»оо Используя определение бесконечно малой последовательности, мы приходим к другому определению сходящейся последовательности, эквивалентному определению 1. Определение 2. Последовательность {хп} называется сходящейся, если существует такое вещественное число а, что для любого положительного вещественного числа г найдется номер N такой**, что при всех п># элементы хп этой последовательности удовлетворяют неравенству \хп—а\<г. (3.15) При этом число а называется пределом последовательности Неравенство (3.15) можно записать в эквивалентной форме —г<хп—а< + е или, что то же самое, а—г<хп<а+Е. (3.15') На геометрическом языке неравенства (3.15') означают, что элементы■ хп при л>М лежат в интервале (а—е, а+г), который мы договорились называть е-окрестностью точки а. Это позволяет сформулировать еще одно определение сходящейся последовательности, эквивалентное определениям 1 и 2. Определение 3. Последовательность {хп} называется сходящейся, если существует такое число а, что в любой г-окрест- ности точки а находятся все элементы последовательности {*„}, начиная с некоторого номера (зависящего, конечно, от е). Установим специальное представление для элементов любой сходящейся последовательности {хп}. В силу определения 1 разность хп—а = ап является элементом бесконечно малой последовательности. Следовательно, элемент хп сходящейся последовательности, имеющей своим пределом вещественное число а, может быть представлен в следующем специальном виде: х„=а+ап, (3.16) где ап — элемент некоторой бесконечно малой последовательности {а„}. * В соответствии с этим определением всякая бесконечно малая последовательность является сходящейся и имеет своим пределом число о=0. ** Так как этот номер N, вообще говоря, зависит от е, то иногда пишут: N=N(6).
§ 1. Последовательность и ее предел 77 Замечание 1. Из определения сходящейся последовательности и ее предела сразу же вытекает, что удаление любого конечного числа элементов последовательности не влияет на сходимость этой последовательности и величину ее предела. Замечание 2. Последовательности, не являющиеся сходящимися, принято называть расходящимися. Замечание 3. Иногда формально договариваются трактовать бесконечно большие последовательности как последовательности, сходящиеся к пределу сю. Такая формализация позволяет использовать для бесконечно большой последовательности {хп) следующую символику 11ГП Х„ :00. Если при этом элементы бесконечно большой последовательности, начиная с некоторого номера, имеют положительный [отрицательный] знак, то используют следующую символику*: Пт хп = + оо [Пт хп = —оо]. В качестве примера докажем, что последовательность {хп} с элементами х„=0,33...3 п раз сходится к пределу а = 1/3. Фиксируем произвольное положительное число е и докажем возможность выбора по этому е такого номера Ы, что хп < е при всех п>Ы. Так как число 1/3 представимо бесконечной десятичной дробью 0,333..., то из правила упорядочения вещественных чисел вытекают следующие неравенства: ±_ ^г, по о , 1 3 0,33 ... 3 < — < 0,33 ... 3 + 10" л раз п раз справедливые для любого номера п. Из последних неравенств мы получим для числа 0,33 п раз следующее соотношение: Так как 10" < 1 10" %П 1 10" ному е>0 номера N такого, что для всех я»М то для нахождения по дан 1 Хп — ■ достаточно выбрать этот номер N из условия —^ < е <е при всех п>#, 1 10" = +оо|=—оо], если для любого Л>0 найдется отвечающий этому А номер N такой, что хп>А[хп<—А] для всех х~^№. * Иными словами, 1ш1хп =
78 Гл. 3. Теория пределов Напомним, что в п. 2 мы установили возможность выбора номера N из условия |<7|^<е для любого |^|<1. Там доказано, что такой номер N можно взять равным N I е(1-|</|) ] В нашем случае |^|=0, 1, так что + 1. [ 9е + 1. Перейдем к установлению свойств произвольных сходящихся последовательностей. Теорема 3.7. Сходящаяся последовательность имеет только один предел. Доказательство. Предположим, что два вещественных числа а и Ь являются пределами сходящейся последовательности {*п}- Тогда в силу специального представления элементов сходящейся последовательности (3.16) мы получим, что хп=а + ап и Хп—Ь + $„, где {<Хп} и {рп} — некоторые бесконечно малые последовательности. Из последних двух равенств получим, что а*—$п — = Ь—а. В силу теоремы 3.2 последовательность {ап—рп} является бесконечно малой, а в силу равенства а^—р«=Ь—а все элементы этой бесконечно малой последовательности равны одному и тому же вещественному числу Ъ-—а. На основании теоремы 3.5 это число Ь—а равно нулю, т. е. Ь = а. Теорема доказана. Теорема 3.8. Всякая сходящаяся последовательность является ограниченной. Доказательство. Пусть {хп} — сходящаяся последовательность и а — ее предел. Фиксируем некоторое положительное число е и по нему номер N такой, что \хп—а\ <еприп>Л^или, что то же самое, а—г<хп<а+г при л>Л^. Обозначим через А наибольшее из следующих (N+1) чисел: \а—е|, |а + е|, |лег |, |х2|,... ..., |*#_1|. Тогда, очевидно, |л;п|<Л для всех номеров п, а это и доказывает ограниченность последовательности {хп}. Теорема доказана. Замечание 4. Не всякая ограниченная последовательность является сходящейся. Так, например, последовательность 0, 1, О, 1, ..., 0, 1, ... является ограниченной, но не является сходящейся. В самом деле, обозначим п-й член этой последовательности символом хп и предположим, что эта последовательность сходится к некоторому пределу а. Но тогда каждая из последовательностей {х„+1—а} и {хп—а} являлась бы бесконечно малой. Стало быть, являлась бы бесконечно малой и разность этих последовательностей {лгп+1—хп}, а этого быть не может в силу того, что | хп+1—хп | = = 1 для всех номеров п.
§ 1. Последовательность и ее предел 79 Следующие четыре теоремы показывают, что четыре арифметические операции над элементами сходящихся последовательностей приводят к аналогичным операциям над их пределами. Теорема 3.9. Сумма сходящихся последовательностей {хп} и {уп} представляет собой сходящуюся последовательность, предел которой равен сумме пределов последовательностей {хп} и {уп}. Доказательство. Предположим, что последовательности {хп} и {уп} сходятся к пределам а и Ь соответственно. Тогда в силу специального представления элементов сходящейся последовательности (3.16) будут справедливы соотношения хп=а+а.п, г/п = Ь + Рп, (3.17) в которых а„ и рп представляют собой элементы некоторых бесконечно малых последовательностей {ап} и {рп}. Из соотношений (3.17) вытекает, что {хп+Уп) — (а + Ь)=а„+р„. (3.18) Так как сумма {ал+Рп} двух бесконечно малых последовательностей {ап} и {рп} представляет собой бесконечно малую последова-. тельность (теорема 3.1), то из соотношения (3.18) вытекает в силу определения 1, что последовательность {хп+уп} сходится и вещественное число а + Ь является ее пределом. Теорема доказана. Теорема 3.10. Разность сходящихся последовательностей {хп} и {уп} представляет собой сходящуюся последовательность, предел которой равен разности пределов последовательностей {хп} « {уп}. Доказательство этой теоремы аналогично доказательству теоремы 3.9, только вместо соотношения (3.18) мы получим соотношение (хп—Уп) — (а—Ь) =ап—рп. Теорема 3.11. Произведение сходящихся последовательностей {хп} и {уп} представляет собой сходящуюся последовательность,, предел которой равен произведению пределов последовательностей {хп} и {уп}. Доказательство. Предположим, что последовательности {хп} и {уп} сходятся к пределам а и Ь соответственно. Тогда для элементов этих последовательностей справедливы специальные представления (3.17), перемножая которые, мы получим Хп-уп = а-Ь + а-$п + Ь-а„+ап-$п или, что то же самое, хпУп—а-Ь = а$п + Ьап+<1п-$п- (3.19) Для доказательства теоремы в силу определения 1 остается убедиться в том, что в правой части (3.19) стоит элемент бесконечно малой последовательности, но это сразу же вытекает из теоремы
80 Гл. 3. Теория пределов 3.3 (согласно этой теореме последовательности {а-(5„} и {Ь-ап} являются бесконечно малыми), из следствия из теорем 3.3 и 3.4 (согласно этому следствию последовательность {а„-рп} является бесконечно малой) и из теоремы 3.1 (согласно этой теореме сумма трех бесконечно малых последовательностей {а-р„}, {Ь-ап} и {ап-Рп} является бесконечно малой последовательностью). Теорема доказана. Теореме о частном двух сходящихся последовательностей предпошлем следующую лемму. Лемма 1. Если последовательность {уп} сходится к отличному от нуля пределу Ь, то, начиная с некоторого номера, определено частное I— \ последовательностей {1} и {уп}, которое пред- \Уп) ставляет собой ограниченную последовательность. Доказательство. Учитывая, что ЬфО, обозначим через е положительное число е =-"—-. Для этого е найдется номер N такой, что при п>Лг справедливо неравенство \уп—Ь\<г или, что то же самое, \Уп~Ь\<-^-. (3.20) Итак, для всех номеров п, начиная с номера Я, выполняется неравенство (3.20). Убедимся в том, что из неравенства (3.20) вытекает следующее неравенство: \Уп\>-^-, (3-21) которое тем самым оказывается • справедливым также для всех номеров п, начиная с номера N. В самом деле, так как модуль суммы двух чисел не превосходит суммы модулей этих чисел, то, исходя из тождества Ь?=(Ь—уп)+уп и используя неравенство (3.20), мы получим \Ь\<\Ь-уп\ + \уп\<-^- + ]уп\. Из последнего неравенства сразу же вытекает неравенство (3.21), справедливость которого, начиная с номера Ы, установлена. Неравенство (3.21) позволяет утверждать, что при п>-Ы элементы уп не обращаются в нуль и, начиная с номера N, можно Уп) Из (3.21), в свою очередь, вытекает, что для всех я>Я справедливо неравенство 1 Уп рассматривать частное <
§ 1. Последовательность и ее предел 81 Это последнее неравенство и доказывает, что последовательность {—}, если ее рассматривать, начиная с номера ./V, явля- I у п. ^ ется ограниченной. Лемма доказана. Теорема 3.12. Частное двух сходящихся последовательностей {хп} и {уп}, предел второй из которых отличен от нуля, определено, начиная с некоторого номера, и представляет собой сходящуюся последовательность, предел которой равен частному преде* лов последовательностей {х„} и {уп}- Доказательство. Предположим, что последовательности {хп} и {уп} сходятся к пределам а и ЬФО соответственно. В силу леммы 1 найдется номер N такой, что при п>-Ы элементы уп не- обращаются в' нуль, определена последовательность I — | и эта I Уп} последовательность является ограниченной. Начиная с указанного* номера Л/", мы и будем рассматривать частное I—5-}. В силу опре- I Уп I деления 1 достаточно доказать, что последовательность |— — 1 является бесконечно малой. Будем исходить из тож- I Уп Ь ) дества хп а_ хп ■ Ъ — уп ■ а .„ ап\ Уп Ь Уп-Ь Так как для элементов хп и уп справедливы специальные представления (3.17), то Хп-Ь—уп-а=(а + ап)-Ь— (Ь + $п) ■а = апЬ—$п-а. (3.23) Подставляя (3.23) в (3.22), получим Т-Т=7"(^—Гр-)- (3'24) Уп о уп \ о ] Остается доказать, что в правой части (3.24) стоит элемент бесконечно малой последовательности, но это сразу вытекает из теоремы 3.3 и из того, что последовательность {—I (в силу I Уп I леммы 1) является ограниченной, а последовательность |а„ — рл | (как разность двух бесконечно малых) является бесконечно малой последовательностью. Теорема доказана. Убедимся теперь в том, что неравенства, которым удовлетворяют элементы сходящихся последовательностей, приводят к аналогичным неравенствам для пределов этих последовательностей. Теорема 3-13. Если все элементы, сходящейся последовательности {хп}, по крайней мере начиная с некоторого номера, удовлетворяют неравенству хп>-Ь[хп<Ь], то и предел х этой последовательности удовлетворяет неравенству х>>Ь[х<сЬ].
«2 Гл. 3. Теория пределов Доказательство. Предположим, что все элементы хп, по крайней мере начиная с некоторого номера Ы*, удовлетворяют неравенству хп>-Ъ. Докажем, что и предел х этой последовательности удовлетворяет неравенству х>-Ъ. Допустим, что это не так, т. е. справедливо неравенство х<Ь. Тогда по определению сходящейся последовательности для положительного числа г = Ъ—х найдется такой номер N (этот номер •мы возьмем еще и таким, чтобы он превосходил Ы*), что при п>Ы •будет справедливо неравенство \хп—х\<г или \хп—х\<Ъ—х. Последнее неравенство эквивалентно неравенствам — (Ь—х) < <хп—х<Ь—х, правое из которых означает, что хп<Ь при всех п>Ы, а это противоречит условию теоремы. Полученное противоречие означает, что наше предположение о том, что х<Ь, неверно, т. е. х>-Ь. Случай хп<Ь рассматривается аналогично. Теорема доказана. Замечание 5. Если все элементы сходящейся последовательности {хп} удовлетворяют строгому неравенству хп>Ъ, то •отсюда, вообще говоря, не вытекает, что и предел х этой последовательности удовлетворяет строгому неравенству х>Ь. (Можно лишь утверждать, что х>Ь.) Например, если хп = —, то для всех номеров хп>0, однако шредел Игл — = х = 0 не удовлетворяет неравенству х>0. Следствие 1. Если все элементы двух сходящихся последовательностей {хп} и {уп}, по крайней мере начиная с некоторого номера, удовлетворяют неравенствам хп<уп, то и пределы этих последовательностей удовлетворяют такому же неравенству Нт*я<Нт#„.' (3.25) П-*-<Х> П->00 В самом деле, начиная с указанного номера, все элементы последовательности {уп—хп} неотрицательны. В силу теоремы 3.13 и предел указанной последовательности Пт (уп — хп) неотрицате- лен. В силу теоремы 3.10 Пт (уп — хп) = \шуп — Пт хп и мы по- лучим, что Пт уп—Птх„>0. Из последнего неравенства выте- кает (3.25). Следствие 2. Если все элементы сходящейся последовательности {хп} находятся на сегменте [а, Ь], то и предел х этой последовательности лежит на сегменте [а, Ь]. В самом деле, так как а<лгп<6 для всех номеров п, то (в силу теоремы 3.13) а<х<Ь. Доследнюю теорему, к доказательству которой мы сейчас переводим, можно назвать принципом двустороннего ограда и ч е н и я.
§ 2. Монотонные последовательности 8Э Теорема 3.14. Пусть {х„} и {уп} — две сходящиеся последовательности, имеющие общий предел а. Пусть, кроме того, все- элементы третьей последовательности {гп}, по крайней мере начиная с некоторого номера, удовлетворяют неравенствам хп<гп<уп- (3.26)' Тогда последовательность {гп} сходится к тому же самому пределу а. Доказательство. Предположим, что неравенства (3.2В) справедливы, начиная с номера Ы*. Тогда, начиная с того же самого номера ./V*, справедливы и неравенства хп—а<гп—а<г/п—а. (3.27) Из неравенств (3.27) вытекает, что для каждого номера п, превосходящего Ы*, \2п—а\<тах{\Хп—а\, \уп—а\}. (3.28) (Эта запись означает, что \гп—а\ не превосходит наибольшего из-, двух чисел \хп—а] и \уп—а\.) Фиксируем произвольное положительное число е. Тогда в силу- сходимости последовательностей {хп} и {уп} к пределу а найдутся» номера Ы1 и М2 такие, что К — а|<е прия>Л^1( -3 2д. \уп — а\< е при п >Л^а. Если мы теперь обозначим через ./V наибольший из трех номеров- Л'*, Л/^ и Л/2, то при п>-Ы будут справедливы оба неравенства в- (3.29) и мы получим в силу (3.28), что при л>А/' справедливо неравенство \гп—а\<е. Это и доказывает сходимость последовательности {гп} к пределу а. Теорема доказана. § 2. МОНОТОННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 1. Понятие монотонной последовательности. Определение 1. Последовательность {хп} называется неубывающей [невозрастающей], если каждый элемент этот последовательности, начиная со второго, не меньше [не больше] предыдущего ее элемента, т. е. если для всех номеров п («=1,2, ...)• справедливо неравенство Хп-<Хп+1 [Хп^>Хп+1]. (3.30),' Определение 2. Последовательность {хп} называется- монотонной, если она является либо неубывающей, либо невозрастающей.
«4 Гл. 3. Теория пределов Если элементы неубывающей последовательности для всех номеров п удовлетворяют строгому неравенству хп<хп+и то эту последовательность называют возрастающей. Аналогично, если элементы невозрастающей последовательности для всех номеров я удовлетворяют строгому неравенству хп>хп+и то эту последовательность называют убывающей. Заметим, что всякая монотонная последовательность заведомо ограничена с одной стороны (либо сверху, либо снизу). В самом деле, всякая неубывающая последовательность ограничена снизу (в качестве нижней грани можно взять величину ее первого элемента), а всякая невозрастающая последовательность ограничена сверху (в качестве верхней грани также можно взять величину ее первого элемента). Отсюда следует, что неубывающая последовательность будет ограниченной с обеих сторон, или просто ограниченной, тогда и только тогда, когда она ограничена сверху, а невозрастающая последовательность будет ограниченной тогда и только тогда, когда она ограничена снизу. Рассмотрим примеры монотонных последовательностей. 1. Последовательность 1, 1, 2, 2,... является неубывающей. Она ограничена снизу величиной своего первого элемента, а сверху не ограничена. 2. Последовательность —, —, —, ... , , ... является 12 3 п убывающей. Она ограничена с обеих сторон: сверху величиной своего первого элемента 2, а снизу, например, числом 1. 2. Теорема о сходимости монотонной ограниченной последовательности. Справедливо следующее фундаментальное утверждение. Основная теорема 3.15. Если неубывающая (невозрастающая) последовательность {хп} ограничена сверху (снизу), то она сходится. Доказательство. Рассмотрим случай неубывающей и ограниченной сверху последовательности {хп}. Множество всех элементов такой последовательности ограничено сверху, а потому по основной теореме 2.1 гл.2 у этого множества существует точная верхняя грань, которую мы обозначим символом х. Докажем, что это число х и является пределом последовательности {х„}. Во-первых, заметим, что по определению верхней грани любой элемент х* последовательности {хп} удовлетворяет неравенству хп<х. (3.31) Далее фиксируем произвольное положительное число е и заметим, что по определению точной верхней грани найдется хотя бы один элемент последовательности лглг, удовлетворяющий неравенству х—г<хн. (3.32)
§ 2. Монотонные последователвности 85 Учтем теперь, что последовательность {хп} является неубывающей и вследствие этого Хг?<схп для всех номеров п, удовлетворяющих неравенству и».^. Сопоставляя неравенство а;^<лп с неравенством (3.32), мы получим, что для всех п^^>N х—е<хп. (3.33) Объединяя неравенства (3.31) и (3.33), мы получим, что для всех п~>Ы справедливы неравенства х—е<хп<х. Следовательно, для всех /г>ЛГ справедливо неравенство \хп—*|<е, которое и доказывает, что последовательность {хп} сходится к пределу х = &ир{хп}. Если последовательность {хп} является невозрастающей и ограничена снизу, то совершенно аналогично доказывается, что она сходится к пределу х=т1{хп}- Теорема доказана. Замечание 1. Теорему 3.15 можно сформулировать в другом виде. Во-первых, заметим, что в силу сказанного в п. 1 последовательность {хп}, удовлетворяющая условию теоремы 3.15, является ограниченной с обеих сторон, или просто ограниченной. Поэтому теорему 3.15 можно переформулировать так: для того чтобы монотонная последовательность {хп} сходилась, достаточно, чтобы она была ограничена. Легко убедиться в том, что эта формулировка может быть заменена более «сильной»: для того чтобы монотонная последовательность {хп} сходилась, необходимо и достаточно, чтобы она была ограничена (необходимость вытекает из теоремы 3.8). Замечание 2. Конечно, не всякая сходящаяся последовательность является монотонной. Например, заведомо сходящаяся 111 1 1 1 к нулю последовательность , —, , ... , —, , ... не является монотонной, так как знаки ее элементов чередуются. Замечание 3. Из приведенного выше доказательства теоремы 3.15 вытекает, что все элементы неубывающей, ограниченной сверху последовательности {хп} не больше ее предела х (хп<х). Аналогично легко убедиться в том, что все элементы невозрастающей, ограниченной снизу последовательности не меньше ее предела х^_ Извлечем важное следствие из теоремы 3.15. Договоримся называть бесконечную последовательность сегментов [а±, Ь^, \аг, Ъг\,..., [ап, Ьп],... стя г и в а ю щ е й с я системой сегментов, если выполнены два требования: 1) каждый следующий сегмент содержится в предыдущем, т. е. ап<ап+ь Ьп+1<Ьп для любого я=1, 2,...; 2) длина п-го сегмента [ап, Ьп], т. е. разность Ьп—ап, стремится к нулю при га->-оо. Следствие из теоремы 3.15. У всякой стягивающейся системы сегментов {[ап, Ьп]} существует и притом единственная точка с, принадлежащая всем сегментам этой системы.
86 Гл. 3. Теория пределов Доказательство. Прежде всего заметим, что точка с, принадлежащая всем сегментам, может быть только одна. В самом деле, если бы нашлась еще одна точка д., отличная от с и принадлежащая всем сегментам, то, предположив ради определенности, что й>с, мы получили бы, что сегмент [с, й\ принадлежит всем сегментам [ап, Ьп]. Но тогда для любого номера п выполнялись бы неравенства Ьп—ап>й—с>0, что невозможно в силу того, что Ьп—ап-»-0 при п->-оо. Докажем теперь, что существует точка с, принадлежащая всем сегментам. Так как система сегментов является стягивающейся, то последовательность левых концов {ап} не убывает, а последовательность правых концов {Ьп} не возрастает. Поскольку обе эти последовательности ограничены (все их элементы находятся на сегменте [аь 2ч]), то обе они сходятся (в силу теоремы 3.15). Из того, что разность Ьп—ап является бесконечно малой, вытекает, что эти две последовательности {ап} и {&„} сходятся к общему пределу, который мы обозначим через с. В силу замечания 3 для любого номера п справедливы неравенства ап<с<Ьп, т. е. с принадлежит всем сегментам [а„, Ьп]. Следствие доказано. 3. Число е. Применим теорему 3.15 для доказательства сходимости последовательности {хп}, элемент хп которой определяется равенством *„=(! +-Г В силу теоремы 3.15 достаточно доказать, что эта последовательность 1) является возрастающей; 2) ограничена сверху. Применяя формулу бинома Ньютона, получим для хп следующее выражение: х = !+„._!.+ "("-П. Л. + п(п-Щп-2)± п га 2! га2 3! п? п(п—1)(п —2) ... [га — (га — 1)] _1_ п\ пп ' Это выражение перепишем в следующем виде: *.-*-^(1-4-)+-М1-4-)(1-! ■•-^(1-т)('-!-)-('--^)- ^ Для следующего элемента последовательности {хп} в полной аналогии с (3.34) получится следующее выражение: " 21 ^ п+1 ) 3\ \ га •+• 1 ] \ п + 1 '
§ 2. Монотонные последовательности 87 1 л+1 / \ п+1 1—^4- + \ 1 /, 1 \ /, 2 л —1 *^ л + 1 у п + ! 1 !— 1 — ... 1 — • (3-35) (л+ 1)1 \ "+1 А я+1 I \ п + 1 ) Для того чтобы убедиться в том, что последовательность {хп} является возрастающей, сравним между собой выражения (3.34) и (3.35). Во-первых, заметим, что правая часть (3.34) состоит из п слагаемых, а правая часть (3.35) — из п+1 слагаемых, причем последнее (я+1)-е слагаемое в правой части (3.35) является «трого положительным. Сопоставим теперь между собой любое из остальных п слагае- !мых в правой части (3.35) с соответствующим слагаемым в правой части (3.34). Легко видеть, что для любого номера к, равного 2, 3,..., п, справедливо неравенство -М'-тН'-тЬ-С-^И А1 \ п+1 /\ л+1 ) \ л + 1 Это последнее неравенство означает, что к-е слагаемое в правой части (3.34) меньше соответствующего к-го слагаемого в правой части (3.35). Итак, мы доказали, что хп<хп+и т. е. последовательность {хп} является возрастающей. Докажем теперь, что эта последовательность ограничена сверху. Заметим, что если каждую круглую скобку в правой части (3.34) заменить единицей, то указанная правая часть возрастет. Поэтому х»<2 + -к + ^+--- + ^- <3-36> Заметим далее, что для любого номера &>2 справедливо неравенство к\ = 2-3... &>2Й_1. Поэтому неравенство (3.36) дает право утверждать, что хп<2 + — + \+ ... + —— -3 — <3. (3.37) 2 22 2""1 2Л-1 (Мы воспользовались формулой для суммы членов геометрической прогрессии.) Неравенство (3.37) доказывает ограниченность последовательности {хп}. По основной теореме 3.15 последовательность {хп} имеет предел, который, следуя Л. Эйлеру *, мы обозначим через е. * Леонард Эйлер (1707—1783) — великий математик, член Петербургской Академии наук, большую часть жизни провел в России, по происхождению швейцарец.
88 Гл. 3. Теория пределов Убедимся в том, что число е удовлетворяет неравенствам 2<е<3. Для этого (в силу следствия 2 из теоремы 3.13) достаточно доказать, что каждый элемент хп последовательности {хп} удовлетворяет неравенствам 2<:е<3. Неравенство х„<3 вытекает из (3.37), а неравенство 2<схп вытекает из (3.34), если отбросить в (3.34) все члены, кроме первого. В дальнейшем выяснится, что число е играет важную роль в математике, и будет указан способ вычисления этого числа с любой степенью точности. 4. Примеры сходящихся монотонных последовательностей. Нач~ нем с рассмотрения последовательности, которая широко используется в современной вычислительной математике для приближенного нахождения корня квадратного из положительного вещественного числа а. Эта последовательность определяется следующей рекуррентной формулой *: хп+1 = ±- (хп + -1-) (п = 1, 2, ... ), (3.38) где в качестве первого приближения х4 берется любое положительное число. Прежде всего докажем, что такая последовательность {хп} сходится, для чего в силу теоремы 3.15 достаточно доказать, что- она ограничена снизу и, начиная со второго номера, является не- возрастающей. Начнем с доказательства огр аниченности снизу. По условию л:1>0. Но тогда из рекуррентной формулы (3.38), взятой при я=1, вытекает, что *2>0, далее из той же формулы (3.38),. взятой при л = 2, вытекает, что хз>0,.... Продолжая эти рассуждения далее, мы последовательно докажем, что все лгп>0. Итак, рассматриваемая последовательность ограничена снизу. Докажем теперь, что при /г>2 все элементы хп удовлетворяют неравенству хп>-Уа. Переписав формулу (3.38) в виде *^ = —(7= + —)■ (3-39> воспользуемся тривиальным неравенством I -) > 2, справедливым для всех />0 **. * Рекуррентная формула (от латинского гесштепв — возвращающийся) —■ формула, выражающая (я+1)-й элемент последовательности через значения ее первых п элементов. ** Это неравенство для всех <>0 эквивалентно неравенству <2+1>2^ вытекающему из того, что (^—1)2^0.
§ 2. Монотонные последовательности 89 Взяв в этом неравенстве I = -Ц=>0, мы получим, что—т= + У а у а + -У— >2, и поэтому соотношение (3.39) дает хп+1>>уа при п=\, хп _ 2,.... Это и означает, что ж„>Уа при п = 2, 3,.... Докажем, наконец;, что последовательность {хп}, если ее рассматривать с номера п = 2, является невозрастающей. Из рекуррентной формулы (3.38) вытекает, что * Из последнего соотношения, учитывая, что хп~^Уа при и>2, получим, что -Хп+1 <1 при п>2 или хп+1<хп при л>2. Итак, при Хп п>2 последовательность {хп} является невозрастающей. По теореме 3.15 последовательность {.*:„} сходится к некоторому пределу х. Остается найти этот предел. Учитывая, что хп>"|/а при п>2,мы получим (в силу теоремы 3.13), что лг>уа>0. Принимая во внимание, что л;>0, перейдем к пределу при И-+-00 в рекуррентном соотношении (3.38). Мы получим в пределе при п-*~оо из (3.38) следующее равенство: 1 / , а х = — \х-\ 2 \ х Это равенство представляет собой уравнение для определения предела х. единственный положительный корень этого уравнения есть х = У а . Итак, мы окончательно доказали, что последовательность {хп}, определяемая рекуррентной формулой (3.38) при любом выборе Х:>0, сходится к пределу У а . ■ В качестве другого применения теоремы 3.15 рассмотрим вопрос о вычислении предела последовательности {хп}, элементы которой имеют вид хп = -^-, (3.40) п! где I — любое фиксированное вещественное число. Для любого фиксированного I найдется номер N такой, что |^|<п+1 при всех п>-Ы. Но тогда, поскольку _*"+* = , мы получим, что хп "+1 ]хп+\ | < |хп| при всех п^-Ы, т. е., начиная с номера N. последовательность {|#„|} является убывающей. Так как, кроме того, эта последовательность ограничена снизу (например, числом нуль), то
90 Гл. 3. Теория пределов по теореме 3.15 она сходится к некоторому пределу х. Для нахождения х запишем соотношение (3.40) для номера л+1: % _]_1 — . — % • " (л+1)! п! п+1 п+1 Таким образом, |л;„+1| = I хп 1 —, и, перейдя в последнем равен- л+1 стве к пределу при л-*-оо, мы получим соотношение | х | = | х | • Пш —Ш— = 0. /2-»-оо Л -|- 1 Итак, последовательность |хи|, а вместе с ней и последовательность (3.40), сходится к пределу х=0. В обоих рассмотренных примерах мы применили часто употребляемый прием: сначала с помощью теоремы 3.15 доказали существование предела последовательности, а затем нашли этот предел, устремив номер п к бесконечности в рекуррентном соотношении, выражающем (л+1)-й элемент последовательности через ее л-й элемент. В качестве третьего примера изучим вопрос о сходимости последовательности {х„}, элемент хп которой имеет вид г а+ ... +УИ хп= V а+У а + У а+ ... + уа (3.41) при условии, что а>0 и общее число извлекаемых корней равно п. Указанную последовательность {хп} можно задать рекуррентным соотношением хп+1 = У~а~+~х~п (л = 1, 2, ...) (3.42) при условии, что х1 = Уа'■ (3.43) .Для доказательства сходимости рассматриваемой последовательности достаточно (в силу теоремы 3.15) доказать, что она возрастает и ограничена. Сначала докажем возрастание последовательности (3.41), т. е. докажем, что для любого номера Хп<Хп+1. (3.44) Доказательство этого неравенства проведем по индукции Достаточно доказать два утверждения: 1) неравенство (3.44) справедливо для номера л=1, т. е. справедливо неравенство Х1<х2; (3.45) 2) из справедливости неравенства (3.44) для данного номера п
§ 2. Монотонные последовательности 91 вытекает справедливость этого неравенства и для номера л+1, т. е. вытекает справедливость неравенства Хп+1<хп+г. (3.46) Справедливость неравенства (3.45) сразу вытекает из равенства (3.43) и из соотношения хг = Уа + У а >Уа . Докажем, что из справедливости неравенства (3.44) вытекаеу справедливость неравенства (3.46). Из неравенства (3.44) и рекуррентной формулы (3.42) вытекает, что хп+1 = Уа + хп < Уа + хп+1. (3.47) С другой стороны, записывая рекуррентное соотношение (3.42) для номера п+\, мы получим равенство хкн = Уа + хп+1. (3.48) Из сопоставления равенства (3.48) с неравенством (3.47) и вытекает неравенство (3.46). Тем самым индукция завершена и возрастание последовательности (3.41) доказано. Докажем теперь, что эта последовательность ограничена сверху. Снова пользуясь методом математической индукции, мы докажем, что для всех номеров п хп<М, (3.49) где М — наибольшее из двух чисел а и 2. Сначала проверим, что неравенство (3.49) справедливо для номера п=1. Пользуясь равенством (3.43) и рассматривая отдельно случаи 0<а<2 и а>2, мы получим хх = Уа < 1/2" < 2 при 0 < а < 2, (3.50) хх = У а < а при а > 2. Из (3.50) вытекает, что л;1<УИ, где М = тах{а, 2}. Пусть теперь неравенство (3.49) справедливо для данного номера п. Пользуясь рекуррентным соотношением (3.42) и рассматривая отдельно случаи 0<а<2 и а>2, мы получим, что хп+1 = Уа + хп < У2 + 2 = 2 при 0 < а < 2, __ (3-51) хп+! = У а + хп < У а + а = У 2а < а при а > 2. Из (3.51) вытекает справедливость неравенства хп+1<-М, где ЛГ = тах{а, 2}. Таким образом, индукция завершена, и ограниченность последовательности (3.41) доказана.
92 Гл. 3. Теория пределов По теореме 3.15 последовательность (3.41) сходится к некоторому пределу х. Остается найти этот предел. Из соотношения (3.41) очевидно, что все элементы рассматриваемой последовательности неотрицательны. Следовательно, в силу теоремы 3.13 и искомый предел х этой последовательности неотрицателен. Возводя в квадрат рекуррентное соотношение (3.42), мы получим равенство х2п+1 = а + хп. (3.52) Так как последовательность {хп} сходится к пределу х, то, переходя в равенстве (3.52) к пределу при п-^-оо и пользуясь теоремой о пределе суммы и произведения двух сходящихся последовательностей, мы получим следующее соотношение для определения искомого предела х: х2=а+х или, что то же самое, х2—х—а = 0. (353) Соотношение (3.53) представляет собой квадратное уравнение для определения искомого предела х. Это уравнение имеет два корня: х= 1+УТТГа >0ях= 1-/Т+45 <()< Так как искомый предел, как уже указано выше, является неотрицательным числом, то мы окончательно получим, что он совпадает с положительным корнем уравнения (3.53), т. е. равен 1+УТ+1а х = § 3. ПРОИЗВОЛЬНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 1. Предельные точки, верхний и нижний пределы последовательности. Рассмотрим некоторую последовательность хи х%, ...,хп,... и произвольную возрастающую последовательность целых положительных чисел ки кг,..., кп,.... Выберем из последовательности {хп} элементы с номерами к\, к2, ..., кп,... и расположим их в порядке возрастания указанных номеров. Мы получим при этом новую последовательность . лй1» Х&21 . . . , Хк * . . . , которую принято называть подпоследовательностью исходной последовательности {хп}- В частности, и сама последовательность {хп} может рассматриваться как подпоследовательность с номерами кп = п.
§ 3. Произвольные последовательности 93 , Заметим сразу же, что всегда &п>", ибо любая подпоследовательность, не совпадающая со всей последовательностью, получается путем некоторого прорежения элементов последовательности. Справедливы два тривиальных утверждения: 1°. Если последовательность {хп} сходится к пределу а, то и любая ее подпоследовательность сходится к тому же самому пределу а. 2°. Если все подпоследовательности некоторой последователь* ности {хп} сходятся, то все они сходятся к одному и тому же пределу а (к этому же пределу а сходится и вся последовательность). Докажем сначала утверждение 1°. Фиксируем произвольное положительное число е и, пользуясь сходимостью последовательности {хп} к пределу а, выберем по этому е номер N такой, что \хп—а\<г при всех п>-Ы. Пусть {хк }— произвольная подпоследовательность последовательности {хп}. Так как кК^>И,то для всех номеров я># элементы подпоследовательности {хк } удовлетворяют неравенству \хк — а | < е, а это и означает, что подпоследовательность {хьп} сходится к пределу а. Для доказательства утверждения 2° достаточно учесть, что так как сама последовательность {хп} (как частный случай подпоследовательности) сходится к некоторому пределу а, то и любая ее. подпоследовательность сходится к тому же пределу а (в силу утверждения 1°). В полной аналогии с утверждением Iе доказывается, что любая подпоследовательность бесконечно большой последовательности представляет собой также бесконечно большую последовательность. Введем фундаментальное понятие предельной точки последовательности. Определение 1. Точка х бесконечной прямой (—со, +оо) называется предельной точкой последовательности {хп}, если в любой ^-окрестности точки х содержится бесконечно много элементов этой последовательности. Определение 2. Точка х бесконечной прямой (—со, + со) называется предельной точкой последовательности {хп}у если из этой последовательности можно выделить подпоследовательность, сходящуюся к пределу х. Убедимся в том, что определения 1 и 2 эквивалентны. 1) Пусть в любой е-окрестности х содержится бесконечно много элементов последовательности {хп}. Рассмотрим совокупность е-ок- рестностей точки х, для которых е последовательно равно 111 1 * 2 * 3' •■•- п В первой из этих окрестностей выберем элемент последовательности Х]ц с некоторым номером к\, во второй из указанных окрестностей выберем элемент последовательности хь2 с номером кг, удовлетворяющим условию кг>ки в третьей из указанных окрест-
$4 Гл. 3. Теория пределов ностей выберем элемент последовательности Хъг с номером к3, удовлетворяющим условию к3>к2.... Этот процесс можно продолжать неограниченно, так как в любой е-окрестности точки х содержится бесконечно много элементов последовательности {хп}. В результате мы получим подпоследовательность х*,,**,,я*,, ... , Хкп, ... последовательности {хп}, которая сходится к пределу х, ибо \хк—х\<—. " п 2) Предположим, что из последовательности {хп} можно выделить подпоследовательность, сходящуюся к пределу х. Тогда в любой е-окрестности точки х лежит бесконечно много элементов подпоследовательности (все, начиная с некоторого номера). Так как каждый элемент подпоследовательности является элементом и всей последовательности, то в любой е-окрестности х лежит бесконечно много элементов последовательности. Эквивалентность определений 1 и 2 доказана. Выясним вопрос о наличии предельных точек у сходящейся последовательности. Лемма 1. Каждая сходящаяся последовательность имеет только одну предельную точку, совпадающую с пределом этой последовательности. Доказательство. Пусть последовательность {хп} сходится •к пределу х. Тогда в любой е-окрестности х лежит бесконечно много элементов последовательности {хп} (все, начиная с некоторого номера), а поэтому х является предельной точкой последовательности {хп}. Остается доказать, что ни одно число х', отличное от х, не является предельной точкой последовательности {хп}, но это непосредственно вытекает из доказанного выше утверждения 1, согласно которому из сходимости всей последовательности к пределу х вытекает сходимость любой ее подпоследовательности к тому же пределу х. Приведем пример ограниченной последовательности {хп}, имеющей две предельные точки. Докажем, что последовательность 1,11,1 1,1 —, 1 , —, 1 —, 1 -, ... имеет только две 2 2 3 3 п п предельные точки х=0 и х=\. Тот факт, что эти две точки х = 0 и х=\ являются предельными, вытекает из того, что подпоследовательность всех нечетных элементов рассматриваемой последовательности сходится к пределу х = 0, а подпоследовательность всех четных элементов рассматриваемой последовательности сходится к пределу х=1. Остается доказать, что ни одно число х0, отличное ют 0 и 1, не является предельной точкой нашей последовательности. Так как х0Ф0 и х0ф\, то заведомо можно указать столь малое положительное число е, что е-окрестности трех точек 0, 1 и Хо не будут иметь общих точек (рис. 3.1).
§ 3. Произвольные последовательности 95 Рис. 3.1 Но все нечетные элементы нашей последовательности, начиная с некоторого номера, находятся в е-окрестности числа 0, а все четные элементы нашей последовательности, начиная с некоторого ног мера, находятся в е-окрестности числа 1. Поэтому, за пределами е-окрестностей чисел 0 и 1 (и, в частности, в е-окрестности числа* Хо) может лежать лишь конечное число элементов нашей последовательности. Это и означает, что х0 не является предельной точкой последовательности. Приведем теперь пример ограниченной последовательности {хп}, имеющей бесконечно много предельных точек. Выше (в п. 3 § 7 гл. 2) мы установили, что множество всех рациональных чисел: из сегмента [0, 1] можно занумеровать в последовательность {х„}. Докажем, что любое вещественное число х из сегмента [0, 1] является предельной точкой указанной последовательности {хп}. Заметим, что, каково бы ни было число х из сегмента [0, 1] для любого 0<е<1/2 хотя бы одно из двух чисел х—е и х + г также принадлежит сегменту [0,1]. Предположим ради определенности, что число х+г принадлежит сегменту [0, 1]. Между двумя не равными друг другу вещественными числами х и х+г, в силу леммы 2 § 3 гл. 2, лежит бесконечно много различных рациональных чисел. Это означает, что при любом 0<е<1/2 в е-окрестности точки х лежит бесконеч* но много элементов последовательности {хп}, т. е. х является предельной точкой этой последовательности. Естественно, возникает идея рассмотрения наибольшей и наименьшей предельных точек последовательности. Определение 3. Наибольшая предельная точка последовательности {хп} называется верхним пределом этой последовательности и обозначается символом х= Пт хп. п-их> Определение 4. Наименьшая предельная точка последовательности {хп} называется нижним пределом этой последовательности и обозначается символом х = Нт хп. П-»оо Возникает вопрос о существовании хотя бы одной предельной точки и верхнего и нижнего пределов у любой ограниченной последовательности.
«6 Гл. 3. Теория пределов Справедлива следующая замечательная теорема. Основная теорема 3.16. У всякой ограниченной последовательности существуют верхний и нижний пределы и, в. частно- ■сти, существует хотя бы одна предельная точка. Доказательство. Остановимся на доказательстве существования у любой ограниченной последовательности хотя бы одной предельной точки и верхнего предела. (Существование нижнего предела доказывается аналогично.) Пусть {хп} — произвольная ограниченная последовательность. По условию ограниченности найдутся два вещественных числа ш и М такие, что любой элемент хп последовательности {хп} удовлетворяет неравенствам т*схп<М. Рассмотрим множество {х} всех вещественных чисел х таких, что правее * каждого из этих чисел либо вовсе нет элементов последовательности {х„}, либо таких элементов лишь конечное число. Иными словами, вещественное число х принадлежит множеству {х}, если правее х лежит не более чем конечное число элементов последовательности {хп}, и не принадлежит множеству {х}, •если правее этого числа х лежит бесконечно много элементов последовательности {Хп}- Заметим, что множество {х} заведомо не является пустым: ему принадлежит любое вещественное число х, удовлетворяющее неравенству х>>М (ибо правее такого х нет элементов последовательности {хп}). Кроме того, очевидно, что множество {х} ограничено снизу и в качестве его нижней грани может быть взято любое число, меньшее т (правее такого числа лежат все элементы последовательности {хп}, а их бесконечно много). По основной теореме 2.1 гл. 2 у множества {д:} существует точная нижняя грань, которую мы обозначим символом х. Докажем, что это число х—Ш{х} и является верхним пределом последовательности {Хп}- Достаточно доказать два утверждения: 1°. Число х является предельной точкой последовательности {хп} (т. е. в любой е-окрестности х лежит бесконечно много элементов последовательности {хп}). 2°. Ни одно число х, большее х, уже не является предельной точкой последовательности {хп} (это и будет означать, что х является наибольшей предельной точкой, т. е. верхним пределом {Хп})• Для доказательства утверждения 1° фиксируем произвольное положительное число в. По определению нижней грани любое число, меньшее х (и, в частности, число х—е), не принадлежит введенному нами множеству {х}. Значит, правее х—е лежит бесконечно много элементов последовательности {хп}. * Напомним, что термин «г/ лежит правее х» означает, что числа х и у связаны неравенством у>х.
§ 3. Произвольные последовательности 97 Далее, из того, что число х является точной нижней гранью {х}, и из неравенства х<х+е вытекает, что найдется хотя бы один элемент х' множества {х}, удовлетворяющий неравенствам ^<д:/< <х + е, т. е. лежащий левее х + е (рис. 3.2). В силу определения множества {х} правее этого числа х' лежит не более чем конечное число элементов последовательности {хп}- На рис. 3.2 условно указано, что правее числа х—е лежит бесконечно много элементов последовательности {хп}, а правее числа х' лежит не более чем конечное число элементов этой последовательности. Бесконечное число элементов /' Конечное число Рис. 3.2 Рис. 3.3 Так как правее х—е лежит бесконечно много, а правее х' — лишь конечное число элементов последовательности {хп}, то мы приходим к выводу, что на полусегменте (х—е, х'] (а значит, и на интервале (х—е, х+е)) лежит бесконечно много элементов последовательности {хп}. Итак, мы доказали, что для любого е>0 в е-окрестности точки х лежит бесконечно много элементов последовательности {хп}- Это и означает, что х является предельной точкой последовательности {хп}. Утверждение Г доказано. Подчеркнем, что попутно мы доказали, что для любого е>0 правее числа х+е лежит не более чем конечное число элементов последовательности {хп}. Это последнее утверждение используем для доказательства утверждения 2° о том, что х является наибольшей предельной точкой. _ Пусть х — любое число, большее х. Обозначим через е положительное число г==_{х—х)/2. При таком выборе е_интервалы (х—е, х+е) и {х—е, х+е), т. ек е-окрестности точек х и х, не будут иметь общих точек, а точнее, вся е-окрестность точки х будет лежать правее числа х + е, т. е. правой границы е-окрестности точки х (рис. 3.3). Выше мы установили, что для любого е>0 правее х+е лежит не более чем конечное число элементов последовательности {хп}- Значит, в рассматриваемой нами е-окрестности точки х лежит не более чем конечное число элементов последовательности {хп}, а это и означает, что л; не является предельной точкой последовательности {хп}. Утверждение 2° доказано. 4 Зак. 72
98 Гл. 3. Теория пределов Мы доказали существование у ограниченной последовательности {хп} верхнего предела (т. е. наибольшей предельной точки). Совершенно аналогично доказывается, что у такой последовательности существует нижний предел, являющийся точной верхней гранью того множества вещественных чисел {х}, левее каждого из которых лежит не более чем конечное число элементов последовательности {хп}. Теорема 3.16 доказана. Следствие 1 из теоремы 3.16. Если {хп} —• ограниченная последовательность, х и х — ее нижний и верхний пределы, г — любое положительное число, то на интервале (х—е, х + г) лежат все элементы этой последовательности] начиная с некоторого номера (зависящего, конечно, от г). Достаточно доказать, что для любого е>0 вне интервала (л:—е, х+е) лежит не более чем конечное число элементов последовательности {хп}. Тем более достаточно доказать, что правее х-\ и левее х лежит не более чем конечное число элемен- 2 - 2 тов последовательности {хп}. Тот факт, что для любого е>0 правее х-\ лежит не более чем конечное число элементов {хп}, уже установлен в процессе доказательства теоремы 3.16. Совершенно аналогично доказывается, что для любого е>0 левее л: лежит 2 не более чем конечное число элементов последовательности {*«}. Следствие 2 из теоремы 3.16. Пусть {хп} — ограниченная последовательность, х и х — ее нижний и верхний пределы, (а, Ь) — интервал, вне которого лежит не более чем конечное число элементов последовательности {хп}- Тогда интервал (х, х) содержится в интервале (а, Ъ) и, в частности, х—х*сЬ—а. Доказательство. Достаточно доказать два неравенства х<Ь и а*сх. Первое из этих неравенств вытекает из того, что точка Ь, правее которой лежит не более чем конечное число элементов последовательности {хп}, принадлежит множеству {х}, рассмотренному при доказательстве теоремы 3.16, а х является точной нижней гранью этого множества. Второе неравенство скх устанавливается аналогично. Следствие 3 из теоремы 3.16 (теорема Больца- но — Вейерштрасса*). Из всякой ограниченной' последовательности можно выделить сходящуюся подпоследовательность. Эта теорема является непосредственным следствием теоремы 3.16 и определения 2 предельной точки. Теорема 3.16 проливает свет на то, как устроено множество всех предельных точек любой ограниченной последовательности. * Бернгард Больцано — чешский философ и математик (1781—1848), Карл Вейерштрасс — немецкий математик (1815—1897).
§ 3. Произвольные последовательности 99 Если, как и выше, обозначить через х и х нижний и верхний пределы этой последовательности, то можно утверждать, что все ее предельные точки лежат на сегменте [я, х], причем если указанная последовательность не является сходящейся, то она имеет по крайней мере две предельные точки х и х. Рассмотренная нами 1,11,1 1 , выше последовательность —, 1 , —. 1 , ... , —, 1 — 2 2 3 3 п , ... представляет собой пример последовательности, имею- п щей только две предельные точки х=0 и х= 1. Другая рассмотренная выше последовательность {хп}, содержащая все рациональные числа из сегмента [0, 1], представляет собой пример последовательности, предельные точки которой покрывают весь сегмент [х, х], у которого х~=0, х=1. Легко построить пример последовательности, предельными точками которой служат: 1) наперед заданное конечное множество точек а4, а2,..., а&; 2) наперед взятая бесконечная последовательность точек аь а2,..., ап,... * (во втором случае каждая предельная точка последовательности предельных точек {ап} будет являться предельной точкой исходной последовательности {хп})- 2. Расширение понятий предельной точки и верхнего и нижнего пределов. Аналогом теоремы Больцано — Вейерштрасса для неограниченной последовательности является следующее утверждение. Лемма 2. Из всякой неограниченной последовательности можно выделить бесконечно большую подпоследовательность (и, в частности, бесконечно, большую подпоследовательность, все элементы которой имеют определенный знак). Доказательство. Прежде всего заметим, что если у неограниченной последовательности отбросить любое конечное число первых ее элементов, то после такого отбрасывания получится снова неограниченная последовательность**. Пусть {хп}<— произвольная неограниченная последовательность. Тогда найдется элемент Хй, этой последовательности, удовлетворяющий неравенству 1**,|>1- Учитывая, что последовательность {хп}, рассматриваемая с номера #1+1, также является неограниченной, мы получим, что найдется элемент этой последовательности Хи„ удовлетворяющий неравенству \хьг\ >2 при 62>&1. Продолжая эти рассуждения далее, мы получим, что для любого номера п найдется элемент Хкп, удовлетворяющий неравенству \хкп\~>п при кп~>кп-у. * Таковой является последовательность ах, ах, а%, а1у а^, а3, ... . ** Ибо предположение о том, что это не так, приводит к противоречию с требованием неограниченности исходной последовательности.
100 Гл. 3. Теория пределов Очевидно, что построенная нами подпоследовательность Хк±» хь,, ... , Хь , ... является бесконечно большой. Замечая, что эта подпоследовательность заведомо содержит бесконечно много либо положительных, либо отрицательных членов, мы может выделить из нее бесконечно большую подпоследовательность, все элементы которой имеют определенный знак. Лемма доказана. Из леммы 2 и из теоремы Больцано — Вейерштрасса вытекает следующее утверждение. Лемма 3. Из совершенно произвольной последовательности можно выделить либо сходящуюся подпоследовательность, либо бесконечно большую подпоследовательность, все элементы которой имеют определенный знак. Лемма 3 естественно приводит к идее расширения понятия предельной точки последовательности. Договоримся формально дополнить введенные выше конечные предельные точки последовательности еще двумя возможными предельными точками +оо и — оо. Будем говорить, что + сю [— оо] является предельной точкой последовательности {хп}, если из этой последовательности можно выделить бесконечно большую подпоследовательность, все элементы которой положительны [отрицательны]. При таком расширении понятия предельной точки из леммы 3 вытекает следующее утверждение: у совершенно произвольной последовательности1 существует хотя бы одна предельная точка *. Естественно, считая, что + оо и — оо связаны с любым конечным вещественным числом х соотношением -^-оо<х< + оо, убедимся в том, что у совершенно произвольной последовательности {хп} существуют верхний и нижний пределы (т. е. существуют наибольшая и наименьшая предельные точки). Ради определенности остановимся на доказательстве существования верхнего предела. В силу теоремы 3.16 достаточно рассмотреть лишь случай, когда последовательность {хп} не является ограниченной. Если при этом последовательность {хп} не является ограниченной сверху, то из нее можно выделить бесконечно большую последовательность, все элементы которой положительны, и поэтому '+ оо является предельной точкой, а значит, и верхним пределом последовательности {хп}. Остается рассмотреть случай, когда неограниченная последовательность {хп} является ограниченной сверху, т. е. когда существует вещественное число М такое, что все элементы хп последовательности удовлетворяют неравенству хп<.М. Так как при этом последовательность \хп} не является ограниченной снизу, то из нее можно выделить бесконечно большую подпоследовательность, * Либо конечная, либо равная +оо или —оо.
§ 3. Произвольные последовательности 101 все элементы которой отрицательны, т. е. — сю является предель- ной точкой такой последовательности. Если при этом указанная последовательность {хп} не имеет ни одной конечной предельной точки, то единственная предельная точка — со и является верхним пределом этой последовательности. Если же при этом у указанной последовательности есть хотя бы одна конечная предельная точка Хо, то, фиксировав некоторое е>0, мы выделим из этой последовательности подпоследовательность тех ее элементов хп, которые удовлетворяют неравенствам * Хв—г<хп<М. Выделенная подпоследовательность ограничена, и по теореме 3.16 у нее существует наибольшая предельная точка, которая является наибольшей предельной точкой (т. е. верхним пределом)' и всей последовательности {хп}. Существование у совершенно произвольной последовательности верхнего предела доказано. Аналогично доказывается, что у совершенно произвольной последовательности существует нижний предел. В заключение заметим, что почти все понятия и утверждения, установленные нами в этом и в предыдущем пунктах, переносятся на случай произвольного числового множества {х}, имеющего бесконечное число элементов. Точку а бесконечной прямой (—со, + со) назовем предельной точкой такого множества, если в любой е-бкрестности тоЧ' ки а содержится бесконечно много элементов этого множества. Наибольшую и наименьшую предельные точки множества {х} назовем соответственно верхней и нижней предельными точками этого множества. Повторяя рассуждения теоремы 3.16 с заменой термина «последовательность {хп}» термином «множество {х}, содержащее бесконечное число элементов», мы придем к следующему утверждению: у всякого ограниченного множества {х}, имеющего бесконечное число элементов, существуют верхняя и нижняя предельные точки (и, в частности, существует хотя бы одна предельная точка). Из этого утверждения вытекает следующее обобщение теоремы Больцано — Вейерштрасса: из элементов всякого ограниченного множества {х}, имеющего бесконечное число элементов, можно выделить схооящуюся подпоследовательность **. Как и для случая последовательности, удобно расширить понятие предельной точки и считать, что + со [—со] является предельной точкой множества {х}, если из элементов этого мно- * Заметим, что Хо^М, ибо все элементы хп последовательности {хп} удовлетворяют неравенству хп<М. Далее заметим, что в силу того, что Ха — предельная точка, существует бесконечно много элементов хп последовательности {*„}, удовлетворяющих неравенству х0—е^Хп^М. ** Любые два элемента которой являются различными элементами множества {х}.
102 Гл. 3. Теория пределов жества можно выделить бесконечно большую последовательность, состоящую из положительных [отрицательных'] чисел. Эта формализация позволяет нам утверждать, что у совершенно произвольного числового множества {х}, имеющего бесконечное число элементов, существуют хотя бы одна предельная точка, а также верхняя и нижняя предельные точки. 3. Критерий Коши * сходимости последовательности. При изучении вопроса о сходимости последовательности {хп} с помощью определения сходящейся последовательности приходится оценивать разность хп—а элементов последовательности и ее предполагаемого предела а. Иными словами, приходится предугадывать величину предела а этой последовательности. В этом пункте мы установим «внутренний» критерий сходимости последовательности, позволяющий сделать заключение о ее сходимости лишь по величине ее элементов и не использующий величины предполагаемого предела этой последовательности. Для установления такого критерия введем понятие фундаментальной последовательности. Определение. Последовательность {хп} называется фундаментальной, если для любого положительного числа г найдется номер N такой, что для всех номеров п, удовлетворяющих условию п>-Ы, и для любого натурального р (р=1, 2,...) справедливо неравенство \хп+р—хп|<е. Установим два важных свойства любой фундаментальной последовательности. Свойство 1. Для любого положительного числа г найдется элемент фундаментальной последовательности х$ такой, что в е-окрестности этого элемента Хп находятся все элементы хп этой последовательности с номерами п, удовлетворяющими условию п>-Ы. Другими словами, для любого е>0 найдется элемент фундаментальной последовательности хк, вне е-окрестности которого лежит не более чем конечное число элементов этой последовательности. Для доказательства этого свойства следует фиксировать произвольное положительное число е и взять в определении фундаментальной последовательности номер п равным N. Мы получим при этом, что для любого натурального р (/7=1, 2,...) элементы фундаментальной последовательности удовлетворяют неравенству | Хп+р—Хщ | < е или, что то же самое, неравенству Хн—б < Хн+р < #1у + е. * Огюстен Луи Коши — французский математик (1789—1857).
§ 3. Произвольные последовательности 103 Так как р — любое натуральное число, то последние неравенства и означают, что все элементы фундаментальной последовательности, номер которых не меньше N, находятся в интервале (*лг—е, XN + г), т. е. в е-окрестности Хя- Свойство 1 доказано. Свойство 2. Фундаментальная последовательность является ограниченной. Доказательство. Фиксируем некоторое е>0. Так как последовательность {хп} является фундаментальной, то для этого # (в силу свойства 1) найдется элемент х^ такой, что все элементы хп с номерами и>Лг удовлетворяют неравенству Хк—е<хп<хк+\е. Обозначим теперь через А наибольшее из следующих (Л^+ 1)" чисел: \х^, \х2\,..., \хК-1\, |*лг—е|, |л:№+е|. Тогда, очевидно, для всех номеров п будет справедливо неравенство |хте|<Л, которое и означает ограниченность последовательности {*„}. Свойство 2 доказано. Докажем теперь следующую вспомогательную теорему. Теорема 3.17. Для того чтобы последовательность {хп} была сходящейся, необходимо и достаточно, чтобы она была огра* ничейной и ее верхний и нижний пределы х и х совпадали между собой. Доказательство. 1) Необходимость. Пусть последовательность {хп} сходится. Тогда она ограничена (в силу теоремы 3.8) и имеет единственную предельную точку (в силу леммы 1 из п. 1 этого параграфа). Это и означает, что ее верхний и нижний пределы х и х совпадают между собой. 2) Достаточность. Пусть последовательность {хп} ограничена (при этом она в силу теоремы 3.16 имеет верхний предел х и ■нижний предел х), и пусть х~х. Положим х—х=х. В силу следствия 1 из теоремы 3.16 для любого е>0 в интервале (д;—е, х+г) лежат элементы последовательности {хп}, начиная с некоторого номера. В силу определения 3 сходящейся последовательности (см. п. 4 § 1) это и означает, что последовательность {хп} сходится к пределу х. Теорема 3.17 доказана. Докажем теперь следующую важнейшую теорему. Основная теорема 3.18 (критерий Коши сходимости последовательности). Для того чтобы последовательность {хп} была сходящейся, необходимо и достаточно, чтобы она была фундаментальной. Доказательство. 1) Необходимость. Пусть последовательность {хп} сходится к некоторому пределу х. Докажем, что эта последовательность является фундаментальной. Фиксируем произвольное положительное число е. Так как последовательность {хп} сходится к пределу х, то для положительного числа е/2 найдется номер N такой, что при всех «>ЛГ
104 Гл. 3. Теория пределов \хп—х\<е/2. (3.54) Если р — любое натуральное число, то при всех п^>Ы и подавно будет справедливо неравенство \х„+Р—х\<е/2 (3.55) (ибо при п>>Ы заведомо будет справедливо неравенство п + р^Ы). Так как модуль суммы двух чисел не превосходит суммы их модулей, то из неравенств (3.54) и (3.55) мы получим, что при всех п>Ы и для любого натурального р \Хп+р—Хп\ = | [#п+р—X] + [X—Хп\ I •< |Хп+р—#| + \Хп-—Х\ <8, а это и означает фундаментальность, последовательности {хп}. 2) Достаточность. Пусть последовательность {хп} является фундаментальной. Требуется доказать, что эта последовательность является сходящейся. В силу теоремы 3.17 достаточно доказать, что последовательность {хп} ограничена и что ее верхний и нижний пределы х и х совпадают между собой. Ограниченность любой фундаментальной последовательности уже установлена нами выше (см. свойство 2). Остается доказать, что для любой фундаментальной последовательности {хп} верхний предел х и нижний предел х совпадают. Фиксируем произвольное положительное число е. В силу свойства 1 фундаментальной последовательности найдется элемент этой последовательности х^ такой, что вне е-окрестности этого элемента, т. е. вне интервала (хы—б, Хп + г) лежит не более чем конечное число элементов последовательности {хп}- Но тогда в силу следствия 2 из теоремы 3.16 интервал (х, х) обязан содержаться в интервале {хх—е, Хдг + е) и, в частности, должно быть справедливо неравенство х—#< (хм+е) — (д:^—е) =2е. Так как, кроме того, х>х, то для любого е>0 будут справедливы неравенства 0<:-г—х<2е. В силу произвольности е из этих неравенств вытекает, что х—х=0*, т. е. х=х. Критерий Коши полностью доказан. Применим критерий Коши для установления расходимости последовательности {хп} с элементами х =1 -\ 1- ... + -—. 2 п Заметим, что если для любого номера п натуральное число р взять равным п, то мы получим, что для всех номеров п 1*„+Р-*1 = 1*2П—*„|= [1 + т +'" + ~ъг)~ * В самом деле, если бы разность х—х равнялась положительному числу а, то,_взяв в качестве е число а/3, мы бы получили противоречие с неравенством х—л^2е.
§ 4. Предел функции 105 \ 2 п ) л+1 л+2 2п >Л = —, 2л 2 ибо подчеркнутая сумма содержит п слагаемых, наименьшее из 1 которых равно —-. Таким образом, для положительного числа е = — не существует номера N. такого, что при всех п>-Ы и для любого натураль- ного р справедливо неравенство \хп+р—хп\<е. Это означает, что рассматриваемая последовательность не является фундаментальной и (в силу критерия Коши) расходится. В качестве второго примера применим критерий Коши для установления сходимости последовательности {хп} с элементами хп = = \ + д + ... + дп, где д — любое число из интервала 0<<7<1. Для любого номера п и любого натурального числа р (р = = 1, 2,...) справедливо неравенство \хп+р-хп\ = (1 + д + • • • + дп+р) -(1 + д+ .... + дп)]= = дп+г + дп+2 + . . . + дп+Р = Я»+>-^+>> < ^# (3.56) 1 —> 1-я Фиксируем произвольное положительное .число е. Так как при 0<<7<1 последовательность {дп} является бесконечно малой, то для положительного числа е(1—д) найдется номер N такой, что прк всех п>-Ы справедливо неравенство <7"<е(1— д). (3.57) Из неравенств (3.56) и (3.57) вытекает, что при всех п>Ы и для любого натурального р , • е( 1 —а) 1*и-р--*л1< ; =е> а это означает, что рассматриваемая последовательность является фундаментальной и (в силу критерия Коши) сходится. § 4. ПРЕДЕЛ (ИЛИ ПРЕДЕЛЬНОЕ ЗНАЧЕНИЕ) ФУНКЦИИ Перейдем теперь к изучению другой более сложной формы операции предельного перехода, основанной на понятии предела (или предельного значения) функции. Но прежде всего мы должны уточнить сами понятия переменной величины и функции. 1. Понятия переменной величины и функции. Как мы уже видели в гл. 1, к понятию функции приводит изучение двух перемен*
106 Гл. 3. Теория пределов ных величин, изменение которых взаимообусловлено. Поэтому естественно начать с уточнения понятия переменной величины. Рассмотрение реальных физических переменных величин приводит нас к выводу, что эти величины не всегда могут принимать произвольные значения. Так, скорость материальной точки не может быть больше 3-Ю10 см/с (т. е. скорости света в пустоте), температура тела не может быть меньше —273°, смещение материальной точки, совершающей гармонические колебания по закону у=А со§(о)^+б), может принимать значения только из сегмента [-А, +А]. . Отвлекаясь от конкретных физических свойств наблюдаемых в природе переменных величин, мы приходим к понятию математической переменной величины, характеризуемой только численными значениями, которые она может принимать *. Множество {х} всех значений, которые может принимать данная переменная величина х, называется областью изменения данной пер ем ен ной в ел и ч и н ы. Переменная величина считается заданной, если задана область ее изменения. В дальнейшем мы, как правило, будем обозначать переменные величины малыми латинскими буквами х, у, I,..., а области изменения этих переменных величин соответственно символами {х}, {у}, {(},-. Перейдем теперь к уточнению понятия функции. Пусть задана переменная величина х, имеющая областью изменения некоторое множество {х}. Если каждому значению переменной х из множества {х} ставится в соответствие по известному закону некоторое число у, то говорят, что на множестве {х} задана функция у=у(х) или у=!(х). При этом переменная х называется аргументом или независимой переменной, множество {х} называется областью задания функции, а то число у, которое соответствует данному значению х, называется частным значением функции в точке х. Совокупность всех частных значений образует вполне определенное множество {у}, которое называют либо областью изменения функции, либо множеством всех значений функции. В обозначении у=}(х) букву / часто называют характеристикой функции. Для обозначения аргумента, функции и ее характеристики могут употребляться различные символы. Остановимся на примерах функций. 1". г/ = К4—хг. Эта функция задана на сегменте — 2<я«:2 (при этом выражение под знаком корня является неотрицатель- * Понятие переменной величины также относится к числу начальных математических понятий.
§ 4. Предел функции 107 ным), а множеством всех ее значений является сегмент 0<:г/<:2 (рис. 3.4). 2°. Так называемая функция Дирихле*, которая определяется так: _'п/ \_ |0» если х — иррациональное число, (1, если х — рациональное число. Эта функция задана на бесконечной прямой — оо<#< + оо, а множество всех ее значений состоит из двух точек 0 и 1. 3°. 1+ 1, если х > 0, 0, если х = 0, — 1, если х < 0. (Термин «5§п» происходит от латинского слова зщпит —, знак.) Читается: <«/ равно сигнум х». Эта функция задана на всей бесконечной прямой — оо<д:< + оо, а множество всех ее значений со- стоит из трех точек у=—1, у = 0 и у=\ (рис. 3.5). У" 7$ Рис. 3.4 -/ Рис. 3.5 X 4°. у=[х], или у=Е(х), где символ [я] или Е(х) обозначает целую часть числа х или, точнее, наибольшее целое число, не превосходящее х. Читается:«г/ равно антье х» (от французского слова епИег — целый). Эта функция задана на всей бесконечной прямой— со <х< + оо, а множеством всех ее значений является множество всех целых чисел (рис. 3.6). 5°. у = п\. Эта функция задана на множестве всех натуральных чисел я=1, 2, 3 Множеством всех значений этой функции является множество натуральных чисел вида п\ = 1-2-3- ... -я, где п=\, 2, 3,... (рис. 3.7). Часто закон, устанавливающий соответствие между множеством всех значений аргумента и множеством всех значений функции, задается посредством формул. Такой способ задания функции называется а н а л и т и ч е с к и м. Петер Густав Лежен-Дирихле — немецкий математик (1805—1859).
108 Гл. 3. Теория пределов При этом следует подчеркнуть, что функция может задаваться разными формулами на разных участках области своего задания. Например, функция _ |—х при х<С 0, I х2 у- при х > 0 задана аналитическим способом на всей —оо<л:< + оо (рис. 3.8). бесконечной прямой У 4- 3 2 1 -4-3-2-1 I Л О «—с"- Л -Г"<1 / 2 3x4 5а; У- 4!г <р Весьма распространенным способом задания функции является так называемый табличный способ, заключающийся в задании таблицы отдельных значений аргумента и соответствующих им значений функции. При таком способе задания можно приближенно вычислить не содержащиеся в таблице значения функции, отвечающие промежуточным значениям аргумента. Для этого применяется метод интерполяции, заключающийся в замене функции между ее соседними табличными значениями какой-либо функцией простой природы (например, линейной или квадратичной). Примером табличного способа задания функции может служить расписание движения поезда, которое определяет местополо-
§ 4. Предел функции 109 жение поезда в отдельные моменты времени. Интерполяция позволяет приближенно определить местоположение поезда в любой промежуточный момент времени. В практике физических измерений весьма распространенным является и еще один способ задания функции — так называемый графический способ, при котором соответствие между аргументом и функцией задается посредством графика (снимаемого, например, на осциллографе). 2. Предел функции по Гейне и по Коши. Пусть функция У~НХ) определена на некотором бесконечном множестве {х}, и пусть а — точка бесконечной прямой (—оо, +оо), быть может и не принадлежащая множеству {х}, но обладающая тем свойством, что в любой б-окрестности этой точки а имеются точки множества {х}, отличные от а *. Например, множеством {х} может служить интервал (а, Ь); в этом случае точка а, являясь граничной точкой интервала, ему не принадлежит, но в любой б-окрестности а содержатся точки указанного интервала. Другим примером множества {х}, на котором задана функция [(х), может служить множество всех рациональных чисел, принадлежащих интервалу (а—б, а+б) с выкинутой точкой а. Заметим, кстати, что при любом б>0 интервал (а—б, а+б), "из которого выкинута точка а, принято называть проколотой ^-окрестностью точки а. Определение 1 (предел функции по Гейне**). Число Ъ называется пределом (или предельным значением) функции #=/(х) в точке а (или при х->-а), если для любой последовательности значений аргумента Хи Хг,..., хп, —, сходящейся к а и состоящей из чисел хп, отличных от а, соответствующая последовательность значений функции /(#1), 1(хг),...,$(хп) ...сходится к числу Ь. Определение 1* (предел функции по Коши). Число Ъ называется пределом (или предельным значением) функции у—1(х) в точке а (или при х-+а), если для любого положительного числа е найдется отвечающее ему положительное число б такое***, что для всех значений аргумента х, удовлетворяющих условию 0<\х—а|<б, справедливо неравенство \!(х)— Ь\<е. (3.58) Для обозначения предельного значения функции у=}(х) в точке а используют следующую символику: Нт/(л;) = 6 или 1(х)-+Ь при х-+а. * Это означает, что о является предельной точкой множества {*}. ** Генрих Эдуард Гейне — немецкий математик (1821—1881). *** Так как б зависит от е, то иногда пишут: б=6(е).
по Гл. 3. Теория пределов Прежде чем доказывать эквивалентность определений 1 и 1 *, сделаем несколько замечаний, разъясняющих смысл этих определений. Замечание 1. Подчеркнем важность фигурирующего в определении 1 требования, обязывающего элементы последовательности значений аргумента хп быть отличными от а, и аналогичного требования в определении 1*, обязывающего брать значения аргумента х, удовлетворяющие условию 0<|*—а\, т. е. отличные от а. Это требование вызвано уже тем, что функция у=}(х) может быть не определена в точке а. Отсутствие этого требования сделало бы невозможным использование предела функции для определения производной функции. В самом деле, из гл. 1 нам известно, что производная \' (а) функции }(х) в точке а представляет собой предел при х-+а следующей функции: х — а Очевидно, что эта функция Р(х) не определена в точке а и это вызвано существом дела. Замечание 2. Особо подчеркнем, что множество {х}, на котором задана функция }{х), вовсе не обязано сплошь покрывать некоторую проколотую б-окрестность точки а. От этого множества {х} требуется только, чтобы оно имело хотя бы один элемент в любой проколотой б-окрестности точки а. Примером множества {х} может служить множество всех элементов последовательности | — I, лежащих в фиксированной б-окрестности точки о = 0. Замечание 3. Заметим, что фигурирующее в определении 1* условие 0<|л:—а\<6 эквивалентно соотношениям а—б< <х<а + 6, хфа, т. е. означает, что х принадлежит проколотой б-окрестности точки а. Аналогично, фигурирующее в определении 1* неравенство (3.58) эквивалентно неравенствам Ь—е< <}{х)<Ь + е, т. е. означает, что /(д;) принадлежит «-окрестности Ь. Замечание 4. Привлекая идею приближения функции ^(х) в окрестности точки а с наперед заданной точностью е, мы можем следующим образом перефразировать определение 1* предела функции по Коши: число Ь называется предельным значением функции }(х) в т о ч к е а, если для любой наперед заданной точности е>0 можно указать такую Ь-окрестность точки а, что для всех значений аргумента х, отличных от а и принадлежащих указанной Ь-окрестности точки а, число Ь приближает значение функции \(х) с точностью е (рис. 3.9). Замечание 5. Отметим, что функция /(х) может иметь в точке а только один предел. В самом деле, для определения предела функции по Гейне это вытекает из единственности предела последовательности {/(хп)}, а для определения предела функции
§ 4. Предел функции 111 по Коши это вытекает из устанавливаемой ниже эквивалентности этого предела пределу функции по Гейне. Докажем теперь следующую важную теорему. Теорема 3.19. Определения 1 и 1* предела функции по Гейне и по Коши являются эквивалентными. Доказательство. 1) Пусть сначала число Ь является пределом функции у — Цх) в точке а по Коши. Докажем, что это же число Ъ является пределом функции у = }(х) в точке а и по Гейне.. Пусть {хп} — любая сходящаяся к а после- „■ у=/Щ довательность значений аргумента, все элементы которой отличны от а. Требуется доказать, что соответствующая последовательность значений функции {1(хп)} сходится к Ъ. Фиксируем произвольное положительное число е и по нему положительное число б, которое в силу определения предела функции по Коши гарантирует справедливость неравенства (3.58) для всех значений х, для которых 0<|д;—а|<б. В силу сходимости последовательности {хп} к а для указанного положительного числа б найдется номер N такой, что при всех п>Ы справедливо неравенство \хп—а|<б. Поскольку хпфа для всех номеров л, то при всех п>-Ы справедливы неравенства 0< <|хп—а\<8 и, значит, в силу определения предела функции по Коши при всех л>М справедливо неравенство \!(хп)—Ь\<г. Это и означает, что последовательность {/(*п)} сходится к числу Ь. 2) Пусть теперь число Ъ является пределом функции у={(х) в точке а по Гейне. Докажем, что это же число Ь является пределом функции у = !(х) в точке а и по Коши. Предположим, что это не так. Тогда для некоторого положительного числа е и для сколь угодно малого положительного числа б найдется хотя бы одно значение аргумента х такое, что 0<|л:—а|<б, но |/(х)—Ь|>е. Таким образом, мы можем взять последовательность Рис. 3.9 (л=1, 2,...) и утверждать, что для каждого ее элемента найдется хотя бы одно значение аргумента хп такое, что п 1 0<\хп-а\<±., но |/(х„)-&|>е. (3.59)
112 Гл. 3. Теория пределов Левое из неравенств (3.59) означает, что последовательность {хп} сходится к а и состоит из чисел, отличных от а. Но в таком случае согласно определению предела по Гейне соответствующая последовательность значений функции {{(хп)} обязана сходиться к числу Ь, а этому противоречит правое из неравенств (3.59), справедливое для всех номеров п. Полученное противоречие доказывает теорему. Приведем примеры функций, как обладающих, так и не обладающих в данной точке а предельным значением. Г. Функция 1{х) =с = сопз1 имеет равный с предел в каждой точке а бесконечной прямой. В самом деле, для любого значения аргумента х разность }(х)—с равна нулю, и поэтому \{(х)—с|<е для любого е>0 и для всех значений аргумента (в данном случае для любого е>0 в определении предела по Коши можно брать в качестве б любое положительное число). 2°. Функция 1(х) =х в любой точке а бесконечной прямой имеет предел, равный а. В самом деле, для этой функции последовательности значений аргумента и соответствующих значений функции тождественны, и поэтому, если последовательность {хп} сходится к а, то и последовательность {!{хп)} также сходится к а. 3°. Функция Дирихле О(х), значения которой в рациональных точках равны единице, а в иррациональных точках — нулю, не имеет предела ни в одной точке а бесконечной прямой. Это вытекает из того, что для сходящейся к а последовательности рациональных значений аргумента предел последовательности соответствующих значений функции равен единице, в то время как для сходящейся к а последовательности иррациональных значений аргумента предел последовательности соответствующих значений функции равен нулю. Введем теперь понятие одностороннего (т. е. правого или левого) предела функции в данной точке а. Для этого нам прежде всего следует уточнить характер того множества {х}, на котором задана функция Цх). Мы теперь потребуем, чтобы это множество {х} для любого б>0 имело хотя бы один элемент, принадлежащий интервалу (а, а+б) [интервалу (а—б, а)]. Определение 2 (правый [левый] предел функции по Гейне). Число Ь называется правым пределом [левым пределом] функции у = {(х) в точке а, если для любой последовательности значений аргумента {хп}, сходящейся к а и состоящей из чисел, больших а [меньших а], соответствующая последовательность значений функции {{(хп)} сходится к числу Ъ. Определение 2* (правый [левый] предел функции по Коши). Число Ъ называется правым пределом [левым пределом] функции у = {(х) в точке а, если для любого положительного числа е найдется отвечающее ему положительное число б такое, что для всех значений аргумента лг„
§ 4. Предел функции ИЗ- удовлетворяющих условию а<х<а-\-§ [условию а—6<х<а]„ справедливо неравенство (3.58). Для обозначения правого [левого] предела функции {(х) в точке а используют следующую символику: Нт /(*) = & [ Нт Цх) = Ь] х-+а+0 х-уа—О или более краткую символику Ца + 0)=Ь [Т(а-0)=Ь]. В полной аналогии с теоремой 3.19 доказывается эквивалентность определений 2 и 2*: следует лишь во всех проведенных при; доказательстве этой теоремы рассуждениях брать значения аргумента х и элементы последовательности {хп} большими числа ое [меньшими числа а\. В качестве примера рассмотрим функцию 1+ 1, если х > О, О, если х = О, — 1, если- х < 0. Эта функция имеет в точке а — О как правый, так и левый пределы, причем з§п(0 + 0) = + 1, $&п(0—0) =—1. В самом деле, для- любой сходящейся к а=0 последовательности {х„}, состоящей и* чисел, больших нуля, соответствующая последовательность- {з^пхп} сходится к +1, а для любой сходящейся к а = 0 последовательности {хп}, состоящей из чисел, меньших нуля, соответствующая последовательность {&§пхп} сходится к —1. Из проведенных рассуждений вытекает, что у рассматриваемо» функции у = 5&пх не существует в точке а=0 предела. Итак, функция у = 5%пх не имеет в точке а=0 предела, но- имеет в этой точке правый предел, равный +1, и левый предел, равный —1. Тот факт, что правый и левый пределы этой функции не равны друг другу, не является случайным, ибо справедливо' следующее утверждение: если функция 1(х) имеет в точке а как правый, так и левый пределы и если эти односторонние пределы-, равны одному и тому же числу Ь, то эта функция имеет в точке а- предел, равный Ь*. Для доказательства этого утверждения достаточно воспользоваться определениями 1* и 2* и учесть, что если неравенство» (3.58) справедливо для значений аргумента х, удовлетворяющих, условиям а<х<а+Ь и а—Ь<х<а, то неравенство (3.58) справедливо и для всех значений аргумента х, удовлетворяющих условию* 0<\х—а\<8. * Очевидно, справедливо и обратное утверждение: если функция }(х) имеет в точке а равный Ь предел, то как правый, так и левый пределы }(х) в» точке а существуют и оба равны Ь.
«14 Гл. 3. Теория пределов Сформулируем теперь понятие предела функции при я-хэо. Для введения этого понятия следует потребовать, чтобы множество {х}, на котором задана функция у=цх), для любого б>0 имело хотя бы один элемент, лежащий вне сегмента [—б, + 6]. Определение 3 (предел функции при х-^-оо по Гейне). Число Ъ называется пределом (или предельным значением) функции у = !(х) при х->-оо, если для любой ^бесконечно большой последовательности значений аргумента {хп} соответствующая последовательность значений функции {1(хп)} сходится к числу Ь. Определение 3* (предел функции при л:->-со по !Кош и). Число Ъ называется пределом (или предельным значением) функции у—1(х) при л;->-оо, если для любого ■положительного числа е найдется отвечающее ему положительное •число б такое, что для всех значений аргумента х, удовлетворяющих условию |х|>б, справедливо неравенство (3.58). Для обозначения предела функции у=Цх) при х->-оо используют следующий символ: Пт/(л>) = Ь. Х-*аа В полной аналогии с теоремой 3.19 доказывается эквивалентность определений 3 и 3*. Следует лишь в рассуждениях, использованных при доказательстве этой теоремы, всюду заменить сходящуюся последовательность значений аргумента {хп} бесконечно большой последовательностью значений аргумента {хп}, а неравенство 0<|х—а\<8 заменить неравенством |л;|>б. Примером функции, имеющей предел при д:->-оо, может служить функция /(х) = — (хфО), В самом деле, для любой беско- X ■иечно большой последовательности значений аргумента {хп} соответствующая последовательность значений функции $(хп) = 1/хп (в силу теоремы 3.6) является бесконечно малой, т. е. имеет своим пределом число Ь = 0. Значит, в силу определения 3 Нт — = 0. Х-+а> X Сформулируем, наконец, понятие предела функции при стремлении х к бесконечности определенного знака. Для введения такого понятия потребуем, чтобы функция у = Цх) была задана на талом множестве {х}, которое для любого б>0 имеет хотя бы один элемент, лежащий правее б [левее — б]. Определение 4 (предел функции при х->- + оо I*-»—°°] по Гейне). Число Ь называется пределом •■(или предельным значением) функции у=](х) при .*->-+оо [при х-*»—со], если для любой бесконечно большой последовательности значений аргумента {хп}, все элементы которой
§ 4. Предел функции 115 положительны {отрицательны], соответствующая последовательность значений функции [}(хп)} сходится к числу Ь. Определение 4* (предел функции при х-^ + оо [х-*—оо] по Кош и). Число Ь называется пределом (или предельным значением) функции у = }(х) при% х->- + оо [при х->—°о]; если для любого положительного числа е найдется отвечающее ему положительное число б такое, что для* всех значений аргумента х, удовлетворяющих условию х>Ь [х< <—,6], справедливо неравенство (3.58). Для обозначения введенных понятий используется следующая символика: Ига ?(х) = Ь [ Пт Цх) = Ь]. дс-Н-оо х-*— со Эквивалентность определений 4 и 4* доказывается по схеме доказательства теоремы 3.19: следует только во всех рассуждениях, заменить сходящуюся последовательность значений аргумента1 {Хп} на бесконечно большую последовательность значений аргумента {хп}, состоящую из положительных [отрицательных] чисел*, а неравенство 0<|л:—а\<8 заменить неравенством х>8 [х<—б]. Замечание 6. Отметим, что изученное нами в § 1—3 поня- тие предела числовой последовательности {хп} можно рассматривать как частный случай предела функции при л;->-+оо. В самом- деле, если взять в качестве {х} множество всех натуральных чисел 1, 2, ..., п, ..., а в качестве функции 1(х), заданной на этом множестве, ту функцию, которая каждому значению аргумента п ставит в соответствие л-й член последовательности хп, то определение 4*; предела такой функции при х-»-+оо в точности совпадет с опре~ делением предела числовой последовательности {*„}. Замечание 7. Естественно, возникает идея связать воедино все введенные нами понятия пределов функции и предел числовой последовательности. В § 5 настоящей главы вводится? понятие общего предела функции по базе, включающее в себя! как частный случай все введенные нами понятия пределов; функции и понятие предела числовой последовательности. 3. Критерий Кош и существования предела функции. Ради определенности рассмотрим подробно случай предела функции {/=/(*)* в точке о, введенного определениями 1 и 1*. Определение. Будем говорить, что функция у=}(х) удовлетворяет в точке а условию Коши, если для любого положительного числа г найдется отвечающее ему положительное число б такое, что для любых двух значений аргумента х' и х"„ удовлетворяющих условиям 0<|х'—а\<8, 0<\х"—а\<8, (3.60)* справедливо неравенство \[(х')-1(х")\<е. (3.61>
116 Гл. 3. Теория пределов Теорема 3.20 (критерий Коши существования предела функции в то'чке а). Для того чтобы функция <у=}(х) имела в точке а конечный предел, необходимо и достаточно, чтобы функция у=!(х) удовлетворяла в точке а условию Коши. Доказательство. 1) Необходимость. Пусть существует конечный предел Пт/(л:) = 6. Фиксируем произвольное положи- х-*а тельное число е. В силу определения 1* предела функции по Коши для положительного числа е/2 найдется положительное число б такое, что, каковы бы ни были два значения аргумента х' и х", удовлетворяющие условиям 0<\х'—а)<Об, 0<|х"—а|<6, для соответствующих значений функции справедливы неравенства |/(*')-б|<-§-. I ?(*")-& К-§- (3-62) Так как модуль суммы двух величин не превосходит суммы дах модулей, то в силу неравенств (3.62) мы получим, что \[(х')-Цх") | = 1 [1{х')-Ъ] + [Ь-!(х")) К <\Г(х')-Ь\ + \1(х")-Ь\<г, & это и означает, что функция у=1(х) удовлетворяет в точке а условию Коши. 2) Достаточность. Пусть функция /(х) удовлетворяет в точке •а условию Коши. Требуется доказать, что функция }{х) имеет в точке а предел. Пусть {хп} — произвольная последовательность значений аргумента.^ сходящаяся к а и состоящая из чисел, отличных от а. В силу определения 1 предела по Гейне достаточно доказать, что соответствующая последовательность значений функции {}(хп)} сходится к некоторому числу Ъ и что это число Ъ одно и то же для всех сходящихся к а последовательностей {хп}, состоящих из чисел, отличных от а. Докажем сначала, что для каждой сходящейся к а последовательности {х„} значений аргумента, отличных от а, соответствующая последовательность значений функции {1(х„)} сходится к некоторому пределу. Фиксируем произвольное положительное число е и по нему отвечающее ему, согласно условию Коши, положительное число б. В силу сходимости последовательности {хп} к а и в силу условия хпфа для этого б>0 найдется номер N такой, что 0<|хп—а|<б при п>-Ы. Если теперь р — любое натуральное число (р=1, 2, 3, ...), то тем более 0<\хп+Р—а\<8 при п>N *. Таким образом, при п^Ы и для любого натурального р справедливы два неравенства: 0<|л;„+р—а|<б, 0<|л:„—а|<6, * Ибо если п^Ы, то и подавно п+р^Ы.
§ 4. Предел функции 117 Из этих двух неравенств и из условия Коши вытекает, что при гС^-Ы и для любого натурального р \1(хп+р)—1(Хп)\,<г, а это означает фундаментальность последовательности {?(хп)}- В силу критерия Коши. сходимости числовой последовательности (см. теорему 3.18) последовательность {[(хп)} сходится к некоторому числу Ь. Остается доказать, что для любых двух сходящихся к а последовательностей значений аргумента {х„} и {хп'}, все элементы которых отличны от а, соответствующие последовательности значений функции {/(*„)} и {/(*„')} сходятся к одному и тому же пределу. Предположим, что последовательности {!(хп)} и {/(*/)} сходятся к пределам Ь и Ъ' соответственно. Рассмотрим новую последовательность значений аргумента Х\, Х\, х2, х2', Хз,1 Хъ, ..., хп, хп', ..., также сходящуюся к а и состоящую из чисел, отличных от а. В силу доказанного выше соответствующая последовательность значений функции /(*,), /(*,'), /(*2), /(V), -. /(*ч), /(*«')>••• обязана сходиться к некоторому пределу Ъ". Но тогда в силу утверждения, доказанного в начале п. 1 § 3, и любая подпоследовательность этой последовательности обязана сходиться к тому же самому пределу Ь". Значит, как подпоследовательность нечетных элементов /(*1), \{х2), ..., ((хп), .-, так и подпоследовательность четных элементов !(х\), 1(х2), ..., 1(хп'), ... обе сходятся к Ь". Отсюда вытекает, что Ь = Ь'=Ь". Теорема полностью доказана. Аналогично формулируется условие Коши и доказывается критерий Коши и для случаев правого [левого] предела в точке а, предела при лс-»-оо и предела при х-*-+оо[х-*—оо]. При формулировке условия Коши достаточно в приведенном выше определении заменить условия (3.60) для случая правого [левого] предела в точке а условиями а<х'<а+Ъ, а<х"<а+8 [а—Ь<х'<а, а~8<х"<а], для случая предела при х->оо условиями И>в, |х"|>б и, наконец, для случая предела при х-»-+ оо [л:-*—-с»] условиями х'>6, х">6 [х'<—Ь, *"<—6]. Соответствующие критерии Коши доказываются по схеме доказательства теоремы 3.20: следует только во всех рассуждениях понимать под последовательностями значений аргумента {*„'} и {хп") в случае правого [левого] предела в точке а последовательности, сходящиеся к а и состоящие из чисел, больших а [меньших а], в случае предела при х->оо бесконечно большие последовательности и, наконец, ; случае предела при х-> + оо [л;->—оо] бес-
118 Гл. 3. Теория пределов конечно большие последовательности, состоящие из положительных [отрицательных] чисел. 4. Арифметические операции над функциями, имеющими предел. Справедлива следующая фундаментальная теорема. Основная теорема 3.21. Пусть две функции /(х) и §(х) заданы на одном и том же множестве {х} и имеют в точке а пределы, соответственно равные Ь и с. Тогда функции ((х)+§(х)^ }(х)—ц(х), 1(х)-§(х) и 1(х)/(*(х) имеют в точке а пределы, соответственно равные Ь + с, Ъ—с, Ъ-с, Ь/с (в случае частного нужно дополнительно требовать, чтобы с было отлично от нуля). Доказательство. Пусть {хп} — произвольная сходящаяся к а последовательность значений аргумента, все элементы которой отличны от с. В силу определения 1 предела по Гейне соответствующие последовательности значений функции {Нхп)} и {§(хп)} сходятся к пределам Ь и с соответственно. Но тогда в силу теорем 3.9—3.12 последовательности {}(хп)+ё(хп)}, {1(хп)—§(хп)}, {{(хп) -§(хп)} и 1 '^Хп'А сходятся к пределам Ь + с, Ь—с, Ъ-с и I 8(хп) I Ь/с соответственно. Это последнее в силу произвольности последовательности значений аргумента {хп}, сходящейся к а, и в силу определения 1 предела по Гейне означает, что функции !(х) + + §(х), 1(х)—ё(х), !(х)-§(х) и !{х)/§(х) имеют в точке а пределы, соответственно равные Ь + с, Ь—с, Ъ-с и Ь/с. Теорема доказана. Доказательство соответствующей теоремы для случаев правого [левого] предела в точке а, предела при л:-*-оо и предела при х-+ + оо [х-+—оо] проводится по той же схеме. Все отличие состоит в том, что в качестве последовательности значений аргумента {хп} следует взять в случае правого [левого] предела в точке а последовательность, сходящуюся к а и состоящую из чисел, больших а [меньших а], в случае предела при х-э-со — бесконечно большую последовательность и, наконец, в случае предела при *->+оо [х-*—оо] бесконечно большую последовательность, состоящую из положительных' [отрицательных] чисел. Рассмотрим примеры применения теоремы 3.21. Выше в п. 2 мы убедились в том, что для любой точки а бесконечной прямой \\тх = а. Используя теорему 3.21, мы можем утверждать, что Пт х2 == Нт х ■ Нт х = а ■ а = а2 дг-»а х-*а х-»а и, вообще, для любого номера п Нт хп = а". х-ю Пусть теперь Рп{х) =Ъ0 + Ъ1х+Ь2х2+... + Ъпхп, где Ъ0, Ьи ..., Ьп-и ЬпфО — некоторые постоянные числа. Такая функция Рп(х) называется многочленом степени п. В силу той же теоремы 3.21
§ 4. Предел функции 119 Ит Рп(х) = Нт [Ь0 + Ъхх + ... + Ьпхп] = Ьд+^а + ... + Ьпап = Рп(а) х-*а х-* а для любой точки а бесконечной прямой. Итак, многочлен Рп(х) имеет предел в любой точке а бесконечной прямой, и этот предел равен частному значению этого многочлена в точке а. Пусть, наконец, Рп(х) и С}т(х) — два произвольных многочлена степеней пит соответственно. Частное 7? (х) — ——— принято* называть рациональной дробью. В силу теоремы 3.21 для случая частного <2т(а) V в любой точке а, не являющейся корнем многочлена (2т(х). Таким образом, рациональная дробь имеет предел в каждой точке а бесконечной прямой, не являющейся корнем ее знаменателя, и этот предел равен частному значению этой дроби в указанной точке а. 5. Бесконечно малые и бесконечно большие функции. Ради определенности будем рассматривать предел функции в точке а. Функция а(х) называется бесконечно малой в точке а, если предел этой функции в точке а равен нулю. Примером бесконечно малой в точке а функции может служить функция а(х) = (х—а)п, где п — любое целое положительное число. В самом деле, в конце предыдущего пункта мы установили, что многочлен (х—а)п имеет предел в каждой точке а, причем этот предел равен частному значению этого многочлена в точке х=а, т. е. равен нулю. Заметим, что если функция 1(х) имеет предел в точке а, равный числу Ь, то функция а(х)=1(х)—Ь является бесконечно малой в точке а. Это вытекает из того, что пределы каждой из функций {(х) и §(х)^вЪ в точке а равны числу Ъ, и из теоремы 3.21 для случая разности !(х)—§(х). Сформулированное утверждение приводит нас к следующему специальному представлению для функции !(х), имеющей равный Ь предел в точке а: Нх)=Ь + а(х), (3.63) где а(х) — некоторая бесконечно малая в точке а функция. Представление (3.63) весьма удобно в различных приложениях теории пределов. Введем теперь понятие бесконечно большой в данной точке а справа [или слева] функции. Пт/?(х) = Нт Рп(х) х->а \т Рп{х) х-+а х-*а 0.т{х) Нт <2т(х) х-»а
120 Гл. 3. Теория пределов Функция А(х) называется бесконечно большой в точке а справа [слева] функцией, если для любой сходящейся к а последовательности {хп} значений аргумента, все элементы которой больше а [меньше а], соответствующая последовательность значений функции {А(хп)} является бесконечно большой последовательностью, все элементы которой, начиная с некоторого номера, либо положительны, либо отрицательны. Для бесконечно больших в точке а справа [слева] функций используется следующая символика: Нт А(х) = +оо [ Пт Л (г = + оо] х-»а+0 дг-»а—0 ИЛИ Нт А(х) = —оо [ Нт А(х) = — оо]. х-ю+0 х-+а—0 Иногда употребляют более лаконичную символику: А(а+0)= + °о[А(а—0) = +оо] или А (а+0) =—оо [Л (а—0) —— оо]. Остановимся на методике сравнения двух бесконечно малых в данной точке а функций. Пусть а(х) и 6(х) — две функции, заданные для одних и тех же значений аргумента и обе являющиеся бесконечно малыми в точке а. 1°. Говорят, что а(х) является в точке а бесконечно малой более высокого порядка, чем В(х) (имеет в точке а более высокий пор яд о к малости, чем $(х)), если Нт-^- = 0. (3.64) х-+а р(х) 2°. Говорят, что а(х) и В(х) являются в точке а бесконечно малыми одного порядка (имеют в точке а одинаковый порядок малости), если предел, стоящий в левой части (3.64), равен конечному числу, отличному от нуля. 3°. Говорят, что а(х) и В(х) являются в точке а эквивалентными бесконечно малыми, если предел, стоящий в левой части (3.64), равен единице. Для обозначения того, что а(л;) является в данной точке бесконечно малой более высокого порядка, чем В(л;), используют следующую запись: а = о(В) (читается: «а равно о малому от В»). Итак, символ о($) обозначает любую бесконечно малую в данной точке а функцию, имеющую в этой точке более высокий порядок малости, чем бесконечно малая в той же точке функция
§ 4. Предел функции 121 0(#). Из этого определения символа «о малое» вытекают следующие его свойства: 1) о(Р)+о(Р)=о(Р),о(Р)-о(Р)=о(Р); 2) если7 = о(р),то о(р)+о(7) =о(р); 3) если а и р— любые две бесконечно малые в данной точке функции, то а-р = о(а) и а-р=о(Р). Аналогично сравниваются две бесконечно большие в данной точке а справа (или слева) функции. Пусть А(х) и В(х) определены для одних и тех же значений? аргумента и для определенности Нт Л(х) =•+оо, Пт В(х) = +оо. х-»а+0 х-ю+О 1°. Говорят, что А(х) имеет в точке а справа более вы- А(х) с о кий порядок роста, чем В(х), если функция —^-!- яеляется бесконечно большой в точке а справа. 2°. Говорят, что А(х) и В(х) имеют в точке а справа одинаковый порядок роста, если предел функции —-^- при х->а+0 равен конечному числу, отличному от нуля. Приведем примеры сравнения бесконечно малых и бесконечно больших функций. 1. Функции а(х) = х'6—х5 и р(х) = 5х3 + х* являются в точке дг = 0 бесконечно мальг/и одного порядка, ибо ,. а(х> ,. х3—х6 .. 1-х2 1 1ш1—-— ит = 11т =—. х-*о р(х, *-*о 5х3-\-х* х->о 5 + х 5 2. Функции а(х) = (х—2)2-(дг—1) и $(х) = (х—2)2 являются в точке х=2 эквивалентными бесконечно малыми, ибо 1- &(х) 1-„ (х — 2)2(х — 1)' ... 1Ч , 1ип —*-*- = Ьт —- — '— = Ьт (х — 1) = 1. *+2 Р(Х) Х-*2 (ЛГ-2)2 х+2К 24-х 1 3. Функции А (х) = я В(х) = — являются бесконечно X X большими одинакового порядка роста в точке х=0 как справа, так и слева, ибо Пт -4Ф- = Нт (2 + х)= 2. *-*о 8(х) х->-о Аналогично определяются и сравниваются функции, бесконечно малые или бесконечно большие при дг-^оо, а также при х->- + оо (соответственно при х—г—оо).
122 Гл. 3. Теория пределов § 5. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ПРЕДЕЛА ФУНКЦИИ ПО БАЗЕ Анализируя определения различных видов предела функции 1(х) по Коши, мы легко можем заметить, что во всех этих определениях требуется, чтобы для любого е>0 все значения этой функции, отвечающие значениям аргумента х, принадлежащим некоторому множеству Сй, удовлетворяли неравенству (3.58), т. е. принадлежали е-окрестности Ь. При этом множество С5, определенное для всех б>0, имеет разный вид при определении различных видов предела. При определении предела в точке а множество С6 представляет собой проколотую б-окрестность точки а, при определении правого [левого] предела в точке а множество С6 представляет собой интервал (а, а + б) [соответственно (а—б, а)], при определении предела при х->-оо множество Св представляет собой внешнюю часть сегмента [—6, +6] и, наконец, при определении предела при х->оо [при х->—'оо] множество Св представляет собой открытую полупрямую (б, + оо) [соответственно (—оо, —б) ]. Если функция 1(х) задана на множестве {х}, то во всех определениях пределов по Коши требуется, чтобы неравенство (3.58) было справедливо для тех элементов множества {х\, которые принадлежат соответствующему множеству Сб. Договоримся обозначать символом Вь подмножество тех элементов {х}, которые принадлежат С5, т. е. положим Я4={*}ПСв. Естественно, возникает вопрос, какими общими свойствами обладает совокупность всех подмножеств В6 множества {х}. Анализ условий, при которых формулируются определения 1*—4* пределов функции по Коши, приводит нас к выводу, что множество {х} задания функции 1(х) всякий раз имеет хотя бы один элемент, принадлежащий Сб, т. е. множество В6 всегда не является пустым. Далее легко убедиться в том, что для всех видов пределов пересечение двух любых множеств совокупности {В6} представляет собой некоторое множество той же совокупности. Так, например, пересечение двух множеств В6 и В/, первое из которых состоит из значений аргумента, принадлежащих проколотой б-окрестности точки а, а второе — из значений аргумента, принадлежащих проколотой б'-окрестности точки а, представляет собой совокупность значений аргумента, принадлежащих проколотой б"-окрестности точки а, где б" — наименьшее из двух положительных чисел б и б', т. е. представляет собой множество Вь" той же совокупности {В6}. В более общей ситуации, которая может встретиться, например, при изучении функции нескольких переменных, пересече-
§ 5. Общее определение предела функции по базе 123 ние двух любых множеств совокупности {В&} само может не являться элементом этой совокупности, но обязательно содержит элемент этой совокупности. Проведенное рассмотрение, естественно, приводит нас к фундаментальному понятию базы множества {л;} задания функции. Определение 1. Будем говорить, что бесконечная совокупность В = {Въ} подмножеств Вь множества {х} образует базу (или базис фильтра) множества {х}, если для элементов этой совокупности выполнены два требования: 1) каждый элемент Вь является непустым подмножеством множества {х}\ 2) в пересечении любых двух элементов совокупности {В6} обязательно содержится некоторый элемент этой же совокупности. Приведем примеры наиболее употребительных баз (базисов фильтра). Г. Пусть функция /(лО задана на множестве {х}, имеющем хотя бы один элемент в любой проколотой б-окрестности точки а. Указанную проколотую б-окрестность точки а обозначим символом Сб и положим Вб — {х}\']С(,. Очевидно, совокупность В = {Въ} множеств Вь при всех б>0 образует базу множества {х}, ибо каждое множество Вй при любом б>0 не является пустым и пересечение любых двух множеств совокупности {Вв}, как уже отмечалось выше, представляет собой множество из той же совокупности. Рассмотренную базу {В6} принято обозначать символом х-^а. 2°. Пусть функция 1(х) задана на множестве {х}, имеющем при любом б>0 хотя бы один элемент, принадлежащий интервалу (с, а + 8) [соответственно (а—б, а)]. Обозначив указанный интервал символом С6, положим В!, = {х}р1С^. Тривиально проверяется, что совокупность В = {Вй} множеств В6, отвечающих всевозможным б>0, образует базу множества {д;}. Указанную базу принято обозначать символом х->а + 0 [соответственно х^~а—0]. 3°. Пусть функция 1\х) задана на множестве {х}, имеющем хотя бы один элемент вне сегмента [—б, +б] при любом б>0. Положим Сб=(—оо, +00)\[—б, +б], Вь={х}[}С6. Легко проверить, что совокупность В = {В6} образует базу множества {х}. Эту базу принято обозначать символом х->-оо. 4°. Пусть функция 1{х) задана на множестве {х}, имеющем при любом 6>0 хотя бы один элемент на полупрямой ( + б, +<х>) [соответственно (—оо, —б)]. Обозначим указанную полупрямую символом С и положим В& = {х}[\С6. Легко убедиться в том, что совокупность В={В6} образует базу множества {%}. Эту базу обозначают символом х->+оо [соответственно х-+—оо].
124 Гл. 3. Теория пределов 5°. Пусть, наконец, множество {х} представляет собой множество всех натуральных чисел 1, 2, 3 п Положив йв= = {*}Л( + о\ +оо).для любого 6>0, мы легко убедимся и в том, что совокупность В={Вц} образует базу множества {х}. Эту базу принято обозначать символом я->оо. Сформулируем теперь фундаментальное определение предела функции ?(х) по базе В множества ее задания, содержащее в себе как все рассмотренные выше виды предела функции, так и предел числовой последовательности. Предположим, что функция 1(х) задана на множестве {х} и что совокупность В = {В(} подмножеств Вй множества {х} образует базу множества {х}. Множество всех значений, которые принимает функция }(х), когда ее аргумент х пробегает множество В6, договоримся называть образом множества Вб и обозначать символом Определение 2. Число Ь называется пределом функции 1(х) по базе В множества ее задания, если для любого е>0 существует такой элемент В« базы В, образ 1(ВЬ) которого принадлежит г-окрестности точки Ъ, т. е. принадлежит интервалу (Ь—е, Ь + е). Для обозначения предела функции /(*) по базе В множества ее задания будем использовать симв )л Ит[(х) = Ь. в Читатель без труда проверит, что это общее определение предела по базе содержит в себе как часшые случаи изученные выше виды пределов, отвечающие базам »->а, х->а+0, х-^-а—0, Х-*~оо, х-*-+сю, х-> со И П->-оо. Легко проверить также, что для общего определения предела по базе остаются справедливыми основные свойства предела, отвечающего простейшей базе х-*-а. Мы ограничимся тем, что докажем критерий Коши существования общего предела функции /(х) по базе В множества ее задания. Теорема 3.22. Для существования предела функции $(х) по базе В= {В^} множества ее задания необходимо и достаточно, чтобы для любого е>0 нашелся элемент В6 базы В, образ }(Вб) которого содержится в некотором интервале длины 2е. Доказательство. 1) Необходимость очевидна: если существует предел Ъ функции {(х) по базе В, то для любого е>0 найдется элемент этой базы Бв, образ которого /(55) со-< держится в интервале (Ь—е, Ь + е), имеющем длину 2е. 2) Достаточность. Пусть для любого е>0 существует элемент Вц базы В, образ которого /(бв) содержится в некотором I интервале длины 2е. Рассмотрим бесконечно малую последова-
§ 5. Общее определение предела функции по базе 125> тельность положительных чисел е„ = — (я = 1, 2, 3, ...)• Для;' п каждого 8П найдется элемент базы В&п, образ которого [фьп) содержится в некотором интервале длины 2е«. По определению базы в пересечении элементов 5а, и В^ обязательно лежит некоторый элемент базы, который мы обозначим символом.^. Образ этого элемента /!,Вв2) лежит как в некотором интервале Д длины 2г\, так и в некотором интервале V длины 2е2. Пересечение интервалов /[ и /г' представляет- собой интервал /г длины, не большей 2ег, содержащийся в интервале 1\. Далее, по определению базы в пересечении элементов 5в2 и Вб3 обязательно лежит некоторый элемент базы, который мы обозначим символом В&х Образ этого элемента /(Лб3) лежит как в интервале /г длины, не большей 2ег, так И" в некотором интервале I/ длины 2ез. Пересечение интервалов /г и 1г представляет собой интервал /з длины, не большей 2ез,_ содержащийся в интервале /г- Продолжая эти рассуждения далее, мы построим последовательность элементов базы 2?в2, В*в„ .. .,Ъъп, ... таких, чт& образ [(Вьп) каждого элемента Вб„ содержится в некотором интервале /„ длины, не большей 2е„, причем в последовательности интервалов /г, 1з, ■■-, 1п, ... каждый следующий интервал содержится в предыдущем. Обозначим символом Т„ сегмент, получающийся добавлением к интервалу /„ его концов. Так как последовательность 7г, /з, ■••, 1п, ... представляет собой стягивающуюся систему сегментов (см. п. 2 § 2), то в силу следствие из теоремы 3.15 существует, и притом единственная, точка Ъ, принадлежащая всем сегментам. Остается доказать, что Ь является пределом функции 1{х) по базе В, т. е. убедиться в том, что для любого е>0 найдется элемент базы В, образ которого содержится в интервале- (Ь—е, Ъ + г). В силу того, что система сегментов {Тп} является стягивающейся и Ь является общей точкой всех сегментов, мы можем утверждать, что для любого е>0 найдется сегмент Тп с достаточно большим номером п, содержащийся в интервале (Ь—е, Ь + е). Это означает, что при соответствующем номере п элемент базы В&п имеет образ /(В^)» содержащийся в интервале (Ь—ё, Ъ + г). Теорема доказана. Подчеркнем, что доказанная теорема содержит в качестве- частных случаев как критерий Коши сходимости числовой последовательности, так и критерии Коши существования всех рассмотренных выше видов предела функции.
Л 26 Гл. 3. Теория пределов В качестве возможных обобщений изложенной теории можно рассматривать функции, заданные на подмножествах произвольного метрического пространства (см. по этому поводу дополнение 2 к гл. 12). Замечание. Базы В я О множества {х} называются эквивалентными, если для любого элемента В^ базы В найдется такой элемент И^ базы Д что О^СВб,, и для любого элемента /)а, базы В найдется такой элемент Вь2 базы В, что В^СЮ^. Совокупность всевозможных эквивалентных между собой баз В множества {а'} называется фильтром множества {х}. Нетрудно убедиться, что утверждения о пределах функции | по эквивалентным базам В и Э справедливы одновременно.
Глава 4 НЕПРЕРЫВНОСТЬ ФУНКЦИИ В настоящей главе будет всесторонне изучаться важнейшее понятие математического анализа — понятие непрерывности- функции. В дополнении 2 к гл. 12 понятие непрерывности будет введено в общей ситуации, когда задано отображение одного метрического» пространства в другое. § 1. ПОНЯТИЕ НЕПРЕРЫВНОСТИ ФУНКЦИИ 1. Определение непрерывности функции. Пусть точка а принадлежит области задания функции /{л:}* и любая е-окрестность точки а содержит отличные от а точки области задания функци» 1{х}**. Формальное определение непрерывности в. точке а. Функция }{х} называется непрерывной в точке а, если функция }(х) имеет в точке а предел и этот предел равен частному значению }(а) функции }(х) в точке а. Используя определения предела функции у=}(х) в точке а по. Гейне и по Коши, мы приходим к определению непрерывности функции в данной точке а по Гейне и по Коши. Определение 1 (непрерывность в точке а по? Гейне). Функция у=}(х) называется непрерывной в точке а, если для любой сходящейся к а последовательности значений аргумента х\, х% ..., хп, соответствующая последовательность значений функции /(*1), /(^г), ..., !(хп), ... сходится к числу /(а). Замечание 1. По сравнению с определением 1 предела функции по Гейне (см. п. 2 § 4, гл. 3) в определении непрерывности по Гейне мы опустили требование, обязывающее все элементы последовательности {хп} быть отличными от а. Это можно сделать в силу того, что добавление к элементам последовательности {/(*«)}> сходящейся к числу }(а), любого числа новых элементов, равных /(а), не нарушит сходимости этой последовательности, к Да). * Заметим, что этого не требовалось, когда мы рассматривали предел функции {{х) .в точке а. ** Т. е. точка о является предельной точкой множества {х}, на котором задана функция }(х).
Й28 Гл. 4. Непрерывность функции Определение 1* (непрерывность в точке а по К о ш и). Функция /(*) называется непрерывной в точке •а, если для любого положительного числа е найдется отвечающее •ему положительное число б такое, что для всех значений аргумента х, удовлетворяющих условию \х—а\<8, справедливо неравенство \!(х)— Да) | <е. Замечание 2. По сравнению с определением 1* предела -функции по Коши (см. п. 2 § 4, гл. 3) в определении непрерывности по Коши мы опустили требование, обязывающее все значения аргумента х удовлетворять неравенству \х—а|>0, т. е. быть отличными от а. Это можно сделать в силу того, что для значений х=а разность \{х)—/(а) равна нулю и удовлетворяет неравенству \1(х)— 1(а) |<е при любом г>0. Условие непрерывности функции $(х) в точке а символически можно выразить следующим равенством: \'кп?(х) = [(а). Так как а = \\гах, то этому равенству можно придать следую- х-+а щую форму: Игл [(х) = [(Итх). х->а х-*а Следовательно, для непрерывной в точке а функции символ Пт лредельного перехода и символ / характеристики функции можно менять местами. Из теоремы об эквивалентности определений предельного значения по Гейне и по Коши (см. теорему 3.19 из п. 2 § 4 гл. 3) «следует, что определения непрерывности функции по Гейне и по Коши (определения 1 и 1*) эквивалентны. Сформулируем теперь определение односторонней непрерывности функции {(х) в точке а, т. е. непрерывности в точке а либо только справа, либо только слева. От множества {х} задания функции /(л;) мы на этот раз должны потребовать, чтобы это множество включало течку а и для любого 6>0 имело хотя бы один элемент, лежащий на интервале [а, а + Ь) [соответственно (а—б, с)]. Формальное определение непрерывности в >гочке а справа [слева]. Функция }(х) называется не пр е- -рывной в точке а справа [слева], если правый [левый] предел этой функции в точке а существует и равен частному значению }(а) функции }(х) в точке а. Используя определения правого [левого] предела функции ;/(х) в точке а по Гейне и по Коши, мы придем к определениям непрерывности функции }(х) в точке а справа [слева] по Гейне и яю Коши.
§ 1. Понятие непрерывности функции 129 Определение 2 (непрерывность функции в точке а справа [слева] по Гейне). Функция 1(х) называется непрерывной в точке а справа [слева], если для любой сходящейся к а последовательности значений аргумента {хп}, все элементы которой удовлетворяют условию хп>а[хп<а], соответствующая последовательность значений функции {/(*„)} сходится к числу 1(а). Заметим, что в этом определении условие хп>а [хп<а] можно заменить менее жестким условием хп^а [хп^а], ибо добавление к последовательности {!(хп)}, сходящейся к /(а), какого угодно числа новых элементов, равных {(а), не нарушит сходимости этой последовательности к /(а). В применениях более эффективно условие х„>а [хп<а]. Определение 2* (непрерывность функции.в точке а справа [слева] по Кош и). Функция }(х) называется непрерывной в точке а справа [слева], если для любого положительного числа г найдется отвечающее ему положительное число б такое, что для всех значений аргумента х, удовлетворяющих условию- а<х<а+ 6 [а—6<х<а], справедливо неравенство \!(х)Ч(а)\<г. Заметим, что и в этом определении условие а<х<а+6 [а—6<х<а] можно было бы заменить менее жестким условием а<х<а + б [а—б<х^а]. Эквивалентность определений 2 и 2* вытекает из эквивалентности соответствующих определений предела функции. Тот факт, что функция }(х) непрерывна в точке а справа [слева], записывают так: Пт / (х) — I (а) или / (а + 0) = } (а) [ 1ш/(*) = /(а) или /(а—0) = /(а)]. х-ю—0 Замечание 3. Если функция \(х) непрерывна в точке а и слева, и справа, то она непрерывна в этой точке. Действительно, в силу утверждения, доказанного в п. 2 § 4 гл. 3, в этом случае существует предел функции в точке а, равный 1(а). Точки, в которых функция не обладает свойством непрерывности, называются точками разрыва этой функции. Рассмотрим примеры. 1) Степенная функция }(х)=хп, где п — натуральное число, непрерывна в каждой точке а бесконечной прямой (—оо, +оо). Действительно, в гл. 3 было установлено, что предельное значение этой функции в любой точке а бесконечной прямой равно частному значению а". 5 Зак. 72
130 Гл. 4. Непрерывность функции 2) Многочлены и рациональные дроби имеют в каждой точке области задания предельное значение, равное частному значению (см. п. 3 § 4 гл. 3). Поэтому они являются непрерывными функциями в каждой точке области задания. 3) Функция 1(х)=5цпх имеет разрыв в точке х=0 и непрерывна во всех остальных точках числовой оси. Действительно, в точке х=0, как было показано в гл. 3, существуют правый (равный +1) и левый (равный —1) пределы функции з§пх. Поскольку эти односторонние пределы не равны друг другу, функция з§пх в точке 0 разрывна (не является непрерывной). В остальных точках оси она обладает предельным значением, равным частному значению, и непрерывна. 4) Функция Дирихле О(х) (см. § 4 гл. 3) разрывна в каждой точке числовой оси, поскольку она не имеет предельного значения ни в одной точке. Заметим, однако, что функция {(х) =х-0{х), где й{х) — функция Дирихле, является непрерывной в точке х = 0 и разрывной во всех остальных точках бесконечной прямой. Разрывность }(х) в любой точке Хот^О устанавливается точно -так же, как для функции О(х) (для любой сходящейся к х0 последовательности {хп} рациональных точек соответствующая последовательность {Цхп)} сходится к числу Хо=т^О, а для любой сходящейся к Хо последовательности {хп} иррациональных точек соответствующая последовательность {/(хп)} сходится к нулю). Убедимся в том, что функция / (х) = х ■ Э (х) непрерывна в точке х = 0. Для любой бесконечно малой последовательности значений аргумента {хп} последовательность {0(хп)} ограничена, а потому (в силу теоремы 3.3 из гл. 3) последовательность 1{х„) =хп-0(хп) является бесконечно малой, т. е. имеет предел нуль, равный частному значению/(0). Мы будем говорить, что функция непрерывна на множестве {х}, если она непрерывна в каждой точке этого множества. Например, функция, непрерывная в каждой точке интервала, называется непрерывной на интервале. Особо договоримся называть функцию }(х) непрерывной на сегменте [а, Ь], если она непрерывна в каждой внутренней точке этого сегмента и, кроме того, непрерывна справа в точке а и непрерывна слева в точке Ь. Выше, давая определение непрерывности функции /(х) в точке а, мы предположили, что точка а обладает тем свойством, что в любой ее е-окрестности содержатся точки области задания, отличные от а. Формально этого предположения можно бы было и не делать и допустить, что точка а обладает е-окрестностью, свободной от точек области задания функции, а в самой точке а функция определена. В этом случае формально .функцию ./(х) можно считать непрерывной в точке а. Однако вся содержательная часть понятия непрерывности функции относится как раз
§ 1. Понятие непрерывности функции 131 к случаю, когда а — предельная точка области определения функции. Определение непрерывности функции можно дать и в следующей, эквивалентной форме. Определение 1**. Функция ((х) называется непрерывной в точке а, если для любой окрестности точки 1(а) найдется такая окрестность точки а, что образ всех точек множества задания функции, лежащих в этой окрестности точки а? при отображении, осуществляемом функцией 1(х), целиком лежит в указанной окрестности точки }(а). В дополнении 2 к гл. 12 будет показано (даже в более общей ситуации), что последнее определение непрерывности эквивалентно предыдущим. Предлагается в качестве упражнения проверить это. Используя введенное в § 5 гл. 3 общее определение предела функции 1{х) по базе В множества ее задания, мы можем объединить в одной формулировке понятие непрерывности в точке а, в точке а справа и в точке а слева. Пусть функция }(х) задана на множестве {х}, которое включает точку а и допускает базу В одного из видов х-+а, х-+а + 0, х-^-а—О*. Функция 1(х) называется непрерывной в точке а, если ее предел по базе В множества ее задания существует и равен 1(а). 2. Арифметические операции над непрерывными функциями. Убедимся в том, что арифметические операции над непрерывными функциями приводят снова к непрерывным функциям. Справедлива следующая теорема. Основная теорема 4.1. Пусть на одном и том же множестве заданы функции ](х) и §(х), непрерывные в точке а. Тогда функции !(х)+§(х), Цх)—§(х), / (х) ■§ (х) и -!-^-1 непрерывны в точке а (в случае частного нижно дополнительно требовать Доказательство. Так как непрерывные в точке а функции }(х) и §(х) имеют в точке а пределы, соответственно равны /(а) и § (а), то в силу теоремы 3.21 из гл. 3 пределы функций /(*) + +8{х), !(х)—§(х), }(х)-§(х) и существуют и равны соот- В(х) ветственно 1(а)+§(а), !(а)—§(а), }(а)-§(а) и -^1. Но как раз 8 (а) зти величины равны частным значениям перечисленных функций в точке а. По определению эти функции непрерывны в точке а, что и требовалось доказать. * См. § 5 гл. 3.
132 Гл. 4. Непрерывность функции 3. Сложная функция и ее непрерывность. Функции, полученные в результате суперпозиции двух или нескольких функций, мы будем называть сложными. Под суперпозицией двух функций мы понимаем функцию, полученную в результате наложения или последовательного применения указанных двух функций в определенном порядке. Ясно, что достаточно определить сложную функцию, полученную в результате суперпозиции только двух функций. Указанный алгоритм можно будет применять, беря суперпозицию трех и большего конечного числа функций. Пусть функция # = ф(?) задана на множестве {/}, и пусть {х} — множество ее значений. Допустим, что на множестве {х} задана функция у=}(х). Тогда говорят, что на множестве {}} задана сложная функция г/=/[ф(/)] =^(0 или У=1(х)> &де х — цЦ). Справедлива следующая теорема. Теорема 4.2. Пусть функция х=ф(0 непрерывна в точке а, а функция у=!(х) непрерывна в точке Ь = ц>(а), Тогда сложная функция #=/[ф(0] =^(0 непрерывна в точке а. Доказательство. Пусть {/л} — произвольная последовательность значений аргумента сложной функции, сходящаяся к а. Так как функция х=у(() непрерывна в точке а, то (в силу определения 1 непрерывности по Гейне) соответствующая последовательность значений функции хп = уУп) сходится к числу Ь = ф(а). Далее, поскольку функция г/=/(х) непрерывна в точке Ь=ф(а) и для нее указанная выше последовательность {хп}, сходящаяся к Ь = ф(а), является последовательностью значений аргумента, то (в силу того же определения 1 непрерывности по Гейне) соответствующая последовательность значений функции /(*„) = =/[ф(*п)] =Р(*п) сходится к числу /(Ь)=/[ф(а)] =Р{а). Итак, для любой последовательности {1п} значений аргумента сложной функции, сходящейся к а, соответствующая последовательность значений самой сложной функции {Р({п)}=1[<$Уп)\ сходится к числу Р(а) = /[ф(а)]. В силу определения 1 непрерывности по Гейне сложная функция непрерывна в точке а. Теорема доказана. § 2. СВОЙСТВА МОНОТОННЫХ ФУНКЦИЙ 1. Монотонные функции. Введем понятие монотонной функции. Определение 1. Функция 1(х) называется неубывающей [невозрастающей] на множестве {х}, если для любых Х\ и х2 из этого множества таких, что х\<х2, справедливо неравенство !(х1)^(х2) [}(хО^!(х2)]. Неубывающие и невозрастающие функции называют монотонными функциями. Определение 2. Функция называется возрастающей [убывающей] на множестве {х}, если для любых Х\ и х2 из
§ 2. Свойства монотонных функций 133 этого множества таких, что хг<х2, справедливо неравенство /(*.)</Ы 1/(*1)>/(*2)Ь Возрастающие и убывающие функции называются строго монотонными. Приведем примеры монотонных функций. 1. Функция /Ос) =хг — строго монотонна, а именно возрастает на всей числовой оси. 2. Функция у=х2 — возрастает на полуоси лг^О и убывает на» полуоси я^О. 3. Функция у=5&пх — неубывающая на всей числовой оси. 4. Функция Нх) = убывает на множествах х<0 и х>0. х 2. Понятие обратной функции. Пусть функция у=Цх) задана на сегменте [а, Ь], и пусть сегмент [а, р] является множеством значений этой функции. Пусть, кроме того, каждому у из сегмента [а, р] соответствует только одно значение х из сегмента [а, Ь]г для которого !(х)=у. Тогда на сегменте [а, р] определена функция, которая каждому у из [а, р] ставит в соответствие то значение х из [а, Ь], для которого {(х)=у. Эта функция обозначается символом х=}~1(у) и -называется обратной для функции В проведенных выше рассуждениях вместо сегментов [а, Ь\ и [а, р] можно было бы рассматривать интервалы (а, Ь) и (а, р) или, например, случай, когда один или оба из этих интервалов превращаются в бесконечную прямую или открытую полупрямую. Можно рассматривать и самый общий случай, когда задано отображение I одного множества {х} на другое множество {у}, причем отображение / устанавливает взаимно однозначное соответствие между элементами этих множеств. Тогда можно определить обратное отображение /_1 множества {у} на множество {х}. В этом случае уравнение у = !(х) можно разрешить относительно х, т. е. можно однозначно определить х, зная элемент у, и мы имеем х = 1~1(у). Отметим, что если #=/_1(#) — обратная функция для у=}(х), то, очевидно, функция у={{х) является обратной для функции х==!~Чу)- Поэтому функции у=1(х) и х=г~Чу) называются взаимно обратными. Очевидно, что }[}~ {у)]=У, 1~1 [/(*)] =х. Приведем примеры взаимно обратных функций. 1. Пусть на сегменте [а, Ь] задана функция у = 2х. Множеством значений этой функции будет сегмент [2а, 2Ь]. Функция х = {-х(у) = —' определенная на [2а, 2Ь], будет обратной к заданной функции у — 2х. 2. Рассмотрим на сегменте [0, 2] функцию у=х2. Множество значений этой функции есть сегмент [0, 4]. На этом сегменте определена обратная к заданной функции функция х=Уу .
134 Гл. 4. Непрерывность функции 3. Рассмотрим на сегменте [0, 1] функцию ( х, если х—рациональное число, 11--*, если х—иррациональное число. Нетрудно убедиться, что заданная на сегменте [0, 1] функция __ [ у, если у—рациональное число, { 1—у, если у—иррациональное число, будет обратной к заданной функции. Докажем несколько утверждений о монотонных функциях. Начнем с доказательства леммы, справедливой для любой монотонной (не обязательно строго монотонной) функции. Лемма. Если функция }(х) является монотонной на сегменте [а, Ь], то у нее существуют правый и левый пределы в любой внутренней точке сегмента [а, Ь] и, кроме того, существуют правый предел в точке а и левый предел в точке Ь. Доказательство. Для полного доказательства леммы достаточно доказать два факта: 1) существование правого предела в любой точке с, удовлетворяющей неравенствам а^.с<сЬ; 2) существование левого предела в любой точке с, удовлетворяющей неравенствам а<с<&. Мы установим только первый из указанных двух фактов, ибо второй устанавливается аналогично. При этом мы проведем все рассуждения для функции }{х), неубывающей на сегменте [а, Ь] (ибо для невозрастающей функции они проводятся аналогично). Итак, пусть функция }(х) не убывает на [а, Ь], с — любая точка, удовлетворяющая неравенствам а^с<Ь. Рассмотрим множество Ц(х)} всех значений функции /(х) для значений аргумента х, удовлетворяющих неравенствам с<х^й. Это множество {/(х)} непусто (в силу того, что с<&) и ограничено снизу (в силу неубывания функции /(х) для всех х из полусегмента с<х^Ь справедливо неравенство /(с)г^/(х), которое означает, что /(с) является нижней гранью рассматриваемого множества). По основной теореме 2.1 гл. 2 у рассматриваемого множества существует точная нижняя грань, которую мы обозначим символом у. Докажем, что это число у и является правым пределом функции /(х) в точке с, т. е. докажем, что у=/(с + 0). Фиксируем произвольное е>0. По определению точной нижней грани найдется положительное число б, не превосходящее Ъ—с и такое, что значение функции /(с+6) удовлетворяет неравенству /(с + б)<у + Е. Но тогда в силу неубывания функции /(х) для всех х из интервала с<х<с+6 и подавно 'будет справедливо неравенство 1(х)<у + г. Так как, кроме того, для всех х из указанного интервала справедливо неравенство у^/(х), то мы получим, что для всех х из интервала с<х<с+6 справедливы неравенства
§ 2. Свойства монотонных функций 135 у</Ч*)<? + е или |у—/(*)|<е, а это и означает (в силу определения правого предела по Коши)', что число 7 является правым пределом !(х) в точке с. Лемма доказана. Замечание к лемме. В предположениях леммы при условии неубывания 1(х) для любых сих, удовлетворяющих соотношениям а<с<л:<Ь, будут справедливы неравенства 1(а)<!(с)<[(с + 0)<1(х)<[(Ь), (4.1) а для любых сих, удовлетворяющих соотношениям а^х<с^Ь, будут справедливы неравенства /(а)<Д*)</(С-0)</(с)</(&). (4.2) При условии невозрастания }(х) все знаки в неравенствах (4.1) и (4.2) следует заменить на противоположные. Пусть, например, /(*) не убывает на [а, Ь] и а^с<х^&. Тогда /(а)</(с)^/(л;Х/(Ь). Из последних неравенств сразу же вытекает, что ДаХДсХДс+ОХ^б). Для завершения доказательства неравенств (4.1) следует убедиться в том, что /(с+0)^ ^/(х)^/(Ь) для любого х из полуинтервала с<х^Ь, но это сразу вытекает из того, что число у = }(с+0) является, как доказано в лемме, точной нижней гранью множества значений }(х) на полу? интервале с<х^СЬ. Справедливость неравенств (4.2) проверяется аналогично. Докажем теперь три. теоремы о строго монотонных функциях. Теорема 4.3. Пусть функция у=}{х) возрастает (убывает) на сегменте [а, Ь], и пусть а=/(а), р = /(Ь). Тогда, если множеством всех значений функции у—Цх) является сегмент [а, р] (соответственно сегмент [р, а]), то на этом последнем сегменте определена обратная для у=1(х) функция х—1~1(у), которая также возрастает (убывает) на указанном сегменте. Доказательство. Проведем все рассуждения в предположении, что 1(х) возрастает на сегменте [а, р] (для убывающей функции рассуждения аналогичны). Убедимся в том, что функция у = Цх) устанавливает взаимно однозначное соответствие между сегментами а^х^Ь и а^г/^р. Действительно, то, что каждому х из [а, Ь] соответствует только одно значение у из [а, р], следует из самого понятия функции у=1(х), а то, что каждому у из [а, р] соответствует только одно х из [а, Ь], вытекает из возрастания функции у = {(х). Убедимся теперь, что если у=1(х) возрастает на [а, Ь], то и Х=1~1(У) также возрастает на [а, р]. Пусть у\<у% где у\ и у2 — любые два числа из [а, р]. Тогда х\=1~1 (у{)<Х2=/~!(г/г)> ибо из неравенства х{^Х2 и из возрастания функции у—1(х) следовало бы, что г/1^г/г> что противоречит неравенству у\<у2- Теорема доказана.
136 Гл. 4. Непрерывность функции Замечание 1. Совершенно аналогично доказывается более общее утверждение: пусть у—[(х) задана и возрастает (убывает) на некотором множестве {х}, а {у} — множество всех значений этой функции. Тогда на множестве {у} определена обратная для у=}(х) функция х=1~1(у), которая также возрастает (убывает) на указанном множестве {у}. Теорема 4.4. Пусть функция у={(х) возрастает (или убывает) на сегменте [а, Ь], и пусть а=}(а), Р=/(Ь). Тогда для того, чтобы функция у=!(х) являлась непрерывной на сегменте [а, Ь], необходимо и достаточно, чтобы любое число у, заключенное между аир, было значением этой функции. Доказательство. Все рассуждения проведем для возрастающей на сегменте [а, Ь] функции, ибо для убывающей функции они аналогичны. 1) Необходимость. Пусть функция у^Цх) возрастает и непрерывна на сегменте [а, Ь]. Требуется доказать, что любое число у, удовлетворяющее условиям а<у<р, является значением функции в некоторой точке с сегмента [а, Ь]. Пусть {х} — множество всех значений х из сегмента [а, Ь], для которых /(х)^у- Это множество {х} непусто (ему принадлежит, например, точка а, ибо Да)=а<у) и ограничено сверху (например, числом Ь). По основной теореме 2.1 гл. 2 у множества {х} существует точная верхняя грань, которую мы обозначим через с: с = зир{х}. Остается доказать, что 1{с)=у. Сначала убедимся в том, что 1(х)^.у для всех х из [а, Ь], лежащих левее с, и 1(х)>у для всех х из [а, Ь], лежащих правее с. В самом деле, если х<с, то по определению точной верхней грани найдется х' из полуинтервала х<х'^.с, принадлежащее множеству {х}, т. е. такое, что /(-О^у- Но тогда из возрастания 1(х) будет вытекать, что и /(х)^у (ибо /(я) </(*'))• Далее, любое х, лежащее правее с, не принадлежит множеству {х}, а потому для такого х справедливо неравенство Цх)>у. Теперь убедимся в том, что с является внутренней точкой сегмента [а, Ь]. Докажем, что с<Ь. Предположим, что это не так, т. е. допустим, что с = Ь. Возьмем любую сходящуюся к с=Ь возрастающую последовательность {хп} точек сегмента [а, Ь]. Так как все ее элементы хп лежат левее с, то /(хл)^у для всех номеров п, а поэтому (в силу теоремы 3.13 гл. 3) и Нт/(хй) < у. Но так как функция /(х) непрерывна в точке с — Ь, то 1\т[(хп) = [(Ь). Тем самым мы получаем неравенство Р=/(Ь)^у, которое противоречит условию у<р. Полученное противоречие доказывает, что с<Ь. Совершенно аналогично доказывается, что а<с. Итак, доказано, что с — внутренняя точка сегмднта [а, Ь]. Теперь для того, чтобы доказать, что !(с)=у, рассмотрим две
§ 2. Свойства монотонных функций 137 сходящиеся к с с разных сторон последовательности точек сегмента [а, Ъ] — возрастающую последовательность {хп'} и убывающую последовательность {хп"). В силу того, что функция 1(х) непрерывна в точке с, Игл / (х'п) = Игл / (х"п) = / (с). С другой стороны, поскольку хп'<с<Хп" для любого номера п, то /(Хл')^?> {(Хп")>у (для любого номера л). Но тогда в силу теоремы 3.13 11ГП / (х'п) = / (С) < у, ИГЛ / (Хп) = / (С) > у, т. е. !(с)=у. Необходимость доказана. 2) Достаточность. Пусть функция [(х) возрастает на сегменте [а, Ь], и пусть любое число у из сегмента [а, р] является значением этой функции. Докажем, что функция /(х) непрерывна на сегменте [а, Ь]. Достаточно доказать, что /(х) непрерывна справа в любой точке с, удовлетворяющей условиям а^с<Ь, и непрерывна слева в любой точке с, удовлетворяющей условиям а<с^&. Мы ограничимся доказательством непрерывности справа в любой точке с, удовлетворяющей условиям а^с<Ь, ибо вторая часть утверждения доказывается аналогично. Предположим, что функция /(х) не является непрерывной справа в некоторой точке с, удовлетворяющей условиям а^с<&. Тогда ее правый предел /(с + О), который существует согласно доказанной выше лемме, будет отличен от значения /(с), и поэтому справедливые в силу замечания к указанной лемме неравенства (4.1) примут вид а = /(а)</(с) </(с + 0)</(*К/(й) =р (4.2') (для всех х из полуинтервала с<х^6). Неравенства (4.2') означают, что содержащийся в [а, р] интервал (/(с), /(с+О)) не содержит значений функции 1(х)*, а это противоречит тому, что любое число у из сегмента [а, р] является значением этой функции. Теорема 4.4 полностью доказана. Теорема 4.5. Пусть функция у=1(х) возрастает (убывает) и непрерывна на сегменте [а, Ь], и пусть а=\(а), $=((Ъ). Тогда на сегменте [а, р] (соответственно на сегменте [р, а]) определена обратная для у=}(х) функция х=}~х(у), которая возрастает (убывает) и непрерывна на указанном сегменте. Кратко можно сказать, что из строгой монотонности и непрерывности на сегменте [а, Ь] данной функции вытекают существо- * В самом деле, для х<с значение /(х) удовлетворяет неравенству /(х)^ <|/(с) (в силу возрастания функции), а для х~>с значение }(х) удовлетворяет неравенству /(с+0)</(д:) (в силу (4.2')).
138 Гл. 4. Непрерывность функции вание, строгая монотонность и непрерывность на соответствующем сегменте обратной функции. Доказательство. Проведем все рассуждения для возрастающей функции, ибо для убывающей функции они проводятся аналогично. Так как /(*) возрастает и непрерывна на сегменте [а, Ь], то в силу необходимости теоремы 4.4 множеством всех значений этой функции является сегмент [а, р]. Но тогда теорема 4.3 обеспечивает существование на этом сегменте возрастающей обратной функции дс=/_1(«/). Остается доказать непрерывность указанной обратной функции на сегменте [а, р]. Для этого достаточно учесть, что множеством всех значений обратной функции х={~1(у) служит сегмент [а, Ь], где а=/_1(а), Ь=/:_1(Р). и использовать для этой обратной функции достаточность теоремы 4.4. Доказательство теоремы 4.5 завершено. Замечание 2. Можно показать, что из существования обратной функции для функции 1(х), непрерывной на сегменте [а, Ь], следует, что 1(х) строго монотонна на этом сегменте (см. п. 2 § 6 настоящей главы). § 3. ПРОСТЕЙШИЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ Простейшими элементарными функциями, как уже отмечалось, обычно называют следующие функции: у=ха, у = ах, у = \о§ах, у = &тх, у=со5Х, у = 1§х, у=с1§х, у=агс&тх, у = атссоёх, у = — атс1§х, у = агссх§ х. - Нашей основной целью является изучение вопроса об определении и непрерывности простейших элементарных функций. Следует заметить, что вопрос об определении простейших элемен* тарных функций далеко не прост. Так, например, показательная функция у = ах легко может быть определена для рациональных значений аргумента х, вместе с тем эту функцию следует определить для произвольных вещественных значений х, т. е. следует определить возведение вещественного числа в любую вещественную степень х. Далее, определение тригонометрических функций зт* и созх с помощью наглядных геометрических соображений имеет логический пробел. Возможность определить эти функции для всех вещественных значений аргумента х сводится к возможности установления взаимно однозначного соответствия между точками единичной окружности и всеми вещественными числами полусегмента [0, 2я). Всеми этими вопросами мы и будем заниматься в настоящем параграфе. 1. Показательная функция. Начнем наше рассмотрение с определения рациональных степеней положительных чисел. Для того чтобы возвести любое вещественное число х в целую положительную степень п, следует умножить это число х само на себя п раз.
§ 3. Простейшие элементарные функции 139 Следовательно, при целом п мы можем считать определенной степенную функцию у = хп для всех вещественных значений х. Установим некоторые простейшие свойства этой функции. Утверждение 1. Степенная функция у = хп при х^О и целом положительном п возрастает и непрерывна. Доказательство. Покажем, что функция у = х" возрастает. Пусть 0<Х1<х2. Тогда х2п— ххп = (х2—х:) {х2п~1 + х2п~2 ■ х\ +... ... + Х]"-1). Оба сомножителя в правой части, в соответствии с выбором значений х2 и х\, положительны. Поэтому положительна и левая часть равенства, т. е. х2п>х\п, а это означает возрастание функции у—хп при х^О. Непрерывность функции у = хп в любой' точке а бесконечной прямой (—оо, +оо) была установлена в примере 1 п. 1 § 1 настоящей главы. Утверждение 1 доказано. Рассмотрим степенную функцию у=хп на сегменте [О, Ы], где N — любое положительное число. Так как эта функция непрерывна и возрастает на указанном сегменте, то в силу теоремы 4.5 она имеет на сегменте [О, ./V"] возрастающую и непрерывную обратную функцию, которую мы обозначим через х=у1/п. Поскольку Л' можно выбрать как угодно большим, то и Ып также можно сделать сколь угодно большим. Следовательно, функция х=у1,п определена для всех неотрицательных значений у. Меняя для этой функции обозначение аргумента у на х, а обозначение функции х на у, мы получим степенную функцию у = х1/п, определенную для всех вещественных х^О. Теперь мы в. состоянии определить любую рациональную степень г положительного числа а. Определим, прежде всего, а1/п да к вещественное число Ъ, равное значению функции х1/п в точке а. Далее, если /■ = —. где тип — целые положительные числа, п то мы положим т аг = ап = (а'/")т. Кроме того, положим по определению а°= 1, агг = (—У при г > 0. Тем самым, мы определили любую рациональную степень положительного вещественного числа а. Выполняются следующие свойства рациональной степени положительных вещественных чисел: {аг)* = аг\ аг-Ьг=(а-Ь)г, аг-а° = аг+*. (*) Докажем сначала справедливость первого свойства (*). т Заметим, что при целом положительном р равенство (а )" =
!40 Гл. 4. Непрерывность функции =а , в котором под тип понимаются любые целые положительные числа, заведомо справедливо, ибо как левая, так и правая части этого равенства равны произведению числа а1/п самого на себя т-р раз. Полагая г = -^-, 5 = —-> докажем равенство (аг)8~аг!' в ситуации любых положительных рациональных г и 5. ПОЛОТИ, тг т1-тг жим с1 — (ап')п', с2 = ал''"2. Если бы с\ было отлично от Сг, то из возрастания степенной функции у = хп> следовало бы, что и С\п' фс2п*, а последнее соотношение, в силу уже доказанной т т-р справедливости равенства (ап)р = а " при целом р, означало т1 т1-т2 бы, что (ап')т'фа "* . Полученное соотношение противоречит уже доказанному нами для целых положительных ти п\ и /Иг равенству {аП1)т" = а "' . Тем самым С\ = с2, и первое равенство (*) доказано для любых положительных рациональных г и 5. Распространение этого равенства на неположительные г и я не представляет труда в силу нашей договоренности о том, что а°=1, а-г = — при г > 0. аг Второе равенство (*) также достаточно доказать для положительного рационального г. Полагая это г равным т/п, где тип — целые положительные числа, заметим, что нам достаточно доказать равенство а1/П-Ь1^п=(а-Ь)1/п, ибо перемножением т таких равенств будет доказано общее соотношение аг-Ьг= (а- Ъ)г. Для доказательства равенства а}1п-Ь1'п=(а-Ъ)у/п заметим, что в силу свойств взаимно обратных функций у = х1/п и х=уп мы можем утверждать, что {ЪХ/П)П=Ъ, (а1/п)"=а, ((аЬ)1/п)п— = аЬ. Поэтому, положив С\ = а>1п-Ъх1п, с2=(аЬ)1/п и предполагая, что с\Фс2, мы получили бы, что С\ПФС2П, что противоречит равенству а-Ь = аЬ. Докажем теперь последнее свойство (*), учитывая, что первые два уже доказаны. Пусть г = -^-, $ — -^-, тогда г=ч = .5= , и мы приходим к следующему равенству: 1 1 1 дГ. а$ __ /д««- Ял»»- л2 /я,- л«/л,/1, __ , я, ■ лл/п1-га2+ш2-п,._ (Последнее равенство справедливо, так как туп2 и т2-щ — целые числа.)
§ 3. Простейшие элементарные функции 141 Л Таким образом, I т1 ■ пг-\-тг ■ п1 т, т% I аг-а' = а "••"• = ап' "• = аг+*, | что и требовалось. При а>\ и рациональном г>0 справедливо неравенство аг>\. В самом деле, пусть г = — и аг = ат/п<1. Перемножая псу п членно п указанных неравенств, получим ат^1. Но это неравенство противоречит неравенству ат>1, полученному почленным перемножением ш неравенств вида а>\. Отметим также, _ что если рациональная дробь г — —имеет нечетный знаменатель п, то определение рациональной степени можно распространить и на отрицательные числа, полагая при а>0, что (—а)г = аг, если ш четное, (—а)г=—аг, если пг нечетное. Убедимся в том, что функция у = ах при а>1, определенная нами на множестве рациональных чисел, монотонно возрастает на этом множестве. Действительно, пусть г\ и г2 — два рациональных числа таких, что г2>г\. Тогда Ф—ап = аг« (аг*-ъ — 1). (4.3) Поскольку г2—Г1>0 и а>1, то (в силу установленного выше)' аг*~"'ч>1. Таким образом, правая часть равенства (4.3) положительна. Следовательно, аг'—аг1>0, т. е. аг*>аГ\ что и требовалось. Определим, наконец, функцию у — ах не только для рациональных значений х, но и для любых вещественных значений. Пусть х — произвольное вещественное число. Рассмотрим всевозможные рациональные числа аир, удовлетворяющие неравенствам а<д;<р. (4.4) Определим ах при а> 1 как вещественное число у, удовлетворяющее неравенствам аа^у<а* (4.5) при всевозможных рациональных аир, удовлетворяющих неравенствам (4.4).
142 Гл. 4. Непрерывность, функции Оказывается, что такое число у существует и притом только одно. Следовательно, таким путем функция у — ах будет определена на множестве всех вещественных х. Мы покажем, что эта функция возрастает и непрерывна на всей вещественной прямой. Эти результаты содержатся в доказываемых ниже утверждениях. Утверждение 2. Для любых фиксированных вещественных чисел х и а> 1 и всевозможных рациональных чисел а и р, удовлетворяющих неравенствам (4.4), существует и притом единственное вещественное число у, удовлетворяющее неравенствам (4.5). Доказательство. Докажем сначала существование такого числа у. Фиксируем произвольное рациональное число р\ удовлетворяющее правому неравенству (4.4), и рассмотрим всевозможные рациональные числа а, удовлетворяющие левому неравенству (4.4). Так как а<р и показательная функция, определенная на множестве рациональных чисел, возрастает, то аа<а?. Таким образом, множество {аа} ограничено сверху, и число ае является одной из верхних граней этого множества. Из основной теоремы 2.1 следует, что множество {аа} имеет точную верхнюю грань, которую мы обозначим через у. Покажем, что у удовлетворяет неравенствам (4.5). Из определения верхней грани вытекает справедливость левого неравенства (4.5), а справедливость правого неравенства (4.5) вытекает из того, что а9 — одна из верхних граней, а у — точная верхняя грань множества {аа}. Докажем теперь, что такое число у только одно. Достаточно доказать, что для любого е>0 найдутся такие рациональные числа аир, удовлетворяющие неравенствам (4.4), для которых а?—аа<е. Тогда любые два числа ух и у2, удовлетворяющие неравенствам (4.5), обязаны совпасть, так как разность между ними по модулю меньше любого наперед заданного числа е>0. Фиксируем произвольное положительное число е и некоторое рациональное число Ро, удовлетворяющее правому неравенству (4.4). Тогда так как аа<аР°, то а»—аа = аа(а^а— 1)<аР° (а"-"— 1). Неравенство а^—аа<г будет доказано, если мы установим возможность выбора в неравенствах (4.4) таких рациональных а и р, что аР_а —1<—тг- В гл. 2 было доказано, что для любого натурального п можно выбрать рациональные числа аир, удовлетворяющие неравенствам (4.4), так, что разность р—а будет меньше \/п. Таким образом, достаточно доказать, что существует такое натуральное п, что а^ - 1 < -4-.
§ 3. Простейшие элементарные функции 143 Пусть а1/п==1 + бл. Так как а1/п>1, то 8п положительно. Используя первые два члена бинома Ньютона, мы получим, что а=(а1/»)"=(1+6п)п>1+«-6п. Отсюда а—1>«-б«, т. е. 0<Ь„<С^~— . Значит а>/п — 1 < п п Выберем теперь натуральное п удовлетворяющим неравенству с—1 , е _ . (а — 1)ар° ~ , ,„ , .а—\. е <—«- или «>-> '- . Тогда а}'п — 1< < —«-.„ п аРо е п аР° и доказательство однозначной определенности числа у, удовлетворяющего неравенствам (4.5), завершено. Утверждение 2 доказано. Заметим, что если х — рациональное число и ах — значение в точке х показательной функции, первоначально определенной лишь на множестве рациональных чисел, то ах и является тем единственным числом у, которое удовлетворяет неравенствам (4.5). Утверждение 3. Показательная функция у = ах при а> 1 возрастает на всей бесконечной прямой. Доказательство. Пусть х\ и лгг — любые два вещественных числа такие, что х\<х%. Всегда существуют рациональные числа аир такие, что х\<а<^<Хг (см. лемму 2 § 3 гл. 2). Так как х\<а и $<Х2, то по определению показательной функции выполнены неравенства а*> < аа, аР < ахк С другой стороны, так как а<р, то из возрастания показательной функции на множестве рациональных чисел вытекает аа<а?. Сопоставляя неравенства ах> < аа, аа < ар и аР < аХг и используя свойство транзитивности знаков > и =, получим, что а*><-а«», а это и доказывает возрастание функции ах. Утверждение доказано. Утверждение 4. Показательная функция у=ах при а>\ является непрерывной функцией в любой точке бесконечной прямой. Доказательство. Пусть х — произвольное вещественное число, а {хп} — любая сходящаяся к х последовательность. В силу определения непрерывности по Гейне достаточно доказать, что для любого 8>0 существует такой номер Ы, что \аХп—а*|<е при всех п^Ы. Фиксируем произвольное е>0 и по нему рациональные числа аир такие, что а<х<р и а?—аа<е. Возможность фиксировать по любому е>0 такие рациональные числа а и р была установлена в утверждении 2. Поскольку последовательность {хп} сходится к л; и а<х<р, то существует такой номер Ы, что при всех п^Ы справедливы неравенства а<х„<р. Так как показательная функция монотонно возрастает, то а < ах < аР, аа < < а*п < ар при всех п^Ы. Таким образом, оба числа а*п и ах при п^Ы заключены между двумя числами аа и ав, разность между которыми а"—аа меньше е. Отсюда следует, что при п^Ы справедливо неравенство
144 Гл. 4. Непрерывность функции \ах"—а*|< е, которое и доказывает непрерывность показательной функции в произвольной точке х. Утверждение 4 доказано. Получим теперь некоторые следствия из доказанных свойств показательной функции. Прежде всего заметим, что если 0<а<1, то а = —. где Ь>\. Поэтому функцию у=ах при 0<а<1 можно Ь определить как функцию у—Ь~х при Ъ — — > 1. Следствие 1. Показательная функция у = ах при а>1 положительна (при всех значениях х). Если х — произвольная точка числовой оси, а г — рациональное число такое, что г<х, то по определению показательной функции на множестве рациональных чисел аг>0, а по утверждению 3 ах>аг при а>1. Следовательно, ах>0. Следствие 2. Показательная функция у = ах при а>1 удовлетворяет условиям: Итах = 0, Нтах= +оо. /г-*-—оо #-#-|-со В самом деле, так как о>1, то а=1-т-б, где 5>0 и а" = = (1 + 6)">я6. Следовательно, \\тап= +оо. В силу монотон- ГС-*со ности функции у — ах получаем, что и \хтах= + оо. Так как Х-»+оо агп = — , то Игл а~п = 0, и поэтому Пта^ = 0. ап п-кх х-*—оо Следствие 3. Значения функции у=ах при а>1 заполняют всю положительную полупрямую у>0. Действительно, по следствию 1 функция у=ах принимает только положительные значения, а по следствию 2 она принимает как сколь угодно малые, так и сколь угодно большие положительные значения. Из непрерывности и строгой монотонности а* и из теоремы 4.4 вытекает, что любое положительное число является значением функции у = ах. Следствие 4. Для любых вещественных чисел Х\ и Хг справедливы соотношения (ах')х' = ах^х', а*«-й*» = (а •&)*», а^• ах> = а*>+*г. В самом деле, эти соотношения уже были установлены нами для рациональных показателей. Отсюда вытекает справедливость их и для произвольных вещественных показателей. Убедимся, например, в справедливости первого соотношения. Пусть {/•'„} и {гп"} ■— последовательности рациональных чисел, сходящиеся со- ответственно к х\ и х% Тогда (ап)п = ап а. Переходя к пределу при л->-оо и используя непрерывность показательной функции, получим (а*»)**=а*1-*». Аналогично устанавливаются и остальные равенства. Заметим теперь, что мы фактически изучили и свойства показательной функции у = ах при 0<а<1. Действительно, ее непре-
§ 3. Простейшие элементарные функции 145 рывность следует из самого определения. Из определения следует также, что эта функция монотонно убывает на бесконечной прямой. Следствия 1, 3, 4 верны и для функции у=ах при 0<а<1, а следствие 2, очевидно, будет выглядеть так: Итах— +00, Пта* = 0. На рис. 4.1 и 4.2 изображены графики показательной функции у — ах для случаев а>\ и 0<а<1. Рис. 4.2 Замечание. Показательную функцию можно было бы определить как решение некоторого функционального уравнения, удовлетворяющее определенным условиям. Можно доказать, что существует, и притом единственная, функция /(я), определенная на всей бесконечной прямой и удовлетворяющая трем требованиям: 1) для любых вещественных х\ и х% выполнено соотношение 1{Х1+Х2)=!{ХХ)-1(Х2)\ 2) Д0) = 1*. !(\)=а пр-и а>1; 3) функция 1(х) непрерывна при х = 0. Такой функцией и является построенная выше функция {(х) = а* при а>1. 2. Логарифмическая функция. Логарифмическую функцию мы определим как обратную к показательной. Пусть [с, й] — произвольный сегмент бесконечной прямой. На этом сегменте функция у=ах при а>1 возрастает и непрерывна. Поэтому в силу теоремы 4.5 функция у=Цх) = ах имеет на сегменте [ас, аа] возрастающую и непрерывную обратную функцию х = 1~г(у), которая и называется логарифмической и обозначается так: х=1-г(У)=1°ёаУ- Заменяя обозначение аргумента у на х, а обозначение функции х на у, запишем ее в более привычном нам виде: у = 1о%ах. * Можно доказать, что требование /(0)=1 является следствием остальных, требований (и потому может быть опущено).
146 Гл. 4. Непрерывность функции Случай 0<а<1 рассматривается аналогично. Отметим следующие свойства логарифмической функции, вытекающие из ее определения: 1) Логарифмическая функция определена для всех положительных значений х. В самом деле, аргумент логарифмической функции представляет собой значения показательной функции, которые, как мы знаем, только положительны и заполняют всю полупрямую х>0. 2) Логарифмическая функция непрерывна и возрастает на .всей полупрямой х>0 при а>\ и непрерывна и убывает на всей полупрямой *>0 при 0<а<1, причем ит1о§аЛ;= —оо, Пт1о§ал;= +оо при а > 1, х->-0+0 х-*+°° Нт 1о§, х -- *-»о+о -т-оо, Пт 1одах= —оо при 0< а< 1. •Справедливость этих свойств вытекает из свойств показательной •■функции. 3) Для любых положительных х\ и #2 1од0 (XI ■ Х2) = \Оёа XI + \0§а Х2. Это свойство также вытекает из свойств показательной функции. Замечание. Следует особо выделить логарифмическую функцию у = \о%ех, где е = Пт(1 4-—) • Для этой функции используется обозначение у = \пх. Логарифмы по основанию е называются натуральными. у=\цах,а>1 У1 0 , 1 /\ Рис. 4.3 Рис. 4.4 На рис. 4.3 и 4.4 изображены графики логарифмической функции у = 1оцах для случаев а>\ и 0<а<1. 3. Степенная функция. Определим теперь степенную функцию с любым вещественным показателем а через суперпозицию логарифмической функции и показательной. Пусть х>Ог Тогда общая степенная функция определяется так:
§ 3. Простейшие элементарные функции 147 у = х* = (а,ое°х)" = аа1ое"х, где а — любое фиксированное число, ради определенности большее единицы: Из этого определения и из того, что при а>1 логарифмическая функция возрастает на всей полупрямой л:>0, а показательная функция возрастает на всей бесконечной прямой, вытекает, что степенная функция у = ха = ааЛоеах возрастает при а>0 и убывает при а<0 на полупрямой х>0. Справедливы следующие свойства: 1) Для степенной функции выполнены соотношения: Пгп ха = 0 при а > 0, Нт ха = + °° при а < 0. ж-»0+0 *-»0+0 В самом деле, пусть {хп} — любая сходящаяся к нулю справа последовательность значений аргумента хп- Так как Пт1одад:п = = — оо, то из свойств показательной функции вытекает, что Нтаа'1оеЛ = 0 при а>0 и Птаа'|ое«г»= +оо при а<0. По- определению положим 0а=0 при а>0 и будет считать это выражение неопределенным при а<0. 2) Степенная функция у — ха = аа']°"аХ непрерывна в каждой точке х открытой полупрямой х>0. Это сразу же вытекает из теоремы 4.2 непрерывности сложной функции с учетом того, что функция и = а-\о§,ах непрерывна в любой точке х>0, а функция у=аи непрерывна в любой точке и бесконечной прямой. Замечание. Если показатель а степенной функции представляет собой рациональное число гп/п, где п — нечетное целое число, то степенную функцию у = ха можно определить на всей числовой оси, полагая при х<0: у = I х |а, если а = — и /и четное, п у= — \х г, если а = — и т нечетное. п На рис. 4.5—4.7 изображены графики степенной функции у = хх для различных значений а. 4. Тригонометрические функции. Мы уже имеем представление о тригонометрических функциях у = зтх и у=со&х и функциях, которые через них выражаются, у~\%х = , у = с\%х— —, С05 X 5Ш X у = &есх= , г/ = созесл; = С05 X 51П X Во введении к этому параграфу мы уже говорили о логических пробелах, возникающих при определении функций у = 5'тх и
48 Гл. 4. Непрерывность функции «?1 Рис. 4.5 Рис 4.6 У=Х } <х*0 Рис. 4.7 у=соёх с помощью наглядных геометрических соображений. Логически безупречно эти функции можно определить как решение некоторой системы функциональных уравнений. Точнее, можно доказать следующее утверждение: существует и притом единственная пара функций ?(х) и §(х), определенных для всех вещественных значений аргумента х и удовлетворяющих условиям: 1) !(Х1 + Х2) =/(*!) Я (*2) +/Ы -8 (XI), Я(*1+х2) =*(•*! )-2(*а)—!{Х1)-8{х2), Щх)+§Цх) = 1; [2) /(0) = 0, §(0) = \, /(^- 1- 8^ = 0; (4.6) 3) если0<х<-%-, то0<Нх)<х<~Т- 2 §(х) * Справедливость неравенства *< „ ,„ч Для 0<х< — следует из ос- *(*) -• 2 тальных сформулированных здесь условий (см. по этому по!оду указываемое ниже дополнение к книге В. А. Ильина и Э. Г. Позняка).
§ 3. Простейшие элементарные функции 149 Первую из этих функций назовем синусом и обозначим символом {(х) = 5Шх, вторую назовем косинусом и обозначим символом §(х) = со&х. Доказательство приведенного утверждения можно найти в дополнении к гл. 4 книги В. А. Ильина и Э. Г. Позняка «Основы математического анализа», 1 (М., Наука, 1982). Нетрудно доказать, что из свойств 1), 2) и 3) можно извлечь в виде следствий все другие свойства функций у = з'тх и у—созх, известные читателю из школьных учебников и устанавливаемые в средней школе из наглядных геометрических соображений. Впрочем, этот факт сразу вытекает из того, что свойства 1), 2) и 3) определяют единственную пару функций ?(х) и §{х) и что введенные в средней школе из наглядных геометрических соображений функции }(х)=5тх и &(х) = соз х этими тремя свойствами обладают. В качестве примера установим с помощью свойств 1), 2), 3) некоторые свойства функций у = &тх и у=соёх, которые понадобятся нам при доказательстве непрерывности этих функций и для отыскания участков их монотонности. а) Из третьего соотношения 1), имеющего вид зш2л:+соз2л;=1, сразу же вытекает, что зш2л;<1 и соз2ж1, т. е. |зтх|<:1, |соз*|<:1. (4.7) б) Далее, с помощью первых двух соотношений 1) и первых двух равенств 2) мы получим, что З1п0 = зт[х+ (—*)] =31Пд;-соз(—х) +созх-зт(—*) =0, соз0=соз[д;+ (—х)] = созл:'С05(—х)—зшл^8ш(—х) = 1. Полученные два равенства представляют собой систему двух уравнений относительно двух неизвестных соз(—х) и зт(—х). Решая эту систему и учитывая, что з1п2л;+соз2л;=1, мы получим, что СОЗ (—X) =С03 X, 31П (—X) = —31П X, (4.8)' т. е. сов* представляет собой четную функцию, а зт# — нечетную функцию *. в) Из соотношений 1), в свою очередь, вытекают равенства 5Ш(Л:1— Х2) =31П[ЛГ1+ (—Х2) ] = 31П Х\ -СОз(—Х2) + + СОЗ Х\ • 31П (—Х2) = 51П Х\ -СОЗ Х2—С05 Х\ • 51П Х2, (4.9) СОЗ (XI—Х2) =С08.[*1 + (—Х2) ] = СОЗ XI • СОЗ (—Х2) — —31П Х\ • 31П•(—Х2) = СОЗ Х\ 'СОЗ Х2 + 31П Х\ • 31П Х2. * Функция ф(х), определенная для всех вещественных значений х, называется четной, если ф(—*)=ф(л!) (для любого значения я), и нечетной, если ф(—*)=—ф(*) (также для любого значения х).
150 Гл. 4. Непрерывность функции г) Из первого соотношения 1) и первого соотношения (4.9) мы получим, что *2 ~Н х1 | ^ — *1 2 \ 2 2 2 2 2 2 81^= зт'-*2^*1 ^2^*1- 51ДХ2 + Л:1С08 **--** — 8]11 Х2~Х1-С08 *2 + **, Складывая и вычитая полученные два равенства, мы придем к соотношениям бШх2 + 8ш хх = 2вШ Х* + Х1 .соз *2~*х 2 (4.10) 8Ц1 Х2 — 81П Хй = 2С05 Х2 + Х1 ■ 8Ш — — д) Далее, из первого соотношения (4.9) и из последних двух равенств 2) получим, что 81и (— х) = в1п—-созл;—соз —•5Шл; = со8л;, V 2 ) 2 2 т. е. С08Х=81п (——*)■■ (4,11) е) Убедимся, наконец, в периодичности функций 1{х)=ътх и §(х)=созх с периодом 2л. Из первых двух соотношений 1) при х = х\ = Х2 получим, что 51п2д:=2й1пх-со8л:, с052х=соз2л;—зт2х (4.12) Учитывая, что в силу равенств 2) 8Ш—=1, сое— = 0, мы.по- лучим из соотношений (4.12) при х = — , что $тя=0, созя= = —1, а из последних двух равенств и из соотношений (4.12) при х = я получим, что 51п2л = 0, соз2я=1. Используя последние два равенства, мы получим из первых двух соотношений 1), что зт(л:+2я) =81пл:-со5 2я + 51п2я-со5 х = зт х, соз(х + 2я) = соз х-соз 2я—зт х-зт 2я = соз х,
§ 3. Простейшие элементарные функции 151 а это и означает периодичность функций зт х и соз х с периодом 2я*. ж) В заключение несколько усилим неравенства, содержащиеся в свойстве 3). Мы установим, что для всех вещественных х справедливо следующее несколько общее неравенство: | 81П ДГ | < \х\. (4.13) При 0<х<— соотношение (4.13) следует из неравенств, содержащихся в свойстве 3). При — <х<0, в силу соотношения зт(—х) =—зтл:, неравенство (4.13) следует из следующих неравенств: О < зт (—л;) < —х при < х < О, а эти последние неравенства справедливы вследствие того, что {—х) лежит в интервале (0, —)• При л:=0 зтл:=л;. При —<|#| имеем |81пд:|<1< — <|х|, т. е. |зтх|< Перейдем к установлению двух основных свойств функций /(*) =31П X И §(х) =СОЗ X. 1°. Функции зт х и соз х непрерывны в каждой точке х бесконечной прямой. Доказательство. Достаточно установить непрерывность в каждой точке х только функции /(Х) = зшх, ибо непрерывность в каждой точке х функции §{х)=со§ х будет при этом вытекать из •соотношения (4.11) и теоремы 4.2. Сначала докажем, что функция зт х непрерывна в точке х—0. Так как в силу первого равенства 2) зтО = 0, то в силу •определения непрерывности по Гейне достаточно доказать, что для любой бесконечно малой последовательности {хп} последовательность значений функции {з1пд;„} также является бесконечно малой. Из неравенства (4.13) и из условия |зтл:|:>0 вытекает, что для всех х 0<|8ш*|<:|х|. (4.13') ■Следовательно, 0< |зтл:„|«: \хп\. Последние неравенства в силу принципа двустороннего ограничения (см. теорему 3.14 гл. 3) означают, что последовательность * Функция ф(х), определенная для всех вещественных х, называется периодической с периодом Т, если <р(х+Т) =ф(д-) для всех х.
152 Гл. 4. Непрерывность функции {|з1пд;„|}, а значит, и последовательность {&тхп} является бесконечно малой. Непрерывность функции зтл: в точке х=0 доказана. Докажем теперь, что функция зт х непрерывна в любой точке х бесконечной прямой. Пусть {хп} — произвольная последовательность, сходящаяся к х. Достаточно доказать, что соответствующая последовательность {зтхл} сходится к зшя. Воспользуемся вторым соотношением (4.10), положив в нем Х2 = хп, Х[=х. Получим вах — 51пл: = 2С08 Хп + Х -8Ш Хп~х • (4.14) " 2 2 Достаточно доказать, что в правой части (4.14) стоит элемент бесконечно малой последовательности, но это сразу вытекает из. того, что последовательность | в!п—- > в силу уже доказанной непрерывности синуса в нуле, является бесконечно малой, а последовательность 12соз Хп —1. в силу второго неравенства (4.7) является ограниченной. 2°. Функция 51П х возрастает на каждом из сегментов 2Ы- 2 2 -|-, (2*+1)я+-§- и убывает на каждом из сегментов (2к + 1)п- функция соз х убывает на каждом из сегментов [2кп, 2йя+я] и возрастает на каждом из сегментов [2кл—я, 2кя] (здесь всюду к — любое целое число, т. е. к = 0, ±1, ±2,...). Доказательство. Все рассуждения достаточно провеет» для функции зт х, ибо после нахождения всех участков монотонности функции 31П х участки монотонности функции соз х могут быть получены, исходя из равенства (4.11). Далее, поскольку зт х — периодическая функция с периодом 2я, то достаточно найти участки ее монотонности, лежащие в пределах одного периода, т. е., например, для значений аргумента из сегмента , 2я — — • [2 2 ] Докажет сначала, что функция &'тх возрастает на сегменте 0, — • Пусть XI и х2 — любые два числа из этого сегмента такие, что х2>Х\. Тогда, очевидно, числа *» + ** и. ж* хг 2 2 принадлежат интервалу (0, —}. причем в силу второго равенства (4.10) зшх2—з1ях1 = 2со8 Х* + Хх вШ ** *' ♦ (4.15)
§ 3. Простейшие элементарные функции 153 Достаточно доказать, что в правой части (4.15) стоит положительное число, а для этого достаточно убедиться в том, что для всех значении аргумента из интервала О,— 2 ФУНКЦИИ 51П X и соз х принимают только положительные значения. Для функции /(х)=зшх это вытекает из свойства 3), а для функции созх следует из равенства (4.11). Итак, доказано, что функция зтх возрастает на сегменте О, — • Из нечетности функции зт х, т. е. из второго соотношения (4.8), в таком случае следует, что функция зтх возрастает -—,0 2 и на сегменте Тем самым доказано, что функция зтх возрастает на сегменте Остается исследовать поведение функции зт х я я "• т. я я Т' ~2 на сегменте я , я —» п-\ 2 2 В пункте е) мы убедились в том, что зтя = 0, еозя = —1, а из этих равенств и из первого соотношения 1) вытекает, что 51П(х+я) =31П Х-СОЗ Я + СОЗ Х-81П Я = ■—31П X. Полученное соотношение позволяет заключить, что из установленного нами возрастания функции зтх на сегменте вытекает убывание этой функции на сегменте т] пол- —, яН 2 2 ] Изучение участков монотонности функций зт х и соз х ностью завершено. В силу представлении Щх = , сх§х= и в силу СОЗ X 51П X теоремы 4.1 для случая частного функция х^ х непрерывна в любой точке х Ф 1- кл, а функция С1§х непрерывна в любой точке хфкл. Пользуясь соотношениями зт(л+я)=—зтх, соз (х+я) = = —созх, мы получим, что х§(х + я) = — = {.§х и аналогично СОЗ X с[ц (х+я) = С[§х. Это означает, что 1§х и ст^х являются периодическими функциями с периодом л. Значит, достаточно произвести исследование участков монотонности этих функций только в пределах интервала длины я. Из равенства 1§х2—х§Х! = ЗШЛГ2 5111X1 5Ш (х2—х{) С05Хг СОЗХх созлта-созл^ (4.16) и из того, что зтх принимает только положительные значения на интервале (0, я), а созх принимает только положительные значе-
154 Гл. 4. Непрерывность функции ния на интервале — л я ~2г Т возрастает на интервале / я я из интервала — вытекает, что функция 1дх — , )• (ДЛЯ Любых XI И #2 таких, что х2>хи в правой части (4.16) будет стоять положительная величина.) Аналогично устанавливается, что функция сгд х убывает на интервале (0, л). Мы не останавливаемся на изучении функций зесл: = и созесд; = 1 81ПХ Графики всех тригонометрических функций изображены на рис. 4.8—4.13. У= 5{ПХ Рис. 4.8 5. Обратные тригонометрические функции. Остановимся на вопросах определения и свойствах непрерывности и -монотонности обратных тригонометрических функций.
§ 3. Простейшие элементарные функции 155 1 у = тес х Рис. 4.13 Для определения функции у = агсз'тх рассмотрим я п у = &тх на сегменте функцию Согласно п. 4 на этом сег- 2 2 менте функция у = зтх монотонно возрастает и непрерывна. Множество ее значений есть сегмент [—1, 1]. В силу теоремы 4.5 на сегменте [—1, 1] существует. непрерывная возрастающая обратная функция, принимающая значение — в точке —1 и значе- я 2 ние л 2 в точке 1. Эту функцию обозначают символом х= = агсзтг/ или, меняя обозначение аргумента у на х и обозначение х для функции на у, символом у = агс$тх. Точно так же определяется на сегменте [—1, 1] функция г/ = агссозл;, обратная по отношению к функции х = созу, убывающей и непрерывной на сегменте 0<у<я. Функция у = атссо5Х убывает и непрерывна на сегменте [—1, +1] и принимает в точках х= — 1 и х= + \ значения, соответственно равные л и 0. Функции г/ = агс1§х и г/ = агсстдх определяются как обратные для тангенса и котангенса, рассматриваемых на интервалах {-——, —) и (0, я). Эти функции определены и монотонны
156 Гл. 4. Непрерывность функции Рис. 4. у- ж 2 У л 2 14 1 0 у = аг ее \а х ' ■ Рис. 4.15 у,, —:—-~^-я' 0 ж ^2 у =агсс1д ее X Рис. 4.16 Рис. 4.17 на всей бесконечной прямой. На рис. 4.14—4.17 изображены гра- 'фики обратных тригонометрических функций. 6. Гиперболические функции. Функции е* + е х ех — е х 2 2 называются соответственно гиперболическим косинусом и гиперболическим синусом и обозначаются символами сЬл: и зпл:: сЬх = ех -\- е , 8П X = еЛ — е Гиперболический тангенс и гиперболический котангенс определяются соответственно формулами .1 $Ь х ех — е~х ,, сЬ х ех + ё~х тх = —— = ———— . сш х = - — — сЪх ех + ех &Ъх Из определения гиперболических функций следует, "что гиперболический косинус, гиперболический синус и гиперболический тан-
§ 3. Простейшие элементарные функции 157 гене заданы на всей числовой оси, а гиперболический котангенс определен всюду на числовой оси, за исключением точки л:=0- На рис. 4.18—4.21 изображены графики этих функций. У' +/ 0 ->\ -г 1 у = с!Нх X у=1Ьсс Рис. 4.20 Рис. 4.21 Гиперболические функции непрерывны в каждой точке области их задания (это следует из непрерывности показательной функции и теоремы 4.1). Гиперболические функции обладают рядом свойств, аналогичных свойствам тригонометрических функций. Например, для гиперболических функций имеют место теоремы сложения, аналогичные теоремам сложения для тригонометрических функций: 5Ь(х+г/) =зН я-сЬ </+сп х-.зН у, сЬ (х+у) = сЬ х ■ сЬ у+5п х • зЬ у. Непосредственно также проверяются формулы зЬ 2я = 2 зЪх-сЪх,
158 Гл. 4. Непрерывность функции сЬ2 х—зп2л:=1-. Эпитет же «гиперболический» связан с тем обстоятельством, что равенства х=а-сЪ. I, у=а-&Ы задают гиперболу, подобно тому, как равенства х=а-со5/, у = а-&'т1 задают . окружность. Действительно, в первом случае мы, очевидно, имеем х?—у2 = а2, т. е. уравнение гиперболы, а во втором х2+у2=а2 — уравнение окружности. § 4. ДВА ЗАМЕЧАТЕЛЬНЫХ ПРЕДЕЛА 1. Первый замечательный предел. Прежде всего докажем следующую теорему, представляющую собой функциональный аналог теоремы 3.14. Теорема 4.6 (функциональный аналог принципа двустороннего ограничения). Пусть в некоторой проколотой 6-окрестности точки а* заданы три функции }(х), Н(х) и §(х), две из которых }(х) и §(х) имеют в точке а общий предел, равный Ъ. Тогда если всюду в указанной проколотой 6-окрестности точки а справедливы неравенства Пх)<Цх)<8{х), (4.17) то и функция п(х) имеет в точке а предел, равный Ь. Доказательство. Пусть {хп} — произвольная, сходящаяся к а последовательность значений аргумента, все элементы которой отличны от а. Тогда, с одной стороны, в силу определения предела по Гейне, обе последовательности соответствующих значений функций {/(*„)} и {§(хп)} сходятся к Ь, а с другой стороны, в силу (4.17), для всех номеров п справедливы неравенства 1(хп)<п(хп)<8(Хп). В силу теоремы 3.14 мы можем утверждать, что последовательность п(хп) также сходится к Ь, а это и означает, что число Ь является пределом функции Н(х) в точке а. Теорема доказана. Теорема 4.7. Предел функции й(х)== в точке х=0 существует и равен единице, т. е. *-»о х Доказательство. Будем отправляться от неравенств 0< 81ПХ <*<*§* (при 0 <*<—).' (4.18) * Напомним, что проколотой 6-окрестностью точки а назцвается интервал {а—б, а+б), из которого выкинута точка а.
§ 4. Два замечательных предела 1591 указанных в п. 4 § 3. Посредством деления на зт л:>0 мы получим из (4.18) следующие неравенства: 1< -4-< —— (при 0< х< -5-) • Для обратных величин, очевидно, справедливы обратные неравенства созл;<-^^<1 (при 0<л<—V. (4.19) Заметим, что из того, что неравенства (4.19) справедливы при 0<*<—. вытекает, что эти неравенства справедливы и при <#<0, ибо при замене х на —х все три функции созх,. 8Н1Ж , „а- и 1 не меняют своих значении . х Таким образом, неравенства (4.19) справедливы для всех значений х из интервала—2- < х < -^ За исключением точки х=0„ т. е. справедливы всюду в проколотой окрестности точки х = 0. Так как, кроме того, обе функции /(лс)=созл: и §{х) = 1 имеют в точке л;=0 равный единице предел, то в силу теоремы 4.6 31П X и функция к(х) = имеет в точке х = 0 предел, равный единице. Теорема доказана. 2. Второй замечательный предел. Теорема 4.8. Предел функции '/(*) = (1+х)1/х в точке х = 0 существует и равен числу е **. Доказательство. Достаточно доказать, что как правый, так и левый пределы функции 1(х) = (\+х)1/х в точке х — 0 существуют и оба равны е. 1) Сначала докажем, что правый предел указанной функции в точке х = 0 существует и равен е. В силу определения правого предела по Коши достаточно доказать, что для любого е>0 найдется отвечающее ему б>0 такое, * В самом деле в п. 4 § 3 мы установили, что соз(—*)=созд:) зт(—д;) = зт (—х) &'тх = —зтх и, значит, —; = ** Число е введено в п. 3 § 2 гл. 3 как предел последовательности { (1 +
160 Гл. 4. Непрерывность функции что для любого х из интервала 0<д;<б справедливо неравенство \{\ + хУ'х—е\<г. (4.20) Фиксируем произвольное е>0 и рассмотрим две последовательности {ап} и {Ьп} с элементами ап— (1 -\ ) , Ьп= (1 + Н ] • Убедимся в том, что обе эти последовательности схо- п I дятся к е. В самом деле, поскольку в силу п. 3§2гл. 3 Пт (1 + П-*оо \ 1 \п 4-— = е, то на основании теорем о пределе частного и произ- п 1 ведения двух сходящихся последовательностей мы получим, что 1 \"+1 -, / 1 \«-Н Нт ап — Пт я+1 1 л+1 Нт 1 •, П-кх> \ П -\- 1 Нт (1+—^-г = Т = б, Пт 6„=Нт п \ п Пт (1 +-^-Г.Нт ^1 + — П / п-+х \ П = е-\=е. Так как обе последовательности {ап} и {Ьп} сходятся к е, то для фиксированного выше е>0 найдутся номера Ы\ и ТУг такие, что \ап—е|<е при гС^Ыи \Ьп—е|<е при п^Ы2. Пусть N — это наибольший из двух номеров /V] и /У2. Тогда, очевидно, при ги^Ы будут справедливы оба неравенства: \ап—е\<г и \Ъп—е\<е. (4.21) Теперь для завершения доказательства существования равного е правого предела функции 1(х) = (1+х)1/х в точке х = 0 убедимся в том, что если взять б = —■ то Для любого х из интер- N вала 0<л:<6 = будет справедливо неравенство (4.20). В самом деле, пусть х — любое число из интервала 0 < х < < б = —. Тогда — > /^-Обозначив через п целую часть числа N х 1 —, т. е. положив п = X 1 1 мы, во-первых, с помощью неравенства — >/У можем утверждать, что п>Ы, а во-вторых, моде жем утверждать, что справедливы неравенства
§ 4. Два замечательных предела 161 п< — <л+1. (4.22) Из (4.22) вытекают неравенства -4т-<*<— и 1+—!— <1 + х<1 + —. (4.23) л + 1 п п + 1 п Из сопоставления неравенства (4.22) со вторым неравенством (4.23) и из свойства возрастания показательной функции с основанием, большим единицы, вытекает, что 1 +—1— Г<(1+ *)"*< (1 +—)"+1 или ап<(1 + хУ'*<Ь. Итак, мы доказали, что для любого х из интервала 0 < х < < 6 = — при некотором п>-Ы, зависящем, конечно, от х, будут справедливы неравенства ап<(1 + х)1/х<Ьп, а значит, и неравенства ап—е<{\+хУ'х—е<Ьп—е. (4.24) Из сопоставления (4.24) с неравенствами (4.21), справедливыми для любого п^Ы, мы окончательно убедимся в том, что для любого х из интервала 0<л;<б = — будут справедливы неравенства (4.20). 2) Докажем теперь, что и левый предел функции !(х) = = (1 + х)1/х в точке х=0 существует и равен е. В силу определения левого предела по Гейне достаточно доказать, что для любой бесконечно малой последовательности отрицательных чисел {хп} соответствующая последовательность значений функции }{хп) = {\ + хп) „ сходится к е. Пусть {хп} — произвольная бесконечно малая последовательность отрицательных чисел. Эту последовательность мы будем рассматривать, начиная с того номера Ы, с которого все элементы хп по модулю меньше единицы. Положим уп= —, так что х„ = =^-5—. Тогда, оче- 1 + хп 1+Уп видно, {уп} будет являться бесконечно малой последовательностью, состоящей из положительных чисел, причем _1+Уп Г(хп) = (1 + хп)1>хп=(1--1^-) уп = 1 \ [у. 1+Уп \ап 1+Уп -[+-+А ^+1 6 Зак. 72
162 Гл. 4. Непрерывность функции Таким образом, Нт /(*„) = Игл (1 + уп)Уп ■ Пт(1 + уп) (4.25> П-^оо при условии, что существуют пределы в правой части (4.25). Но поскольку {уп} сходится к нулю и состоит из положительных чи- сел, то Пт(1 + г/„) =е (в силу уже доказанного существовав ния равного е правого предела), а Нт (1+ {/„)= 1 • Тем самым доказано, что последовательность {/(х„)} сходится к числу е. Теорема 4.8 полностью доказана. Следствие. Предел функции /(() = 11 + — ) при ^->-оо> существует и равен е. В силу определения предела при /-»~оо по Гейне требуется доказать, что для любой бесконечно большой последовательности {/п} соответствующая последовательность значений функции /(/„)= (1 Н ) " сходится к числу е. Мы будем рассматривать бесконечно большую последовательность {^п}, начиная с того номера Ы, с которого все ее элементы 1п по модулю превосходят единицу. Положим хп=—, так что 1п= . В силу теоре- мы 3.6 из гл. 3 последовательность.!^} является бесконечно ма- лой, причем /(д=(1+-1у« = (1.+ х11),/я». Остается заметить, что в силу теоремы 4.8 Ига/(д = Ит(1+*„)-/п=в. П-»0О П-+0О § 5. ТОЧКИ РАЗРЫВА ФУНКЦИИ И ИХ КЛАССИФИКАЦИЯ 1. Классификация точек разрыва функции. В § 1 мы договорились называть точками разрыва функции /(х) те точки, в которых эта функция не обладает свойством непрерывности. При этом подразумевается, что функция }(х) определена в той точке, которую мы апробируем на предмет наличия или отсутствия в ней свойства непрерывности-. Расширяя наше рассмотрение, мы можем подвергнуть изучению и те точки, в которых функция /(л:) не определена (при условии, конечно, что эти точки являются предельными для множества задания функции). Выясним возможные типы точек разрыва.
§ 5. Точки разрыва функции и их классификация 163 1°. Устранимый разрыв. Точка а называется точкой устранимого разрыва функции у=?(х), если предел функции Дх) в точке а существует, но в точке а функция 1(х) либо не определена, либо имеет частное значение {(а), отличное от предела 1(х) в этой точке. Например, функция /(*) = 51ПЖ при хф[0, л 0,5 при х = О имеет в точке х = 0 устранимый разрыв. Действительно, предельное значение этой функции в точке х=0, как мы доказали в п. 1 § 4, равно 1. Частное же значение 0,5^1. Если функция }(х) имеет в точке а устранимый разрыв, то этот разрыв можно устранить, не изменяя при этом значений функции в точках, отличных от а. Для этого достаточно положить значение функции в точке а равным ее предельному значению в этой точке. Так, в рассмотренном выше примере достаточно положить /(0) = 1 и тогда Пт = /(0) = 1, т. е. функция $(х) станет непрерывной в точке х=0. В физических процессах точки устранимого разрыва встречаются при сосредоточенных распределениях физических величин. 2°. Разрыв первого рода. Точка а называется точкой р аз- рывапервого рода, если в этой точке функция ((х) имеет конечные, но не равные друг другу правый и левый пределы Нт Цх)Ф Пт 1{х). *->а+0 х-*а—О Образно выражаясь, разрыв первого рода можно назвать конечным скачком. Приведем некоторые примеры. 1) Функция 1 при х > О, /(лг) = 5§пх = О при х = О, —1 при х< О в точке х = 0 имеет разрыв первого рода Действительно, Функция / (л;) = 5§п х, очевидно, может быть записана так: х 1(х) =з§п х =■< |х1 при х =^= О, О при х — 0.
164 Гл. 4. Непрерывность функции Нт з§пл:=1, Нт 5§пл: =—1, и, таким образом, эти пределы х-*0+0 х-*0—О не равны между собой. 2) Другой пример дает функция /(*) = — при хфО. Для \х\ Ч1П X с?т1 у этой функции Нт = 1, Нт = — 1, так что точка х~М)+0 \х\ х-»0—О \х\ х — 0 является точкой разрыва первого рода. 3) Функция /(*) = , определенная всюду, кроме точ- 1+2^ ки х=1, имеет в точке х=1 разрыв первого рода. В самом деле, если {хп} сходится к 1 и состоит из элементов хп>\< то I 1 является бесконечно большой последователь-, \ хп -1 / ностью с положительными членами. Поэтому {1 + 2*"- } — бесконечно большая последовательность и, значит, последовательность / (хп) = является бесконечно малой, т. е. 1 хп-\ ) Нт ;(х) = 0. *->1+0 Если же {хп} сходится к 1 и состоит из элементов хп<1, то является бесконечно большой последовательностью с 1 отрицательными членами. Поэтому {2Х"~ } сходится к нулю и, значит, последовательность /.(•*„) = ■■ сходится к еди- 1+2^ нице, т. е. Нт /(д;) = 1. х-И—О 3°. Разрыв второго рода. Точка а называется точкой разрыва второго рода, если в этой точке функция \(х) не имеет по крайней мере одного из односторонних пределов или если хотя бы один из односторонних пределов бесконечен. Примеры. 1) Функция х-соз— при х< О, X / (х) = | 0 при х = О, соз — при х > О X обладает левым пределом в точке #=0, равным нулю: Нт /(х) = Х-+0—0 = 0. В самом деле, если {хп} — последовательность, сходящаяся
§ 5. Точки разрыва функции и их классификация 165 к нулю и состоящая из чисел хп<0, то 1 0< !/(*„)| С08- <\ха\. Поскольку |лсл]-»-0 при л-»-оо, то Нт/(*„) = в. Убедимся теперь в том, что рассматриваемая функция не имеет в точке х=0 правого предела. Для этого рассмотрим две сходящиеся к нулю и состоящие из положительных чисел последовав тельности х„ = и хп — . Если бы функция обладала п п 2яя 2 ^ в точке х = 0 правым пределом, то обе последовательности {{{хп)} и {/(*'«)} сходились бы к одному и тому же числу. Однако }(хп')=со$2лп=1 сходится к единице, а /(лгл) = соз (- пп = 0 сходится к нулю. Итак, рассматриваемая функция имеет в точке х=0 разрыв второго рода. 2) Функция 1(х)=^х, очевидно, имеет разрыв второго рода в каждой из точек хй = Ьяк, где к = 0, ±1, ±2,..., ибо в каждой такой точке Хк Нт /(х)=+оо, Пт /(*)= — оо. Можно образно сказать, что в каждой точке Хк функция 1§х имеет бесконечный скачок. 3) Функция 151П — при х ф О, х 1 при х = О имеет разрыв второго рода в точке х=0, ибо в этой точке у нее не существует ни правого, ни левого пределов. В самом деле, поскольку 51П = —81П—, достаточно удостовериться в отсут- X X ствии в точке х = 0 только правого предела, а для этого достаточно заметить, что двум последовательностям значений аргумента 1 ' 1 хп= — и хп = отвечают последовательности значе- лп я — 4-2лп 2 ний функции / (хп) = з1п пп = О и / (л^) = 31П [ — + 2пп 1=1, сходящиеся первая к нулю, а вторая — к единице. Введем понятие кусочно непрерывной функции, часто встречающееся в математике и в ее приложениях.
166 Гл. 4. Непрерывность функции Функция }(х) называется кусочно непрерывной на сегменте [а, Ь], если эта функция определена всюду на сегменте [а, Ь], непрерывна во всех внутренних точках этого сегмента, за исключением, быть может, конечного числа точек, в которых она имеет разрыв первого рода и, кроме того, имеет правый предел в точке а и левый предел в точке Ь. Функция $(х) называется кусочно непрерывной на интервале (или на бесконечной прямой), если }(х) кусочно непрерывна на любом принадлежащем этому интервалу (или бесконечной прямой) сегменте. Например, функция у=[х] кусочно непрерывна как на любом сегменте, так и на бесконечной прямой. 2. О точках разрыва монотонной функции. Следующее утверждение проливает свет на природу точек разрыва монотонной функции. Теорема 4.9. Если функция 1(х) определена на сегменте [а, Ь] и является монотонной * на этом сегменте, то она может иметь на этом сегменте только точки разрыва первого рода, причем множество всех ее точек разрыва не более чем счетно. Доказательство. В силу леммы, доказанной в п. 1 § 2, монотонная функция имеет конечные правый и левый пределы в любой внутренней точке сегмента [а, Ь] и, кроме того, конечный правый предел в точке а и конечный левый предел в точке Ъ. Отсюда и вытекает, что точками разрыва монотонной функции могут быть только точки разрыва первого рода. Чтобы доказать вторую часть теоремы о том, что множество всех точек разрыва не более чем счетно, будем ради определенности считать, что }{х) является неубывающей на сегменте [а, Ь]. Достаточно доказать не более чем счетность множества точек разрыва, расположенных на интервале (а, Ь), т. е. точек разрыва, являющихся внутренними точками сегмента [а, Ь]. Заметим, что в каждой такой точке разрыва х справедливо неравенство для правого и левого пределов /(л;+0)>/(л;—0) (см. замечание к указанной выше лемме). В силу леммы 2 гл. 2, каковы бы ни были два вещественных числа, не равных друг другу, всегда найдется рациональное число, заключенное между ними. Так как в каждой точке разрыва х справедливо неравенство }{х + 0)>!{х—0), то каждой точке разрыва х можно поставить в соответствие некоторое рациональное число г{х), удовлетворяющее неравенствам }(х+0)>г(х) >}(х—0). Заметим, что при этом разным точкам разрыва будут поставлены в соответствие разные рациональные числа. В самом деле, если х\ и Х2 — две точки разрыва такие, что х\<х2, то из не- * Т. е. либо неубывающей, либо невозрастающей.
§ 6. Локальные и глобальные свойства непрерывных функций 167 убывания функции следует, что /(^1 + 0) </(дг2—0), а поэтому Г(Х1)<Г(Х2). Таким образом, множество всех точек разрыва функции !(х), расположенных внутри сегмента [а, Ь] эквивалентно подмножеству множества рациональных чисел, которое, как доказано в § 7 гл. 2, является не более чем счетным. Теорема доказана. § 6. ЛОКАЛЬНЫЕ И ГЛОБАЛЬНЫЕ СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИИ К локальным свойствам относятся те свойства функции, которые справедливы в сколь угодно малой окрестности фиксированной точки области определения функции. Эти свойства характеризуют поведение функции при стремлении аргумента к исследуемой точке. Например, непрерывность функции в некоторой точке области ее определения является локальным свойством этой функции. Глобальные свойства — это свойства, связанные со всей областью определения функции. Например, монотонность функции на сегменте [а, Ь] является ее глобальным свойством. 1. Локальные свойства непрерывных функций. Введем новые понятия. Предположим, что функция }{х) задана на множестве Определение 1. Функция {(х) называется ограниченной сверху (снизу) на множестве {х}, если существует такое вещественное число М (вещественное число пг), что для всех значений аргумента х из множества {х} справедливо неравенство }(х)*аМ (}(х)^>гп). При этом число М (число пг) называется верхней (нижней) гранью функции }(х) на множестве {х}. Определение 2. Функция /(х) называется ограниченной с обеих сторон (или просто ограниченной) на множестве {х}, если она ограничена на этом множестве и сверху, и снизу, т. е. если найдутся такие вещественные числа т и М, что для всех значений аргумента х из множества {х} справедливы неравенства пг*с[(х)<М. Таким образом, ограниченность функции {(х) на множестве {х} фактически означает ограниченность множества всех значений этой функции (отвечающих значениям аргумента из множества Примеры. 1) Функция /(я) =1дх, рассматриваемая на интервале (0, —), ограничена на этом интервале снизу (в качестве нижней грани можно взять число т<0), а сверху не ограничена.
168 Гл. 4. Непрерывность функции 2) Функция Дирихле 0{х), равная нулю в иррациональных точках и единице в рациональных точках, ограничена (с обеих сторон) на любом множестве {х}. Справедлива следующая теорема о локальной ограниченности функции, имеющей конечное предельное значение. Теорема 4.10 (о локальной ограниченности функции, имеющей конечный пр е дел). Пусть функция 1(х) задана на множестве {х} и имеет конечное предельное значение в точке а. Тогда существует такое положительное число 6, что функция 1(х) ограничена на множестве В6, представляющем собой пересечение множества {х} с интервалом (а—б, а + б), т. е. с 8-окрестностью точки а. Замечание 1. Если множество задания функции }(х) сплошь покрывает некоторую б-окрестность точки а, то в качестве Вь можно взять сам интервал (а—б, а+ 6). Доказательство. Пусть предел {(х) в точке а равен Ь. В силу определения предела по Коши для некоторого положительного числа е найдется отвечающее ему положительное число б такое, что для всех значений аргумента х из проколотой 6-ок- рестности точки а* справедливо неравенство |/(л:)—Ь\<е или Ь—г<1(х)<Ь + г. (4.26) Если множество {х} задания функции не содержит точку а, то теорема доказана, ибо в этом случае неравенства (4.26) означают, что для всех точек множества В6 = {х}(](а—б, а+ 6) значения функции 1(х) заключены между числами т = Ь—е и М = Ь + е. Если же множество {х} задания функции /(х) содержит точку с и этой точке отвечает некоторое значение функции ?(а), то, обозначив через т наименьшее из двух чисел Ъ—е и /(а), а через М наибольшее из двух чисел Ь+ъ и /(а), мы получим, что для всех точек множества В^ = {х}(](а—б, а + б) будут справедливы неравенства** т<!(х)<М, (4.27) которые и означают ограниченность 1(х) на множестве В6. Теорема доказана. Иллюстрацией к доказанной теореме может служить рис. 4.22. Следствие из теоремы 4.10. Если функция }(х) непрерывна в точке а, то эта функция ограничена на множестве всех значений ее аргумента, принадлежащих некоторой Ь-окрестности точки а. * Напомним, что проколотой б-окрестностью точки а называется интервал (а—б, а+б) без точки а. ** В самом деле, для всех точек множества В6= {х}(](й—б, а+б), за исключением точки а, будут справедливы неравенства (4.26), а потому и неравенства (4.27). Для точки х=а неравенства (4.27) справедливы вследствие выбора чисел пг и М.
§ 6. Локальные и глобальные свойства непрерывных функций 169 Достаточно заметить, что непрерывная в точке с функция имеет в этой точке конечное предельное значение. Теорема 4.11 (об устойчивости знака непрерывной в точке функции). Пусть функция }(х) задана на множестве {х}, непрерывна в точке а этого множества и ее значение }(а) положительно [отрицательно]. Тогда существует такое положительное число б, что функция {(х) является положительной [отрицательной] всюду на множестве В6, представляющем собой пересечение множества {х} с 8-окрестностью точки а. Рис. 4.22 Рис. 4.23 Замечание 2. Если множество задания функции /(*) сплошь покрывает некоторую б-окрестность точки а, то в качестве В6 можно взять саму б-окрестность точки а. Доказательство. В силу определения непрерывности по Коши для любого положительного числа е найдется отвечающее ему положительное число б такое, что для всех значений аргумента х из б-окрестности точки а справедливо неравенство или /(а)— е</(*)</(а)+е. (4.28) Если взять в качестве е положительное число ' . то оба 2 числа {(а)—е и /(а)-1-е будут положительны при Да)>0 и отрицательны при /(а)<0. Поэтому неравенства (4.28) будут означать, что для всех значений аргумента из б-окрестности точки а функция }{х) является положительной при /(а)>0 и отрицательной при /(а)<0. Теорема доказана. Иллюстрацией к теореме 4.11 может служить рис. 4.23. Теорему 4.11 легко переформулировать на случай, когда функция /(л:) непрерывна в точке атолько справа или только слева.
170 Гл. 4. Непрерывность функции Договоримся называть полусегмент [а, а+8) правой Ь-полу- окрестностью точки а, а полусегмент (а—б, а] — левой Ь-полу- окрестностью точки а. Теорема 4.11*. Пусть функция 1(х) задана на множестве {х}, непрерывна в точке а этого множества справа [слева] и ее значение {(а) не равно нулю. Тогда найдется такое положительное число б, что функция }(х) не обращается в нуль и имеет тот же знак, что и в точке а, для всех значений х из множества {х}, принадлежащих правой [левой] д-полуокрестности точки а. Для доказательства этой теоремы следует дословно повторить доказательство теоремы 4.11 с заменой термина «б-окрестность точки а» термином «правая [левая] б-полуокрестность точки а». Замечание 3. К числу локальных свойств непрерывных в данной точке функций следует отнести доказанные выше теоремы 4.1 и 4.2 о непрерывности суммы, разности, произведения и частного двух непрерывных в данной точке функций и о непрерывности сложной функции. 2. Глобальные свойства непрерывных функций. Теорема 4.12 (прохождение непрерывной функции через нуль при смене знаков). Пусть функция \{х) непрерывна на сегменте [а, Ь], и пусть значения этой функции на концах сегмента {(а) и 1(Ъ) суть числа разных знаков. Тогда внутри сегмента [а, Ь] найдется такая точка |, значение функции в которой равно нулю. Доказательство. Не ограничивая общности, можно считать, что /(а)<0, /(Ь)>0. Пусть {х} — множество всех значений х из сегмента [а, Ь], для которых /(д;)<0. Это множество непусто (-ему, например, принадлежит точка х=а) и ограничено сверху (например, числом Ь). Согласно теореме 2.1 у множества {х} существует точная верхняя грань, которую мы обозначим через |. Заметим, что точка | — внутренняя точка сегмента [а, Ь], так как из непрерывности функции }(х) на [а, Ь] и из условий Да)<0, /(6)>0, в силу теоремы 4.11*. вытекает, что найдется правая б-полуокрестность точки а, в пределах которой /(лс)<0, и левая б-полуокрестность точки Ь, в пределах которой /(х)>0. Убедимся в том, что /(Е)=0- Если бы это было не так, то по Теореме 4.11 нашлась бы б-окрестность |—б<*<?; +б точки |, в пределах которой функция [(х) имела бы определенный знак. Но это невозможно, так как по определению точной верхней грани найдется хотя бы одно значение х из полусегмента |—б<ж§ такое, что /(х)<0, а для любого значения х из интервала ^<х<|+б справедливо неравенство [(х)>-0. Полученное противоречие доказывает, что /(|)=0. Теорема доказана. Иллюстрацией к теореме 4.12 может служить рис. 4.24. Теорема 4.13 (прохождение непрерывной функции через любое промежуточное значение).
§ 6. Локальные и глобальные свойства непрерывных функций 171 Рис. 4.24 Рис. 4.25 Пусть функция $(х) непрерывна на сегменте [а, Ь], причем /(а)=сс, /(&)=(5. Пусть, далее, у — любое число, заключенное между а и р. Тогда на сегменте [а, Ь] найдется точка | такая, что !Ц)=у. Доказательство. В доказательстве нуждается, очевидно, лишь случай аф$ (в противном случае у = а = р и можно взять |=а). По этой же причине отпадает случай, когда у совпадает с одним из чисел а или р. Не ограничивая общности, будем считать, что а<р, а<у<р. Рассмотрим функцию ц>(х)=1(х)—у. Эта функция непрерывна на сегменте [а, Ь] (как разность непрерывных функций) и принимает на концах этого сегмента значения разных знаков: Ф(а) =/(а)—у = а—у<0, Ф(Ь) = /(&)-у=р-у>0. По теореме 4.12 внутри сегмента [а, Ь] найдется точка | такая, что ф(^) =/(|)—у = 0, т. е. /(^) = у. Теорема доказана. Используя только что доказанную теорему, мы убедимся в справедливости замечания 2, высказанного в п. 2 § 2. Пусть функция }(х) непрерывна на сегменте [а, Ь] и существует функция, обратная для 1(х), рассматриваемой на этом сегменте. Тогда ((х) строго монотонна на указанной сегменте [а, Ь]. Доказательство. Из существования обратной функции для {(х) следует, что }(а)^(Ь). Пусть /(а) </("&) [}(а)>?(Ь)]. Покажем, что }(х) строго монотонно возрастает [убывает] на сегменте [а, Ь]. Рассмотрим случай /(а)</(Ь). (Если /(а) >/(&), то рассуждения аналогичны.) Предварительно установим справедливость неравенства $(х)<1(Ъ) для всех х из (а, Ь). Действительно, пусть существует такое х\^(а, Ь), что !(х\)>/(&). (Равенство }{х\)=1(Ь) невозможно ввиду, существования обратной функции для функции /(«)•). Применяя теорему 4.13 для сегментов [а, х\] и [х\, Ь] и используя вытекающие из /(а) </(Ь) </(хг) неравенства Па)<ш±ш<ПХ1)г
172 Гл. 4. Непрерывность функции ,м>ша>/Й1 убедимся в существовании двух таких чисел ^е(а, х\) и &е=(*,, Ь), что ?<&) = ПЫ=Пхд + т . Итак, Ь^Ь, но /(|1)=/(Ы> что противоречит существованию обратной функции для функции }(х) на сегменте [а, Ь]. Установим теперь строго монотонное возрастание [(х) на сегменте [а, Ь]. Пусть существуют два числа х\<х2, принадлежащие полусегменту [а, Ъ), такие, что /(*1)>/(л:2). Покажем, что это предположение приводит нас к противоречию. Применяя теорему 4.13 для сегментов [х\, х2] и [х2, Ь] и используя вытекающие из Г(*1)>/(*2), !{х\)<\(Ь) неравенства №>™ + гм >!Ы, Пх1<№±Ш<пЬ), убедимся в существовании двух таких чисел |з^(*ь х2) и |4<= (х2, Ь), что / (|3) = / (&) = Пч)^Ы . Итак, ЬФЬ, но /(1з)=/(Ы> что также противоречит существованию обратной функции для функции 1(х) на сегменте [а, Ь]. Замечая, что условие 1{х\)=}(х2) для Х1<х2 также невозможно, мы приходим к выводу, что 1{х1)<1(х2) для любых х\<х2 из сегмента [а, Ь]. Замечание доказано. Теорема 4.14 (первая теорема Вейерштр а ее а). Если функция }(х) непрерывна на сегменте [а, Ь], то она ограничена на этом сегменте. Доказательство. Докажем, что функция /(*) ограничена на сегменте [а, Ь] сверху (ограниченность снизу доказывается аналогично). Доказательство проведем от противного, т. е. предположим, что 1(х) не является ограниченной сверху на сегменте [а, Ь]. Тогда для любого натурального п (п=1, 2,...) найдется хотя бы одна точка хп из [а, Ь] такая, что 1(хп)>п. (В противном случае /(я) была бы ограничена сверху на сегменте [а, &].) Таким образом, мы указали последовательность значений {хп} из сегмента [а, Ь] такую, что соответствующая последовательность значений функции {/(хп)} является бесконечно большой. В силу теоремы Больцано—Вейерштрасса (см. следствие 3 из теоремы 3.16 п. 1 § 3 гл. 3) из последовательности {х„} можно выделить подпоследовательность {**„}, п=1,2,..., сходящуюся к некоторой точке 1. Так как все элементы подпоследовательности {Хкп} лежат на сегменте [а, Ь], то и точка | принадлежит сег-
§ 6- Локальные и глобальные свойства непрерывных функций 173 менту [а, Ь] (в силу следствия 2 из теоремы 3.13). В силу непрерывности функции }(х) в точке | соответствующая подпоследовательность значений функции {/ (Хк)} обязана сходиться к /(|). Но это противоречит тому, что подпоследовательность {/ (**„)}» будучи выделена из бесконечно большой последовательности {Цхп)}, сама является 0есконечно большой. Полученное противоречие доказывает теорему. Замечание 1. Для интервала (или полусегмента) утверждение, высказанное в теореме 4.14, уже несправедливо, т. е. из непрерывности функции на интервале (или полусегменте) не вытекает ее ограниченность на этом множестве. Рассмотрим, например, функцию !(х) = — на интервале (0,1) (или на полуде сегменте (0,1]). Эта функция непрерывна на указанном множестве, но неограниченна на нем. В самом деле, последовательность хп=— (л = 2,3,...) принадлежит указанному множеству, а последовательность значений функции {!(хп)}={п} является бесконечно большой. Рассмотрим функцию 1(х), ограниченную на данном множестве [х] сверху (снизу). Определение. Число М (число т) называется точной верхней (точной нижней) гранью функции }(х) на множестве {х}, если выполнены два требования: 1) для каждого значения х из множества {х} справедливо неравенство 1(х)<сМ (}(х)>-т); 2) для любого числа е>0 существует такое значение х из множества {х}, что для соответствующего значения функции }(х) справедливо неравенство }(х)>М—г (}(х)<пг+г). Заметим, что в данном определении условие 1) означает, что число М (число т) является одной из верхних (нижних) граней функции 1(х) на множестве {х}, а условие 2) означает, что эта грань является наименьшей (наибольшей) и уменьшена (увеличена) быть не может. Точная верхняя грань М функции }(х) на множестве {х} обычно обозначается символом М = зир {/ (х)}'= вир / (х). {') ^ (*} Аналогично точная нижняя грань т функции /(х) на множестве {х} обозначается символом. т = Ш {/ (л:)} = 1пГ / (х). {*} {*) В частности, точная верхняя грань функции /(л;) на сегменте \а, Ь] может обозначаться любым из следующих четырех символов:
174 Гл. 4. Непрерывность функции $ир /(*) = зир {/(*)} = зир /(%)= вир {/(*)}. а^,*<Ь а<*<й *е[я.Ь] *€[а.Ь] Аналогичные четыре символа для точной нижней г,рани имеют вид а<*<Ь а^х^Ь хе[а,Ь] х&[а,Ь] Справедливы следующие утверждения: 1) если функция }(х) ограничена на множестве {х} сверху [снизу], то у нее существует на этом множестве точная верхняя грань [точная нижняя грань]; 2) если функция }(х) ограничена на множестве {х} (с обеих 'сторон), то у нее существуют на этом множестве как точная верхняя, так и точная нижняя грани. Эти утверждения являются прямым следствием теоремы 2.1 гл. 2, ибо ограниченность функции /(х) на множестве {х} сверху [снизу] означает, что множество всех значений этой функций ограничено сверху [снизу]. Возникает вопрос о том, является ли точная верхняя [точная нижняя] грань ограниченной на множестве {х} функции /(*) достижимой, т. е. существует ли среди точек множества {*} такая точка х0, значение функции в которой Цхо) равно точной верхней [соответственно точной нижней] грани /(*) на множестве {х}. Следующий пример показывает, что точные грани ограниченной на данном множестве функции, вообще говоря, не являются достижимыми. Рассмотрим на сегменте [0,1] функцию /(х) следующего вида (рис. 4.25): /(х) = / *2 прИ °<х< 1* \ 1/2 при х = 0 и х— 1. Эта функция ограничена на сегменте [0, 1] и имеет на нем точную верхнюю грань М=\ и точную нижнюю грань т=0. Однако эти грани недостижимы: среди точек сегмента [0, 1] «е существует точек, значения функции в которых были бы равны нулю или единице. Заметим, что рассматриваемая функция {(х) не является непрерывной на сегменте [0, 1] (она имеет разрывы в точках х=0 и х=1). Оказывается, это обстоятельство не является случайным, ибо справедливо следующее утверждение. Теорема 4.15 (вторая теорема Вейерштр а ее а). Если функция 1(х) непрерывна на сегменте [а, Ь], то она достигает на этом сегменте своих точных верхней и нижней граней, т. е. среди точек сегмента \а, Ъ] найдутся такие точки Х\ и х^ что значение \{х\) равно точной верхней грани }(х) на сегменте
§ 6. Локальные и глобальные свойства непрерывных функций 175 [а, Ь], а Значение }(х2) равно точной нижней грани }(х) на сегменте [а, Щ. Доказательство. В силу первой теоремы Вейерштрасса 4.14 функция 1(х) ограничена на сегменте [а, Ь], а поэтому у нее существует на этом сегменте точная верхняя грань М и точная нижняя грань т. Остановимся на доказательстве достижимости точной верхней грани М, ибо достижимость точной нижней грани т доказывается аналогично. Предположим, что точная верхняя грань М не является достижимой, т. е. предположим, что во всех точках сегмента [а, Ь] функция 1{х) принимает значения, строго меньшие М. Тогда мы можем рассмотреть функцию Р(х) = . М-Цх) Знаменатель М—[(х) представляет собой функцию, непрерывную и строго положительную на сегменте [а, Ь]. Поэтому по теореме 4.1 (для случая частногр) функция Р(х) будет являться непрерывной на сегменте [а, Ь]. Значит, по первой теореме Вейерштрасса 4.14 функция Р(х) ограничена на сегменте {а, Ь], т. е. найдется положительное число А такое, что Р (х) = <■ -<Л для всех х из сегмента [а, Ь]. Так как функция М—/(*) строго положительна на [а, Ь], то последнее неравенство эквивалентно неравенству /(*)-< М- для всех х из сегмента [а, Ь], а это противоречит тому, что число М является точной верхней гранью, т. е. наименьшей из всех верхних граней функции /(*) на сегменте [а, Ь]. Полученное противоречие доказывает, что наше предположение о недостижимости точной верхней грани является неверным. Теорема доказана. Замечание 2. После того как доказана достижимость непрерывной на сегменте [а, Ь] функцией своих точных верхней и нижней граней, мы можем назвать точную верхнюю грань М максимальным значением, а точную нижнюю грань т минимальным значением функции /(х) на сегменте [а, Ь]. Теорему 4.15 можно переформулировать в виде: непрерывная на сегменте [а, Ь] функция \(х) имеет на этом сегменте максимальное и минимальное значения. Максимальное значение функции ((х) на сегменте [а, Ь] обозначается одним из следующих символов: тах /(*)= тах {/(х)}= тах /(*)= тах {?(х)}. а<*<4 а<х«;& х€[а.Ь] *6[а,&]
176 Гл. 4. Непрерывность функции Аналогичные символы для минимального значения }(х) на сегменте [а, Ь] имеют вид ГШП /(Х)= ГШП {/(%)}= ГШП / (х) = ПИП {/ (х)}. а<х<Ь а^х<Ь хе[а,Ь] *6[а,Ь] Замечание 3. Заметим, что и функции, не являющиеся непрерывными на данном сегменте, могут достигать на этом сегменте своих точной верхней и точной нижней граней. Примером может служить функция Дирихле 0(х), равная нулю для всех иррациональных х и равная единице для всех рациональных х. Эта функция разрывна в каждой точке сегмента [0, 1], но, очевидно, достигает на этом сегменте своей точной верхней грани, равной единице, и своей точной нижней грани, равной нулю. Замечание 4. Утверждение теоремы 4.15 окажется неверным, если в ее формулировке термин «сегмент» заменить термином «интервал» или «полусегмент». Так, функция }(х)=х является непрерывной на интервале (О, 1) или на полусегменте [0, 1), однако точная верхняя грань этой функции на указанном интервале или полусегменте М=1 хотя и существует, но не достигается. К этому следует добавить, что у функции, являющейся непрерывной на интервале или полусегменте, точные грани могут даже не существовать, ибо такая функция может не являться ограниченной на указанном интервале или полусегменте (см. замечание 1). 3. Понятие равномерной непрерывности функции. Предположим, что функция у=$(х) задана на таком множестве {х}, каждая точка которого является предельной точкой этого множества. Примером такого множества могут служить сегмент, интервал, полусегмент, полупрямая, бесконечная прямая, множество всех рациональных точек, принадлежащих любому из перечисленных множеств. Определение. Функция у=!(х) называется равномерно непрерывной на множестве {х}, если для любого положительного числа е найдется отвечающее ему положительное число б такое, что для любых двух точек х' и х" множества {х}, удовлетворяющих условию \х'—;е"|<6, справедливо неравенство \!(х')-!(х")\<*. (4.29) Замечание 1. Сразу же подчеркнем, что если функция 1{х) равномерно непрерывна на множестве {я}, то она непрерывна в каждой точке х множества {х}. В самом деле, взяв в сформулированном определении в качестве х" данную фиксированную точку х0 множества {х}, а в качестве х' — любую точку этого множества, мы придем к определению непрерывности функции \{х) в точке х0 по Коши. Замечание 2. Основным в сформулированном определении равномерной непрерывности является требовайие, гаранти-
§ 6. Локальные и глобальные свойства непрерывных функций 177" рующее существование по любому е>0 такого универсального 5>0, которое обеспечивает справедливость неравенства (4.29) сразу для всех точек х' и х" множества {х}, удовлетворяющих условию \х'~х"\<Ь. Если потребовать непрерывности функции }(х) в каждой точке хо множества {х}, то для любого е>0 и любой точки х0 множества {х} можно гарантировать существование «своего» положительного числа б = б(е, Хо), зависящего не только от е, да и от х0 и обеспечивающего справедливость неравенства- \1(х)—((хо)\< <е для всех х из множества {л:}, удовлетворяющих условию \х—х0\<8(г, х0). При этом, вообще говоря, может не существовать положительной точной нижней грани указанных б(е, *0) по всем точкам хо множества {х}, т. е. равномерная непрерывность функции на множестве {х} не вытекает, вообще говоря, из непрерывности этой функции в каждой точке хо множества {л:}. Замечание 3. Из данного нами определения равномерной непрерывности непосредственно вытекает, что если функция /(х) равномерно непрерывна на множестве {х}, то эта функция равномерно непрерывна и на любом подмножестве множества {х}. Рассмотрим примеры функций, как обладающих, так и не обладающих на данном множестве {х} свойством равномерной непрерывности. 1. Убедимся в том, что функция /(*) =— равномерно не- X прерывна на полупрямой х>1. В самом деле, для любых двух точек х' и х" из указанной полупрямой справедливо неравенство х" — х' X' ■ X" \х" — х'\ х' ■ х" Поэтому, взяв для любого е>0 положительное число б равным е, мы получим, что для любых двух точек х' и х" полупрямой [1, +°о), удовлетворяющих условию \х"—х'|<8, справедливо неравенство Ц(х')—/(х")|<б=е. 2. Функция /(х) = зт— не является равномерно непрерывной на интервале (0, 1)*. Чтобы убедиться в этом, достаточно доказать, что для некоторого е>0 и для любого как угодно малого 6>0 найдется хотя бы одна пара точек х' и- х" интервала (0, 1) таких, что \х'—х"\<Ь, но \1{х')— /(*")|>е. * Хотя эта функция и является непрерывной в каждой точке интервала- (0,1).
178 Гл. 4. Непрерывность функции Рассмотрим две последовательности точек, принадлежащих интервалу (0, 1), {х'п} и {х"п} с элементами 1 1 . 0 *„ = и х = , /г=1, 2 — + 2яя 2 ^ Обе эти последовательности, а значит, и их разность являются бесконечно малыми. Поэтому для любого как угодно малого й>0 найдется номер п такой, что \х'п—х"п\ < б. Вместе с тем для любого номера п 1/«)-/Ю1 = 81П ЯП — 51П ( — + 2ЛП 2 ) 1. Поэтому для е= — >0 и для как угодно малого б>0 найдется пара точек х' и х" из интервала (0, 1) таких, что \хп'— —хп"\<Ь, в то время как \1{хп')—1(хп") |>е, это и означает, что рассматриваемая функция не является равномерно непрерывной на интервале (0, 1). Заметим, что если бы мы рассмотрели ту же самую функцию /(х) = 51п— не на интервале (0, 1), а на интервале (у, 1), где X у — любое число из интервала 0<у<1, то приведенные выше рассуждения уже не имели бы места. Этот факт не является случайным, ибо ниже мы покажем, что указанная функция является равномерно непрерывной на интервале (у, 1) при 0<,у<1. 3. Докажем, что функция {(х)=х2 не является равномерно непрерывной на полупрямой #>1. Заметим, что для любых двух точек х' и х" полупрямой д;>1 справедливо неравенство !/(*')-/(*") 1 = 1(*')2-(*Т1 = (4.30); = |х'+х"| • |х'—х"\>х'-\х'—х"|. Убедимся теперь в том, что не только для некоторого г>0, а даже для любого е>0 и для любого как угодно малого 6>0 найдется пара точек х' и х" из' полупрямой д;>1 таких, что \х'—х"\<Ь, но )!(х')—!(х")\^е. (Это и будет означать отсутствие свойства равномерной непрерывности у функции }(х)=х2 на рассматриваемой полупрямой.) Фиксировав произвольные е>0 и 6>0, возьмем в качестве х' /^ 28 произвольное число, превосходящее единицу и такое, что х>—-, б в и положим х" = х'-\ . Для таких х' и х" будет справедливо
§ 6. Локальные и глобальные свойства непрерывных функций 179 неравенство \х'—х"\ = — < б. С другой стороны, в силу (4.30) для этих же х' и х" будет справедливо неравенство 1/(*')-/Ю1^-~ = е. Заметим, что если бы мы рассмотрели ту же самую функцию 1(х)=х2 не на полупрямой х>-1, а на любом сегменте [1, Ь], где Ь — любое число, то проведенные нами рассуждения уже не имели бы места. Этот факт становится понятным в силу следующей фундаментальной теоремы. Основная теорема 4.16. Если функция 1(х) непрерывна на сегменте [а, Ь], то она и равномерно непрерывна на этом сегменте. Доказательство. Предположим, что функция /(х) непрерывна на сегменте [а, Ь], но не является равномерно непрерывной на этом сегменте. Тогда для некоторого е>0 и для любого как угодно малого- б>0 найдутся две точки х' и х" сегмента [а, Ь] такие, что \х'-х"\<8, но |/(л/)-/(*")!> е. Выберем бесконечно малую последовательность положительных чисел б„=— (л=1,2,...). Можно утверждать, что для ука- п занного е>0 и для любого номера п найдутся две точки хп' и хп" сегмента [а, Ь] такие, что К-<1<7- Н0 1/«)-/Ю1>8- (4-31) Так как последовательность {х„'} состоит из точек сегмента [а,. Ь], то она ограничена и по теореме Больцано—Вейерштрасса (см. следствие 3 из теоремы 3.16 гл. 3) из нее можно выделить сходящуюся подпоследовательность {х'ъ}, п—\, 2,.... Предел | указанной подпоследовательности (в силу следствия 2 из теоремы 3.13 гл. 3) будет также принадлежать сегменту [а, Ь]. В силу левого неравенства (4.31) соответствующая подпоследовательность {х"к } будет сходиться к той же самой точке |. Поскольку функция {(х) непрерывна в каждой точке сегмента [а, Ь], она непрерывна и в точке |*. Но тогда, в силу определения непрерывности по Гейне, обе подпоследовательности соответствующих значений функции Ц{х'к )} и {Цх'к )} обязаны сходиться к /(|), т. е. разность указанных подпоследовательностей * В случае, если | совпадает с одним из концов сегмента [а, 6], под непрерывностью следует понимать одностороннюю непрерывность.
380 Гл. 4. Непрерывность функции {/(■*> )—Их1)} обязана быть бесконечно малой. Это противоречит правому неравенству (4.31), справедливому для всех номеров п и потому для всех номеров кп. Полученное противоречие доказывает, что наше предположение о том, что непрерывная на сегменте [а, Ь] функция не является равномерно непрерывной на этом сегменте, является неверным. Теорема доказана. Возвратимся теперь к рассмотренному выше примеру 2 и покажем, что функция / (х) = зш — является равномерно непре- х рывной на интервале (у, 1) при любом у из интервала 0<у<1. В самом деле, при любом таком у функция /(л:) = 5т— непрерывна на сегменте [■у, 1]. Значит, по теореме 4.16 функция /(*) = = 81п равномерно непрерывн • на сегменте [у, 1]. В силу заме- X чания 3 к определению равномерной непрерывности функция /(х) = 51п—. тем более является равномерно непрерывной на X интервале (у, 1), представляющем собой подмножество сегмента [V. !]• Теорему 4.16 удобно переформулировать в терминах колебания функции на данном сегменте. Пусть функция 1(х) ограничена на данном сегменте [с, й]. Назовем колебанием функции }(х) на сегменте [с, ё] разность ю = М—гп между точной верхней и точной нижней гранями функции }(х) на этом сегменте. Для непрерывной на сегменте [с, 3] функции $(х) колебание равно разности между максимальным и минимальным значениями этой функции на указанном сегменте. Из теоремы 4.16 непосредственно вытекает следующее утверждение. Следствие из теоремы 4.16. Если функция 1(х) непрерывна на сегменте [а, Ь], то для любого положительного числа г найдется отвечающее ему положительное число б такое, что колебание функции }(х) на любом содержащемся в сегменте [а, Ь] сегменте длины, меньшей 8, будет меньше числа е. Замечание 4. Анализируя доказательства теорем 4.14 и ■4.15 Вейерштрасса и теоремы 4.16, нетрудно заметить, что в этих трех теоремах вместо сегмента [а, Ь] можно взять произвольное множество {л:}, для которого выполнены два требования: 1) это множество {х} является ограниченным; 2) это множество {х} содержит любую свою предельную точку (такое множество договоримся называть з а м к н у т ы м). Множество {л;}, удовлетворяющее указанным двум требованиям, договоримся называть компактным множеством
§ 6. Локальные и глобальные свойства непрерывных функций 181 или компактом. Таким образом, указанные три теоремы (т. е. две теоремы Вейерштрасса и теорема 4.16) справедливы не только для функции, непрерывной на сегменте, но и для функции, непрерывной на любом компакте. В § 7 настоящей главы будут сформулированы более точные определения замкнутого и компактного множеств. Впрочем, для случая числовых множеств эти более точные определения оказываются эквивалентными приведенным нами выше определениям^ 4. Понятие модуля непрерывности функции. Предположим, что функция }(х) определена и непрерывна на некотором множестве {х}, каждая точка которого является предельной точкой этого множества. Определение. Для каждого б>0 назовем модулем непрерывности функции ](х) на множестве {х} точную верхнюю грань модуля разности \1(х')—!(х") | по всем точкам х', и х", принадлежащим множеству {х} и удовлетворяющим неравенству | х'—х" | < б. Для обозначения указанной точной верхней грани обычно употребляют следующий символ: зир{|/(х') —/(х") | : \х'—х"| <: б; х!', х"<={х}}. ! Сам же модуль непрерывности функции }{х) на множестве {х} принято обозначать символом со(/, б). Таким образом, по определению со (/, б) = зир{ | / (х') —/ (х") | : | х'—х" | <в; *', х"^{х}}. (4.32) Замечание. При определении' модуля непрерывности , со(/, б) в правой части (4.32) вместо \?(х')—}(х") | можно 1 было бы писать разность [/(л;')—}(х")] без знака модуля. Это , вытекает из того, что точки х' и х" можно поменять местами (при этом разность \\(х')—Цх")] изменит знак на противопо- , ложный, в то время как величина \х'—х"\ не изменится). Отметим два свойства модуля непрерывности со(/, б). 5 Г. Модуль непрерывности со(/, б) всегда неотрицателен: со(/,б)>0. Это свойство непосредственно вытекает из определения модуля непрерывности (4.32). 2°. Модуль непрерывности со(/, 6) представляет собой неубывающую функцию б всюду на полупрямой б>0. В самом деле, при уменьшении б множество, по которому ! берется супремум (4.32), сужается, а супремум на части множества не превосходит супремума на всем множестве. Вычислим модули непрерывности некоторых функций. ' 1. Вычислим модуль непрерывности функции [(х)=х2 на сегменте [0, 1]. ^ Пусть х' и х" — любые две точки сегмента [0, 1] такие, что | х" = х'—б, где 0<б<1. Тогда, очевидно,
182 Гл. 4. Непрерывность функции [/(*')— /(*")] = [(х')2— (х")2] =<[(х')2—(х'—6)2]<28—&. Из последнего неравенства, учитывая замечание к определению» модуля непрерывности, мы получим, что ш(/, б)=зир {[/(*')-/(*")]: \х'-х"\<Ь\ х\ х"ев[0,1]}«2б-62. С другой стороны, взяв х'=\, х"=\—б, так что \х'—#"|=б, мы получим, что [/(*')-/(*")] = 1-(1-б)2=2б-62. Значит, и(/, б)=й(х2, б) =26—б2 (если б<1). 2. Вычислим далее модуль непрерывности функции / (я) = = 51П— на интервале (0, 1). х Так как 1 I/(*')-/(*")! = 51П 51П < 51П + х' х■ \ х' 31П- х" <2, то со(/, 6)<2. С другой стороны, взяв две бесконечно малые последовательности {хп'} и {*„"} точек интервала (0, 1) вида х'п = . х"п = . где я = 1, 2, ..., мы для любо- — + 2ял — —+2ял го б>0 сможем указать номер «такой, что 0<хп'<Ъ и 0<асл/'< <б, так что \хп—хп"|<б, причем хп хп Отсюда следует, что ю(/, б) = « |зт—, б ) = 2. 3. Вычислим, наконец, модуль непрерывности функции /(*) =— на интервале (0, 1). Убедимся в том, что этот х модуль непрерывности равен +<х>. Фиксировав произвольное б>0, рассмотрим только такие точки х' и х", которые удовлетворяют соотношениям 0<*'<б, х" = 8, так что \х'—л"|<б. Очевидно, что* ®Ц-, б)>8ир{-^- ^-:0<д;'<б1 = +оо. В заключение докажем теорему, устанавливающую связь между свойством равномерной непрерывности функции {(х) на * Мы учитываем, что при сужении множества значений х!\ и х", по которым берется супремум, этот супремум может только уменьшаться.
§ 6. Локальные и глобальные свойства непрерывных функций 183 множестве {х) и величиной модуля непрерывности этой функции на указанном множестве. Теорема 4.17. Для того чтобы функция {(х) являлась равномерно непрерывной на множестве {х}, необходимо и достаточно, чтобы модуль непрерывности со(/, б) этой функции на указанном множестве удовлетворял соотношению Ига со(/, 6) = 0. (4.33) 6-»-0+0 Доказательство. 1) Необходимость. Пусть функция }(х) равномерно непрерывна на множестве {х}. Требуется доказать, что справедливо соотношение (4.33), т. е. требуется доказать, что для любого е>0 найдется отвечающее ему бе>0 такое, что для всех б, удовлетворяющих условию 0<б<бе, справедливо неравенство со (/, б) <е*. По определению равномерной непрерывности для любого е>0 найдется отвечающее ему б6>0 такое, что для всех х' и х" из множества {л:}, удовлетворяющих условию \х'—х"\<8е, справедливо неравенство \\{х')—/(^")| <—. Но это и означает, что для любого б из интервала 0<б<б„ справедливо неравенство ©(/, б) = вир{|/(*')-I(х")\:\х'-х"\< б; х',яГе= {х}}< -|- < е. 2-) Достаточность. Пусть выполнено соотношение (4.33), т.е. для любого е>0 существует отвечающее ему бе>0 такое, что для всех б, удовлетворяющих условию 0<б<б8, справедливо неравенство со(/, б)<е. Из определения модуля непрерывности следует, что для всех х' и х" из множества {х}, удовлетворяющих условию \х/—х"|<:б<бе, справедливо неравенство Ц(х')—/(д;")|<б, а это и означает, что функция /(х) равномерно непрерывна на множестве {х}. Теорема доказана. Выше мы вычислили модули непрерывностей трех функций: функции х2 на сегменте [0, 1] и функций $ш— и — на интервале (0, 1). Так как со (х2, б) = 26—б2, со^вт —, б) =2, со (—, б] = +оо, то из теоремы 4.17 сразу же вытекает, что функция х2 В равномерно непрерывна на сегменте ГО, 1], а функции зш — X и —-не являются равномерно непрерывными на интервале (О,*). • Мы учитываем при этом, что со(/, б)>0.
184 Гл. 4. Непрерывность функции § 7. ПОНЯТИЕ КОМПАКТНОСТИ МНОЖЕСТВА 1. Открытые и замкнутые множества. Рассмотрим произвольное множество вещественных чисел {х}. Определение 1. Точка х множества {х} называется внутренней точкой этого множества, если существует положительное число б такое, что ^-окрестность точки х также принадлежит множеству {х}. Определение 2. Множество {х} называется от кр ы- т ы м, если любая точка этого множества является внутренней, его точкой. Примерами открытых множеств могут служить интервал,, открытая полупрямая, бесконечная прямая, объединение нескольких непересекающихся интервалов. Определение 3. Множество {х} называется замкнутым, если дополнение этого множества (т. е. разность (—<х>>, + оо)\{л;}) является открытым множеством. В замечании 4 в конце п. 3 § 6 было дано другое определение замкнутого множества. Напомним его формулировку. Определение 3*. Множество {х} называется з амкну- т ы м, если это множество содержит все свои предельные- точки. Убедимся в том, что для случая произвольных числовых множеств определения 3 и 3* эквивалентны. _ 1) Пусть сначала множество {х} является дополнением открытого множества. Докажем, что в таком случае любая предельная точка х этого множества {л;} обязательно ему принад* лежит. В самом деле, предположив, что предельная точка х не принадлежит множеству {х}, мы бы получили, что х принадлежит дополнению множества {х}, которое является открытым множеством. Но тогда х принадлежала бы этому открытому множеству вместе с некоторой своей б-окрестностью, т. е. некоторая 6-окрестность точки х не содержала бы точек множества {х}, а это противоречило бы тому, что х является предельной точкой множества {*}. 2) Пусть любая предельная точка множества {х} принадлежит этому множеству. Докажем, что множество {х} является дополнением открытого множества. Пусть х — любая точка дополнения множества {л:}. Требуется доказать, что это дополнение содержит и некоторую 6-окрестность точки х. Если бы это было не так, то любая 6-окрестность точки х содержала бы точки множества {х}, т. е. точка х являлась бы предельной точкой множества {х} и по условию ему принадлежала, а это противоречило бы тому, что х — точка дополнения множества {х}. 2. О покрытиях множества системой открыты* множеств.
§ 7. Понятие компактности множества 185 Определение1. Будем говорить, что система {2а} открытых множеств Ба образует покрытие множества {х}, если любая точка х множества {х} принадлежит хотя бы одному из множеств системы {2а}- Докажем две замечательные леммы о покрытиях множества системой открытых множеств. Лемма Гейне—Бореля для сегмента. Из любой системы {2а} открытых множеств 2а, образующей покрытие сегмента [а, Ь], можно выделить конечную подсистему, также образующую покрытие этого сегмента. Доказательство. Пусть бесконечная система {2а} открытых множеств 2„ образует покрытие сегмента [а, Ь]*. Допустим, что сегмент /= [а, Ь] нельзя покрыть конечным набором открытых множеств из системы {2а}. Тогда, разделив этот сегмент / пополам, мы получим, что хотя бы одну из половин сегмента / нельзя покрыть конечным набором открытых множеств из системы {2а}. Обозначим эту половину, через 1\. Поделив /[ пополам, мы получим, что хотя бы одну из половин /1 (обозначим ее через 1ч) нельзя покрыть конечным набором множеств из системы {2а}. Продолжая далее эти рассуждения, мы получим систему вложенных сегментов {/«}, каждый из которых нельзя покрыть конечным набором множеств из системы {2„}. Длина и-го сегмента 1п составляет 1/2" часть длины основного сегмента 1=[а, Ь] и стремится к нулю при п-+оо. В силу следствия из теоремы 3.15 (см. п. 2 § 2 гл. 3) существует единственная точка с, принадлежащая всем сегментам {/„}• Так как эта точка с принадлежит основному сегменту /=,[а, Ь], то в системе {2а} найдется открытое множество 2а, которому принадлежит точка с. В силу того, что множество 2а является открытым, найдется 6>0 такое, что б-окрестность точки с, т. е. интервал (с—б, с+ 6) также принадлежит множеству 2а. В силу того, что все сегменты /„ содержат точку с и длины этих интервалов стремятся к нулю при га-э-оо, можно утверждать, что найдется номер п0 такой, что при я>по все сегменты /„ содержатся в интервале (с—6, с+ 6). Но это означает, что все сегменты /п при п>/го могут быть покрыты одним множеством 2а системы {2«}. Тем самым мы получили противоречие с утверждением о том, что ни один сегмент 1п нельзя покрыть конечным набором множеств из системы {2а}. Полученное противоречие завершает доказательство леммы. Докажем теперь более общее утверждение. * Если бы система {2а}, образующая покрытие сегмента [а, Ь], не являлась бесконечной, то лемма была бы доказана.
186 Гл. 4. Непрерывность функции Лемма Гейн е—Б орелядля замкнутого ограниченного множества. Из любой систему {2а} открытых множеств 2«, образующей покрытие замкнутого ограниченного множества {х}, можно выделить конечную подсистему, также образующую покрытие множества {х}. Доказательство. Пусть {х} ■— замкнутое ограниченное множество, {2а} — система открытых множеств, образующая покрытие множества {х}. Так как множество {х} ограничено, то найдется сегмент [а, Ь], содержащий это множество. Обозначим через Ер открытое множество, являющееся дополнением к замкнутому множеству {х} и заметим, что объединение системы {2а} с открытым множеством 2г образует покрытие сегмента [а, Ь]. В силу леммы Гейне—Бореля для сегмента из этого покрытия можно выделить конечную подсистему, также образующую покрытие сегмента [а, Ь]. Если множество 2Р входит в эту конечную подсистему, то, удалив его из нее, мы получим конечную подсистему системы {2а}, образующую покрытие множества {х}*. Если же множество 2Р не входит в конечную подсистему, образующую покрытие сегмента [а, Ь], то эта конечная подсистема состоит исключительно из множеств 2а системы {2„} и образует покрытие множества {х}, содержащегося в сегменте [а, Ь]. Лемма доказана. 3. Понятие компактности множества. Пусть {х} — произвольное множество вещественных чисел. Определение 1. Множество {х} называется компакт* ным множеством (или компактом), если из любой системы {2„} открытых множеств, образующей покрытие множества {х} можно выделить конечную подсистему, также образующую покрытие множества {х}. В замечании 4 в конце п. 3 § 6 было дано другое определение компактного множества. Напомним его формулировку. Определение 1*. Множество {х} называется компактным, если оно является замкнутым и ограниченным **. Докажем, что для произвольных числовых множеств определения 1 и 1 * эквивалентны. 1) Пусть сначала множество {х} является замкнутым и ограниченным. Тогда тот факт, что из любой системы открытых множеств {2„}, образующей покрытие {х}, можно выделить конечную подсистему, также образующую покрытие {х}, сразу вытекает из леммы Гейне—Бореля (см. п. 2). * Мы учитываем, что множество 2В) являясь дополнением к множеству \х), не содержит ни одной точки множества {х}. ** Относительно термина «компактность» см. п. 2 § 3 гл. 12. -
§ 7. Понятие компактности множества 187 2) Пусть множество {х} таково, что из любой системы открытых множеств {20}, образующей покрытие {я}, можно выделить конечную подсистему, также образующую покрытие {х}. Докажем, что множество {х} является замкнутым и ограниченным. Сначала докажем замкнутость множества {*}. Достаточно доказать, что дополнение Б множества {х} является открытым множеством. Фиксируем произвольную точку у дополнения /). Требуется доказать, что существует некоторая б-окрестность точки у, также принадлежащая дополнению /). Пусть х — любая точка множества {х}. Так как хфу, то число б (х) = является положительным, причем 6(х) — окрестности точек х и у 1:Х=(х—8(х), х+6(х)), Чх=(у—8(х), у+8(х)) не пересекаются. Поскольку система открытых множеств {2*}, отвечающих всевозможным точкам х множества {х} образует покрытие множества {х}, то из этой системы можно выделить конечную подсистему 2,,, 2*,,.... ,2* , также образующую покрытие множества {л;}. Обозначим через \Р"*,, Ч*-*,, ... ,^х соответствующую конечную подсистему б-окрестностей точки у. Наименьшая из этих б-окрестностей будет содержаться во всех множествах Ч^,, Чгх2. ■• •.Чг* и потому не будет иметь общих точек ни с одним из множеств 2*,, 2*а,... ,2*п. Но тогда, поскольку подсистема 2Х,, 2*2 2*л образует покрытие множества {*}, указанная наименьшая б-окрестность точки у не будет содержать точек множества {х}, т. е. будет целиком принадлежать дополнению Б множества {х}. Тем самым доказано, что множество Б является открытым и потому множество {х} является замкнутым. Докажем теперь, что множество {х} является ограниченным. Если бы это было не так, то нашлась бы последовательность {хп} не совпадающих друг с другом точек множества {л;}, удовлетворяющая условию \хп\>п (л=1, 2,...). Так как эта последовательность не имеет Конечных предельных точек, то каждая точка хп имеет 6-окрестность 2Х/1 , свободную от других точек последовательности {хп}. Очевидно, что из бесконечной системы открытых множеств {2* }, образующих покрытие множества точек {хп}, нельзя
188 Гл. 4. Непрерывность функции выбрать конечной подсистемы, образующей покрытие всех точек {Хп}- Так как множество {х„} является подмножеством {х}, то тем более нельзя из всякой системы открытых множеств, образующих покрытие {х}, выделить конечную подсистему, также образующую покрытие {х}. Но это противоречит нашему предположению о множестве \х). Полученное противоречие доказывает ограниченность множества {х}. Заметим в заключение, что все введенные в этом параграфе понятия в более общей ситуации изучаются в дополнении 2 к гл. 12.
Глава 5 ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В настоящей главе будут введены фундаментальные понятия производной и дифференциала функции. Мы установим основные правила дифференцирования и вычислим производные всех простейших элементарных функций, уже приведенные нами в гл. 1 » известные из школьного курса. В конце главы будут рассмотрены производные и дифференциалы высших порядков и вопрос о- дифференцировании функции, заданной параметрически. § 1. ПОНЯТИЕ ПРОИЗВОДНОЙ 1. Приращение функции. Разностная форма условия непрерывности. Рассмотрим функцию у = }(х), заданную на интервале (а, Ь)*. Пусть х — любая фиксированная точка интервала (а, Ь), а Ад; — произвольное число, настолько малое, что значение х+Ах- также находится на интервале (а, Ъ). Это число Ал; обычно называют приращением аргумента. Приращением функции у=\(х) в точке х, отвечающим приращению аргумента Ах, будем называть число Ау = Пх+Ьх)-Цх). (5.1) Так, для функции у = &тх приращение в точке х, отвечающее приращению аргумента Ал:, имеет вид / Дх \ Ах Ау = 51П (х + Ал;) — зт х = 2 соз л; Н зга . (5.2) Справедливо следующее утверждение: Для того чтобы функция у = 1(х) являлась непрерывной в точке х, необходимо и достаточно, чтобы приращение Ау этой функции в точке х, отвечающее приращению аргумента Ах, являлось бесконечно малым при Дх->-0. В самом деле, по определению функция у = 1(х) непрерывна в точке х, если существует предел Нт/(х+Дх) = /(*). (5.3) &Х-+0 В силу п. 4 § 4 гл. 3 существование предельного значения (5.3) * В качестве множества задания функции вместо интервала (а, Ь) можна взять любое плотное в себе множество {х} (см. гл. 2, § 5, п. 3).
190 Гл. 5. Дифференциальное исчисление эквивалентно тому, что функция [/(х+Дх)—/(х)] аргумента Ах является бесконечно малой при Дх->-0. Доказанное утверждение позволяет выразить условие непрерывности функции у = !(х) в точке х в следующей форме: функция у = 1(х) непрерывна в точке х, если приращение Ау- этой ^функции в точке х, отвечающее приращению аргумента Ах, является бесконечно малым при Ах-^-0, т. е. если 1ш1 Ду = Нт [/(х + Дх)—/(х)] = 0. (5.4) Дх-»0 Дх-*0 Условие (5.4) мы будем называть разностной формой условия непрерывности функции г/=/(х) в точке х. Это условие мы будем неоднократно использовать в дальнейшем. С помощью условия (5.4) еще раз убедимся в том, что функция г/ = зтх непрерывна в любой точке х бесконечной прямой. В самом деле, из формулы (5.2), из условия со5[хН —) < Ах -< 1 и из равенства Пт зт = 0 непосредственно вытекает^ что Пт Дг/ = 0. ' Д*-»0 2. Определение производной. Пусть, как и в п. 1, функция л/==/(х) определена на интервале (а, Ь), х — фиксированная точка этого интервала, Ах — любое приращение аргумента, настолько малое, что число х+Ах также принадлежит интервалу (а, Ъ). Считая, что АхФО, рассмотрим в данной фиксированной точке х отношение приращения Ау функции у = }(х) в этой точке к соответствующему приращению аргумента Ах: АУ = Д* + А*)—/(*) (5.5) Ах Ах Отношение (5.5) будем называть разностным отношением (в данной точке х). Так как х фиксировано, разностное отношение (5.5) представляет собой функцию аргумента Ах. Эта функция определена для всех значений аргумента Ах, принадлежащих некоторой достаточно малой б-окрестности точки Ах=0, за исключением самой точки Дх=0, т. е. определена всюду в достаточно малой проколотой б-окрестности точки Ах=0. Это дает нам право рассматривать вопрос о существовании предела указанной функции при Дх-»-0. Определение 1. Производной функции у=\{х) в данной фиксированной точке х называется предел при Дх->0 разностного отношения (5.5) (при условии, что этот предел существует) . Производную функции г/ = /(х) в данной фиксированной точке х будем обозначать символом /'(х) или у'(х) или кратким символом у'.
§ 1. Понятие производной 191 Итак, по определению и I \ 1 • Л У 1 ■ Нх + Ах) — / (х) /' (х) = Ьш —2- = 1ип -^—! -—ии—. дж-,о Дх дх-+о Ах Если функция имеет производную для всех точек х интервала (а, Ь), то эта производная будет представлять собой некоторую функцию аргумента х, определенную на интервале (а, Ь). Приведем два тривиальных примера вычисления производных* 1°. 1(х) =С = сопз1. Совершенно очевидно,, что производная /'(х) этой функции тождественно равна нулю, ибо приращение этой функции Ау=1(х+Ах)—}{х) равно нулю для всех х и всех: Ах. 2°. 1(х)=х. Для этой функции разностное отношение (5.5) равно Ду __ (х + Ах) — х Ал: _ . Дд: Да; Ах Отсюда следует, что и производная указанной функции равна единице в любой точке х бесконечной прямой. В полной аналогии с понятиями правого и левого пределов функции в данной точке вводятся понятия правой и левой производных функции у = 1(х) в данной фиксированной точке х. Определение 2. Правой [левой] производной функции У=!(х) в данной фиксированной точке х называется правый [левый] предел разностного отношения (5.5) в точке Лл: = 0 (при условии, что этот предел существует). Для обозначения правой [левой] производной функции в точке х используют символ /'{х+0) [}'(х—0)]. Из сопоставления определений 1 и 2 и из свойства правого к левого пределов функции, установленного в п. 2 § 4 гл. 3 *, вытекают следующие утверждения: 1) если функция 1(х) имеет в точке х производную }'(х), то- эта функция имеет в точке х как правую, так и левую производные, причем {'(х+0) =1'(х—0)= }'(х); 2) если функция /(х) имеет в точке х как правую, так и левую производные, причем эти производные равны друг другу, то функция }(х) имеет в точке х производную {'(х), причем /'(х)=/'(*+0)=/'(*-0). В дополнение к утверждению 2) следует отметить, что если у функции }(х) существуют правая и левая производные в точке х» но эти производные не равны друг другу, то у этой функции не * Если функция {(х) имеет в точке х и правый, и левый пределы, оба равные одному и тому же числу Ь, то функция }{х) имеет в этой точке предел, равный числу Ь.
192 Гл. 5. Дифференциальное исчисление существует производной в точке может служить функция /(х)=|х| = х*. Примером такой функции х при х> О, -х при х<С 0. Эта функция имеет в точке х = 0 правую производную, равную 1- Ах 1 1-„ (— Ах) 1 41т =1» и левую производную, равную ит — = — 1, д*-»о Ах д*->о Ах но не имеет в точке х=0 производной. 3. Геометрический смысл производной. Рассмотрим график функции у = }(х), определенной и непрерывной на интервале (а, Ь). Фиксируем произвольную точку х интервала (а, Ь) и рассмотрим приращение АхфО аргумента х, настолько малое, что число х+Ах также принадлежит интервалу (а, Ъ). Пусть М и Р — точки графика функции у = {(х), абсциссы которых соответственно равны х и х+Ах (рис. 5.1). Координаты точек М и Р, очевидно, будут иметь вид х+Ах ь Рис. 5.1 М(х, !(х)), Р(х+Ах, 1(х+Ах)). Прямую, проходящую через точки М и Р графика функции «/ = Дх), будем называть секущей. Поскольку точку М мы предполагаем фиксированной, то угол наклона каждой секущей МР к ■оси Ох будет функцией аргумента Ах (ибо значение Ах однозначно определяет точку Р графика функции г/ = /(х)). Обозначим указанный угол наклона секущей МР к оси Ох символом ф(Лх). Определение. Если существует предельное положение секущей МР при стремлении точки Р графика функции к точке М (или, что то же самое, при стремлении Ах к нулю), то это предельное положение называется касательной к графику функции у — 1{х) в данной фиксированной точке М этого графика, Из этого определения следует, что для существования касательной к графику функции у=}(х) в точке М достаточно, чтобы существовал предел Нт ср (Дх) = ф0, причем указанный предел Ддг->0 <ро равен углу наклона касательной к оси Ох. * Иначе мы получили бы противоречие с утверждением 1).
§ 2. Понятие дифференцируемости функции 193 Докажем следующее утверждение: Если функция у = }(х) имеет в данной фиксированной точке х производную, то существует касательная к графику функции у~1(х) в точке М(х, /(*)), причем угловой коэффициент этой касательной (т. е. тангенс угла наклона ее к оси Ох) равен производной /'(л;). Опустим из точек М и Р перпендикуляры на ось абсцисс (см. рис. 5.1). Проведем через точку М прямую, параллельную оси абсцисс, и обозначим через N точку пересечения этой прямой с перпендикуляром, опущенным из Р на ось абсцисс. Из треугольника ММР очевидно, что т.§ф(Ах)= —2-= ' . —>Л-!-. Ах Ах Таким образом, Ф(Дх) = агс1е-^. (5-6) Ах Убедимся в том, что существует предел правой (а значит, и левой)" части (5.6) при Ах->-0. В самом деле, в силу существования производной 1'(х) существует предел Пт —У- = ['(х). Отсюда и из дх-»о Ах непрерывности функции агс!§ и для всех значений и следует, что существует предел правой части (5.6), равный агс1д/'(*). Итак, мы доказали, что существует предел 1 )гп ф (Ах) = агс1§ /' (л:). д*-»о Но это и оаначает, что существует предельное положение секущей, т. е. существует касательная к графику функции в точке М(х, !(х)), причем угол наклона фо этой касательной к оси Ох равен ф0 = агс1|э;/'(х). Значит, угловой коэффициент указанной касательной 1§<ро равен Г{х). Сформулированное утверждение доказано. § 2. ПОНЯТИЕ ДИФФЕРЕНЦИРУЕМОСТИ ФУНКЦИИ 1. Определение дифференцируемости функции. Пусть, как и в предыдущем параграфе, функция у — !(х) определена на интервале (а, Ь), х — любое фиксированное число из этого интервала, Ах — произвольное приращение аргумента, настолько малое, что значение аргумента х+Ах также принадлежит интервалу (а, Ь), Ау={(х+Ах)—1(х) —приращение функции в точке х, отвечающее приращению аргумента Ах. Определение. Функция у — }(х) называется дифференцируемой в точке х, если приращение Ау этой функции в точке х, отве- 7 Зак. 72
194 Гл. 5, Дифференциальное исчисление чающее приращению аргумента Ах, может быть представлено в виде Ау=ААх + а(Ах)Ах, (5.7) где А — некоторое число, не зависящее от Ах, а а (Ах) — функция аргумента Ах, бесконечно малая в точке Дх = 0. В самой точке Дх=0 эта функция а (Ах), вообще говоря, не определена, и ей можно приписать в этой точке любое значение. Для дальнейшего удобно считать это значение а(0) равным нулю. При такой договоренности функция а (Ах) будет непрерывна в точке Дх=0 и равенство (5.7) можно распространить и на значение Дх=0. Замечание. Второе слагаемое в правой части (5.7) а (Ах) Ах можно переписать в виде о (Ах) *. В самом деле, так как обе функции а (Ах) и Ах являются бесконечно малыми в точке Ах=0, то произведение этих функций а(Ах)Лх представляет собой бесконечно малую в точке Ах = 0 функцию более высокого порядка, чем Дх (см. п. 5 § 4 гл. 3). Таким образом, представление (5.7) можно переписать в виде Ау = ААх + о(Ах). Докажем следующее утверждение. Теорема 5.1. Для того чтобы функция у={(х) была дифференцируемой в точке х, необходимо и достаточно, чтобы она имела в этой точке конечную производную \' (х). Доказательство. 1) Необходимость. Пусть функция у = =/(х) дифференцируема в точке х, т. е. ее приращение Ау в этой точке, отвечающее приращению аргумента Ах, представимо в виде (5.7). Считая Ах отличным от нуля и поделив (5.7) на Ах, получим -^- = Л + а(Дх). (5.8) Ах Правая (а поэтому и левая) часть (5.8) имеет равный А предел в точке Дх=0**. Остается заметить, что предел при Дх^О левойчас- ти (5.8) (в случае, если он существует) по определению равен производной 1'(х). Итак, мы доказали, что если для функции /(х) справедливо представление (5.7), то эта функция имеет в точке х производную /'(х), причем 1'(х)=А. 2) Достаточность. Пусть существует конечная производная /'(х), т. е. существует конечный предел Нт-^- = П*). (5-9) * Напомним, что символ о (Ах) обозначает бесконечно малую в точке А*=0 функцию более высокого порядка, чем Ах, ** Ибо Игл А = А, Нгп а = 0. Ддг-»0 ДЛ1~>0
§ 2. Понятие дифференцируемости функции 195 Обозначим символом а (Ах) разность —= /' (х), т. е. по- Ах ложим а(Дх) = -^-—/'(*)■ (5-1°) Ах Из существования предела (5.9) вытекает, что функция а (Ад:), определяемая соотношением (5.10), имеет предел при Дл;->-0, равный нулю. Умножая соотношение (5.10) на Ах, мы придем к представлению Ау = 1'(х)Ах+а {Ах) Ах, совпадающему с представлением (5.7) при А=}'(х). Тем самым доказано, что из существования конечной производной I'(х) вытекает дифференцируемость функции у = 1(х) в точке х, причем в условии дифференцируемости (5.7) число А совпадает с /'(л:). Теорема доказана. Доказанная теорема позволяет нам в дальнейшем отождествлять понятие дифференцируемости функции в данной точке с понятием существования у этой функции в данной точке конечной производной. Операцию нахождения производной в дальнейшем договоримся называть дифференцированием. 2. Дифференцируемость и непрерывность. Легко доказывается следующее утверждение. Теорема 5.2. Если функция у = {{х) дифференцируема в данной точке х, то она и непрерывна в этой точке. Доказательство. Так как функция /(х) дифференцируема в точке х, то для ее приращения Ау в этой точке справедливо представление (5.7), из которого следует, что Ига Ау — 0, а это Ах-»0 и означает непрерывность функции у=}(х) в данной точке (в силу разностной формы условия непрерывности (5.4), введенной в п. 1 § 1). Теорема доказана. Заметим, что утверждение, обратное к теореме 5.2, несправедливо, т. е. из непрерывности функции у=Цх) в данной точке х, вообще говоря, не вытекает дифференцируемость функции [(х) в этой точке. Примером может служить функция у=\х\, которая, очевидно, непрерывна в точке х=0, но (как мы уже видели в конце п. 2 § 1) не имеет в этой точке производной. Отметим, что существуют функции, непрерывные в каждой точке некоторого интервала, но не имеющие производной ни в одной точке этого интервала. (Первый пример такой функции был построен Вейерштрассом. Один из примеров такой функции строится в дополнении к гл. 10.) 7*
196 Гл. 5. Дифференциальное исчисление 3. Понятие дифференциала функции. Рассмотрим функцию у=!(х), дифференцируемую в данной точке х. Приращение Ау такой функции в точке х может быть представлено в виде (5.7). Заметим, что приращение (5.7) представляет собой сумму двух слагаемых, первое из которых ААх линейно относительно Ах, а второе а(Дх)Дл: является в точке Ах=0 бесконечно малой функцией более высокого порядка, чем Ах. Если число А, равное согласно теореме 5.1 производной 1'(х), отлично от нуля, то указанное первое слагаемое ААх=\: {х)Ах представляет собой главную часть приращения Ау дифференцируемой функции у=1(х). Эта главная часть приращения является линейной однородной функцией аргумента Ах* и называется дифференциалом функции у = 1(х). В случае, если Л=/'(л:)=0, дифференциал функции по определению считается равным нулю. Итак, дифференциалом функции У=}(х) в данной фиксированной точке х, отвечающим приращению аргумента Ах, называется число, обозначаемое символом йу и равное а"у=Т(х)Ах. (5.11) В случае ['(х)Ф0 это число представляет собой главную часть приращения Ау функции у=1(х), линейную и однородную относительно приращения аргумента Ах. Сразу же отметим, что дифференциал йу и приращение Ау функции у = }(х) в данной точке х, оба отвечающие одному и тому же приращению аргумента Ах, вообще говоря, не равны друг другу. Это легко уяснить из рассмотрения графика функции у = {(х) (рис. 5.2). Пусть М и Р — точки графика функции у = \(х), отвечающие значениям аргумента, соответственно равным х и х+Ах, М5 — касательная к графику в точке М, МЩ\Ох, МР\\Оу, <2 —точка пересечения касательной М8 с прямой РМ. Тогда приращение Ау функции у=[(х) в точке х, отвечающее приращению аргумента Ах, очевидно, равно величине отрезка МР, в то время как дифференциал йу этой функции в точке х, отвечающий тому же самому Ах, равен величине отрезка N(2. (Это сразу вытекает из формулы (5.11) и из того, что в прямоугольном У\ 0 м а Р/ А> 4—«—' АХ 7 <Г' 0^ N *-йх ^8 X Рис. 5.2 * Напомним, что линейной функцией аргумента I называется функция вида у=А{+В, где А и В — некоторые постоянные. В случае В=0 линейная функция называется однородной.
§ 3. Дифференцирование сложной и обратной функций 197 треугольнике ЛКЗМ величина отрезка МЫ равна Ах, а тангенс угла (ЗЛШ равен ['(х).) Ясно, что величины отрезков ЫР и N(2 являются, вообще говоря, различными. Весьма удобно ввести в рассмотрение понятие дифференциала аргумента х. При этом следует различать два случая: 1) случай, когда указанный аргумент х представляет собой независимую переменную; 2) случай, когда аргумент х сам является дифференцируемой функцией вида х=ц>({) некоторой новой пере* менной I, которую мы можем считать независимой. Договоримся.для случая, когда аргумент х является независимой переменной, отождествлять дифференциал этого аргумента с его приращением Ах*, т. е. считать, что а"х=Ах. В силу этой договоренности равенство (5.11) принимает вид йу = Г(х)йх. (5.12) Таким образом, для случая, когда аргумент х является независимой переменной, для дифференциала функции у=!(х) справедливо представление (5.12). Ниже в п. 3 § 3 мы докажем, что представление (5.12) носит универсальный характер и справедливо также и в случае, когда аргумент х не является независимой переменной, а является дифференцируемой функцией вида *=<р(/) некоторой независимой переменной I. (В этом случае в формуле (5.12) величину их нельзя считать равной Ах, ибо в силу сказанного выше она равна их— = Ф'(*)Л.) § 3. ДИФФЕРЕНЦИРОВАНИЕ СЛОЖНОЙ ФУНКЦИИ И ОБРАТНОЙ ФУНКЦИИ 1. Дифференцирование сложной функции. Установим правило, позволяющее найти производную сложной функции «/=Дф(01 в точке I при условии, что известны производные составляющих ее функций х=у(1) и у=Цх) в точках I и я=ф(/) соответственно. Теорема 5.3. Пусть функция х=<$У) дифференцируема в точке I, а функция у=Цх) дифференцируема в соответствующей точке ;е = ф(^). Тогда сложная функция */=/[ф(/)] дифференцируема в указанной точке I, причем для ее производной в этой точке справедлива формула Шф(0]}'=П*)-ф'(9=Г[ф(0]-<р'(0. (5.13) Доказательство. Придадим аргументу функции х=у(() в данной точке I произвольное отличное от нуля приращение А1. Этому приращению отвечает приращение Ах=у{1Л-А1)—ф(0 * Эта договоренность согласуется с рассмотрением независимой переменной х как функции вида у=[(х)=х, для которой 4у={'(х)&х—Ах, т. е. 4х=Ах.
198 Гл. 5. Дифференциальное исчисление функции х=ср(^), причем указанное приращение Ах может обращаться в нуль. Приращению Ах, в свою очередь, отвечает приращение Ау = — {(х+Ах)—1{х) функции у = 1(х) в соответствующей точке х=ф(0- Поскольку функция у = 1(х) по условию дифференцируема в указанной точке х=ф(^), то ее приращение Ау в этой точке может быть представлено в виде * Ау=1'{х)Ах+а(Ах)Ах, (5.14) где а (Ах) имеет при Лх-э-0 предел, равный нулю. Подчеркнем, что, как указано в п. 1 § 2, представление (5.14) остается справедливым и при Дд;=0. Поделив (5.14) на А^О, будем иметь ЛУ. = /'(*)-^-+ «(Ах) —. (5.15) Докажем, что правая (а значит, и левая) часть (5.15) имеет предел при А/-*-0, причем этот предел равен величине, стоящей в правой части (5.13). Этим будет доказана дифференцируемость сложной функции и формула (5.13) для ее производной. Из дифференцируемое™ функции х = ф(^) в точке I вытекает, что отношение ~~гг имеет предел при А^->0, равный ф (?). Остается доказать, что функция а (Ах) имеет предел при А^->-0, равный нулю, но это сразу вытекает из того, что а(Дх)-*-0 при Дх->-0 и что Ах-^-0 при А^О на основании разностной формы условия непрерывности дифференцируемой в точке I функции х=ц>(()**. Итак, вся правая часть (5.15) имеет предел при А^О, и этот предел равен величине, стоящей в правой части (5.13). Теорема доказана. Замечание 1. Теорема 5.3 и содержащееся в ее формулировке правило вычисления производной сложной функции последовательно переносится на сложную функцию, являющуюся суперпозицией трех и большего числа функций. Так, для сложной функции, являющейся суперпозицией трех функций у = Р[}(ц> (/))], правило дифференцирования имеет вид ™ф(0)]Г=П/(ф(0)]Пф(0)ф'(0. (5-16) причем формула (5.16) справедлива при условии, что функция х = ц>(1) дифференцируема в данной точке I, функция и = \{х) дифференцируема в соответствующей точке х=ц>(1), а функция у — = Р(и) дифференцируема в соответствующей точке и = }(х) — =Яф(0'1- * См. п. 1 § 2 определение дифференцируемое™ и "теорему 5.1. ** В силу теоремы 5.2 дифференцируемая в точке ( функция х—ц>(1) является непрерывной в этой точке.
§ 3. Дифференцирование сложной и обратной функций 199 Замечание 2. При доказательстве теоремы 5.3 мы рассматривали сложную функцию вида у = !(х), где х=ср(7), т. е. обозначили символом х промежуточный аргумент. Эта символика, конечно, может быть изменена. Чаще удобнее бывает обозначать символом х окончательный аргумент, т. е. рассматривать сложную функцию вида у = {[<р(х)]. В этих обозначениях правило дифференцирования сложной функции (5.13) принимает вид ШФ(*)]}'=Г[Ф(*)]-Ф'(*)- (5-13*) Примеры применения правила дифференцирования сложной функции будут приведены в следующем параграфе. 2. Дифференцирование обратной функции. Теорема 5.4. Пусть функция у = !(х) возрастает (или убывает) и непрерывна в некоторой окрестности точки х. Пусть, кроме того, эта функция дифференцируема в указанной точке х и ее производная в этой точке /' (х) отлична от нуля. Тогда в некоторой окрестности соответствующей точки у = }{х) определена обратная ■ для у=1(х) функция я=/_1(</)> причем указанная обратная функция дифференцируема в соответствующей точке у = 1(х) и для ее производной в этой точке у справедлива формула Доказательство. Так как функция у=}(х) строго монотонна и непрерывна в некоторой окрестности данной точки х, то в силу теоремы 4.5 (см. § 2 гл. 4) обратная функция х=%-1{у\ определена, строго монотонна и непрерывна в некоторой окрестности соответствующей точки у = 1(х). Придадим аргументу этой обратной функции в указанной точке произвольное достаточно малое и отличное от нуля приращение Ау. Этому приращению Ау отвечает приращение Ах = = /_1(г/ + Аг/)—/_1 (у) обратной функции в соответствующей точке у=1(х), причем в силу строгой монотонности обратной функции указанное приращение Ах от лично от нуля. Это дает нам право написать следующее тождество *: — =—!—. (5.18) Ау Ах Ау Пусть теперь в тождестве (5.18) приращение Ау стремится к нулю. Тогда в силу разностной формы условия непрерывности обратной функции х=}~1(у) в соответствующей точке у = 1(х) приращение этой функции Ах также стремится к нулю. Убедимся в том, что в таком случае существует предел правой части (5.18), * Указанное тождество можно написать для любых двух чисел Ау и Ах, отличных от нуля.
200 Гл. 5. Дифференциальное исчисление равный величине, стоящей в правой части (5.17). Этим будет доказано, что тот же самый предел имеет и левая часть (5.18), т. е. будет доказано, что обратная функция имеет производную в соответствующей точке у=!(х) и для этой производной справедливо равенство (5.17). Итак, для завершения доказательства теоремы остается убедиться в том, что правая часть (5.18) имеет предел при Дх->0 равный 1/}'(х), где х — данная точка. Так как* = /-'(*/), Ах=}~1(у+Ау) — 1~1(у), то х + Ах = {-1(у + Ау), т. е. у+Ау={(х+Ах) и Ау={(х+Ах)—/(х). Отсюда следует, что правая часть (5.18) может быть переписана в виде 1 1 Ау {(х+Ах)-[(х) ' Ах Ах Из последнего равенства в силу определения производной }'(х) и предположения }'(х)Ф0 сразу же вытекает, что предел при Дх-э-0 правой части (5.18) существует и равен \Ц'{х). Теорема доказана. Примеры применения доказанной теоремы будут даны в следующем параграфе. Доказанная теорема имеет простой геометрический смысл. Пусть М — точка графика функции у — \(х), отвечающая данному значению аргумента х (рис. 5.3). Тогда, очевидно, производная I'(х) равна тангенсу угла наклона а касательной, проходяшей. через точку М, к оси Ох, а производная обратной функции {/-1(#)}' в соответствующей точке у=[(х) равна тангенсу угла наклона р той же самой касательной к оси Оу. Поскольку углы наклона а и р в сумме составляют я/2, то формула (5.17) выражает очевидный факт: *бР = Т^- приа + р = л/2. 3. Инвариантность формы первого дифференциала. В п. 3 § 2 мы убедились в том, что для случая, когда аргумент х дифференцируемой функции у=1(х) представляет собой независимую переменную, для дифференциала йу этой функции справедливо представление йу=]'{х)йх. (5.12) Сейчас мы докажем, что представление (5.12) является универсальным и справедливо также и в случае, кЬгда аргумент х сам является дифференцируемой функцией вида х=ц>(() некоторой
§ 3. Дифференцирование сложной и обратной функций 201 независимой переменной (. Это свойство дифференциала функции принято называть инвариантностью его формы*. Итак, пусть аргумент х дифференцируемой функции у=}(х) сам является дифференцируемой функцией вида х = ф(?) некоторой независимой переменной ^. В таком случае у можно рассматривать как сложную функцию вида г/ = /[ф(0] аргумента I. Поскольку этот аргумент I является независимой переменной, то для указанной функции У = ^[ф(0] и для функции х=ц>({) дифференциалы представимы в форме (5.12), т. е. в виде йг/={/[Ф(0]}Ж 0х=фЦ)(И.' (5.19) По правилу дифференцирования сложной функции {Яф(0]}'=Г(*)ф'(0- (5.13) Подставляя (5.13) в первую из формул (5.19), придадим этой формуле вид с1у=}'(х)у'У)сН. (5.20)' Сопоставляя полученное равенство (5.20) со вторым из равенств (5.19), окончательно получим для йу выражение йу=Г{х)йх, совпадающее с представлением (5.12). Инвариантность формы (5.12) первого дифференциала функции йу установлена. Замечание. Можно дать и другую эквивалентную формулировку свойства инвариантности формы первого дифференциала, сразу же вытекающую из универсальности представления (5.12): производная дифференцируемой функции у = !(х) равна отношению дифференциала этой функции йу к дифференциалу ее аргумента их, т. е. определяется равенством Г(х) = -%~, (5.21) их как в случае, когда аргумент х является независимой переменной, так и в случае, когда аргумент х сам является дифференцируемой функцией вида х=уЦ) некоторой независимой переменной I. Универсальность представления для производной (5.21) позволяет использовать отношение —— для обозначения производной их функции у = 1(х) по аргументу х. 4. Применение дифференциала для установления приближенных формул. Пусть ради простоты аргумент х функции у = Нх) является независимой переменной. В п. 3 § 2 мы показали, что диф- * Ниже мы введем понятия второго и последующих дифференциалов функции (/=/(*) и обнаружим, что эти дифференциалы уже не обладают инвариантностью формы. Вследствие этого доказываемое свойство называют инвариантностью формы первого дифференциала.
202 Гл. 5. Дифференциальное исчисление ференциал йу функции у = 1(х), вообще говоря, не равен приращению Аг/ этой функции. Тем не менее с точностью до бесконечно малой функции более высокого порядка малости, чем Ах, справедливо приближенное равенство Аужйу. (5.22) Отношение у~~ у естественно назвать относительной Ах погрешностью равенства (5.22). Так как Аг/—йу = о(Ах) *, то относительная погрешность равенства (5.22) становится как угодно малой при уменьшении |Дх|. Соотношение (5.22) позволяет приближенно заменять приращение Аг/ дифференцируемой функции г/ = /(х) дифференциалом йу этой функции. Целесообразность такой замены оправдывается тем, что дифференциал йу является линейной функцией А*, в то время как приращение Аг/, вообще говоря, представляет собой более сложную функцию аргумента Ах. Учитывая, что Дг/ = /(х+Дх)—/(х), йу = $'(х)Ах, мы можем переписать приближенное равенство (5.22) в виде /(х+Дх)—1(х)& »/' (х)Дх или, что то же самое, в виде Цх+Ах)жЦх)+1'(х)Ах. (5.23) Приближенное равенство (5.23), так же как и (5.22), справедливо для любой дифференцируемой в данной точке х функции /(х) с точностью до величины о (Ах) более высокого порядка малости, чем Ах. Это приближенное равенство позволяет с ошибкой о (Ах) заменить функцию }(х) в малой окрестности точки х (т. е. для малых значений Ах) линейной функцией аргумента Ах, стоящей в правой части (5.23). Приближенная формула (5.23) часто применяется для различных конкретных видов функции /(х). § 4. ДИФФЕРЕНЦИРОВАНИЕ СУММЫ, РАЗНОСТИ, ПРОИЗВЕДЕНИЯ И ЧАСТНОГО ФУНКЦИИ Теорема 5.5. Если каждая из функций и(х) и у(х) дифференцируема в данной точке х, то сумма, разность, произведение и частное этих функций (частное при условии, что значение V (х) фО) также дифференцируемы в этой точке, причем имеют место формулы [и (х) ± V (х)]' = и' (х) ± о' (х), [и(х)^(х)]' = и' (х)-о(х) + и(х)-г/(х), ^.24) и(х) V{X) и' (х) -у{х) — и (х)• у' (х) ьЦх) * См. п. 3 § 2.
§ 4. Диф. суммы, разности, произведения и частного функций 203 Доказательство. Рассмотрим отдельно случаи суммы (разности), произведения и частного. 1°. Пусть у(х) = и(х)±ь(х). Обозначим символами Аи, Да и Ау приращения функций и(х), у(х) и у{х) в данной точке х, отвечающие приращению аргумента Ах. Тогда, очевидно, Ау=у(х+Ах)—у{х)=[и{х+Ах)±.у{х+Ах)]—[и(х)±ю(х)]= = [и(х+Ах)—и(х)] ±[ь(х+Ах)—у(х)]=Аи±Ау. Таким образом, _А»=_Л«.±_ДН._ (5>25) Ах Ах Ах Пусть теперь Дх->0. Тогда в силу существования производных функций и{х) и у(х) в точке х существует предел правой части (5.25), равный и'{х)+у'(х). Значит, существует предел (при Ах-^Ь) и левой части (5.25). По определению производной указанный предел равен у {х), и мы приходим к требуемому равенству У' (х) ="' (х) ±ъ' (х). 2°. Пусть, далее, у(х) =и{х)у(х). Сохраняя за Аи, До и Ау тот же смысл, что и выше, будем иметь Ау=у(х+Ах)—у(х) —и(х+Ах)а(х-\-Ах):—и{x)V (х) = = [и{х+Ах)ь{х+Ах)— и{х+Ах)у(х)] + [и(х+Ах)у(х)—и(х^(х)]. (Мы прибавили и вычли слагаемое и(х+Ах)у(х).) Далее можем записать Ау=и(х+Ах)[а(х+Ах)—V(x)] +у(х){и(х+Ах)—и(х)] = = и(х+Да;)Ду + у (х)Аи. Таким образом, Ж = и{х+Ах)^ + Нх)-^.. (5.26) Ах Ах Ах Пусть теперь Дх->0. Тогда в силу дифференцируемости функций и(х) и у{х) в точке х существуют пределы отношений —— и , соответственно равные и'(х) и V'(x). Далее, из дифференцируемости функции и(х) в точке х в силу теоремы 5.2 следует непрерывность и(х) в этой точке. Значит, существует предел Пт и(х + Ах), равный и(х). Дх-»0 Таким образом, существует предел правой части (5.26) при Лх-э-О, равный и(х)ю'(х) +и(х)ю'(х). Значит, существует предел (при Дх->-0) и левой части (5.26). По определению производной указанный предел равен у' {х), и мы приходим к требуемой формуле у'(х)—и'(х)ю(х)+и{х)а'(х).
204 Гл. 5. Дифференциальное исчисление 3°. Пусть, наконец, у(х) = ——. Тогда, поскольку у(х)Ф0, по у(х) теореме 4.11 об устойчивости знака непрерывной в данной точке х функции ь(х+Ах)Ф0 для всех достаточно малых Ах, и мы можем записать, что Ау = у(х + Ах)-у{х)=и{* + *х\ и(х) У (х + А*) V (х) _ и(х-\- Ах)у(х)— у(х + Ах)у(х) V (х) у(х-\- Ах) Добавляя и вычитая в числителе слагаемое и(х)у(х), будем иметь д„_ [и(х + Ах)у(х)— и(х)у(х)]— [у (х + Ах) и (х) — и(х)у(х)] _ У у{х)у(х + Ах) _ у(х)[и(х + Дх) — и(х)\ — и(х)[у(х + Ах)—у(х)\ _ у(х)Аи — и(х)Ау у {х) у(х + Ах) у (х)у (х + Ах) Таким образом, Аи . Да М. = ё* Ах_ (52?) Л* у (х) у (х -\- Ах) Пусть теперь ддс-*-0. В силу дифференцируемости (и вытекающей из нее непрерывности) функций и(х) и у(х) в точке х существуют пределы Нт —— = и'(х), Нт —— = V' (х), Ига у(х+ Аx) = V(x). Ак-*о Ах дх^о Ал: дх-»о Таким образом, поскольку V (х) ф0, существует предел при Дл:->-0 правой части (5.27), равный у (х) и' (х) — и (х) у' (х) у2 (х) Значит, существует предел при Дх->0 и левой части (5.27). По определению производной указанный предел равен у (х), и мы получим требуемую формулу у' <х) = "'(*)" (*) — "'(*)"(*) о» (х) Теорема 5.5 полностью доказана. Следствие из теоремы 5.5. Если для функций и(х) и V (х) выполнены в данной точке х те же предположения, что и в теореме 5.5, то в этой точке х справедливы следующие соотношения для дифференциалов:
§ 5. Производные простейших элементарных функций 205 Л (и ± V) = йи ± &>, й (и ■ V) = ъйи + ийо, , / и \ хз&и. — и&о (5.28) Для установления соотношений (5.28) достаточно умножить равенство (5.24) на их и воспользоваться универсальным представлением (5.12) дифференциала произвольной функции у={{х).ф § 5. ПРОИЗВОДНЫЕ ПРОСТЕЙШИХ ЭЛЕМЕНТАРНЫХ ФУНКЦИИ Из вводной главы и из гл. 4 нам уже извество, что простейшими элементарными функциями принято называть следующие функции: показательную функцию у—ах и логарифмическую функцию у = \о%ах, рассматриваемые для любого фиксированного значения а такого, что 0<а=^1, степенную функцию у=ха, где а — фиксированное вещественное число, четыре тригонометрические функции у=$\пх, у=созх, у=^х и у=с1%х и четыре обратные тригойометрические функции у=агс5'тх, у—атссозх, у = атс1§х и у=агсс1%х. В настоящем параграфе мы вычислим и систематизируем в таблицу производные всех простейших элементарных функций, уже выписанные нами в гл. 1. 1. Производные тригонометрических функций. 1°. Производная функции у = ъ\пх. Так как для этой функции / Ах \ Ах Аг/ = б1п (х + Дл;) — в!п х — 2 соз (х Н 81п , то при любом АхфО разностное отношение имеет вид Ах 81П Ау I , Ах \ 2 = соз а: + Ах \ 2 / _Дх 2 По определению производной Ах Ау _,. / .Ах \ 2 (виГх)' = Пт —-— = Нт {соз (х -\ дя:->о Ах д*-»о | V 1 ] (. Ах_ 2 (5.29) В силу непрерывности функции «/=созх в любой точке х бесконечной прямой Игл соз (х Н —) = соз х. (5.30) &.х-л V 2 )
206 Гл. 5. Дифференциальное исчисление Далее, в силу первого замечательного предела и элементарной Ах * замены переменной 1 = , Ах Нт ±- = 1ип—=1. (5.31) Из существования пределов (5.30) и (5.31) и из теоремы о пределе произведения двух функций вытекает существование предела в правой части (5.29) и равенство (Ах соз (х + —М I —совх. ^ 2 ) Ах ' Итак, (51пл;)/ = со5Х (5.32) (для любой точки х бесконечной прямой). 2°. Производная функции у = соз х. Так как для любой точки х бесконечной прямой . / я СОЗ X = 51П I 2 то по правилу дифференцирования сложной функции** и по формуле (5.32) (соз х)' = . / я 81П \ 2 вС0в|-|—*)(-|—Х| = = соз ( — х) (— 1) = — зш х. Итак, (С05Х)' =—51ПХ (5.33) (для любой точки х бесконечной прямой). 3°. Производная функции у = ^х. Так какт.§х = — , соз л: то в силу правила дифференцирования частного*** и соотношений (5.32) и (5.33) в любой точке х, в которой со$ хфО, Ах * Очевидно, что I = ——»■ 0 при Дх->-0. **\См. п. 1 § 3, формулу (5.13). *** См. § 4, третью формулу (5.24).
§ 5. Производные простейших элементарных функций 207 (*§*)' = (ЗШ X)' С05 X — (СОЗ X)' 5Ш X С032 X СОЗ2 X + 51П2 X 1 Итак, 08*)'|= 1 + №х (5.34) в любой точке хф Ь пп, где п = 0, ± 1, ± 2, ... 4°. Производная функции г/ = с!§х Так как с1§х = 81ПДС то в силу правила дифференцирования частного и соотношений (5.32) и (5.33) в любой точке х, в которой зт хфО, СОЗ X \ ' _ (СОЗ X)' 51П X — (ЗШ х)' СОЗ X (а§ху- &тх —зш2х— соз" л: зш2 х 1 зт"* Итак, (с!§*)' = -(1 + с1§2 х) (5.35) (в любой точке хФлп, где п = 0, ±1, ±2, ±3, ...). 2. Производная логарифмической функции. Пусть у=\о%ах, где 0<аф1, х>0 — фиксированная точка. Тогда для любого достаточно малого АхфО &У _ \оЩа(.х + Ах)—1оёаХ Ах Ах Ах \ х : — 1о& 1 + л: Ах \ . х ■106, 1 + Дж \л* По определению производной х (106,*)' = Нт 4^- = — Ит 1°ёа\(1+—)АХ]- (5-36) В силу второго замечательного предела и элементарной замены Дх * переменной I = х I Ит 171 + -^ЦА*1=Цт[(1 + 0 ' ] = е. Д*-»0 1\ X I ^ <-»0 Ах * Так как д;>0 фиксировано, то /= »-0 при Дх->-0. х ;(5.37)
208 Гл. 5. Дифференциальное исчисление Из существования предела (5.37) и из непрерывности функции у=\о%ах в точке х = е* вытекает, что предел в правой части (5.36) существует и равен —Ъ^е. Итак, (1о&*)'=—1о&,е (5-38) X (для любых 0<а=?И и х>0). В частности, при а = е (1пх)' =— (для любого х > 0). 3. Производные показательной и обратных тригонометрических функций. Для вычисления производных указанных функций используем теорему 5.4 о дифференцировании обратной функции, доказанную нами в п. 2 § 3 настоящей главы. 1°. Производная функции у = ах (0<аф1). Так как функция у=ах, определенная на всей бесконечной прямой —оо<л:< + оо, является обратной для функции х = \о§ау, определенной на полупрямой 0<г/< + оо, и для функции х=\о%ау в окрестности л'юбой точки у полупрямой 0<г/< + оо выполнены все условия теоремы 5.4, то в силу этой теоремы функция у = а* дифференцируема в любой точке х=\о§ау и для ее производной в этой точке справедлива формула (а*)' = _1__== 1— = _*_. (1о8о</)' 1 . 1о§ае — 1о§а е У (Мы использовали выражение (5.38) для производной логарифмической функции.) Из полученного равенства в силу элементарного соотношения = 1па и соотношения у=ах окончательно получим (а*)' = а*1па (5.39) (для любой точки х бесконечной прямой). В частности, при а—е (ех)' = ех. 2°. Производная функции у=агсвтх. Так как функция1 у = агс$,тх, определенная на интервале —1<*<1, является обрат- ной для функции х=5'ту, определенной на интервале — < у < * В п. 2 § 3 гл. 4 доказано, что функция у—\о%ах непрерывна в любой точке х>0.
§ 5. Производные простейших элементарных функций 209 <Н , и для функции х = $\пу в окрестности любой точки у интервала — — < у < Н выполнены все условия теоремы 5.4, то по этой теореме функция у=агс&тх дифференцируема в любой точке х=зту и для ее производной в этой точке справедлива формула (агсзш х)' = —— = —— = г 1 . (5.40) (зту)' соау у 1-вта у Мы использовали равенство (5.32) и взяли перед корнем знак + в силу того, что созг/ положителен всюду на интервале < <»<+т Учитывая, что &ту=х, мы окончательно получим из (5.40) (агсзт х)' ——т== (для всех х из интервала —1<л:< + 1). 3°. Производная функции г/=агссозх. Так как функция1 у = агссо$х, определенная на интервале —1<#< + 1, является обратной для функции х~со$у, определенной на интервале 0<у<я, и для функции х=со5у в окрестности любой точки у интервала 0<у<п выполнены все условия теоремы 5.4, то по этой теореме функция г/ = агссозх дифференцируема в любой точке х = со$у и для ее производной в этой точке справедлива формула (агссозх)'=—-— = = .. 1 (5.41> (созг/)' (— ату) —у 1—соза у Мы использовали равенство (5.33) и взяли перед корнем знак — в силу того, что &'ту положителен всюду на интервале 0<у<л. Учитывая, что созг/ = х, мы окончательно получим из (5.41) (агссоз х)' = у у 1 — хг (для всех х из интервала —1<х< + 1). 4°. Производная функции г/=агс1§х. Так как функция г/=агс1д#, определенная на бесконечной прямой —оо<х< + оо, является обратной для функции х={§у, определенной на интервале < у < —, и для функции х=1ду в окрестности каждой точки у интервала < у < — выполнены все условия теоремы 5.4, то по этой теореме функция г/ = агс!§л: дифференцируема в каждой точке х=1§у и для ее производной в этой точке справедлива формула
210 Гл. 5, Дифференциальное исчисление (агс1ех) = = = {Мы использовали соотношение (5.34).) Итак, 1 (агс^ х)' = ■ 1+х2 (для любой точки х бесконечной прямой). 5°. Производная функции у = агсс1дл;. Так как функция у = агсс1%х, определенная на бесконечной прямой —оо<а-< + °° является обратной для функции х=с1§у, определенной на интервале 0<г/<я, и для функции х = с{цу в окрестности каждой точки интервала 0<у<л выполнены все условия теоремы 5.4, то по этой теореме функция у = агсс1^л; дифференцируема в каждой точке х=с1§у и для ее производной в этой точке справедлива формула (агссх§х)' = - ' * * (с*8У)' -(1+с1§гу) (Мы использовали соотношение (5.35).) Итак, 1 (агсс1§ х)' = 1 +х2 (для любой точки х бесконечной прямой). 4. Производная степенной функции. Пусть у = хос, где а — любое вещественное число, х — любая точка полупрямой 0<х< + оо. В гл. 4 мы уже рассматривали степенную функцию у = х? как суперпозицию логарифмической и показательной функций у = х* = (а1ов*к)" = аа1ов* (где а — любое фиксированное число СХо^Ч). По правилу дифференцирования сложной функции у = аи, где и = а 1ода х, получим у' = (а*)' • (а 1о&, х)' = а" • 1п а ■ а-— 1о§б е = X ^аа1о^х .а.±-=х*-а-!- = ах«-К X X Итак, окончательно {хаУ=аха-1 (для любого л:>0). 5. Таблица производных простейших элементарных функций. Соберем теперь в таблицу все вычисленные нами производные простейших элементарных функций. 1°. (ха)' = аха-1 (х>0).
§ 5. Производные простейших элементарных функций 211 В частности, { — ) = —, (Vх)'- 2°. (1о§ах)'=-^\оиае (0<аф1,х>0). В частности, (1пх)' =—. X 3°. (а*)' = а*.1па (0<аФ1). В частности, (ех)' = ех. 4°. (з1пх)/ = созл;. 5°. (созх)' = —зтх. 6°. (г§х)' =—!—= 1 + х§2л; (хф — + пп; п = 0, ±1, ..Л. С052Х \ 2 / 7°. (с1§*)'=—-4— =-(1+сх82х) (*дЬПя;п = 0. ±1, .••)► 81ПаХ 8°. (агс81пх)'= 1/1/1-з*М—К *< + !)• 9°. (агссозх)' = — 1/|Л —х2 (— 1< х < + 1). 10°. (агс1ё%)' = —^. 1 + л;2 1Г. (агсс^х)^--^, В гл. 4 мы ввели в рассмотрение четыре гиперболические функции г/ = зпх, у — сЪ.х, г/ = Шх и </ = сШх, являющиеся простыми комбинациями показательных функций. Из представления этих функций через показательные функции элементарно вытекают следующие выражения для их производных: 12°. (зЬх)' = спх. 13°. (спх)' = зпх. 14°. (1Ьх)' = ' сЬ2* .. 15°. (стЬх)' = -±- (хфО). Установленная нами таблица производных вместе с правилом дифференцирования сложной функции (установленным в п. 1 § 3) и правилами дифференцирования суммы, разности, произведения и частного (установленными в § 4) составляет вычислительный аппарат той части математического анализа, которую принято называть дифференциальным исчислением. В гл. 1 и 4 мы уже ввели понятие элементарной функции, как такой функции, которая выражается через простейшие элементарные функции посредством четырех арифметических действий и суперпозиций, последовательно применяемых конечное число раз. Из установленной нами таблицы производных и правил дифференцирования суммы, разности, произведения, частного и сложной функции вытекает следующий важный вывод: производная любой элементарной функции представляет собой также элементарную
212 Гл. 5. Дифференциальное исчисление функцию, т. е. операция дифференцирования не выводит нас из класса элементарных функций. 6. Таблица дифференциалов простейших элементарных функций. В п. 3 § 3 мы установили, что дифференциал йу функции у = 1(х) всегда равен производной этой функции /'(х), умноженной на дифференциал аргумента их. Поэтому установленная нами таблица производных сразу же приводит нас к соответствующей таблице дифференциалов простейших элементарных функций. Г. а(ха) = а-ха~1а'х. В частности, й \ — ) = их, йСУх) ——г=йх. 2°. й(1о§ах) =— 1о&ебх (О < а ф 1, * >0). X их В частности, й(\пх) — . 3°. й(ах) = а*\па(1х (0<аф1). В частности, а*(ех) =ехйх. 4°. Л(?,тх) —соъхйх. 5°. е?(созл:) =—ъхпхйх. 6°. й(\%х) =-^- = (\ + \&х)йх созах х Ф -у + тг; п = 0, ± 1. ± 2, .. й(с1§х)= ^— = — (1 + с\&2х)йх (хфпл;п=0,±;1,...) 8°. й (агсзт х) = 0х/У1 — х2 (— 1< х < + 1)■ 9°. й (агссоз х) = —йх/У1 — х2 (— 1< х < + 1). 10°. <*(агс1§л:) = йх 1+*2 11°. с*(агс*ё*) = ** 1 +Х2 7. Логарифмическая производная. Производная степенно-показательной функции. Пусть функция у=}(х) положительна ■и дифференцируема в данной точке х. Тогда и сложная функция аргумента х вида ш=\х\.у, где у=!(х), в силу теоремы 5.3 будет также дифференцируема в указанной точке х, причем для производной этой сложной функции по аргументу л: будет справедлива формула [\пНх)]' = (1пуУу, = ^- = -^-. (5.42) Величину (5.42) принято называть логарифмической 'производной функции у = !(х) в данной точке х. Логарифмическая производная может быть использована для вычисления производных некоторых функций, не являющихся простейшими элементарными.
§ 6. Производные и дифференциалы высших порядков 213 В качестве примера вычислим производную так называемой степенно-показательной функции, т. е. функции вида у = и(х)у(-х\ где и(х) и V{x)—две функции, дифференцируемые в данной точке х, первая из которых и(х) строго положительна в этой точке. При таких ограничениях функция оу = 1пг/ = о(Х) 1пи(х) будет дифференцируема в данной точке х. В самом деле, в силу теоремы 5.3 функция 1п и(х) дифференцируема в точке х. Значит, на основании теоремы о дифференцируемости произведения двух дифференцируемых функций можно утверждать дифференцируемость в данной точке х и функции ии=\пу=ю(х) •\пи(х), причем в силу второй формулы (5.24) (1п у)' = ь' {х) 1п и (х) + о (х) [1п и (*)]' = = V'(x)^пи{x) + V(x)■^-. (5.43) и(х) Из (5.42) и (5.43) получим, что X = о'(*)Ыи(х) + V{х) ^Ш-. у «(*) Учитывая, что у = и(х)а1-х\ окончательно получим следующее выражение для производной степенно-показательной функции: {и (*)«*»}' = и (*)«*> Го' (х) 1п и(х) + ь {х) -^-^- . (5.44) Формула (5.44) справедлива в предположении, что и(х) и о (я) дифференцируемы в данной точке х и и(х)>0 в этой точке. § 6. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 1. Понятие производной п-го порядка. Как уже отмечалось в о. 2 § 1, производная 1'(х) функции у=Цх), определенной и дифференцируемой на интервале (а, Ь), представляет собой функцию, также определенную на интервале (а, Ъ). Может случиться, что функция 1'{х) сама является дифференцируемой в некоторой точке х интервала (а, Ь), т. е. имеет в этой точке производную. Тогда указанную производную называют второй производной (или производной второго порядка) функции у = !(х) в точке х и обозначают символом 1(2)(х) или #(2>*. После того .как введено понятие второй производной, можно последовательно ввести понятие третьей производной, затем четвертой производной и т. д. Если предположить, что нами уже введено понятие (п— 1)-й производной и что (п—1)-я производная дифференцируема в некоторой точке х интервала (а, Ь), т. е. * Для обозначения второй производной используют также символы У или у".
214 Гл. 5. Дифференциальное исчисление имеет в этой точке производную, то указанную производную называют и-й производной (или производной /1-го порядка) функции у=Цх) в точке х и обозначают символом Iм (х) или у^. Таким образом, мы вводим понятие я-й производной индуктивно, переходя от первой производной к последующим. Соотношение, определяющее п-ю производную, имеет вид ^(»)=[у(я-1)]/. (5.45) Функцию, имеющую на данном множестве {х} конечную производную порядка п, обычно называют п раз дифференцируемой на данном множестве. Понятие производных высших порядков находит многочисленные применения. Здесь мы ограничимся тем, что укажем механический смысл второй производной. Если функция у—Цх) описывает закон движения материальной точки вдоль оси Оу, то, как мы уже знаем из гл. 1, первая производная !'(х) дает мгновенную скорость движущейся точки в момент времени х. В таком случае вторая производная /(2)(-*0 равна скорости изменения скорости, т. е. равна ускорению движущейся точки в момент времени х. Методика вычисления производных высшего порядка предполагает умение вычислять только производные первого порядка, ибо последовательное применение формулы (5.45) есть не что иное, как многократное вычисление первых производных. В качестве примеров вычислим производные л-го порядка некоторых простейших элементарных функций. 2. п-ые производные некоторых функций. 1°. Вычислим п-ю производную степенной функции у=х* (х>0, а — любое вещественное число). Последовательно дифференцируя, будем иметь у' = аХ*-1, у^ = а{а—1)ха~2, у™ = а(а— 1) (а—2)ха~* Отсюда легко уяснить общий закон (*<*)<"> = а (а— 1) ... (а—п+ 1)ха-п. Строгое доказательство этого закона легко проводится методом математической индукции. В частном случае а=/и, где т — натуральное число, получим (*'")<'*>=т!, (л:т)(п) = 0 при п>т. Таким образом, п-я производная многочлена т-го порядка при п>т равна нулю*. * При этом мы используем следующую очевидную формулу: [Аи (х) -+• +Во(х)]п=Аи<п)(х)+Ви("')(х), где А и В — постоянные.
§ 6. Производные и дифференциалы высших порядков 215 2°. Далее вычислим п-ю производную показательной функции у = ах. Последовательно дифференцируя, будем иметь у'=ах1пх, уЮ = ах\п2х, у^=ах\п3а Общая формула, легко устанавливаемая по методу имеет вид индукции, (а")<л> = ах 1п" а. В частности, (е*)(ч) = ех. 3°. Вычислим п-ю производную функции у = 5'тх. Первую производную этой функции можно записать в виде у = С05 X -- :зт1д;Н ]. Таким образом, дифференцирование функции у = 5\пх прибавляет к аргументу этой функции величину —. Отсюда получаем формулу (ЗШХ)^ =5Ш (х + П 4°. Совершенно аналогично устанавливается формула (соз хУп) = соз (х + п — 5°. Вычислим п-ю производную функции г/ = агст§х Докажем с помощью метода математической индукции, что справедлива следующая формула: (я-1)1 (агс*§ *)<">; 51П п (агс1;§ х-\ (1 + х*)п/2 Учитывая, что у = атс\д,х, х = 1§,у, 1+х2 1 + 182 У, можем переписать устанавливаемую формулу в виде (5.46) 1 у™ = (п —1)1 соз',г/51п п у + -- соз11 у, мы (5.46*) Убедимся методом индукции в справедливости формулы (5.46*). При п=1, в силу п. 3 § 5, у' = (агст§х)' ■■ 1 +х2 = соз2 г/. То же самое выражение получается при п=1 из (5.46*) (достаточно Учесть, ЧТО 81П ( у + — ) = СОЗ у). Таким образом, при л=1 формула (5.46*) справедлива.
216 Гл. 5. Дифференциальное исчисление Предположим теперь, что формула (5.46*) справедлива для некоторого п, и убедимся, что в таком случае эта формула справедлива и для следующего номера я+1. В самом деле, производя дифференцирование (5.46*), получим ыСН-Ц = («— 1)1 — СОЗп 0 8Ш их ' я \У + = (л-1)1 ау СОЗ" у 51П я у+ ■ 4» ах (л-1)1 * (С05пу) 51П Я Л + СОЗ" I/ 51ПП ({/ + П + УчИТЫВаЯ, ЧТО у' = С052 у, (СОЗл у) = П С03п_1 у (— ЗШ у), МЫ ПО- лучим, что ^(л+1) = п\ С05л+1 у I — 51П # 81П И (у + — ] + СОЗ у С05 \п (у + — ] 1 = п!со5п+1г/51п [(/г + 1)(у + —\ . п\ соз^1 у соз (м+1)г/ + и — Мы получаем для г/(л+1> формулу вида (5.46*), взятую для номера л+1. Тем самым индукция завершена и формула (5.46) доказана. 6°. В заключение вычислим л-ю производную так называемой , „„. ах-\-Ъ , , дроби о-л инеинои функции у= , где а, 1г, с их а — сх -\- & некоторые постоянные. Последовательно дифференцируя эту функцию, будем иметь а{сх + ф с(ах + Ь)=={а(1_Ьс) (сх + ау уЮ=(аа—Ьс) (—2) {сх+й)~*с, уЮ={ай—Ъс) (—2) (—3) (сх+с1)-4с2 Легко усмотреть и общий закон у(п) = I ОХ±Ь_ \ <"> = ^ _ЬсЦ_1 )„-1 П| ,сх + Оу-(П+1) с»-1, который доказывается по методу индукции. 3. Формула Лейбница для п-й производной произведения двух функций. В то время как установленное выше правило вычисления
§ 6. Производные и дифференциалы высших порядков 21 7 первой производной от суммы или разности двух функций (ы±у)'=ы'±у' легко переносится (например, по методу индукции) на случай л-й производной (н±1>)<л> = м(">±а(п), возникают затруднения при вычислении я-й производной от произведения двух функций и V. Соответствующее правило носит название формулы Лейбница и имеет следующий вид: (ыг>)<"> = ц(л>1> + ^«("-«у' + С>"-2)у(2> + С3пи(п-3)^3) + • • • + м>(п). (5.47) Легко подметить закон, по которому построена правая часть формулы Лейбница (5.47): она совпадает с формулой разложения ■бинома (и + о)п, лишь вместо степеней и и V стоят производные соответствующих порядков. Это сходство становится еще более полным, если вместо самих функций и и V писать соответственно ы(0) и «(0> (т. е. если рассматривать саму функцию как производную нулевого порядка). Докажем формулу Лейбница по методу индукции. При п—1 эта формула принимает вид (иу)' = и'р + ыу', что совпадает с установленным выше (в § 4) правилом дифференцирования произведения двух функций. Поэтому достаточно, предположив справедливость формулы (5.47) для некоторого номера п, доказать ее справедливость для следующего номера л+1. Итак, пусть для некоторого номера я формула (5.47) верна. Продифференцируем эту формулу и объединим слагаемые, стоящие в правой части, так, как это указано ниже: (тУп+» = «<"+% + [С°и<">а' + СУ»>о'] + [С,1ы<п-1>р<2> + С^с-'М2»] + + [С>-%(3» + С^е-2)г/3>] + ... + да<п+1). (5.48) (При этом мы воспользовались тем, что 1 = С„°.) Легко проверить, что для любого номера к, не превосходящего п, справедлива формула С* + С*-' = С*+1. (5.49) Для того чтобы убедиться в справедливости формулы (5.49), достаточно заметить, что гк _ /г(/г —1) ... (д —6+1) гк-\ _ п(п — 1)...(п—к + 2) пк (п+1)п...(п— к+ 2) Из написанных соотношений вытекает, что гк + гк-1_ Щп — 1) ...(п—к+1) п(п — 1) ...(п^к + 2) _ " " к\ (А—1)1
218 Гл. 5. Дифференциальное исчисление _^ п(п — \)...(Л — к + 2)(п — к + \)-\-п{п—\)..,(п — к + 2)к _ ~ к\ _п(п — \)...{п — к + 2)Цп—к+\) + к\_ ~~ к\ ' ~ (я+ \)п(п — 1) ... (л — к+ 2) пи = й = Сп+и Используя формулу (5.49), мы можем следующим образом переписать соотношение (5.48): (цс)(п+1) = и<»+1Ъ + С1п+1и^Ь' + С^+1М("-'Ь(2) + С^+цИ"-^ + ... + иа(п+1К Тем самым мы убедились в справедливости формулы (5.47)' для номера л+1. Индукция проведена, и вывод формулы Лейбница (5.47) завершен. Пример. Вычислим я-ю производную функции у=х2ех. Полагая в формуле Лейбница (5.47) и = ех, и=х2 и учитывая, что и(к) = ех (для любого номера к), а'= 2*, V^^ = 2, а(3) = у(4>=...=0, мы получим, что (х2ехУп> = ехх2 + СУ 2х + С%ех -2 = ех[х2 + 2пх+ п(п — \)]. Подчеркнем, что формула Лейбница особенно эффективна в том случае, когда одна из перемножаемых функций имеет лишь конечное число отличных от нуля производных и не представляет затруднения вычисление всех производных другой из перемножаемых функций. 4. Дифференциалы высших порядков. Выше для обозначения дифференциала аргумента и соответствующего ему дифференциала функции мы использовали символы их и соответственно йу, В рассуждениях настоящего пункта нам придется использовать для обозначения дифференциала аргумента и соответствующего ему дифференциала функции и другие символы. В частности, мы будем обозначать дифференциал аргумента и соответствующий ему дифференциал функции символами 8х и 8у соответственно. В этих обозначениях инвариантное по форме выражение для первого дифференциала функции у=}(х) будет иметь вид 8у = =}'(х)8х. » Рассмотрим выражение для первого дифференциала дифференцируемой в данной точке х функции у=1(х): ёу = ['(х)с1х. (5.50) Предположим, что величина, стоящая в правой части (5.50), представляет собой функцию аргумента х, дифференцируемую в данной точке х. Для этого достаточно потребовать, чтобы функция у=}(х) была два раза дифференцируема в данной точке х, а аргумент либо являлся независимой переменной, либо представ-
§ 6. Производные и дифференциалы высших порядков 219 лял собой дважды дифференцируемую функцию некоторой независимой переменной I. При этих предположениях мы можем рассмотреть дифференциал 6(Ж/) =6 [/'(*)<**] от величины (5.50). Определение 1. Значение ё((1у) дифференциала от первого дифференциала (5.50), взятое при Ьх = йх, называется ' вторым дифференциалом функции у—\(х) (в данной точке х) и обозначается символом дР-у. Итак, по определению* й2у = б (йу) | бх=ах = {б [/' (х) их]} | б*=<г*. Дифференциал йпу любого порядка п вводится по индукции. Предположим, что уже введен дифференциал йп~1у порядка п—1 и что функция у = !(х) п раз дифференцируема в данной точке х, а ее аргумент х либо является независимой переменной, либо представляет собой п раз дифференцируемую функцию некоторой независимой переменной I. Определение 2. Значение б(йп~~*у) дифференциала от (п—\)-го дифференциала йп"1у, взятое при ^х—йх, называется л-м дифференциалом функции у = \(х) (в данной точке х) и обозначается символом й"у. Итак, по определению йпу = б (йп~1у) \ьх=лх- При вычислении второго и последующих дифференциалов приходится существенно различать два случая: 1) случай, когда аргумент х является независимой переменной; 2) случай, когда аргумент х представляет собой соответствующее число раз дифференцируемую функцию некоторой независимой переменной ^. В первом случае, когда х является независимой переменной, мы имеем право считать, что их не зависит от х и равен одному и тому же приращению аргумента Ах (для всех точек х). При этом мы получим, что б {их) = (йх)'6х = 0. Последнее соотношение и второе соотношение (5.28) позволяют нам записать следующую цепочку равенств: <?У = б (йу) 16х=ах = {б [/' (х) их}} 16х=ах = = {6 [Г (х)\йх + Г (х) б (их)} 15х=ах = {б [Г (х)] их} | &х^х = = {Р (х) Ьха-х) | 6*=й, = Р> (х) (йх)\ (5.51) Итак, в случае, когда аргумент х является независимой переменной, для второго дифференциала функции у=$(х) справедливо представление ' (Ру=РЧх)(е1х)2. (5.52) * Символ {...} |ах = <*х означает, что в выражении, заключенном в фигурные скобки, следует положить дх = 4х.
220 Гл. 5. Дифференциальное исчисление Совершенно аналогично, по индукции легко убедиться в том, что в случае, когда аргумент х является независимой переменной, для га-го дифференциала л раз дифференцируемой функции у= =!(х) справедливо представление апу=}("■){х) (йх)п. Таким образом, в случае, когда аргумент х является независимой переменной, производная порядка га функции у=!(х) равна отношению л-го дифференциала этой функции йпу к га-й степени дифференциала аргумента их. Совсем другой вид имеют представления для второго и последующих дифференциалов в случае, когда аргумент х является соответствующее число раз дифференцируемой функцией некоторой независимой переменной I. Установим выражение для второго дифференциала, считая, что функция у=!(х) два раза дифференцируема в данной точке х, а ее аргумент х является два раза дифференцируемой функцией некоторой независимой переменной I. Повторяя рассуждения из цепочки (5.51), мы на этот раз получим й2у = б {йу) | Ьх=йх = {б [/' (х) ах]} | в*=<г* = = {б [/' (х)] их + Г (х) б {их)} 1Ьх^х = = {/<2> (х) Ьхйх} 16х=ах + {/' (х) б (их)) | бх-ах- Заметим, что в силу определения второго дифференциала функции у = х Ь(йх)\(,х^х = йгх. Учитывая это соотношение, мы приходим к следующему представлению: й2у=р)(х){йху+1'(х)<Рх. (5.53) Сравнивая полученное представление (5.53) с представлением (5.52), мы убедимся в том, что (в отличие от первого дифференциала) второй дифференциал уже не обладает свойством инвариантности формы. Тем более не обладают свойством инвариантности формы последующие дифференциалы. § 7. ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИИ, ЗАДАННОЙ ПАРАМЕТРИЧЕСКИ Мы будем говорить, что переменная у как функция аргумента х задана нам параметрически, если обе переменные х и у заданы как функции некоторой третьей переменной 7: х=<р(7), * = *(<)•
§ 7. Дифференцирование функции, заданной параметрически 22Г При этом указанную переменную I обычно называют параметром. Мы, естественно, будем предполагать, что функции ф(^) и х|>(^)* имеют нужное число производных по параметру / в рассматриваемой области изменения этого параметра. Кроме того, мы всегда будем считать, что функция х = <р(/) в окрестности рассматриваемой точки 1=^ имеет обратную функцию 1=у~1{х)*, ибо это позволяет рассматривать у как функцию X. Рассмотрим вопрос о вычислении производных функции у = =у(х) по аргументу х. В силу свойства инвариантности формы первого дифференциала (см. п. 3 § 3) мы можем записать равенства: «'/*)=_*., 4и=ф'(*)Я, Жс = <р'(*)Я. (5-54> их Из этих равенств сразу же вытекает, что у' (х) = -*^>- (5.55). " ф'(0 Для вычисления второй производной у(2){х) достаточно заметить, что в силу свойства инвариантности формы первого дифференциала уЮ(х)= а1у'(х)] . (5.56)- их Используя в правой части (5.56) соотношение (5.55) и третье равенство (5.54), получим ■ф'(0 "' Л _я>(2)(оф'(о-ф(2)(оч>чо (5'57* У{2) (х) _ I ф'(<) фЧОЛ [фЧО!* По такому же принципу вычисляются производные третьего и> последующих порядков. Так, для вычисления третьей производной- г/(3)(х) достаточно представить эту производную в виде ,<з> {х) = '1»тМ их и воспользоваться "соотношением (5.57) и третьим равенством! (5.54). В качестве примера вычислим первую и вторую производные- следующей функции, заданной параметрически: X =й({ — 5111 Л, „ . _ к ' —схэ<^< + оо. у = а(\ — соз/), * В гл. 14 будет доказано, что для существования у функции д:=ф(<) в» окрестности точки (=(0 обратной функции достаточно, чтобы производная. Ф'(0 была непрерывна и отлична от нуля в точке <0.
222 Гл. 5. Дифференциальное исчисление Кривая, являющаяся графиком этой функции, называется циклоидой. Эта кривая представляет собой траекторию некоторой фиксированной точки окружности радиуса а, которая катится без скольжения по прямой линии (параметр I равен углу поворота радиуса этой окружности). Пользуясь формулами (5.55) и (5.57), получим * а(1 —саз*) 2 Кг)' -, а(1-с«0 Аа&^± 2 § 8. ПРОИЗВОДНАЯ ВЕКТОРНОЙ ФУНКЦИИ В приложениях математики часто встречаются понятия векторной функции и ее производной. Если каждому значению переменной I из некоторого множества (0 ставится в соответствие по известному закону определенный вектор а, то говорят, что на множестве {1} задана векторная функция а = а(^). Так как каждый вектор а в заданной декартовой прямоугольной системе координат однозначно определяется тремя координатами х, у и г, то задание векторной функции а = а (I) эквивалентно заданию трех скалярных функций х = х(1), у = = #(0 И 2 = 2(0- Понятие векторной функции приобретает особую наглядность при обращении к так называемому годогра- ф у этой функции (т. е. геометрическому месту концов всех векторов а = а(^), приложенных к началу координат О). На рис. 5.4 кривая Ь представляет собой годограф векторной функции а = а(^). Понятие годографа векторной функции является естественным ■обобщением понятия графика скалярной функции. Введем понятие производной векторной функции а = а(/) в данной фиксированной точке I. Зададим аргументу в точке I произвольное приращение МФО и рассмотрим соответствующий вектор приращения Да = ,==а(^+Л^)—а(/). (На рис. 5.4 указанный вектор совпадает с МР.)
§ 8. Производная векторной функции 223 Умножив указанный вектор на число , мы получим новый вектор ^- = Л-[а(/ + Д0-а(/)], (5.58) д* дг коллинеарный прежнему. Этот вектор (5.58) является аналогом разностного отношения (5.5). Вектор (5.58), очевидно, представляет собой среднюю скорость изменения векторной функции на сегменте [*, ^+А^]. Производной векторной функции а = а(0 в данной фиксированной точке I называется предел при А^-^-0 вектора (5.58) (при условии, что этот предел существует). Для обозначения производной векторной функции а = а(^) используются символы а'(^) или . й1 Из геометрических соображений очевидно, что производная векторной функции а = а(^) представляет собой вектор, касательный к годографу этой функции. Так как координаты разностного отношения (5.58) соответственно равны х((+М) ~х(() у(1 + Ы)—у{1) г(( + А() —г(1) М М ' М то ясно, что координаты производной а'(0 равны производным функций х'{1), (/'(0, ^'{I). Таким образом, вычисление производной векторной функции сводится к вычислению производных ее координат. Замечание 1. Так как векторная функция а = а(^) определяет закон движения материальной точки по кривой Ь, представляющей собой годограф этой функции, то производная а'(^) равна скорости движения по указанной кривой. Замечание 2. Из курса аналитической геометрии известны различные типы произведений векторов (скалярное произведение, векторное произведение и смешанное произведение). Выражение всех этих произведений в координатах дает возможность указать правила, по которым вычисляются производные соответствующих произведений векторных функций. В качестве примера приведем правило вычисления производной скалярного произведения двух векторных функций а(/) = (^(1), М0> МО) и Ь(/) = (&1 (^), МО. МО) : {а(О-Ь(0}'=а'(0-Ь(0+а(0-Ь'(0 = {а,'(0 -6,(О + + а2'(0-Ы0 + а8'(0-Ы0> + ЫО-Ь/С) + а2{1)-Ь2'{1) + + М0 -Ьз'(0}- Аналогичное правило справедливо и для векторного произведения двух векторных функций: [а(*)Ь(0]'=[а'(0Ь(0] + [а(*),Ь'(')]-
Глава 6 ОСНОВНЫЕ ТЕОРЕМЫ О ДИФФЕРЕНЦИРУЕМЫХ ФУНКЦИЯХ В настоящей главе будет установлен ряд важных теорем, относящихся к произвольным дифференцируемым функциям. Эти теоремы чрезвычайно эффективны при исследовании поведения функции (как в окрестности отдельных точек области ее задания, так и на целых участках области ее задания). § 1. ВОЗРАСТАНИЕ (УБЫВАНИЕ) ФУНКЦИИ В ТОЧКЕ. ЛОКАЛЬНЫЙ ЭКСТРЕМУМ Рассмотрим функцию у=Нх)> определенную всюду в некоторой окрестности фиксированной точки с. Определение 1. Будем говорить, что функция у=!(х) возрастает в точке с, если найдется такая Ь-окрестность точки с, в пределах которой Кх)<1(с) ПРИ х<с и ?(х)>1(с) при х>с. Определение 2. Будем говорить, что функция у=1(х) убывает в точке с, если найдется такая Ь-окрестность точки с, в пределах которой {{х)>1(с) при х<с и 1(х)<[(с) при х>с. Определение 3. Будем говорить, что функция у=[(х) имеет в точке с локальный максимум [локальный минимум], если найдется такая Ь-окрестность точки с, в пределах которой значение {(с) является наибольшим [наименьшим] среди всех значений }(х) этой функции. Определение 4. Будем говорить, что функция у=Кх) имеет в точке с локальный экстремум, если эта функция имеет, в указанной точке либо локальный максимум, либо локальный минимум. На рис. 6.1 изображена функция, возрастающая в точке си убывающая в точке Сг, имеющая локальный максимум в точке Сз и локальный минимум в точке с4. Докажем следующие две теоремы.
§ 1. Локальный экстремум 225 Рис. 6.1 Рис. 6.2 Теорема 6.1 (достаточное условие возрастания или убывания функции в точке). Если функция у — ] {х) дифференцируема в точке с и ее производная в этой точке \"(с) положительна [отрицательна], то функция у=((х) возрастает [убывает] в точке с. Доказательство. Проведем все рассуждения для случая /'(с)>0 (для случая /"(с)<0 они аналогичны). Так как (по определению производной) /'(с)=Ит ^-'(с) , хч-с х — с то на основании определения предела функции по Коши для положительного числа г = 1'(с) найдется б>0 такое, что /(*) - /(с) ■Г (с) </'(с) при 0 < (х — с|<б или, что то же самое, 0< < 2/' (с) при с — б < х < с + б, хФ с. Таким образом, всюду в проколотой б-окрестности точки с К*)-/(с) >0. X —С Но это и означает, что всюду в пределах б-окрестности точки с !(х)>1(с) при х>с, и /(х)</(с) при х<с, т. е. функция у = }(х) возрастает в точке с. 8 Зак. 72
226 Гл. 6. Основные теоремы о дифференцируемых функциях Случай /'(с)<0 рассматривается аналогично. Теорема доказана. Замечание 1. Подчеркнем, что положительность [отрицательность] производной {'(с) не является необходимым условием возрастания [убывания] дифференцируемой в точке с функции У4(х). Так, функция у = хъ возрастает в точке с = 0, в то время как производная этой функции }'(х)=3х2 обращается в нуль в точке с = 0 (график функции — на рис. 6.2). Теорема 6.2 (необходимое условие локального экстремума дифференцируемой в данной точке функции). Если функция у=1(х) дифференцируема в точке с и имеет в этой точке локальный экстремум, то /'(с)=0. Доказательство. По условию теоремы существует конечная производная /'(с). Так как функция г/=/(х) имеет в точке с локальный экстремум, то она не может в этой точке с ни возрастать, ни убывать. Значит, в силу теоремы 6.1 производная /'(с) не может быть ни положительной, ни отрицательной. Тем самым доказано, что /'(с) =0. Теорема 6.2 имеет очень простой геометрический смысл: она утверждает, что если в той точке кривой у = ?(х), в которой достигается локальный экстремум, существует касательная к этой кривой, то эта касательная обязательно параллельна оси Ох (рис. 6.3). Касательная У; 0 1 а Касательная ■14 1 1 ? * ос Рис. 6.4 Замечание 2. Пример той же самой функции у = хъ (см. рис. 6.2) показывает, что обращение в нуль производной является лишь необходимым и не является достаточным условием локального экстремума. (Производная 1'(х)=3х2 этой функции обращается в нуль в точке с = 0, но никакого экстремума в этой точке нет.) § 2. ТЕОРЕМА О НУЛЕ ПРОИЗВОДНОЙ Теорема 6.3 (теорема Рол л я*). Пусть функция \(х) непрерывна на сегменте [а, Ъ] и дифференцируема во всех внут- * Мишель Ролль — французский математик (1652—1719).,
§ 3. Формула конечных приращений 227 ренних точках этого сегмента. Пусть, кроме того, }(а)=}(Ь). Тогда внутри сегмента [а, Ь\ найдется точка % такая, что значение производной в этой точке }'Ц) равно нулю. Кратко можно сказать, что между двумя равными значениями дифференцируемой функции обязательно лежит нуль производной этой функции. Доказательство. Так как функция {(х) непрерывна на сегменте [а, Ь], то согласно теореме 4.15 эта функция достигает на этом сегменте максимального значения М и своего минимального значения пг. Могут представиться два случая: 1) М — т; 2) М>т. В случае 1) {(х) =М = т = сопз1. Поэтому производная /'(х) равна нулю в любой внутренней точке сегмента [а, Ь]. В случае М>т, поскольку 1(а)—1(Ь), можно утверждать, что хотя бы одно из двух значений М или т достигается функцией в некоторой внутренней точке % сегмента [а, Ь]. Но тогда функция 1(х) имеет в этой точке | локальный экстремум. Поскольку функция }(х) дифференцируема в точке |, то по теореме 6.2 /'(|)=0. Теорема полностью доказана. Теорема Ролля имеет простой геометрический смысл: если крайние ординаты кривой у=!(х) равны, то согласно теореме Ролля на кривой у = 1(х) найдется точка, в которой касательная к кривой параллельна оси Ох (рис. 6.4). Как мы увидим ниже, теорема Ролля лежит в основе многих формул и теорем математического анализа. Замечание. В теореме Ролля требуется, чтобы функция У = }{х) была непрерывна на сегменте [а, Ь] и дифференцируема во всех внутренних точках этого сегмента. Так как из дифференцируемое™ 1(х) во всех внутренних точках вытекает непрерывность 1(х) во всех внутренних точках, то по существу вместо непрерывности 1(х) на сегменте [а, Ь] можно было бы потребовать непрерывность }(х) в точке а справа и в точке Ь слева. § 3. ФОРМУЛА КОНЕЧНЫХ ПРИРАЩЕНИЙ (ФОРМУЛА ЛАГРАНЖА) Большое значение в анализе и его приложениях имеет следующая теорема, принадлежащая Лагранжу*. Теорема 6.4 (теорема Лагранжа). Если функция $(х) непрерывна на сегменте [а, Ь] и дифференцируема во всех внутренних точках этого сегмента, то внутри сегмента [а, Ь] найдется точка | такая, что справедлива формула 1(Ь)-!(а)=Г(Ь)(Ь-а).- (6.1) Формулу (6.1) называют формулой Лагранжа или формулой конечных приращений. Жозеф Луи Лагранж — великий французский математик и механик (1736—1813). И 8*
228 Гл. 6. Основные теоремы о дифференцируемых функциях Доказательство. Рассмотрим на сегменте [а, Ь] следующую вспомогательную функцию ПЬ)-П") Р(х) = 1{х)-[{а) (х— а). (6.2) Проверим, что для функции Р{х) выполнены все условия теоремы Ролля. В самом деле, Р(х) непрерывна на сегменте [а, Ь] (как разность функции /(*) и линейной функции) и во всех внутренних точках сегмента [а, Ь] имеет производную, равную Р'(х) = Г(х)~ Г{Ь)-!(а) . Ь — а Из формулы (6.2) очевидно, что Р(а) = Р(Ь) =0. Согласно теореме Ролля внутри сегмента [а, Ь] найдется точка Ъ, такая, что ПЬ)-№ г(®=гт- Ь—а 0. (6.3) Из равенства (6.3) вытекает формула Лагранжа (6.1). Подчеркнем, что в формуле (6.1) вовсе не обязательно считать, что Ь~>а, эта формула верна и при Ь<а. Замечание. Мы получили теорему Лагранжа как следствие теоремы Ролля. Заметим вместе с тем, что сама теорема Ролля является частным случаем теоремы Лагранжа (при 1(а) =1(Ь)). Для выяснения геометрического смысла теоремы Лагранжа заметим, что величина -—-—■—— есть угловой коэффициент се- Ь — а кущей, проходящей через точки А(а, 1(а)) и В(Ь, }(Ь)) кривой «/=/(*), а /'(I) есть угловой коэффициент касательной к кривой у = }(х), проходящей через точку С (|, Д-|)). Формула Лагранжа (6.1) означает, что на кривой г/ = = ^(х) между точками А к В найдется такая точка С, касательная в которой параллельна секущей АВ (рис. 6.5). ^ Часто бывает удобно записы- *с вать формулу Лагранжа в виде, несколько отличном от (6.1). Пусть !(х) удовлетворяет условиям теоремы 6.4. Зафиксируем любое ха из сегмента [а, Ь] и зададим ему приращение Ах произвольное, но такое, чтобы значение Хо+ + Кх также лежало на сегменте [а, Ь]. Тогда, записывая формулу Лагранжа для сегмента, ограниченного точками х0 и 'хо+Ах, будем иметь Нхо+Ьх)—Т(Хо)=Ьхр(Ъ), (6.4) Рис. 6.5
§ 4. Некоторые следствия из формулы Лагранжа 229 где | — некоторая точка, лежащая между х0 и х0+Ах. Можно утверждать, что найдется такое (зависящее от Ах) число 8 из интервала 0<6<1, что 1=х0 + дАх. Таким образом, формуле (6.4) можно придать вид 1(х0+Ах)—!(хо) =Д*П*о+0Д*). (6.5) где 0 — некоторое число из интервала О<0<1. Формула Лагранжа в виде (6.5) дает точное выражение для приращения функции через вызвавшее его произвольное конечное приращение Ах аргумента. Этот вид формулы Лагранжа оправдывает термин «формула конечных приращений». § 4. НЕКОТОРЫЕ СЛЕДСТВИЯ ИЗ ФОРМУЛЫ ЛАГРАНЖА 1. Постоянство функции, имеющей на интервале равную нулю производную. Теорема 6.5. Если функция 1(х) дифференцируема всюду на интервале (а, Ь) и если всюду на этом интервале }'(х)=0, то функция 1(х) является постоянной на интервале (а, Ь). Доказательство. Пусть хо — некоторая фиксированная точка интервала (а, Ь), ах — любая точка этого интервала. Сегмент [х0, х] или соответственно [х, х0] целиком принадлежит интервалу (а, Ь). Поэтому функция }{х) дифференцируема (а значит, и непрерывна) всюду на этом сегменте. Это дает право применить к функции \{х) на этом сегменте теорему Лагранжа. Согласно этой теореме внутри указанного сегмента найдется точка | такая, что /(*)-/(*>) = (*-*<>) ПБ). (6-6) По условию производная функции \{х) равна нулю всюду в интервале (а, Ь). Значит, !'(Ц=0 и из формулы (6.6) мы получим Цх)ЧЫ- (ел Равенство (6.7) утверждает, что значение функции Цх) в любой точке х интервала (а, Ь) равно ее значению в фиксированной толке хо. Это и означает, что функция }(х) постоянна всюду на интервале (а, Ь). Теорема доказана. Теорема 6.5 имеет простой геометрический смысл: если касательная в каждой точке некоторого участка кривой у — ]{х) параллельна оси Ох, то указанный участок кривой у—}(х) представляет собой отрезок прямой, параллельной оси Ох. Замечание. Теорема 6.5 будет использована нами в гл. 8 «Первообразная функция и неопределенный интеграл». Во всем остальном гл. 8 является независимой от гл. 6 и 7 и может читаться сразу после гл. 5.
230 Гл. 6. Основные теоремы о дифференцируемых функциях 2. Условия монотонности функции на интервале. В качестве второго следствия формулы Лагранжа рассмотрим вопрос об условиях, обеспечивающих неубывание (невозрастание) функции на данном интервале. Прежде всего напомним определения неубывания, невозрастания, возрастания и убывания функции на данном интервале. 1°. Говорят, что функция !(х) не убывает (не возрастает) на интервале (а, Ь), если для любых точек х\ и х2 из интервала (а, Ъ), удовлетворяющих условию Х\<х2, справедливо неравенство !(х1)^!(х2)({(х1у^(х2)). 2°. Говорят, что функция }(х) возрастает (убывает) на интервале (а, Ь), если для любых точек Х\, х2 из интервала (а, Ъ), связанных условием хх<_х2, справедливо неравенство' /(*,)</(*2) ({(Х1)>1(Х2)). Теорема 6.6. Для того чтобы дифференцируемая на интервале (а, Ь) функция $(х) не убывала (не возрастала) на этом интервале, необходимо и достаточно, чтобы производная этой функции была неотрицательной (неположительной) всюду на этом интервале. Доказательство. 1) Достаточность. Пусть /'(л:)^;0 (^0) всюду на интервале (а, Ь). Требуется доказать, что }{х) не убывает (не возрастает) на интервале (а, Ь). Пусть х\ и х2 — любые две точки из интервала (с, Ъ), удовлетворяющие условию Х\<х2. Функция }(х) дифференцируема (а значит, и непрерывна) всюду на сегменте [х\, х2]. Поэтому к }(х) можно применить на сегменте [х\, Хг\ теорему Лагранжа, в результате чего получим 1(х2)-1{хх) = {х2-х{)Га), (6.8) где х\<1<х2.' По условию /'(|)^0 (^0), х2—Х1>0. Поэтому правая, а значит, и левая части (6.8) неотрицательны (неположительны), что и доказывает неубывание (невозрастание) /(х) на (а, Ь). 2) Необходимость. Пусть функция 1(х) дифференцируема на интервале (а, Ь) и не убывает (не возрастает) на этом интервале. Требуется доказать, что /'(х)^0 (^0) всюду на этом интервале. Так как /(х) не убывает (не возрастает) на интервале (а, Ъ), то эта функция не может убывать (возрастать) ни в одной точке интервала (а, Ь). Значит, в силу теоремы 6.1 производная !'{х) йи в одной точке интервала (а, Ь) не может быть отрицательной (положительной), что и требовалось доказать. Теорема 6.7. Для того, чтобы функция ?(х) возрастала (убывала) на интервале (а, Ъ), достаточно, чтобы производная \'(х) была положительной (отрицательной) всюду на этом интервале. Доказательство проводится по той же схеме, что и доказательство достаточности в теореме 6.6. Пусть хи х2 — любые
§ 4. Некоторые следствия из формулы Лагранжа 231 две точки из интервала (а, Ъ), удовлетворяющие условию х\<х2. Записывая для сегмента [хь хг] формулу Лагранжа, получим равенство (6.8), но на этот раз в этом равенстве /'(|)>0 (<0). Вследствие этого левая часть (6.8) положительна (отрицательна), что и доказывает возрастание (убывание) }(х) на интервале (а, Ь). Замечание. Подчеркнем, что положительность (отрицательность) производной 1'(х) на интервале (а, Ь) не является необходимым условием возрастания (убывания) функции \(х) на интервале (а, Ъ). Так, функция у = х3 возрастает на интервале (—1, +1), но производная этой функции {'(х) = 3х2 не является всюду положительной на этом интервале (она обращается в нуль в точке х = 0). Вообще, легко доказать, что функция 1(х) возрастает (убывает) на интервале (а, Ь), если производная этой функции !'(х) положительна (отрицательна) всюду на этом интервале, за исключением конечного числа точек, в которых эта производная равна нулю. (Для доказательства достаточно применить теорему 6.7 к каждому из конечного числа интервалов, на которых }'(х) строго положительна (отрицательна), и учесть непрерывность /(х) в тех точках, в которых производная равна нулю.) Установленную теоремой 6.7 связь между знаком производной я направлением изменения функции легко понять из геометрических соображений. Поскольку производная равна угловому коэффициенту касательной к графику функции у = 1(х), знак производной указывает, острый или тупой угол с положительным направлением оси Ох составляет луч касательной, лежащей в Еерхней полуплоскости. Если {'(х)>0 всюду на интервале (а, Ь), то всюду на этом интервале луч касательной, лежащей в верхней полуплоскости, составляет с положительным направлением оси Ох острый угол, значит, и кривая у = {(х) иДег вверх всюду на этом интервале (рис. 6.6). 3. Отсутствие разрывов первого рода и устранимых разрывов у производной. Теорема Лагранжа позволяет установить одно замечательное свойство производной. Начнем с доказательства следующей леммы. Лемма. Пусть функция у = [(х) имеет конечную производную }'(х) всюду на интервале (с, с + 8) [на интервале (с—б, с)], где б — некоторое положительное число и, кроме того, имеет правую производную /'(с + 0) [левую производную /'(с—0)]. Тогда, если производная \'(х) имеет в точке с правый предел [левый предел], а; Рис. 6.6
232 Гл., 6. Основные теоремы о дифференцируемых функциях 1- }(х)—Цс) то этот предел совпадает с правой производной /'(с+0) [с левой производной /'(с—0)]. Доказательство. Из существования правой производной /'(с+0) [левой производной /'(с—0)] вытекает существование конечного предела Ит -^-!—1-±-1- х-ю+0 X—С [х-н:—0 Но это означает, что существует равный нулю предел Ит {/(*)-/(с)) = 0 [ Ит {/(*)-/(с)} = 0], ж-»с+0 х-*с—О т. е. функция у = !(х) является непрерывной в точке с справа [слева]. Фиксируем любое х из интервала (с, с+д) [(с—б, с)]. Так как функция у=1{х) дифференцируема (а значит, и непрерывна) всюду на указанном интервале и, кроме того, непрерывна в точке с справа [слева], то для этой функции выполнены на сегменте [с, х] [на сегменте [х, с]] все условия теоремы Лагранжа 6.4. В силу этой теоремы между х и с найдется точка | такая, что справедливо равенство Пх)~-{(с) =П|)/ (6.9) X —С Перейдем теперь в равенстве (6.9) к пределу при х->-с + 0 [при х-*-с—0]. Если производная }'(х) имеет в точке с конечный пра'- вый предел Ит /' (х) [конечный левый предел Нт /' (х)], то х-*с+0 *-»с—0 правая часть (6.9) обязана стремиться к этому пределу (ибо §->с + 0 [1-+с—0] при х-к: + 0 [х->с—0]). Тот же самый предел при х-*-с+0 [х-*-с—0} обязана иметь и левая часть (6.9). Но предел левой части (6.9) при х-^с + 0 [х-+с—0] по определению равен правой производной /'(с + 0) [левой производной /'(с—0)]. Лемма доказана. Применяя только что доказанную лемму в каждой точке с некоторого интервала (а, Ъ), мы придем к следующему утверждению: если функция }(х) имеет конечную производную всюду на интервале (а, Ь), то эта производная !'(х) не может иметь на этом интервале ни точек устранимого разрыва, ни точек разрыва первого рода. В самом деле, если в некоторой точке с интервала (а, Ь) существуют конечные правый и левый пределы функции !'(х), то }'{х) непрерывна в точке с (в силу доказанной нами леммы*). * В силу этой леммы Игл {'(х)= }'(с+0), Нт /'(*)=/'(с—0)., а поскольку Пс+0)=/'(с—0)=Пс), то Ит /'(*)= ,}т /'(*) =/'(Ф Это и означает, что }'(х) непрерывна в точке с.
§ 4. Некоторые следствия из формулы Лагранжа 233 Если же не существует хотя бы одного из пределов Нт /' (х) х->с+0 и 1\т}'(х), то функция {'(х) по определению имеет в точке с Х-Ю—О разрыв второго рода. Итак, производная /'(х) в каждой точке с интервала (а, Ь) либо непрерывна, либо имеет разрыв второго рода. Сформулированное нами утверждение доказано. Приведем пример функции /(х), производная {'(х) которой существует и конечна всюду на некотором интервале и имеет* в некоторой точке этого интервала разрыв второго рода. Рассмотрим на интервале (—1, +1) функцию 1х2соз— при хфО, х О при х — 0. Очевидно, что для любого хф§ производная \''(х) этой функции существует и равна /'(х) = 2х соз (- зт—. Существование X X производной }'(х) в точке д; = 0 непосредственно вытекает из существования предела ,. ДО + Дх) — /(0) ,. А 1 . п Ит м ^—-—!±-и- — 1нп Дхсоз = 0. дх-*0 А* дх-»о Дх Производная {'(х) не имеет в точке х=0 ни правого, ни левого пределов, ибо первое слагаемое 2яеоз— имеет в точке х = 0 X равный нулю предел, а второе слагаемое зт— не имеет в точке X х=0 ни правого, ни левого пределов. (Это было доказано в примере, рассмотренном в п. 3 § 5 гл. 4.) 4. Вывод некоторых неравенств. В заключение покажем, как с помощью теоремы Лагранжа могут быть получены некоторые весьма полезные неравенства. В качестве примера установим следующие два неравенства: |зтх1—втх21< \х1~х21, (6.10) | агсхд Х\—агс1д х21< | х^~х2 \. (6.11) (Здесь под х\ и х2 можно понимать любые значения аргумента.) Для установления неравенства (6.10) применим теорему Лагранжа к функции }(х) =зт х по сегменту [х1г хг]. Получим 8Ш*1—81П 2= (Х1—Х2)}'{1). (6.12) Учитывая, что /'(|)=соз§ и что |соз||^1 для любого |, получим, переходя в (6.12) к модулям, неравенство (6.10).
234 Гл. 6. Основные теоремы о дифференцируемых функциях Для установления неравенства (6.11) следует применить теорему Лагранжа по сегменту [х\, Хъ] к функции 1(х)=агс1&х и учесть, что /'(!) = "^ 1- . 1+1 § 5. ОБОБЩЕННАЯ ФОРМУЛА КОНЕЧНЫХ ПРИРАЩЕНИЙ (ФОРМУЛА КОШИ) В этом параграфе мы докажем теорему, принадлежащую Коши и обобщающую установленную выше теорему Лагранжа. Теорема 6.8 (теорема Коши). Если каждая из двух функций [(х) и §(х) непрерывна на сегменте [а, Ь] и дифференцируема во всех внутренних точках этого сегмента и если, кроме того, производная §'(х) отлична от нуля всюду внутри сегмента [а, Ь], то внутри этого сегмента найдется точка | такая, что справедлива формула ПЬ)-?(а) = Щ) (6 13) ё(Ь)-ё(а) §'(1) ' Формулу (6.13) называют обобщенной формулой конечных приращений или формулой Коши. Доказательство. Прежде всего докажем, что ё(а)ф§(Ь). В самом деле, если бы это было не так, то для функции §(х) были бы выполнены на сегменте [а, Ь] все условия теоремы 6.3 (Ролля) и по этой теореме внутри сегмента [а, Ь] нашлась бы точка | такая, что §'{%)=0. Последнее противоречит условию теоремы. Итак, §(а)ф§(Ь), и мы имеем право рассмотреть следующую вспомогательную функцию: Р (х) = I {х) - / (а) - ^"^ [е (х) - 8 (а)]. (6.14) В силу требований, наложенных на функции /(%) и 8(х), функций Р(х) непрерывна на сегменте [а, Ь] и дифференцируема во всех внутренних точках этого сегмента. Кроме того, очевидно, что Р(а)=Р(Ь). Таким образом, для Р(х) выполнены все условия теоремы 6.3 (Ролля). Согласно этой теореме внутри сегмента [а, Ь] найдется точка | такая, что Г(|)=0. (6.15) Имея в виду, что Р' (х) = /' (х) — '( '~'(а> а'(х),п используя §{Ь)—§(а) равенство (6.15), будем иметь Г®-П.Ь)~П°\8'(Ъ) = 0- (6-16) 8{а)—в(Ь) Учитывая, что §'(|)=т^0, из равенства (6.16) получим формулу Коши (6.13). Теорема доказана.
§ 6. Раскрытие неопределенностей 235 Замечание 1. Формула Лагранжа (6.1) является частным случаем формулы Коши (6.13) при §{х)=х. Замечание 2. В формуле (6.13) вовсе не обязательно считать, что Ь>а. Эта формула верна и при Ь<а. § 6. РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ (ПРАВИЛО ЛОПИТАЛЯ) 1. Раскрытие неопределенности вида —. Будем говорить, что отношение двух функций представляет собой при х-+а неопределенность вида —■ если И О Пт / (х) = Пт § (х) = 0. Раскрыть эту неопределенность — это значит вычислить предел Пт ■ (при условии, что этот предел существует). х^а §(х) Аналогично вводится понятие неопределенности вида — при х^-а + 0 [я-иг—0], при дг-*-оо, а также при х->-+оо [х->—оо].. Следующая теорема дает правило раскрытия неопределенности о вида —■ для предела в точке а. Теорема 6.9 (первое правило Л опит а л я*). Пусть множество Сй представляет собой проколотую 8-окрестность точки а**, функции \(х) и §(х) определены и дифференцируемы на Сц и, кроме того, производная §'(х) не обращается на Сб в нуль. Пусть, далее, Нт/(х) = 1ш1#(*) = 0. (6.17) х-+а х->а Тогда если существует (конечный или бесконечный) предел Пш-^-, (6.18) то существует и предел х-а §(х) причем справедливо соотношение х-,а ё'(х) 1га -^-, (6.19) Пт _М_ = пт Л*)_# (6.20) х-*а В(х) х->а ё'(х) * Гильом Франсуа де Лопиталь — французский математик (1661—1704). ** Напомним, что проколотой 6-окрестностью точки а называется интервал (а—б, а+б) с выкинутой точкой а (при условии, конечно, что б>0).
236 Гл. 6. Основные теоремы о дифференцируемых функциях Теорема 6.9 дает правило раскрытия неопределенности вида О —, сводящее вычисление предела в точке а отношения двух функций к вычислению предела в этой точке отношения производных этих функций. Доказательство. Пусть {х„} — произвольная последовательность значений аргумента, сходящаяся к а и состоящая из чисел отличных от а. Доопределим функции Цх) и §(х) в точке а, положив их равными нулю в этой точке. При таком доопределении функции }(х) и §(х) окажутся непрерывными всюду на множестве С5, дополненном точкой а, т. е. всюду в б-окрестности точки а. В самом деле, непрерывность / (х) и § (х) во всех точках б-окрестности точки а, за исключением самой точки с, вытекает из их дифференцируемости в этих точках, а непрерывность Цх) и §(х) в точке а вытекает из того, что в силу нашего доопределения этих функцих их пределы в точке а равны частным значениям в этой точке. Учитывая, что все элементы последовательности {хл} принадлежат множеству Сц, рассмотрим произвольный сегмент, ограниченный точками а и хп. В силу сказанного выше обе функции }(х) и &(х) будут непрерывными на таком сегменте. Кроме того, функции /(х) и §(х) дифференцируемы во всех внутренних точках указанного сегмента, и производная §'(х) не обращается в этих внутренних точках в нуль. Это дает нам право применить к функциям /(*) и §(х) по указанному сегменту, ограниченному точками а и хп, теорему Коши 6.8. В силу этой теоремы между точками а и хп найдется точка %п такая, что справедливо равенство Я*д)—Дя). = ПЫ /62п 8(хп)-8(а) §'(1п) ' Учитывая, что по нашему доопределению функций }(х) и д(х) справедливы равенства /(а) =§(а) = 0, мы можем переписать соотношение (6.21) в виде Пусть теперь в соотношении (6.22) номер п стремится к бесконечности, тогда лгп->а. Поскольку %п заключено между а и хп, то и 1п->-а при п->оо. В силу существования предела (6.18) и определения предела функции по Гейне правая часть (6.22) имеет предел при я->оо, равный пределу (6.18). Значит, тот же самый предел при га->-оо имеет и левая часть (6.22). В силу произвольности последовательности значений аргумента {хп}, сходящейся к а, и в силу определения предела функции по Гейне существо-
§ 6. Раскрытие неопределенностей 237 вание равного (6.18) предела при п-^оо левой части (6.22) означает существование предела функции (6.19), также равного (6.18). Итак, в пределе из (6.22) при л->-оо мы получаем соотношение (6.20). Теорема доказана. Замечание 1. Правило Лопиталя «действует» не всегда, т. е. предел отношения функций (6.19) может существовать и в случае, когда предела отношения производных (6.18) не существует. Например, при а=0, /(х) = х2соз—,д(х)=&тх существует 1 хг соз— Нх) хх 1 предел Пт ; — Нт = Нт Птхсоз— = 0, в то х-»а д(х) х-*о &'тх х->о «ш* х-*о х 1 1 2х СОЗ + 51П время как предел Пт ' = Нт — не существо §'(Х) х->0 С05Х вует ( в силу того, что не существует предел Птзш—, а предел Х-.0 X Пт (2хсо5 —| существует и равен нулю). *-*о \ х } Замечание 2. Если к условиям теоремы 6.9 добавить требование непрерывности производных /'(я) и §'(х) в точке а, то при условии §'(а)Ф0 соотношение (6.20) можно переписать в виде 1- !(х) '/'(а) Пт —-— - - В(х) 8'(а) Замечание 3. Если производные $'(х) и §'(х) удовлетворяют тем же требованиям, что и сами функции }(х) и §(х), то правило Лопиталя можно применять повторно, т. е. предел отношения первых производных функций 1(х) и §(х) можно заменить пределом отношения вторых производных этих функций. Мы получим при этом, что ,. Цх) ,. /'(*) ,. }"(х) Пт 1У ' = Пт ' ч ' = Пт ■' к ' *-*а ё(х) х->а §'(х) х-*а 8"(х) Пр и мер ы. 1) , - 1 —соз л; .. зтл: 1 Пт = Нт = —. х-*0 х2 *-»о 2х 2 2) Следующий предел вычисляется двукратным применением правила Лопиталя: ,. X — 51П X ,• 1—СОЗ X ' ,. 8Ш X 1 игл = Пт = Нт —■— — —. 1-.0 Xя «о Зд;2 х-*о &х 6
238 Гл. 6. Основные теоремы о дифференцируемых функциях 3) Трехкратным применением правила Лопиталя вычисляется предел ,. х* ,. 4х3 ,. 12л-2 1]т = Ьт = Ьт х*о д:2 + 2созл; — 2 х^-0 2х — 251пл: ж-»о 2—2созх = Пт-^- = 12. *-*0 2_5Ш X Мы рассмотрели вопрос о раскрытии неопределенности вида — для случая предела в точке а. Совершенно аналогичные результаты справделивы и для случаев предела в точке а справа [слева], предела при х-+оог а также предела при х-»-+со [при х^—оо]. Мы сейчас убедимся в том, что теорема 6.9 остается справедливой в каждом из следующих трех случаев: 1) в случае, если в этой теореме в качестве множества С» взять интервал (а, а+б) [соответственно (а—б, а)], а все пределы (6.17) — (6.20) взять при х->*а+0 [соответственно при х-^-а—0]; 2) в случае, если в теореме 6.9 в качестве Сб взять множество всех точек, лежащих вне сегмента [—б, б], а все пределы (6.17) — (6.20) взять при *->оо; 3) в случае, если в теореме 6.9 в качестве множества Сь взять полупрямую (б, +оо) [соответственно (—со, —б)], а все пределы (6.17) — (6.20) взять при х-> + оо [соответственно при х—>—со]. Случай 1. В этом случае остается справедливой вся схема доказательства теоремы 6.9, только вместо последовательности -\хп}, сходящейся к а и состоящей из чисел хп, отличных от а, следует взять последовательность {хп} точек интервала (а, а + б) [соответственно (а—б, а)), сходящуюся к а. Детали рассуждений предоставляем читателю. Случай 2. Пусть функции {(х) и §(х) определены и дифференцируемы всюду вне сегмента [—б, б] при некотором б>0 и производная §'{х) не обращается в нуль вне указанного сегмента. Путь, кроме того, существует предел Игл -^-. (6.18') Сделаем замену переменной I =^— и положим 0(0 = § (—) = = §(х), ру) = [ | — | = /(х). Тогда, очевидно, функции Р(1) и О(^) будут определены и дифференцируемы в проколо-
§ 6. Раскрытие неопределенностей 239 той окрестности точки ^ = 0* и производная не будет обращаться в нуль в указанной проколотой — -окрестности. Кроме того, в силу существования предела (6.18') существует предел г(±)(-±) г" Ьт —Д-^ = Пт —\ , . ; г-т = Пт —)—гг- = 11т Но тогда в силу теоремы 6.9 существует и предел 1 (6.23) Нт-^-=Пт )'!=УШ-№-, (6.2.4) *->о 0(0 <-»о §(— \ *-*■» #(-0 причем справедливо соотношение (6.20), принимающее (в силу (6.23) и (6.24)) вид Нт "■ ; = Пт —^- = пт —*-*- = пт ' . х^х $(х) 1-+о .0(0 г-»о 0'(0 х-хх, §'(х) Рассмотрение случая 2 завершено. Случай 3. В этом случае действует та же замена 1= —, X что и в случае 2, однако на этот раз эта замена сводит рассмотрение предела при х-*-+оо[х-)—сю] к пределу при /-*-0-т-0 [*->-0—0], рассмотренному в случае 1. Детали рассуждений предоставляем читателю. хб Примеры. 1) Вычислить Нт (для любого х-*о+о 1п(1 -4-х) б>1). Этот пример относится к случаю 1. Применяя правило Лопиталя, получим Нт — = Пт . 6* ~ ■ = \\т 6х*-Ч1+х) = 0. *-»о+о 1п(1+х) *-*о+о ( ' \ х-»о+о 1+х 1 1 * Т. е. всюду в интервале —— <;<<с——, за исключением точки < = 0. о о
240 Гл. 6. Основные теоремы о дифференцируемых функциях я / 1 2) Вычислить Пт : (этот пример отно- * $1П X сится к случаю 2). Применяя правило Лопиталя, получим я / 1 г Т~агс(е Г-Т, .. 11ГП ^ — = 11ГП - 8Ш— *~° [СОЗ — 1 + (' -1 — 4") :(■ X2) X \ X 1 = Нт + 1,-^! *-- С08— 2 ' X 2. Раскрытие неопределенности вида . Будем говорить, что оо отношение двух определенных в окрестности точки а функций /(х) " ё(х) представляет собой при х-+а неопределенность вида -22-, оо если Пт/(д;)=оо, Нт § (х) = оо*. (6.25) х~ьа х-*а Для раскрытия этой неопределенности, т. е. для вычисления предела 1пп ———, справедливо утверждение, полностью аналоге ё(х) гичлое теореме 6.9. Теорема 6.9* (второе правило Лопиталя). Пусть множество Св представляет собой проколотую 6-окрестность точки а, функции }(х) и §(х) определены и дифференцируемы на Св и, кроме того, производная §'(х) не обращается на Св в нуль. Пусть, далее, Нт/(*) = оо, Пт^(д;) = оо. (6.17*) х-*а х~>а Тогда, если существует (конечный или бесконечный) предел х->а 8 (х) Ит-^-, (6.19*) х->а ё(х) то существует и предел * Вместо оо в (6.25) может стоять +оо или —оо.
§ 6. Раскрытие неопределенностей 241 причем справедливо соотношение Нт_й^ = ПтЛ^.. (6.20-) 8(х) х-*а 8'(х) Доказательство. 1) Предположим чсначала, что существует конечный предел (6.18*), равный числу Ь. Докажем, что в этом случае существует предел (6.19*), также равный числу Ь. Пусть {хп} — произвольная последовательность значений аргумента, сходящаяся к а либо справа, либо слева *. Так как все элементы этой последовательности принадлежат множеству С6, то, каковы бы ни были два элемента этой последовательности хт и хп, для функций 1(х) и §(х) выполнены на сегменте [хт, х„] все условия теоремы Коши 6.8. По этой теореме между хт и хп найдется точка ^т„ такая, что справедливо равенство _ П*т) п*п)-н*т) _ п*п) п*п) : пи») §(хп)—ё(хт) [е(хп) 1 __ ё(хт) ё'&тп) 8(Хп) Из этого равенства заключаем, что (6.26) 1(Хп) ==_П|тл) ё(хп) Фиксируем теперь произвольное положительное число е. Так 1- !(Х) • I Л как по условию ит -1-1—- = о, а последовательность {хЛ схо- х->а §'(х) дится к а, то для положительного числа — можно фиксировать такой номер т, что для любого номера п, превосходящего т, будет выполняться условие ** -^- = * + а™, где |аял|< ^-. (6.27> 8 (Ътп) 2 Далее заметим, что в силу условий (6.17*) Пт /(хл) = оо, Нт д(хп) = со, а поэтому, поскольку номер т фиксирован, существует равный единице предел 1_8(хт) Пт 1^-=1. п-»оо . 1\хт) П*п) * Т. е. {хп} — такая сходящаяся к о последовательность, у которой либо все *„>а, либо все хп<.а. ** Мы учитываем, что %тп заключено между хт и хп.
242 Гл. 6. Основные теоремы о дифференцируемых функциях ~ е/2 Это означает, что для положительного числа и для I Ь\ + е/2 фиксированного нами номера тп найдется превосходящий его номер п0 такой, что при всех п>п0 1 _ ё(*т) *1*0__ I + ртя> где ,Кп{< _5/2_. (6.28) Цхт) ~х ' ^"^ ^™'^ |б| + 8/2 Из соотнвшений (6.26), (6.27) и (6.28) вытекает, что -*тЧ = (6 + а-«) (! + Р«») = ь'.+ & + а™> Р«» + ««»• Значит, справедливо неравенство -^--Ь|<(|Ь| + |атл|)|рт„| + 1атл|. й(*п) I Учитывая неравенства, стоящие в условиях (6.27) и (6.28), мы получим, что при всех я>/г0 (1М + |атп1)ЧРтв1 + |аяи|<(|6| + ^)-пГГГ^ + -Г = е- \ 2 / 16| + е/2 2 Итак, для произвольного фиксированного нами е>0 мы нашли номер п0>т такой, что при всех п>л0 1^1-Ь <е. #(*л) Это и означает, что предел (6.19*) равен числу Ь и справедливо соотношение (6.20*). Таким образом, для случая конечного предела (6.18*) теорема доказана. 2) Пусть теперь предел (6.18*) равен оо. Тогда, очевидно, предел обратного отношения \\т ■ будет равен нулю и по х->а I {х) только что рассмотренному нами случаю конечного предела (6.18*) мы получим, что* Пт^-=0. х->а /(*) Последнее соотношение с учетом (6.17*) эквивалентно тому, что пт х-*а §(Х) Теорема 6.9* полностью доказана. * Мы учитываем, что для обратного отношения выполнены все условия теоремы 6.9*. В частности, производная }'(х) не обращается в нуль в достаточно малой проколотой б-окрестности точки а. (Это вытекает из существования равного оо предела (6.28*) и из необращения в указанной проколотой ^-окрестности производной ^(х).)
§ 6. Раскрытие неопределенностей 24а Так же как и теорема 6.9, теорема 6.9* остается справедливой, в каждом из следующих трех случаев: 1) в случае, если в этой теореме в качестве множества С« взять интервал (а, а+б) [соответственно (а—б, а)], а все пределы (6.17*) —(6.20*) взять при х-^а + 0 [соответственно при х^>-а—0]; 2) в случае, если в качестве множества Св взять совокупность всех х, лежащих вне сегмента [—б, 6], а все пределы (6.17*) — (6.20*) взять при х->~оо; 3) в случае, если в качестве множества Сь взять полупрямую» (б, + оо) [соответственно (—оо, .—б)], а все пределы (6.17*) — (6.20*) взять при х-> + оо [соответственно при х-э оо]. Обоснование справедливости теоремы 6.9* в этих трех случаях может быть заимствовано из предыдущего пункта. Примеры. 1) 1 ■ 1 Г 1 1 • Ь Х пт ух тх — пт , .., = х-»0+0 х-»0+0 *"*" ' = Пт -. ^ = — 2Пт]Ле =0. *->о+о /__!_\ х—з/2 *-»о+о 2) «-кратным применением правила Лопиталя вычисляется», предел ,. хп ,. пх""1 ,. п(п— 1)х"-2 ,. п\ п Ьт — ит = 1ип — = ...= пт = 0. х-*+а> ех х->+х> ех х-4+<х ех х-»+х ех 3. Раскрытие неопределенностей других видов. Кроме изучен- 0 оо ных выше неопределенностей видов — и , часто встречают- 0 оо ся неопределенности следующих видов: 0-оо, оо—оо, 1°°, 0°°, оо°. Все эти неопределенности сводятся к изученным выше двум неопределенностям путем алгебраических преобразований. Покажем это, например, по отношению к последним трем из указанных выше неопределенностей. Каждая из этих неопределенностей имеет вид у = Цх)1:м, (6.29 > где при х-*-а функция ((х) стремится соответственно к 1, 0 или оо, а &(х) стремится соответственно к оо или 0. Логарифмируя выражение (6.29), получим (считая, что {(х)>0) \пу=§{х)\п}(х). (6.30> Для нахождения предела выражения (6.29) достаточно найти предел выражения (6.30). Заметим, что в любом из трех рассматриваемых случаев выражение (6.30) представляет собой при х-^а неопределенность
244 Гл. 6. Основные теоремы о дифференцируемых функциях вида О-оо. Значит, достаточно научиться сводить неопределенность вида О-оо к неопределенности вида — или . Покажем, О со как это делается. Итак, пусть г=<р(*) 1|>(*), (6.31) причем Птф(л:)=0, Пт гр(х) = оо. х-*а х-м Перепишем (6.31) в виде 2 = ф (х) ф {х) = ф(д:) . (6.32) Очевидно, выражение (6.32) представляет собой при х->а неопределенность вида —. Наша цель достигнута. Примеры. 1) Вычислить Нт хх. Обозначим и=хх. Тогда л->0+0 \пу=х\пх= . Применяя правило Лопиталя, будем иметь X _1_ Нт(1п«/)= Ит "* = Пт —~ =— Нт х = 0. х->0+0 *-»0+0 _!_ х-»0+0 _1_ *->0+0.1 х хг Отсюда ясно, что Пт у = 1. х-ИЧ-0 2) Пт (1 + х2) «*-»-*. Пусть у = (1 + л;2)е ->-* х-#0 Тогда, 1пу = —\ 1п(1+х»). ех — 1 — х Пользуясь правилом Лопиталя, получим 2х 1- /I \ I- 1п(1+*2) ,. 1+х* Пт (Ыу) = Нт ——-—'— = Нт -—С— ж->-0 *-»0 ех — 1 — л: *-»() ех — 1 = нт 2* = пт ж-0 (е*-1)(1+^) х->0 е*(1+я2) + (е* —1)2х Отсюда ясно, что Мту—ег. *-+0
§ 7. Формула Тейлора 245 § 7. ФОРМУЛА ТЕЙЛОРА В этом параграфе мы установим одну из важнейших формул математического анализа, имеющую многочисленные приложения как в математике, так и в смежных дисциплинах. Теорема 6.10 (теорема Тейлора*). Пусть функция }(х) имеет в некоторой окрестности точки а производную порядка** л+1 (п — любой фиксированный номер). Пусть, далее, х— любое значение аргумента из указанной окрестности, р — произвольное положительное число. Тогда между точками а и х найдется точка | такая, что справедлива следующая формула: /(*) = П^)+1^-(х-а) + -^-(х-аГ + ... .... + ^^ (х — аГ + Яа+ах), (6.33) я! где ^=ту-ч^>"+п®- (6,4! Замечание. Так как точка |^ лежит между х и а, то дробь всегда положительна, а поэтому для любого р>0 опреде- *—%■ лена степень *-| Формула (6.33) называется формулой Тейлора (с центром в точке а), а выражение %п+1(х) называется остаточным членом. Как мы увидим ниже, остаточный член может быть записан не только в виде (6.34), но и в других видах. Принято называть остаточный член, записанный в виде (6.34), остаточным членом в общей форме***. Доказательство. Обозначим символом ср(д;, а) многочлен относительно х порядка п, фигурирующий в правой части (6.33), т. е. положим Ф(х,а)=/(а) +Ш-(х-а)+ ^а) (х-а)* + ... + + /(">(а) (х — а)п. (6.35) Далее обозначим символом #„+1(х) разность Яти-1 (*)=/(*)— 4>(х, а). (6.36) * Брук Тейлор — английский математик (1685—1731). ** Отсюда вытекает, что сама функция }(х) и ее производные до порядка п непрерывны в указанной окрестности точки а. *** Эту форму остаточного члена называют также формой Шлемильх а—■ Р о ш а.
246 Гл. 6. Основные теоремы о дифференцируемых функциях Теорема будет доказана, если мы установим, что Яп+1{х) определяется формулой (6.34). Фиксируем любое значение х из окрестности, указанной в формулировке теоремы. Ради определенности будем считать, что х>а. Обозначим через I переменную величину, имеющую областью своего изменения сегмент [а, х], и рассмотрим вспомогательную функцию яр(/) следующего вида: Ч>(')=/(*)-ф(*. Ч—(х-*)рЯ{х), (6.37) где <2(*) = -г^. (6-38) (х — а)Р Подробнее ^(^) можно записать так: ф(/)=/(д)-/(*)--^-(Х-*)-... ..._^^)_(л;_г)л__(х_/)РШх). (6.39) Наша цель — выразить С}(х), исходя из свойств введенной нами ФУНКЦИИ 1|)(/). Покажем, что функция -ф (^) удовлетворяет на сегменте [а, х] всем условиям теоремы 6.3 (Ролля). Из формулы (6.39) и из условий, наложенных на функцию }(х), очевидно, что функция г|)(^) непрерывна на сегменте [а, х] и дифференцируема во всех внутренних точках этого сегмента *. Убедимся в том, что гр(а)=1р(х) = 0. Полагая в (6.37) 1=а и принимая во внимание равенство (6.38), будем иметь ■ф(а) =/(*)— <р(л;, а)—Кп+1(х). Отсюда на основании (6.36) получим /ф(а) =0. Равенство \р(х)=0 сразу вытекает из формулы (6.39). Итак, для функции 1|з(^) на сегменте [а, х] выполнены все условия теоремы 6.3 (Ролля). На основании этой теоремы внутри сегмента [а, х] найдется точка | такая, что 1|»'(1) = 0. (6.40) Подсчитаем производную г|/(0- Дифференцируя равенство (6.39), будем иметь * Это вытекает из того, что из условия существования у функции {({) в окрестности точки а производной порядка п+1 вытекает непрерывность самой функции [(() и всех ее производных до порядка п в указанной окрестности точки а, а потому и на сегменте [а, х]. Далее можно утверждать, что сама функция }({) и все ее производные до порядка п один раз дифференцируемы всюду в указанной окрестности точки а, а потому и всюду внутри сегмента [а, х].
§ 7. Формула Тейлора 247 ...+ /(">(<) п(х — 0"-'— ^(л+')(/) (х — 0" + р(х — ()р~1 (}(х). л! л! (6.41) Легко видеть, что все члены в правой части (6.41), за исключением последних двух, взаимно уничтожаются. Таким образом, ,),' (,) = _ /(я+1)(0 {х_/)» + р.(х _/)^-1.$(*). (6.42) п! Полагая в формуле (6.42) ^=г| и используя равенство (6.40), ПОЛуЧНМ , %,п-р+1 (I {Х) = Л.^12 /(«+!) (2). (6.43) п\р Сопоставляя (6.43) и (6.38), окончательно будем иметь Яя+1 (х) = (х- а)» <2 (х) = (^-У ("~1)га+' /'"+1* (Э- Случай, когда х<а, рассматривается совершенно аналогично. Теорема доказана. Найдем разложение по формуле Тейлора простейшей функции — алгебраического многочлена л-го порядка. Пусть 1(х)=СоХп + С1Хп~1+ ... +Сп-1Х+С„. Тогда, поскольку /<™+1) (х) = 0, остаточный член Яп+1(х)=0 и формула Тейлора (6.33) принимает вид /(*) =/(«) + -^-(х-а) + -1^1-(х-аУ +...+ -^ {х-ау. (Здесь в качестве а можно взять любую точку бесконечной прямой.) Таким образом, формула Тейлора позволяет представить любой многочлен 1(х) в виде многочлена по степеням (х—а), где а — любое вещественное число. Пусть теперь [(х) — произвольная функция, удовлетворяющая_ условиям теоремы 6.10. Постараемся выяснить, какими свойства-* ми обладает многочлен (6.35), фигурирующий в формуле Тейлора для этой функции. Как и выше, будем обозначать этот многочлен символом ф(х, а). Символом ф(п>(х, а) обозначим л-ю производную ф(л:, а) по х. Дифференцируя формулу (6.35) по х и затем полагая х = а, мы получим следующие равенства: Ф(а,а)=/(а), Ф>,а)=/'(а), (6.44) ф(2)(а,а) =/(2> (а), Ф<п> (а,а) = /<"> (а).
248 Гл. 6. Основные теоремы о дифференцируемых функциях Таким образом, фигурирующий в формуле Тейлора для произвольной функции {(х) многочлен ф(х, а) обладает следующим свойством: он сам и его производные до порядка п включительно равны в точке х=а соответственно }(х) и ее производным до порядка п. . § 8. РАЗЛИЧНЫЕ ФОРМЫ ОСТАТОЧНОГО ЧЛЕНА. ФОРМУЛА МАКЛОРЕНА 1. Остаточный член в форме Лагранжа, Коши и Пеано. Выше мы установили формулу Тейлора с остаточным членом в общей форме. Здесь мы установим другие возможные представления для остаточного члена. Два из них могут быть получены в качестве частных случаев из общей формы. Прежде всего несколько преобразуем формулу для остаточного члена (6.34). Поскольку точка 5 лежит между точками а и х, найдется такое число 8* из интервала О<0<1; что |—а = = 0(л:—а). При этом |==а + 0(д:—а), х—\—{х—а)(1—9)- Таким образом, формула (6.34) может быть переписана в виде п , ч (х — а)"+1(1— в)п-Р+1 Ля.пг , й/ м /с лс\ Кп+1 (х) = -* '- ^ '■ /С+1) [а + 6 (х — а)]. (6.45) л! р Рассмотрим теперь два важных частных случая формулы (6.45): 1) р—п+\\ 2) р=\ .(напомним, что в формулах (6.34) и (6.45) в качестве р может быть взято любое положительное число). Первый из этих частных случаев (р = п+\) приводит нас к остаточному члену в форме Лагранжа: Дп+1 (х) = ('~д^1 Р+1) [а + 6 (х - а)]. (6.46) (л + 1)1; Эта форма остаточного члена наиболее употребительна в приложениях. Остаточный член в форме Лагранжа напоминает следующий, очередной член формулы Тейлора, лишь только {п + \}-я производная функции }(() вычисляется не в точке а, а в некоторой промежуточной между а и х точке |=а + 0(х—а). Второй из указанных выше частных случаев (р=1) приводит нас к остаточному члену в форме Коши: #„+1 (х) = ('-дУ^'-е>" р+.) [а + 6 (х - а)]. (6.47) Так как формы Лагранжа и Коши отвечают разным значениям р, а 8 зависит от р, то значения 6 в формулах (6.46) и (6.47) являются, вообще говоря, различными. Для оценки некоторых функций форма Коши является более предпочтительной, чем форма Лагранжа. Обе формы остаточного члена (Лагранжа и * Следует подчеркнуть, что %, а значит, и 0 зависит от р.
§ 8. Формула Маклорена 249 Коши) обычно используются в тех случаях, когда требуется при тех или иных фиксированных значениях х, отличных от а, приближенно вычислить функцию 1(х). Естественно приближенно заменить {(х) многочленом (р(х, а) и численно оценить сделанную при этом ошибку. Наряду с этим встречаются задачи, в которых нас интересует не численная величина указанной ошибки, а лишь порядок ее относительно малой величины (х—а). Для этой цели удобна другая форма записи остаточного члена (так называемая форма Пеано*), к установлению которой мы и переходим. Предположим, что функция {(х) имеет производную порядка п—1 в некоторой окрестности точки а и производную порядка п в самой точке а **. При этих предположениях мы можем рассмотреть многочлен <р(лг, а), определяемый соотношением (6.35). Разность между }(х) и этим многочленом, как и при доказательстве теоремы 6.10, обозначим символом Яп+1(х), т. е. положим Яп+1(х)=!(х)— <р(лг, а). Докажем, что при сделанных нами предположениях для остаточного члена Нп+1{х) справедливо следующее представление ***: /?„+!.(*) =о[(*-а)»]. (6.48) Представление (6.48) принято называть остаточным членом в форме Пеано. Используя установленное в конце предыдущего параграфа свойство многочлена ц>(х, а), выражающееся соотношениями (6.44), мы получим следующие равенства: #п+1 (а) = 0, Я'п+Х (а) = 0, ед (а) = 0, ... , /?<*>, (а) = 0. (6^49) Нам остается доказать, что из равенств (6.49) вытекает представление (6.48). Доказательство того, что из равенств (6.49) вытекает представление (6.48), проведем методом математической индукции. Сначала убедимся в том, что равенства (6.49) влекут представление (6.48) при л=1. При п=\ (6.49) превращаются в два равенства: /?2(а)=0, Д'2(а)=0, из которых сразу же вытекает, что х-*а х — а х~>а х — а * Джузеппе. Пеано — итальянский математик (1858—1932). ** Таким образом, мы подчиняем функцию }(х) требованиям более слабым, чем в теореме 6.10. *** Напомним, что символ о[(х—а)п] обозначает бесконечно малую при х-+а функцию более высокого порядка малости, чем (х—а)п (см. п. 5 § 4 гл. 3).
250 Гл. 6. Основные теоремы о дифференцируемых функциях а это и означает, что Я.2{х)=о{х—а), т. е. при п=\ представление (6.48) вытекает из (6.49). Теперь для завершения индукции предположим, что представление (6.48) вытекает из (6.49) для некоторого номера л>1, и убедимся, что в таком случае представление (6.48) вытекает из (6.49) и для следующего номера п+1. Для номера п+ 1 равенства (6.49) имеют вид Кп+2 (а) = 0, К'п+2(а) = 0, Я^2(а) = 0 Я<$" (а) = 0. (6.49*) Поскольку мы предположили, что для номера п равенства вида (6.49) влекут представление вида (6.48), то, отбросив первое из равенств (6.49*), мы можем утверждать, что остальные равенства К+2 (") = 0, Я<+2 («) = ° ВД> («) = 0 влекут представление ^+2(х)=о[(х-аГ]. (6.50) С другой стороны, применяя к функции Яп+2(х) по сегменту [а, х] теорему 6.4 Лагранжа* и учитывая первое равенство (6.49*), мы получаем, что между а н х найдется точка 5 такая, что Яп+2 (х) = Кп+г (х) - Кп+2 (о) = К+2 (9 (* - а) • (б-5* > Сопоставляя соотношения (6.50) и (6.51) и учитывая, что о[(|—а)п]=о[(х—а)п] (в силу того, что Ь, заключено между а и х), мы окончательно получим, что Кп+2(х) =о[(х—а)п], а это совпадает с представлением (6.48), взятым для номера п+1. Тем самым индукция проведена и вывод представления (6.48) остаточного члена в форме Пеано завершен. В заключение запишем полностью формулу Тейлора с остаточным -членом в форме Пеано: Цх)=1{а)+Я&-(х-а)+ ... + ?("'(а) (х-аУ+о[(х-аГ\. 1! п\ (6.52) 2. Другая запись формулы Тейлора. Часто записывают формулу Тейлора (6.33) в несколько ином виде. Положим в (6.33) а = х0, х—а = Ах и возьмем остаточный член в форме Лагранжа (6.46). При этом х = Хй+Ах, и мы получим /(*, + Ах)-[(х0)=-^Ах +-^1(АхГ + ... * При любом га>1 для /?„+2(л) выполнены все условия применимости теоремы 6.4 Лагранжа.
§ 9. Оценка остаточного члена. Разложение элементарных функций 251 ... + ^Ш {Ах)п + /«"-'>(*.+ ед«) {Ах)п+1 (б53) п\ (п-\- 1)! (Здесь 0 — некоторое число из интервала 0<6<1.) Формула Тейлора (6.53) является естественным обобщением формулы Лагран- жа (6.5) (см. § 3). Формула Лагранжа (6.5) получается из формулы (6.53) в частном случае п = 0. 3. Формула Маклорена. Принято называть формулой Маклорена* формулу Тейлора (6.33) с центром в точке а=0. Таким образом, формула Маклорена дает представление функции в окрестности точки х=0. Запишем формулу Маклорена для произвольной функции с остаточным членом в форме Лагранжа, Коши и Пеано**: /(■*) = /(0) + -Цг"*+ -^Г1-*2 + ■ • ■ + -^-х» + Дл+1 (х), 1! 2! п\ (6.54) где остаточный член имеет вид: 1) в форме Лагранжа ^+1(х)=-^уГР+1>(6х) (0 < 0 < 1); (6.55) 2) в форме Коши К+1(*) = хП+^1-^п] /<«+» (6х); (6.56) 3) в форме Пеано Кп+Лх)=о{Х"). (6.57) (Мы использовали формулы (6.46), (6.47) и (6.48).) Перейдем к оценке остаточного члена в формуле Тейлора — Маклорена, к отысканию разложения по формуле Маклорена важнейших элементарных функций и к рассмотрению различных приложений этой формулы. § 9. ОЦЕНКА ОСТАТОЧНОГО ЧЛЕНА. РАЗЛОЖЕНИЕ НЕКОТОРЫХ ЭЛЕМЕНТАРНЫХ ФУНКЦИИ 1. Оценка остаточного члена для произвольной функции. Оценим для произвольной функции Дх) остаточный член в формуле Маклорена (6.54), взятый в форме Лагранжа (6.55). Предположим, что рассматриваемая нами функция /(х) обладает следующим свойством: существует такое вещественное число М, что для всех номеров п и для всех значений аргумента х из рас- * Колин Маклорен — английский математик (1698—1746). ** При этом предполагается, что [(х) имеет (п+1)-ю производную в окрестности точки х = 0, а для остаточного члена в форме Пеано (п—1)-ю производную в окрестности точки х = 0 и п-ю производную в самой точке х = 0.
252 Гл. 6. Основные теоремы о дифференцируемых функциях сматриваемой окрестности точки х=0 справедливо неравенство |/<»>(х)|<Л*. (6.58) Функцию, обладающую указанным свойством, будем называть функцией, совокупность всех производных которой ограничена в окрестности точки х=0. Из неравенства (6.58) и из того, что 0<6<1 вытекает, что \!^(ех)\<М, (6.59)' и поэтому из формулы (6.55) получим |я , (х)| = |х|П+1 |/<»+>> (6*)|< М 1х]П+1 . 1 ч"+14 " (л + 1)! ' ' («+1)1 Итак, мы получаем следующую универсальную оценку остаточного члена для функции, совокупность всех производных которой ограничена числом М в окрестности точки х = 0: 1^М|<м^-. (6.60) (п+ 1)! Напомним, что при любом фиксированном х 11ГП ——! = 0 га-»оо (П + 1)! (см. пример из п. 4 § 2 гл. 3). Отсюда вытекает, что, выбирая достаточно большой номер п, мы можем сделать правую часть (6.60) как угодно малой. Это дает нам возможность применять формулу Маклорена для приближенного вычисления функций, обладающих указанным свойством, с любой наперед заданной точностью. Приведем примеры функций, совокупность всех производных которых ограничена в окрестности точки х=0. 1) 1(х)=ех, {(п)(х)=ех. Совокупность всех производных этой функции ограничена на любом сегменте [—г, г] (г>0) числом М = ет. 2) /(#)=созл: или 1(х)=&'тх. Совокупность всех производных каждой из этих функций ограничена всюду на бесконечной прямой числом М= 1. 2. Разложение по формуле Маклорена некоторых элементарных функций. А. 1{х) = ех. Поскольку }(пЦх)=ех, /<п>(0) = 1 для любого п, формула Маклорена (6.54) имеет вид еХ==1+Т + ^+--- + ^ + *"+Лх)> (<Ш) где остаточный член в форме Лагранжа равен уЛ+1 Дл+1(*) = -^7уГе9* (0 < в < 1). (6.62)
§ 9. Оценка остаточного члена. Разложение элементарных функций 253 На любом сегменте [—г, г] (г>0) в силу того, что \еВх\<ег, получим следующую оценку для остаточного члена: |^+1(х)|<-^е'. (6.62') Б. }(х) =51П X. ПОСКОЛЬКУ /<"> (X) = 51П ( X + Л— /(«)(0) = 51п (п-± О при четном л, п—\ 2~ при нечетном л, К-1) формула Маклорена (6.54) имеет вид 5шх=х -4+4 - 4 + • • • + (-!)"~ ■ 4-+^1 <*>• <6-63> о! о! 7! п\ где л — нечетное число, а остаточный член в форме Лагранжа равен Кп+1(Х) = (д^ 8111 (8Х + П -|- +я) (0<в<1). Очевидно, что на любом сегменте [—г, г] (г>0) для остаточного члена справедлива следующая оценка: '*^(ж)|<тгш- (6-64> В. 1(х) =созд:. Поскольку /<п) (х) = соз (х + л — /<«>(0)=соз(л-|М =. О при нечетном л, п . пт при четном л, формула Маклорена (6.54) имеет вид соз*= 1_|1+^.__| + ... + (- 1)-Т ^Г + К+Лх)> (6.65) где л — четное число, а остаточный член в форме Лагранжа равен На любом сегменте [—г, г] (г>0) получаем для остаточного члена оценку (6.64). Г. }(х)=\п(1+х). Поскольку • ■/<»>■(*) = (_ 1)"-1 ("7 ^ . /(0) = 0, /<«> (0) = (- 1)»-' (л- 1)1 V1 ~Т X)
254 Гл. 6. Основные теоремы о дифференцируемых функциях формула Маклорена (6.54) имеет вид 1п(1+х) = х--^ + 4--?-+ ■•• + (- I)"-1 — +*„+!(*)• (6-6б) 2 3 4 п Остаточный член на этот раз запишем и оценим и в форме Лагранжа, и в форме Коши: /?„+! (х) = - ;— (в форме Лагранжа). (6.67) л+^ ■ (я-1-1)(]+е*)п+1 . К+Лх) = (~ !)"*"%(|аг)*+1 *(В Ф°рМе К0ШИ)- (6-68> Для оценки функции 1п(1+д:) для значений х, принадлежащих сегменту 0<л;<1, удобнее исходить из остаточного члена в форме Лагранжа (6.67). Переходя в формуле (6.67) к модулям, получим для всех х из сегмента 0<х<1 1 ***(*> 1<7+Т- (6-69> Из оценки (6.69) очевидно, что для всех х из сегмента 0<х<1 Яп+1(х)-^0 при я->-оо. Оценим теперь функцию 1п(1+л:) для отрицательных значений х из сегмента —г<л;<0, где 0</"<1. Для этого будем исходить из остаточного члена в форме Коши (6.68). Перепишем этот остаточный член в виде К+г 00 = (- 1)" (-1^-У -^-. (6.70) л+1У ; Ч ' \ 1 + вх ) 1+6* ^ Принимая во внимание, что для рассматриваемых значений х вы- ражение < 1, и переходя в формуле (6.70) к модулям, будем иметь |#л+1(х)|<-^-. (6.71) Так как г<1, то оценка (6.71) позволяет утверждать, что 11тДп+1 = 0. Д. }(х) = (1+х)01, где а — вещественное число. Поскольку /(")(*) =а(а— 1) ... (а—п+1)(1+х)а-", /сп>(0) = а(а— 1) ... (о—л+1), * Еще раз отметим, что в формулах (6.67) и (6.68) значения 9 являются, вообще говоря, различными.
§ 9. Оценка остаточного члена. Разложение элементарных функций 255 формула Маклорена (6.54) имеет вид (1 +х)а = 1 + -^х- 2! + а(а — 1) ... (а — п + 1) хп + Яп+1 (х), (6.72) где остаточный член в форме Лагранжа равен о(о-1) ...(а-п)(1 + 6х)а_(п+1);сП+1 (0<е< 1). (6.73) К+Л*) = (п+\)\ В частном случае, когда а = п — натуральное число, Яп+\(х) =0, и мы получим известную из элементарного курса формулу бинома Ньютона (1 +х)"=1 + ^-х + п("~1}^2+ ... +хп. 2! (6.74> Если нужно получить разложение не двучлена (1+д;)та, а двучлена (а+х)п, то можно вынести ап за скобку и воспользоваться формулой (6.74). При этом получим (а 4- х)п = ап 1 + * \л = а" ■ ГЯ(Я-1)/М' /х\п 1! \ а У 2! \ а / V а 1+.Л-' * Таким образом, общий случай бинома Ньютона является частным случаем формулы Маклорена. Е. /(х) =агс!^х. Поскольку (п-1)! /<"> (х) = ■51П « (агс!^ х Н 0+*2) 2 (см. пример 5 из п. 2 § 6 гл. 5), то 0 при четном п /<»> (0) = и—1 2 (—1) (п — 1)! при нечетном п, и формула Маклорена (6.54) принимает вид л—1 агсх^х = х -±- + -^-4- + ■ • • + (- 1) 2 — + /?я+2 (х), (6.75) о о 7 Л где п — нечетное число, а остаточный член в форме Лагранжа равен
256 Гл. 6. Основные теоремы о дифференцируемых функциях (п + 2) агс18вл + (я + 2) п+2 ' [1+(вх)2] 2 (0<е<1). Для остаточного члена на любом сегменте [—г, г] (где г>0) справделива оценка \Нп+2Ш<-~-. (6.76) {П ~\- I) Из оценки (6.76) очевидно, что при любом г<=:1 остаточный член Кп+г(х) стремится к нулю при га-э-оо. § 10. ПРИМЕРЫ ПРИЛОЖЕНИИ ФОРМУЛЫ МАКЛОРЕНА 1. Вычисление числа е на ЭВМ. В п. 3 §2гл.З мы ввели числое как предел последовательности |(М ) 1 и получили для е грубую оценку вида 2<е<3. В этом пункте мы укажем, как вычислить число е с любой интересующей нас точностью. Воспользуемся формулой Маклорена (6.61) и оценкой остаточного члена (6.62*), положив в этих формулах х=г=\. Мы получим при этом, что ■1- + -1+... ■ х 1! 2! где е=1 +^г + ~+ ...+^- + /?„+1(1). (6.77) л! , 1^+1(1)1<Т^ТТ7<7-ПТГ. (6-78) Выбирая номер п в (6.77) и (6.78) достаточно большим, мы можем оценить с помощью этих формул число е с любой наперед заданной интересующей нас точностью. Алгоритм вычисления числа е, основанный на формулах (6.77) и (6.78), легко реализуется на электронно-вычислительных машинах. Мы приведем пример вычисления числа е по этим формулам при л = 400. Вычисления велись в МГУ на электронно-вычислительной машине БЭСМ-6 с 600 знаками после запятой. Учитывая возможные ошибки округления, мы отбросили последние 10 знаков и приводим результат вычисления с 590 знаками после запятой *: 2,718281 828459 045235 360287 471352 662497 757247 093699 959574 966967 627724 076630 353547 594571 382178 525166 427427 466391 932003 059921 * Для читателей, знакомых со стандартным алгоритмическим языком АЛГОЛ, на с. 261 приведена записанная на этом языке программа вычислений.
§ 10. Примеры приложений формулы Маклорена 257 817413 596629 043572 900334 295260 595630 738132 328627 943490 763233 829880 753195 251019 011573 834187 930702 154089 149934 884167 509244 761460 668082 264800 168477 411853 742345 442437 107539 077744 992069 551702 761838 606261 331384 583000 752044 933826 560297 606737 113200 709328 709127 443747 047230 696977 209310 141692 836819 025515 108657 463772 111252 389784 425056 953696 770785 449969 967946 864454 905987 931636 889230 098793 127736 178215 424999 229576 351482 208269 895193 668033 182528 869398 496465 105820 939239 829488 793320 36... Таким образом, использование формулы Маклорена дает возможность вычислить е с любой интересующей нас точностью. 2. Доказательство иррациональности числа е. Докажем теперь с помощью той же формулы Маклорена (6.77), что число е является иррациональным. Используем для /?п-нО.) формулу (6.62), положив в ней х=1. Мы получим, что, где 0 — некоторое число, удовлетворяющее неравенствам 0<6<1. Из этих неравенств и из (6.79) вытекает, что /?п+1(1) удовлетворяет неравенствам -_1-_< 7?^, (1 )<_!_. (6.80) (и+1)! (га+1)! Итак, для е справедливо представление (6.77) с неравенствами для 7?и+1(1) вида (6.80). Предполжим теперь, что число е является рациональным, т. е. т его можно представить в виде е = —, где т и я — некоторые целые положительные числа, второе из которых (я), мы, не ограничивая общности, можем считать не меньшим двух*. Выбирая в формуле Маклорена (6.77) номер я равным знаме- т нателю рациональной дроби е = —. мы получим, умножая фор- л мулу Маклорена (6.77) на я!, что каждое из чисел я! е и я! (1 + 4- 1- • • • Н ) является целым, в то время как число я! Кп+1 в силу неравенств (6.80) удовлетворяет условиям—-— < п! Кп+Х (1)< * Если бы в представлении е = — число п оказалось равным единице, то п , \2т мы взяли бы эквивалентное ему представление е = • в знаменателе кото- 2я рого стоит число 2л=2. 9 Зак. 72
258 Гл. 6. Основные теоремы о дифференцируемых функциях < и заведомо не является целым *. Таким образом, при п + 1 умножении формулы Маклорена (6.77) на число п\ мы получаем соотношение п\е-п\ (1 + Л- + ±.±... +-М=л! Я„+,(1), V 1! 2! п\ ] в левой части которого стоит целое число, а в правой части — число, не являющееся целым. Мы получаем противоречие, которое доказывает, что наше предположение о том, что е — рациональное число, является ошибочным. Иррациональность е доказана. 3. Вычисление значений тригонометрических функций. Легко убедиться в том, что значения тригонометрических функций зшл: и созх для х, принадлежащих сегменту 0,-=- 4 полностью определяют значения этих функций для всех х. Поэтому мы можем ограничиться вычислением зтх и созя для значений х из указанного сегмента. Желая обеспечить точность 10~4, положим в формуле (6.63) и в оценке (6.64) я = 5, г — Тогда 4 я |/?№+.2(х)| = |/г7(*)1<-^^-<ю- и поэтому для любого х, удовлетворяющего условию |х|<—, 4 с точностью до 10-4 X3 , Хь 81пх^х И 6 120 Аналогично, полагая в формуле (6.65) и в оценке (6.64) п = 6, л г ——, получим 1^+2(х)| = |^8|<^4^<10"5. ог * Достаточно учесть, что в представлении е = • как уже сказано выше, п 1 3 можно считать гС^2, а'при п^& из неравенств — <п\ Яп+,(\) <. п+1 л+1 вытекает, что 0<л!/?„+1<1, т. е. я!#„+1(1) не является целым.
§ 10. Примеры приложений формулы Маклорена 259 и поэтому для любого х, удовлетворяющего условию |х|< —. с точностью до Ю-5 созд: = 1 —• 2 24 720 4. Асимптотическая оценка элементарных функций и вычисление пределов. Формула Тейлора — Маклорена является мощным средством для вычисления тонких пределов. Из установленного нами в п.2§9 разложения ряда элементарных функций вытекают асимптотические * оценки этих функций, характеризующие их поведение в окрестности точки х=0, т. е. при малых значениях |х| с точностью до членов любой степени п малой величины х. Беря в формулах Маклорена для функций ех, 5'тх, созх, 1п(1+х), (1+х)а и агс!дх остаточный член в форме Пеано, мы получим, что для любого номера п справедливы следующие оценки: уЪ уб у7 .-2Я+1 &тх = х—— + - - + ...+(-!"— + о(х™+2), 3! 5! 71 Ч (2л + 1)1 Ч ' сов*=1—— +———+■... +(— 1)" —+ о(х2п+1), (6.81) 2! 4! 6! 1 ' (2га)! Ч /> \ / 1п(1+х) = х-^- + ^—^--{- ••■ +(~1)п — + о(хп), 2 3 4 п <1 + х)а= 1 Н х + — х2+ ... У ' 11 2! _+«(«-1) ...{*-п+1)хП + уЗ у5 у7 лАп+1 агс1%х = х—^-4-—— — + ... +(— 1)"— + о(х2"+2). 6 35 7 х ' 2п+1 х ' Приведем примеры использования асимптотических оценок (6.81). 1°. Привлекая вторую из оценок (6.81), взятую при п = \, вычислим предел X3 х— — 4-о(х*) —х ,. еж* —ж ,. 3 ; .. Г 1 , . . 1 1 1ш — = Ьт = Нт —-—Но(х) = -• * Формулу или оценку, характеризующую поведение функции Цх) при х-+а (в данном случае при х-+0), называют асимптотической.
260 Гл. 6. Основные теоремы о дифференцируемых функциях 2°. /=Нт — х' 2 Х->0 X" 51П X Исходя из вида знаменателя, можно заключить, что определяющую роль должны играть члены четвертого порядка относительно х (ибо $тх=х+о(х)). Пользуясь (6.81), можно записать: созл;=1— — + — + о(хъ), (6.82) 2! 4! 51пх = д; + о(л:), (6.83) <*=1 +2+—+ о(22). (6.84) х2 Значит, при г— получим _ ^! е 2=1—— + — + о(х4). (6.85) 2 8 Из формул (6.82), (6.83) и (6.85) следует, что х2 х* х2 х* 1 1——-| + о(х*)~ 1 + — — — +а(х) , , .. 2 8 ^ У ' ^2 24 ,. 12 т ^ ' 1 . / = Нт ^ = пт- — х^о х* + о(х*) х-*о 1 + <х(*) — 12 о (х4) (Здесь символом а(д:) мы обозначили величину —-—-. являю- Xх щуюся бесконечно малой при х-*-0.) 1 / х3 > X (5111 X— X) 3°. /= Пт созл; +-:—) . Обозначим через у величину х-»о \ 2 / 1 / х2 \Х[$\ПХ—Х) у = создН . Тогда 1=\\ту. Прологарифмируем и \ 2 / х-^0 (так как при малых л; это выражение положительно): 1 / х2 1пу = 1п сое*-) х (зш х — х) \ 2 , / X2 1п сок х + — Вычислим И т 1 п у = Пт лг-^о ж-*о х(&тх—х)
§ 10. Примеры приложений формулы Маклорена 261 хг %а хз Поскольку со5*=1 1 \-о(хъ), 5шх = х \-о(х*), 1 2 24 6 1п(1+^г+0(х6)) получим Пт1пг/ = Пт ч • х-»6 х-»0 X 4 6 ' Учтем теперь, что ]п(\-\~г)=г+о(г). Из этой формулы / X* \ X* 1п 1 -\ Н о (х5) = ■ + о (х4). Таким образом, х4 1 о (л*) ,. , .. 24 ,. 24 *4 1пп 1п у = пт = пт — — + о(х5) — —+ о(*) о о Отсюда / = Пт у = е Х-+0 Программа вычисления числа е Система Алгол—БЭСМ6, вариант 10—12—69 Ьедт Ш!е|*ег /, с, р, п, т; Ме^ег аггау о, Ь, е [0 :601]; от:=400; таге (39, 50, 39, 10, 0, 0); е[0]: = 1; *[0]:-1; гог / :=1 $4ер 1 ипШ 601 йо аЩ:=Ь М : =е[«]:=0; Гог га : = 1 к4ер 1 ипШ /п Йо Ьедт 1ог /: =0 я4ер 1 ипШ 600 йо аЩ:=ЬЩ; с:-аЩ тог / =0 втер 1 ипШ 600 йо Ьедт Ь [»] : =с~-п; с : = (с—пХЬ т) X 10+а [»+1] епй р:=0 4ог /:=600 з4ер—1 ипШ 0 йо Ъе^т с: =е [»]+*И+р; р:=0 1Т с<10 1Неп е[»']: =е е!зе Ье^п е [«']: =с—10; р : =1 епй епй епа Гог л : = 1 «4ер 1 ипШ 6 йо Ьееш ои!ри4 ('10/', 'гй.', е[0]); !вг »: = 1 $1ер 1 ипШ 590 Ло ои4ри4 ('гсГ, е[с\) епй епй
Глава 7 ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ И ОТЫСКАНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИИ В настоящей главе мы применим разработанный в предыдущих двух главах аппарат дифференциального исчисления для исследования графика функции и для отыскания как локальных, так и глобальных экстремумов функции. § 1. ОТЫСКАНИЕ СТАЦИОНАРНЫХ ТОЧЕК 1. Признаки монотонности функции. Из предыдущей главы мы уже знаем, что изучение вопроса об участках монотонности дифференцируемой функции ?(х) сводится к исследованию знака первой производной этой функции. Для удобства сформулируем еще раз найденные нами в предыдущей главе условия монотонности функции. 1°. Для того чтобы дифференцируемая на интервале (а, Ь) функция }(х) не убывала (не возрастала) на этом интервале, необходимо и достаточно, чтобы производная 1'{х) этой функции была неотрицательна (неположительна) всюду на этом интервале. 2°. Для того чтобы дифференцируемая на интервале (а, Ъ) функция 1(х) возрастала (убывала) на интервале (а, Ь), достаточно, чтобы производная ?'(х) была положительна (отрицательна) всюду на этом интервале. Найдем участки монотонности функции $(х)=хг — Зх2— 4. Производная {'(х)=3х(х — 2) этой -функции положительна при —оо<х<0, отрицательна при 0<К2 и положительна при 2< <#< + °о. Поэтому, согласно сказанному, данная функция 1(х) возрастает на полупрямой (—оо, 0) убывает на интервале (0, 2) и возрастает на полупрямой (2, +°°)- График этой функции изображен на рис. 7.1. 2. Отыскание стационарных точек. Напомним- определения локального максимума и локального минимума функции. Пусть функция 1(х) определена всюду в некоторой окрестности точки с. Тогда эта функция имеет в точке с локальный максимум [или соответственно локальный минимум], если существует такая окрестность точки с, что для всех точек этой окрестности значение /(с) является наибольшим [или соответственно наименьшим] среди всех значений }(х) этой функции.
§ 1. Отыскание стационарных точек 263 У' 0 4 1 8 , \ * —1>й/ 1' » 1 х \у=х3-Зх2-4 Рис. 7.1 Локальный максимум и" локальный минимум объединяются общим названием л о к а л ь н ы и экстремум. В § 1 предыдущей главы нами было установлено необходимое условие экстремума дифференцируемой в данной точке функции. Это условие имеет следующий вид: если функция у = = }(х) дифференцируема в данной точке с и имеет в этой точке локальный экстремум, то }'(с)=0. Вместе с тем в § 1 гл. 6 было указано, что обращение в нуль производной является только необходимым и не является достаточным условием локального экстремума дифференцируемой в данной точке функции. Так, функция }(х)=х3 имеет производную }'(х) = = 3х2, обращающуюся в нуль в точке х = 0, но никакого экстремума в этой точке х=О функция [(х)=х3 не имеет (графи-к. этой функции см. на рис. 6.2). Точки, в которых производная 1'(х) функции 1(х) обращается в нуль, будем называть стационарными точками функции 1{х). Каждая стационарная точка — это точка возможного экстремума функции. Однако сделать заключение о том, что в данной стационарной точке на самом деле имеется экстремум, можно лишь на основании дополнительного исследования, для проведения которого мы должны установить достаточные условия экстремума. Такие условия будут установлены в ближайших трех пунктах. 3. Первое достаточное условие экстремума. Теорема 7.1. Пусть функция 1{х) дифференцируема всюду в некоторой окрестности точки с, и пусть точка с является стационарной точкой функции $(х). Тогда если в пределах указанной окрестности производная 1'(х) положительна (отрицательна) слева от точки с и отрицательна (положительна) справа от точки с, то функция 1(х) имеет в точке с локальный максимум (минимум). Если же в пределах указанной окрестности точки с производная !'(х) имеет один и тот же знак слева и справа от точки с, то экстремума в точке с нет. < Доказательство. 1) Пусть сначала производная 1'(х) в пределах рассматриваемой окрестности положительна (отрица-
264 Гл. 7. Исследование графика функции тельна) слева от с и отрицательна (положительна) справа от с. Требуется доказать, что значение {{с) является наибольшим (наименьшим) среди всех значений /(*) в рассматриваемой окрестности. Обозначим через хо любое значение аргумента из рассматриваемой окрестности, отличное от с. Достаточно доказать, что /(с)-/(хо)>0 (<0). Так как функция 1{х) дифференцируема всюду в рассматриваемой окрестности точки с, то на сегменте, ограниченном точками с и хо, для функции 1(х) выполнены все условия теоремы 6.4 Лагранжа. В силу этой теоремы '/(О-/(*„)=/'и) (с—*о), (7Л> где | — некоторое значение аргумента между с и хо. Поскольку производная /'(?) положительна (отрицательна) при х0<с и отрицательна (положительна) при л;0>с, правая часть (7.1) положительна (отрицательна). 2) Пусть теперь производная 1'(х) имеет один и тот же знак слева и справа от с. Обозначая, как и выше, через хо любое значение аргумента, отличное от с, и повторяя проведенные выше рассуждения, мы теперь докажем, что правая часть (7.1) имеет разные знаки при хо<с и при Хо>с. Это доказывает отсутствие экстремума в точке с. Вытекающее из теоремы 7.1 правило можно кратко сформулировать так: 1) если при переходе через данную стационарную точку с производная }'(х) меняет знак с плюса на минус (с минуса на плюс), то функция {(х) имеет в точке с локальный максимум (минимум); 2) если же при переходе через данную стационарную точку с производная }'(х) не меняет знака, то экстремума в точке с нет. Примеры. 1) Найти точки экстремума функции }{х) = =хг — Зх2 — 4. Поскольку }'(х)=3х{х — 2), то функция }(х) имеет две стационарные точки: х = 0 и х=2. При переходе через точку х=0 производная меняет знак с плюса на минус, а при переходе через точку х = 2 — с минуса на плюс. Следовательно, х= = 0 —точка локального максимума, а х = 2 — точка локального минимума (см. рис. 7.1). 2) Найти точки экстремума функции }(х) = (х — 2)5. Производная }'(х)—5(х— 2)4 обращается в нуль в единственной точке х = 2. Так как }'(х) положительна как слева, так и справа от этой точки, то функция }(х) = (х — 2)5 не имеет точек экстремума. График функции }(х) = (х — 2)5 изображен на рис. 7.2. Иногда вызывает затруднение исследование знака первой производной \'(х) слева и справа от стационарной точки. На этот случай мы укажем другое достаточное условие экстремума в данной стационарной точке с, не требующее исследования знака
§ 1. Отыскание стационарных точек 265 /'(*) в окрестности с, но зато предполагающее существование в точке с отличной от нуля конечной второй производной РЦх). 4. Второе достаточное условие экстремума. Теорема 7.2. Пусть функция {(х) имеет в данной стационарной точке с конечную вторую производную. Тогда функция /(х) имеет в точке с локальный максимум, если /(2)(с)<0> и локальный минимум, если р>(с)>0. Доказательство. Из условия /<2)(с)<0 (>0) и из доказанной в гл. 6 теоремы 6.1 вытекает, что функция 1'{х) убывает (возрастает) в точке с. Поскольку по условию Г(с)=0, то най- ]Н*-2)* Рис. 7.2 Рис. 7.3 дется такая окрестность точки с, в пределах которой /'(х) положительна (отрицательна) слева от с и отрицательна (положительна) справа от с. Но тогда по предыдущей теореме {(х) имеет в точке с локальный максимум (минимум) Замечание. Теорема 7.2 имеет, вообще говоря, более узкую сферу действия, чем теорема 7.1. Так, теорема 7.2 не решает вопроса об экстремуме для случая, когда вторая производная /(2)(я) не существует в точке с, а также для случая, когда р)(с) = 0. В последнем случае для решения вопроса о наличии экстремума нужно изучить поведение в точке с производных высших порядков', что будет сделано нами ниже в п. 5. Примеры. 1) В неподвижную чашку, имеющую форму полушара радиуса г, опущен однородный стержень длины / (рис. 7.3). Предполагая, что 2г<1<4г, найти положение равновесия стержня. Положению равновесия стержня соответствует минимальное значение его потенциальной энергии, т. е. наинизшее положение центра его тяжести О (поскольку стержень является однородным, центр тяжести »его совпадает с его серединой). Обозначая через ОК перпендикуляр к плоскости, на которой стоит чашка,
266 Гл. 7. Исследование графика функции мы сведем задачу к отысканию того положения стержня АВ, при котором отрезок ОК имеет минимальную длину. Прежде всего вычислим длину отрезка ОК как функцию угла а наклона стержня к плоскости, на которой стоит чашка. Пусть прямая йЬ параллельна прямой ОК, а прямая ОС перпендикулярна ОК (О — точка, в которой стержень опирается на край чашки). Из рассмотрения прямоугольного треугольника ЕАБ следует, нто Л.О=.М>со5(1 = 2гсо5а. По условию АО=—.Таким образом, 1 0Ю=АО—АО = 2г сова -• 2 С другой стороны, ИС = ОЬ—ОК~г — ОК. Поэтому из рассмотрения прямоугольного треугольника ОйС следует, что ОС г~ОК зша = ОО / 2г соз а— — 2 Таким образом, длина отрезка ОК, которую мы обозначим /(а), равна /:(а) = гЧ эта—гзш2а. Переходим к отысканию того значения угла а, которое доставляет минимум /(а). (Понятно, что мы можем ограничиться значениями угла а из первой четверти.) Так как /' (а) == — соз а— 2г соз 2 а = — соз а + 2г—4г соз2 а, ' к ' 2 2 то стационарные точки находятся как решения квадратного уравнения 4г соз2 а соз а—2г = 0. 2 Поскольку соз а в первой четверти положителен, то нам пригоден только положительный корень этого уравнения /+К/2 + 128л2__ 16г Хотя по смыслу задачи и ясно, что единственная стационарная точка ао является точкой минимума функции /(а), мы установим это строго при помощи теоремы 7.2. Достаточно убедиться в том, что /(2)(<хо)>0. Поскольку /(2>(а) = зша+4г зт2а = 8лз1па« (соза- 16г
§ I. Отыскание стационарных точек 267 то в силу (7.2) р)(«) = 8/-зш «о (сое «о—^А = ^р"К^+Т28? > 0. Тем самым установлено, что положению равновесия стержня отвечает угол наклона его к плоскости, на которой стоит чашка, определяемый формулой (7.2). 2) Еще раз найдем точки эксртемума функции /(*) = = х3—Ъх2—4. Стационарными точками этой функции, как мы уже видели выше, являются точки х = 0 и х=2. Так как РЦх)=6х — 6, /<2)(0)=— 6<0, /<2>(2)=6>0, то в силу теоремы 7.2 функция /(х) имеет максимум в точке 0 и минимум в точке 2. Экстремальные значения этой функции равны /тах = /(0)=-4, /т!п = 7(2)=—8. б. Третье достаточное условие, экстремума. Установим еще одно достаточное условие локального экстремума, пригодное в случае, когда вторая производная функции в данной стационарной точке обращается в нуль. Теорема 7.3. Пусть п>1—некоторое нечетное число, и пусть функция у = Цх) имеет производную порядка п в некоторой окрестности точки с и производную порядка п+1 в самой точке с. Тогда, если выполнены соотношения ['(с) =/<2)(с) = ... =/<»>.(с) =0, рп+Ц(с)Ф0, (7.3) то функция у = }(х) имеет в точке с локальный экстремум, точнее, локальный максимум при /<и+1)(с)<0 и локальный минимум при ри-п(с)>0. Доказательство. При п=\ теорема 7.3 совпадает с уже доказанной выше теоремой 7.2, так что нужно вести доказательство лишь при нечетном п>3. Пусть нечетное число п удовлетворяет условию п>3, и пусть ради определенности ^и+!)(с)>0. Докажем, что функция у=Цх) имеет в точке с локальный минимум. Так как /<п+1)(с)>0, то, в силу теоремы 6.1 о достаточном условии возрастания функции в точке, функция /(к)(*) возрастает в точке с. Но тогда, поскольку /'п)(с)=0, можно утверждать, что всюду в достаточно малой окрестности точки с функция /!п)(*) отрицательна слева от с и положительна справа от с. Заметив это, разложим функцию /'(х) в окрестности точки с по формуле Тейлора, записав остаточный член в форме Лагранжа (см. § 7 и 8 гл. 6). Мы получим, что для всех х из достаточно малой окрестности точки с между х и с найдется точка | такая, что
268 Гл. 7. Исследование графика функции Р" &) (Х_с)п-1ш В силу соотношений (7.3) написанное разложение принимает вид П*)= ^>(Ю (*—с)"-1. (7.4) ' ч ; (л —1)! Выше мы установили, что для всех х из достаточно малой окрестности точки с производная \{п)(х) отрицательна слева от с и положительна справа от с. Так как | лежит между х и с, то для всех х из достаточно малой окрестности точки с величина /(п)(1) (а значит, в силу нечетности п и вся правая часть (7.4)) отрицательна слева от с и положительна справа от с. Итак, с помощью равенства (7.4) мы доказали, что производная }'(х) для всех х из достаточно малой окрестности точки с отрицательна слева от с и положительна справа от с. В этой ситуации, в силу первого достаточного условия экстремума (т. е. теоремы 7.1), функция у — 1(х) имеет в точке с локальный минимум. Случай /<п+1)(с)<0 рассматривается совершенно аналогично. Те же рассуждения и формула (7.4) в этом случае дают возможность заключить, что функция у — 1(х) имеет в точке с локальный максимум. Теорема полностью доказана. Замечание. Очень важным является требование нечетности числа п в теореме 7.3. При четном ли при сохранении всех остальных условий теоремы 7.3 никакого экстремума у функции у = 1(х) в точке с не будет (см. по этому поводу теорему 7.10 из п. 5 § 3 этой главы). 6. Экстремум функции, недифференцируемой в данной точке. Выше мы рассмотрели вопрос о наличии у функции ((х) экстремума в такой точке с, в которой функция }(х) дифференцируема. В этом пункте мы изучим вопрос о наличии экстремума в точке с у такой функции, которая недифференцируема в точке с, но дифференцируема всюду в некоторой окрестности справа и слева от с и, кроме того, непрерывна в точке с. Оказывается, теорема 7.1 может быть обобщена на случай такой функции. Именно, имеет место следующее утверждение. Теорема 7.4. Пусть функция }(х) дифференцируема всюду в некоторой окрестности точки с, за исключением, быть может, самой точки с, и непрерывна в точке с. Тогда, если в пределах указанной окрестности производная У (х) положительна (отрицательна) слева от точки с и отрицательна (положительна) справа от точки с, то функция $(х) имеет в точке с локальный максимум (минимум). Если же производная }'(х) имеет один и тот же знак слева и справа от точки с, то экстремума в точке с нет.
§ 1. Отыскание стационарных точек 269 Доказательство в точности совпадает с доказательством теоремы 7.1. Достаточно заметить, что условия теоремы 7.4 и на этот раз обеспечивают применимость к Цх) теоремы 6.4 Лагранжа по сегменту, ограниченному точками с и хо, где Хо — любое число из достаточно малой окрестности точки с. Примеры. 1) Найти точки экстремума функции {(х) = \х\. Эта функция дифференцируема всюду на бесконечной прямой, кроме точки х=0, и непрерывна в точке л:=0, причем производная }'(х) равна 1 при х>0 и равна —1 при х<0. Теорема 7.1 к этой функции неприменима, а согласно теореме 7.4 она имеет минимум при х = 0 (рис. 7.4). Рис. 7.4 Рис. 7.5 2) Найти точки экстремума функции у = х11Ъ. Эта функция непрерывна на всей бесконечной прямой и дифференцируема всюду на этой прямой, за исключением точки х = 6. Производная при хфО равна 2 1 3 У * В предыдущем примере производная имела в точке д; = 0 конечный скачок*, на этот раз производная имеет в точке.#,='0 разрыв 2-го рода («бесконечный скачок»). Из выражения для производной заключаем, что эта производная отрицательна слева от точ-* ки х = 0 и положительна справа от этой точки. Значит, теорема 7.4 позволяет утверждать, что рассматриваемая функция имеет- минимум в точке д: = 0 (график рассматриваемой функции изображен на рис. 7.5). * В том смысле, что эта производная хотя и не существовала в точке я = 0, но имела в этой точке правое и левое предельные значения, не совпадающие между собой.
270 1 л. 7. Исследование графика функции 3) Найти точки экстремума функции У = 1(х)- — при хфО, 0 при х=0. Легко видеть, что функция непрерывна на всей бесконечной пря* мой. В самом деле, единственной «сомнительной» точкой яв>- ляется точка х=0, но и в этой точке функция непрерывна, ибо Иту = Иту — 0. х-4-0+0 ж->0—0 Далее, очевидно, что рассматриваемая функция дифференцируема на всей бесконечной прямой, кроме точки х = 0. Всюду, кроме этой точки, производная определяется формулой 1 + е +—е У = \ • Легко видеть, что предел Пт (1 + е _)» Нх)-Н0) Пт- 1 + е' не суще*- ствует, так что функция у = {(х) недифференцируема в точке х=0. Поскольку производная у' положительна и слева, и справа от точки #=0, рассматриваемая функция согласно теореме 7.4 не имеет экстремума в точке х—0, а значит, и вообще не имеет экстремумов. (График рассматриваемой функции изображен на рис. 7.6.) У* 0 1 а г ь X Рис. 7.6 Рис. 7.7 7. Общая схема отыскания экстремумов. Переходим к общей схеме отыскания точек локального экстремума. Предположим, что функция 1{х) непрерывна на интервале* (а, Ъ) и ее производная * Вместо интервала (а, Ь) можно рассматривать бесконечную прямую или открытую полупрямую.
§ 2. Выпуклость графика функции 271 }у{х) существует и непрерывна на этом интервале всюду, кроме конечного числа точек. Кроме того, предположим, что производная /'(*) обращается в Цуль на интервале (а, Ь) не более чем в конечном числе точек. Иными словами, мы предполагаем, что на интервале (а, Ь) имеется лишь конечное число точек, в которых производная }'(х) не существует или обращается в нуль. Обозначим эти точки символами х\, х% ...,хп {а<х\<х2< ... <хп<Ь). В силу сделанных предположений производная ['(х) сохраняет постоянный знак на каждом из интервалов (а, х\), (х\, х2),..., {хп, Ь). Значит, вопрос о наличии экстремума в каждой из точек хи х2,...,хп может быть решен (в утвердительном или отрицательном смысле) при помощи теоремы 7.4. § 2. ВЫПУКЛОСТЬ ГРАФИКА ФУНКЦИИ Предположим, что функция /(х) дифференцируема в любой точке интервала (а, Ь). Тогда, как установлено в п. 3 § 1 гл. 5, существует касательная к графику функции у=Нх)> проходящая через любую точку М(х, ?{х)) этого графика (а<х<Ь), причем эта касательная не параллельна * оси Оу. Определение. Будем говорить, что график функции у = = }(х) имеет на интервале (а, Ь) выпуклость, направленную вниз {вверх), если график этой функции в пределах указанного интервала лежит не ниже (не выше) любой своей касательной. Замечание 1. Термин «график лежит не ниже (или не выше) своей касательной» имеет смысл, ибо касательная не параллельна оси Оу. Рис. 7.8 Рис. 7.9 На рис. 7.7 изображен график функции, имеющий на интервале (а, Ь) выпуклость, направленную вниз, а на рис. 7.8 изображен график функции, имеющий выпуклость, направленную вверх. * Ибо угловой коэффициент ее, равный производной ГС*), конечен.
27 2 Гл. 7. Исследование графика функции Теорема 7.5. Если функция у = 1(х) имеет на интервале (а, Ъ) конечную вторую производную и если эта производная неотрицательна (неположительна) всюду на этом интервале, то график функции у = {(х) имеет на интервале (а, Ь) выпуклость, направленную вниз (вверх). Доказательство. Ради определенности рассмотрим случай, когда вторая производная /<2)(д;)^0 всюду на (а, Ъ). Обозначим через с любую точку интервала (а, Ь) (рис. 7.9). Требуется доказать, что график функции у = ^(х) в пределах интервала (а, Ъ) лежит не ниже касательной, проходящей через точку М(с, {(с)). Запишем уравнение указанной касательной, обозначая ее текущую ординату через У. Поскольку угловой коэффициент указанной касательной равен ^(с), то ее уравнение имеет вид* У-Г(с)=Г(с)(х-с). (7.5) Разложим функцию /(х) в окрестности точки с по формуле Тейлора, беря в этой формуле я=1. Получим у = !(х) = !(с) + -^- (х-с) + -^-(х-с)\ (7.6) где остаточный член взят в форме Лагранжа, \ заключено между с я х. (Поскольку по условию {(х) имеет вторую производную на интервале (а, Ъ), формула (7.6) справедлива для любого х из интервала (а, Ъ); см. §§ 7 и 8 гл. 6.) Сопоставляя (7.6) и (7.5), будем иметь у — У= {&{1) (х—с)2. {7.1} Поскольку вторая производная по условию ^0 всюду на (а, Ь), то правая часть (7.7) неотрицательна, т. е. для всех х из (а, Ъ) справедливо у—У>0, или у>У. Последнее неравенство доказывает, что график функции у — = [(х) всюду в пределах интервала (а, Ь) лежит не ниже касательной (7.5). Аналогично доказывается теорема для случая ^2)(х)^0. Замечание 2. Если /(2>(х.)=0 всюду на интервале (а, Ь), то, как легко убедиться, у = 1{х) —линейная функция, т. е. график ее есть прямая линия. В этом случае направление выпуклости \Можно считать произвольным. Теорема 7.6. Пусть вторая производная функции у = ^(х) непрерывна и положительна (отрицательна) в точке с. Тогда существует такая окрестность ** точки с, в пределах которой график * Уравнение прямой, проходящей через точку М(а, Ь) и имеющей угловой коэффициент к, имеет вид У—Ь=к(х—о) (см. курс аналитической геометрии). ** Напомним, что окрестностью точки с называется интервал, содержащий точку с.
§ 3. Точки перегиба 273. функции у={(х) имеет выпуклость, направленную вниз (вверх). Доказательство. По теореме об устойчивости знака непрерывной функции найдется такая окрестность точки с, в пределах', которой вторая производная р2)(х) положительна (отрицательна). По предыдущей теореме график функции у = Цх) имеет в пределах этой окрестности выпуклость, направленную вниз (вве|)х). Таким образом, направление выпуклости графика функции, полностью характеризуется знаком второй производной этой- функЦии. Пример. Исследовать направление выпуклости графика функции у=хг— Зх2 — 4. Из вида второй производной ^2)(х) = = 6(х—1) вытекает, что эта производная отрицательна при х<\ и положительна при х>\. Таким образом, выпуклость графика функции у — хг— Зх2 — 4 направлена вверх на участке (—оо, 1), и вниз на участке (1, оо) (см. рис. 7.1). § 3. ТОЧКИ ПЕРЕГИБА 1. Определение точки перегиба. Необходимое условие перегиба. Пусть а, Ь и с — некоторые три числа, связанные неравенствами» а<с<Ь. Предположим, что функция у = }(х) дифференцируема на интервале (а, Ь), т. е. существует касательная к графику этой функции во всех точках, абсциссы которых принадлежат интервалу (а, Ь). Предположим, кроме того, что график функции у = = 1{х) имеет определенное направление выпуклости на каждом: из интервалов (а, с) и (с, Ъ). Определение. Точка М(с, Нс)) графика функции у = !(х) называется точкой перегиба этого графика, если существует такая окрестность точки с оси абсцисс, в пределах которой график функции у = {(х) слева и справа от с имеет разные направления выпуклости. На рис. 7.10 изображен график функции, имеющий перегиб в точке М(с, /(с)). Иногда при определении точки перегиба графика функции у = 1(х) дополнительно требуют, чтобы указанный график всюду в пределах достаточно малой окрестности точки с оси абсцисс слева и справа от с лежал по- разные стороны от касательной к этому графику в точке М(с„ )~(с)). Ниже мы докажем, что это свойство будет вытекать из данного нами определения в предположении, что производная /'(*) является непрерывной в с. У О а ь ~в м С (\ X Рис. 7.10
274 Гл. 7. Исследование графика функции Докажем следующие две леммы. Лемма 1. Пусть функция у = }(х) имеет производную {'(х) всюду в Ь-окрестности точки с, причем эта производная непрерывна в точке с. Тогда, если график функции у = {(х) имеет на интервале (с, с+б) выпуклость, направленную вниз [вверх], то всюду в пределах интервала (с, с+б) этот график лежит не ниже [не .выше] касательной к графику, проведенной в точке М(с, 11с)). Доказательство. Рассмотрим последовательность {хп} точек интервала (с, с+б), сходящуюся к точке с. Через каждую точку Мп(хп, ?(хп)) графика функции у = !(х) проведем [касательную к этому графику, т. е. прямую * Уп = 1(Хп)+!'(Хп) (X — Хп). Так как по условию график функции у = {(х) имеет на интервале (с, с+б) выпуклость, направленную вниз [вверх], то для любого зюмера п и любой фиксированной точки х интервала (с, с+б) }(х)-Уп = [(х)-?(хп)-['(хп)(х-хп)^0 [<0]. (*) Из условия непрерывности 1'{х) (и тем более 1(х)) в точке с и из определения непрерывности по Гейне вытекает, что существует предел Ит(Пх)-У,) = ит{Пх)-ПхЛ-Г(ха)(х-хп)} = П-+ао П~*ср = Нх)-Г(с)-Г(с)(х-с). Из существования последнего предела в силу неравенства (*) и теоремы 3.13 из § 1 гл. 3 мы получим, что Нх)-Нс)-Г\с){х-с)>0 [<0]. Если обозначить через У текущую ординату касательной (7.5), проходящей через точку М(с, /(с)), то последнее неравенство можно переписать в виде 1(х)—У^0 [<0]. . Итак, переходя в (*) к пределу при п-^-оо и используя теорему 3.13, мы получим, что {(х)— У^О [^0] для любой фиксированной точки х из интервала (с, с+б), причем У обозначает текущую ординату касательной, проведенной через точку М(с, ?(с)). Лемма доказана. Замечание. Аналогично формулируется и доказывается лемма 1 и для случая, когда график функции имеет определенное направление выпуклости не на интервале (с, с+б), а на интервале (с — б, с). * Мы используем уравнение прямой, проходящей через данную точку М„(х„, }(хп)) и имеющей угловой коэффициент, равный }'(хп). Текущую •ординату этой прямой обозначаем через Уп.
§ 3. Точки перегиба 27& Лемма 2. Пусть функция у=1(х) имеет производную }'(х) в некоторой окрестности точки с, причем эта производная непрерывна в точке с. Тогда, если график функции у=?(х) имеет пере^ гиб, в точке М(с, /(с)), то в пределах достаточно малой 8-окрест- ноОти точки с этот график слева и справа от с лежит по разные стороны от касательной, проведенной через точку М(с, $(с)). Для доказательства этой леммы следует выбрать б>0- настолько малым, чтобы на каждом из интервалов (с — б, с) и. (с, с+б) график функции у = Нх) имел определенное направление выпуклости (это направление будет различным на интервалах (с — б, с) и (с, с+б). После этого для доказательства леммы 2 остается применить лемму 1 к функции у = 1(х) по каждому из интервалов (с —б, с) и (с, с+(б). Лемма 2 позволяет нам установить необходимое условие перегиба графика дважды дифференцируемой в данной точке функции у=1(х). Теорема 7.7 (необходимое условие перегиба графика дважды дифференцируемой функции). Если функция у = 1(х) имеет в точке с вторую производную и график этой функции имеет перегиб в точке М(с, /(с)), то /<2>(с)=0. Доказательство. Пусть, как выше, У— текущая ордината касательной У=1(с)+}'(с) (х — с), проходящей через точку- графика М(с, /(с)). Рассмотрим функцию Р(х)=1(х)-У=!(х)-1(с)-Г(с)(х-с), равную разности $(х) и линейной функции /(с)+/'(с) (х — с). Эта функция Р(х), как и функция 1(х), имеет в точке с вторую производную (а потому имеет первую производную в некоторой окрестности с, причем эта первая производная непрерывна в. точке с). В силу леммы 2 в малой окрестности точки с график функции у = 1(х) лежит слева и справа от с по разные стороны: от касательной, проходящей через точку М(с, }{с)), а потому функция Р(х) в малой окрестности точки с имеет слева и справа; от с разные знаки. Значит, функция Р(х) не может иметь в точке с локального экстремума. Предположим теперь, что ^2)(с)Ф0. Тогда, поскольку Р'(х) = = 1'{х)—1'{с), Я2>(х)=р>(*), выполняются условия р'(с)=0,. Р(2) (с) =5^=0 и функция Р(х) в силу теоремы 7.2 имеет в точке с локальный экстремум. Полученное противоречие доказывает, что» предположение {Р>(с)ф0 является неверным, т. е. р>(с)=0. Теорема доказана. Тот факт, что обращение в нуль второй производной является лишь необходимым условием перегиба графика дважды дифференцируемой функции, вытекает, например, из рассмотрения:
276 Гл. 7. Исследование графика функции графика функции у = х*. Для этой функции вторая производная у"—\2х2 обращается в нуль в точке х = 0, но ее график не имеет перегиба в точке М(0, 0). В силу теоремы 7.7 для отыскания всех точек перегиба графика дважды дифференцируемой функции у = {(х) нужно рассмотреть все корни уравнения ^2> (х) =0. Поскольку равенство нулю второй производной является лишь необходимым условием перегиба, то нужно дополнительно исследовать вопрос о наличии перегиба в каждой точке, Для которой ^2)(л:)=0. Для проведения такого исследования следует установить достаточные условия перегиба, к чему мы и переходим. 2. Первое достаточное условие перегиба. Теорема 7.8. Пусть функция у = ?(х) имеет вторую производную в некоторой окрестности точки с и /(2)(с)=0. Тогда, если з пределах указанной окрестности вторая производная }{2){х) имеет разные знаки слева и справа от с, то график этой функции имеет перегиб в точке М (с, Нс))- Доказательство. Заметим, во-первых, что график функции г/ = /(х) имеет касательную в точке М(с, Дс))> ибо из условий теоремы вытекает существование конечной производной /'(с). Далее, из того, что /(2)(-*0 слева и справа от с имеет разные знаки, и из теоремы 7.5 заключаем, что направление выпуклости слева и справа от с является различным. Теорема доказана. Пример. Найти точки перегиба графика функции !(х) — = хъ — Зх2 — 4. Эту функцию мы неоднократно рассматривали выше (график ее изображен на рис. 7.1). Поскольку /(2)(х) = = 6х — 6 = 6(х—1), то единственное значение аргумента, для которого возможен' перегиб, есть х=\. Этому значению аргумента •соответствует точка графика М(1, —6). Так как }{2)(х) имеет разные знаки при х>1 и при х<1, то точка М(\, —6) является точкой перегиба графика рассматриваемой функции. 3. Некоторые обобщения первого достаточного условия перегиба. Прежде всего заметим, что в условиях теоремы 7.8 можно отказаться от требования двукратной дифференцируемости функции у = 1{х) в самой точке с, сохраняя это требование лишь для точек, лежащих в некоторой окрестности слева и справа от <с. При этом следует дополнительно предположить существование .конечной производной {'(с). Доказательство теоремы 7.8 с указанными изменениями дословно совпадает с доказательством, приведенным выше. Далее можно договориться при определении, точки перегиба ле исключать случая, когда касательная к графику в рассматриваемой точке параллельна оси Оу *. При такой договоренности в теореме 7.8 можно отказаться даже от требования однократной * В этом случае первая производная /'(*) в точке с принимает бесконечное значение.
§ 3. Точки перегиба 277 дифференцируемое™ функции /(х) в самой точке с и сформулировать эту теорему следующим образом: Пусть функция у = Цх) имеет конечную вторую производную всюду в некоторой окрестности точки с, за исключением, быть может, самой точки с. Пусть, далее, функция у=}(х) непрерывна в точке с и график этой функции имеет касательную * в точке М(с, /(с)). Тогда, если в пределах указанной окрестности вторая производная ^2)(х) имеет разные знаки слева и справа от точки с, то график функции у={(х) имеет перегиб в точке М(с, {(с)). Доказательство сформулированного утверждения полностью аналогично доказательству теоремы 7.8. Пример. Найти точки перегиба графика функции у—х1/ъ. Эта функция имеет вторую производную всюду на бесконечной прямой, за исключением точки х=0. В точ- Рис. 7.Ы ке х = 0 рассматриваемая функция непрерывна, но уже первая производная обращается в бесконечность. Однако график функции у = х1/3 имеет в точке (0, 0) касательную, параллельную оси Оу** (рис. 7.11). 2 1 Так как вторая производная г/(2) = -щ- имеет слева и справа от точки лг=в разные знаки, то график функции у = хх,г имеет перегиб в точке (0, 0). 4. Второе достаточное условие перегиба. На случай, когда нежелательно исследование знака второй производной в окрестности точки с, мы сформулируем второе достаточное условие перегиба, предполагающее существование у функции у = 1(х) в точке с конечной третьей производной. Теорема 7.9. Если функция у = {(х) имеет в точке с конечную третью производную и удовлетворяет в этой точке условиям /<2)(с) = 0, р3>(с)Ф0, то график этой функции имеет перегиб в точке М(с,!(с)). Доказательство. Из условия ^(с)Ф0 и из теоремы 6.1 вытекает, что функция }{2Цх) либо возрастает, либо убывает в точке с. Так как ^(2)(с) =0, то и в том, и в другом случае найдется такая окрестность точки с, в пределах которой р?Цх) имеет разные знаки слева и справа от с. Но тогда по предыдущей теореме график функции у = Цх) имеет перегиб в точке М(с, Цс)). * Быть может, параллельную оси Оу. ** Эте вытекает, например, из того, что график обратной функции х=у3 имеет в этой точке касательную х=0.
278 Гл. 7. Исследование графика функции Замечание. Конечно, теорема 7.9 имеет более узкую- сферу действия, чем теорема 7.8. Так, теорема 7.9 не решает вопроса о наличии перегиба для случая, когда у функции у = ?(х) не существует конечной третьей производной, а также для случая, когда. /<3)(с)=0'. В последнем случае для решения вопроса о наличии, перегиба нужно изучить поведение в точке с производных высших порядков, что будет сделано нами ниже (см. п. 5). Возвратимся к примеру, рассмотренному в п. 2, и покажем,, что вопрос о наличии перегиба у графика функции у = х3— 2>х2— 4 может быть решен и при помощи теоремы 7.9. В самом деле, ^(х) = 6=^=0, значит, точка М{\, —6) является точкой перегиба согласно теореме 7.9. 5. Третье достаточное условие перегиба. Установим еще одно> достаточное условие перегиба, пригодное для случая, когда в данной точке с обращаются в нуль как вторая, так и третья производные рассматриваемой функции. Аналогом теоремы 7.3 является следующее утверждение. Теорема 7.10. Пусть п^-2 некоторое четное число, и пусть- функция у — }(х) имеет производную порядка п в некоторой окрестности точки с и производную порядка п+1 в самой точке* с. Тогда, если выполнены соотношения {(*)(с) =Р>(с) = ... =р)(с) =0, ^+»(с)=^0, (7.3*), то график функции у=!(х) имеет перегиб в точке М(с, {(с)). Доказательство. При п = 2 теорема 7.10 совпадает с уже доказанной выше теоремой 7.9, так что нужно вести доказательство лишь для четного п^4. Пусть четное число п удовлетворяет условию л>4, и пусть /(п+1,(с)=^0. Тогда, в силу теоремы 6.1 о достаточном условии возрастания или убывания функции в точке, функция }<п)(х) либо* убывает в1 лючке с (при /(п+1)(с)<0), либо возрастает в этой точке (при ^п+1)(с)>0). Поскольку, кроме того, /<п)(с)=0, то и в, том, и в другом случае всюду в достаточно малой окрестности) точки с функция /(п)(л:) имеет разные знаки справа и слева от с. Заметив это, разложим функцию р2){х) в окрестности точки с по формуле Тейлора, записав остаточный член в форме Лагран- жа (см. § 7 и 8 гл. 6). Мы получим, что для всех х из достаточно малой окрестности точки с между х и с найдется точка | таская, что /и>(х) = Р(с) + ^^ (х—с)+ ... + ^"~!)(с> (х—с)"-34- 4 ' ^ ' 1! ч (я —3)1 у ' (л-2)! У '
§ 4. Асимптоты графика функции 279 В силу соотношений (7.3*) написанное разложение принимает вид Р(*) = Г(п) (I) (я-2)! (х—с)"-2. (7.4*) Выше мы установили, что "для всех х из достаточно малой «окрестности точки с производная 1(п)(х) имеет разные знаки справа и слева от с. Так как % лежит между х и с, то для всех х из достаточно малой окрестности точки с величина Цп)(1) (а значит, в силу четности п и вся правая часть (7.4*)) имеет разные знаки справа и слева от с. Итак, в силу равенства (7.4*) для всех х из достаточно малой окрестности точки с производная /(2)(*) имеет разные знаки справа и слева от с. В силу теоремы 7.8 график •функции г/=/(х) имеет перегиб в точке М(с, }{с)). Теорема доказана. Замечание. Очень важным является требование четности л в теореме 7.10 (сравните эту теорему с теоремой 7.3). Рис. 7.12 и 7.13 иллюстрируют исследование на экстремум и перегиб графи- п+1 четно У 0 1 1 Ых-1Г1 .Г. . /'ЩЩ , х X Рис. 7.12 Рис. 7.13 на функции у=(х— 1)п+1. В силу теорем 7.3 и 7.10 эта функция имеет минимум в точке х=1 при нечетном п, а ее график имеет лерегиб в точке М(\, 0) при четном п (проверьте это сами). § 4. АСИМПТОТЫ ГРАФИКА ФУНКЦИИ Определение 1. Говорят, что прямая х = а является вертикальной асимптотой графика функции у = {{х), если хотя бы один из пределов Пт /(х) или х-*а+0 равен -г-00 или —оо. Пт /(х) х-*а—0
280 Гл. 7. Исследование графика функции Пример. График функции у =— имеет вертикальную асимптоту х=0, ибо Пт —= + °°, Пт—= —оо (рис. 7.14). *->0+0 X х-+0—О X Предположим, далее, что функция у = Их) определена для сколь угодно больших значений аргумента. Ради определенности будем рассматривать сколь угодно большие значения положительного знака. Определение 2. Говорят, что прямая У=кх+Ь (7.8) является наклонной асимптотой графика функции у = = }(х) при ;<:->-+оо, если \(х) представима в виде 1(х) = кх-\-Ь-\-а(х), (7.9) где Пт а(х) = 0. Рис. 7.14 Теорема 7.11. Для того чтобы график функции у=}(х) имел лс—>-+оо наклонную асимптоту (7.8), необходимо и достаточно, чтобы существовали два предела Пт -^- = Ь Пт [/(х) —кх] = Ь. *-*+оо X х-*-{-со (7.10» Доказательство. 1) Необходимость. Пусть график функции у = Цх) имеет при х-^+со асимптоту (7.8), т. е. для /(х) справедливо представление (7.9). Тогда пт Х-»-|-оо Нх) = Пт *-»-|-а> кх + Ь + «(х) = Пт к- «(*) = к, Пт [/(х)—кх]= Пт [6 + а(х)] = 6. 2) Достаточность. Пусть существуют пределы (7.10). Второй из этих пределов дает право утверждать, что разность {(х) — — кх — Ъ является бесконечно малой при д;->-+00- Обозначив эту бесконечно малую через а(х), получим для Дх) представление (7.9). Теорема доказана. Замечание. Аналогично определяется наклонная асимптота и доказывается теорема 7.И и для случая х->—оо. 2х2 4- х Пример. График функции у = ->—- имеет наклоннук>
§ 5. Построение графика функции 281 асимптоту У = 2х—1 и при я-^ + оо, и при х->—со и, кроме того, имеет вертикальную асимптоту х = — 1 (рис. 7.15). В самом деле, Пт д;-»±со /(*) 2л;2 + х х^±«> х(х+1) Пт = 2, Пт [/(*) — 2х]= Пт Х-»±ао Х-*4;ао х+ 1 = —1, Пт /(х)= + оо, Пт 1{х)=—оо. х->—1+0 х^—\—Ь Наряду с линейной асимптотой (7.8) рассматривают также и асимптоты более сложного вида. Говорят, что парабола п-го порядка, определяемая многочленом У=а„хп-\-ап-1Хп-1+... +ахХ-\-а0, (7.8* > является асимптотой графика функции у = \{х) при х—>- + оо, если функция 1(х) представима в виде 1(х) =апхп+ап-1Хп-1+ ... -\-а1Х+а0+а(х), Пт а(л;) = 0. х-*-|-оо Легко доказать следующее ут- тверждение. Для того чтобы график функции У = }(х) имел при л:->-+оо Рис. 7.15 асимптоту (7.8*), необходимо и достаточно, чтобы существовали следующие га+1 пределов: 1 • / М , • [М — апхп Пт Х-»+оо ^ (X) Х->+х> •(а„л:'«+а„_1х"-1+.. , + а^х2) -а^ Пт [/ (х) — (апхп + ап^хп-1 + ... + ахх)] = а0. х-»+°° § 5. ПОСТРОЕНИЕ ГРАФИКА ФУНКЦИИ В этом параграфе мы изложим схему, по которой целесообразно проводить исследование графика функции, и приведем пример, иллюстрирующий эту схему.
282 Гл. 7.' Исследование графика функции Для исследования графика функции у = !(х) целесообразно прежде всего провести следующие исследования: Iе. Уточнить область задания функции. 2°. Выяснить вопрос о существовании асимптот (вертикальных и наклонных). 3°. Найти области возрастания и убывания функции и точки экстремума. 4°. Найти области сохранения направления выпуклости и точки перегиба. 5°. Найти точки пересечения графика функции с осью Ох. По полученным данным легко строится эскиз графика функции. В качестве примера построим график функции х3 — 5х2 + 19х —15 ,_ ..< У- ~2 • (7-П) Будем следовать изложенной выше схеме. 1°. Поскольку функция (7.11) представляет собой рациональную дробь, то она определена и непрерывна всюду на бесконечной прямой, кроме точки х = 0, в которой обращается в нуль знаменатель. 2°. Выясним вопрос о существовании асимптот. Очевидно, что ,. х3 — 5х2 + 19* —15 пт ! =—с», х-»0±0 X2 поэтому график функции имеет вертикальную асимптоту х=0. Далее, из существования пределов ,. Их)'- ,. х3 — 5х2 + 19х —15 пт -!-^-== Пт ! = Х-* ± со X \ Х-*± со X 1- (\ 5 , 19 15 \ ' = 1ип 1 + — . =1, *->±оо \ XX2 X3 I '1-™ хи \ т 1- х8 — 5х2 + 19* — 15— х3 пт [[(х)—х\= пт ! — #-*±со Х-^±со X2 Х-*±со \ XX2) вытекает, что при х-^+оо и при х^>—оо график функции имеет наклонную асимптоту У=х — 5. 3°. Для нахождения областей возрастания и убывания вычислим первую производную функции (7.11): ,__т х3~ 19л: + 30 = (л:4-5)(л-— 2)(х — 3) У х3 ~ х* ' Имея в виду, кроме того, что сама функция и первая производная не,существуют при х = 0, мы получим следующие области сохранения знака у:
§ 5. Построение графика функции 283 Область значения х Знак у' Поведение функции — оо < х < —5 + возрастает —5 < х < 0 — убывает 0 < *<2 + возрастает 2<*<3 — убывает 3 <Х<+оо + возрастает Из приведенной таблицы очевидно, что функция имеет следующие точки экстремума: 1) максимум при х =—5, причем К—5) = —14, 4; 2) максимум при х=2, причем /(2) =2,75;. 3) минимум при х = 3, причем /(3) =2,666.... 4°. Для нахождения областей сохранения направления выпуклости вычислим вторую производную 45 V ,(2) _ 38 \х 38*—90 \ 19 х* Имея в виду, что сама функция и ее производные не существуют в точке х=0, мы получим следующие области сохранения 'знака г/(2): Область значений х Знак г/(2) Направление выпуклости графика — оо < х< 0 — вверх 19 — вверх — <*< + «. 19 + ВНИЗ Из приведенной таблицы очевидно, что график функции имеет перегиб в точке I , / ( ) ). Легко подсчитать, что /^5Х_6968_ V 19 У 2565 5°. Остается найти точки пересечения графика с осью Ох. Эти точки соответствуют вещественным корням уравнения х3 — 5х2+19х — 15 = 0. Легко видеть, что хг — 5х2-\-19х— 15= (х— 1) (х2 — 4*+15). Поскольку квадратный трехчлен х2— 4х+15 не имеет вещественных корней, то рассматриваемое уравнение имеет только один ве-
284 Гл. 7. Исследование графика функции щественный корень х=1, так что график функции пересекает ось Ох в точке (1,0). По полученным данным строим эскиз графика рассматриваемой функции (рис. 7.16). § 6. ГЛОБАЛЬНЫЕ МАКСИМУМ И МИНИМУМ ФУНКЦИИ НА СЕГМЕНТЕ. КРАЕВОЙ ЭКСТРЕМУМ 1. Отыскание максимального и минимального значений функции, определенной на сегменте. Рассмотрим функцию у = }(х), определенную на сегменте [а, Ь] и непрерывную на нем. До сих пор мы занимались лишь отысканием локальных максимумов и минимумов функции. Теперь поставим задачу об отыскании глобальных максимумов и минимумов или, по-другому, об отыскании максимального и минимального значений /(*) на сегменте [а, Ь]. Подчеркнем, что в силу теоремы Вейерштрасса (см. теорему 4.15 из гл. 4) непрерывная функция $(х) обязательно достигает в некоторой точке сегмента [а, Ь] своего максимального (минимального) значения. Ради определенности остановимся на отыскании максимального значения $(х) на сегменте [а, Ь]. Максимальное значение функции }{х) может достигаться либо во внутренней точке Хо сегмента [а, Ь] (тогда оно совпадает с Рис. 7.16 У § с р/|\у 7 X, \У\ 1 X Рис. 7.17 одним из локальных максимумов функции 1(х)) (рис. 7.17), либо на одном из концов сегмента \а, Ь] (рис. 7.18). Отсюда ясно, что для нахождения максимального значения функции Цх) на сегменте [а, Ь] нужно сравнить между собой значения }{х) во всех
§ 6. Краевой экстремум 285 точках локального максимума и в граничных точках сегмента а и Ъ. Наибольшее из этих значений и будет максимальным значением }(х) на сегменте [а, Ь]. Аналогично находится и минимальное значение Цх) на сегменте [а, Ь]. Если желательно избежать исследования стационарных точек, то можно просто сравнить между собой значения 1(х) во всех стационарных точках и в граничных точках а и Ъ. Наибольшее (наименьшее) из этих значений, очевидно, и будет максимальным (минимальным) значением функции 1(х) на сегменте [а, Ь]. Отметим далее, что если ?(х) имеет на сегменте [а, Ь] лишь одну точку локального максимума (или лишь одну точку локального минимума), то без сравнения значения }(х) в этой точке с [(а) и 1(Ь) можно утверждать, что это значение является максимальным (минимальным) значением }(х) на- сегменте [а, Ь\ (рис. 7.19). у=з\п(х2) Рис. 7.19 Рис. 7.20 Аналогичными средствами решается вопрос об отыскании максимального (минимального) значения функции у = ?(х) на интер- вале, полупрямой и бесконечной прямой (при условии, что это значение существует). Может случиться так, что дифференцируемая функция вовсе не имеет на сегменте [а, Ь] (или полупрямой а^А'< + °°) стационарных точек. В таком случае ^(х) является монотонной на. этом сегменте (полупрямой) и ее максимальное и минимальное значения достигаются на концах этого сегмента (на конце этой полупрямой). В качестве примера рассмотрим задачу об отыскании максимального и минимального значений функции у=&\п(х2) на сег- менте —у л<х<— . Поскольку у' = 2х соз (л;2) , указанная функция имеет на рассматриваемом сегменте три стационарные точки: х=0 и х — ± у —.Сравнивая значения функции в указанных точках и на концах сегмента
286 Гл. 7. Исследование графика функции /(0) = 0. /(±]/Г-у) = 1. /(-К*) = Р. \ 2 У 4 2 убедимся в том, что максимальное значение рассматриваемой ■функции равно +1 и достигается в двух внутренних точках сегмента: х±=—1/ — и х*= \ /—, а минимальное значение /л /я рассматриваемой функции равно и достигается на правом тАбя .конце сегмента - . График рассматриваемой функции изображен на рис. 7.20. 2. Краевой экстремум. Пусть функция у = !(х) определена на некотором сегменте [а, Ь]. Будем говорить, что эта функция .имеет в граничной точке Ь этого сегмента краевой максимум (краевой минимум), если найдется левая полуокрестность точки Ь, в пределах которой значение ЦЬ) является наибольшим (наименьшим) среди всех других • значений этой функции. Аналогично определяются краевой максимум и краевой минимум в граничной точке а сегмента [а, Ь]. Краевой максимум и краевой минимум объединяются общим названием: кр а ев ой экстремум. Имеет место следующее достаточное условие краевого экстремума: для того чтобы функция у — [{х) имела в точке Ь сегмента [а, Ь] краевой максимум (краевой минимум), •достаточно, чтобы эта функция имела в точке Ь положительную (отрицательную) левую производную *. (Доказательство •совершенно аналогично доказательству теоремы 7.1.) Из указанного достаточного условия краевого экстремума непосредственно вытекает следующее необходимое условие краевого экстремума функции, имеющей в точке Ь левую производную: для того чтобы функция у = }(х)> обладающая в точке Ь левой производной, имела в этой точке краевой максимум (краевой минимум), необходимо, чтобы указанная производная была неотрицательной (неположительной). Аналогично, для того чтобы функция у = 1(х), обладающая в точке а правой производной, имела в этой точке краевой макси- * Для граничной точки а достаточным условием краевого максимума (краевого минимума) является отрицательность (положительность) правой производной в точке а.
§ 6. Краевой экстремум 287 мум (краевой минимум), необходимо, чтобы указанная производная была неположительной (неотрицательной). 3. Теорема Дарбу*. Определение. Будем говорить, что функция I(х) имеет производную на сегменте {а, Ь\ если ](х) имеет конечную производную в каждой внутренней точке [а, Ь] и, кроме того,, имеет конечные односторонние производные {'(а~\-0) и: Г(ь-0). Очевидно, функция, имеющая производную на сегменте, будет непрерывной на этом сегменте**. Докажем теперь следующую теорему. Теорема 7.12 (теорема Дарбу). Пусть функция }(х) имеет производную на сегменте [а, Ь]. Тогда, каково бы ни было число С, заключенное между А = }'(а-\-0) и В = = /'(6 — 0), на этом сегменте найдется точка § такая, что Г(Ъ) = с Итак, производная при одном только условии существования на сегменте [а, Ь] принимает любое промежуточное значение. Доказательство. Сначала докажем следующее утверждение: если Р(х) имеет конечную производную на [а, Ь] и если Р'(а+0) и Р'(Ь—0) — числа разных знаков, то на сегменте [а, Ь] найдется точка | такая, что Р'(%)=0. Пусть ради определенности Р'(а+0)<0, Р'(Ь—0)>0. Тогда функция Р(х) имеет краевой максимум на обоих концах сегмента [а, Ь]. Но это означает, что минимальное значение Р{х) на сегменте [а, Ь] достигается в некоторой внутренней точке | этого сегмента (функция Р{х) имеет производную, а значит,., и непрерывна на сегменте [а, Ь] и поэтому достигает на этом сегменте своего минимального значения). В указанной точке | функция Р(х) имеет локальный минимум, и поэтому -Р(^)=0. Для доказательства теоремы 7.12 остается положить Р(х) = =}(х)—Сх*** и применить к Р(х) только что доказанное* утверждение. Заметим, что непрерывность производной 1'(х) мы не предполагали. Из теоремы Дарбу сразу же следует доказанное в п. 3 § 4 гл. 6 утверждение об отсутствии у прозводной точек разрыва первого рода. * Гастон Дарбу — французский математик (1842—1917). ** В самом деле, из существования производной /'(*) во внутренних, точках [а, Ь], вытекает непрерывность 1(х) во внутренних точках [а, 6], а из; существования односторонних производных }'(а+0) и }'(Ь—0) вытекает непрерывность справа в точке а и слева в точке Ь. *** При этом мы, не ограничивая общности, предполагаем, что {'(а+0)~ =А<С<.В=!'(Ь—0).
288 Гл. 7. Исследование графика функции ДОПОЛНЕНИЕ Алгоритм отыскания экстремальных значений функции, использующий только значения этой функции Предположим, что функция }(х) задана на сегменте [а, Ь], мы располагаем значениями этой функции в узлах сетки, получающейся при делении сегмента [а, Ь] на 2" равных частей (п=1, 2, 3,...). Ради определенности остановимся на отыскании точки минимума функции 1(х). При этом мы будем предполагать, что выполнены следующие два условия: 1) функция 1{х) имеет на сегменте [а, Ь] единственную точку минимума с; 2) при а<с функция /(х) убывает на сегменте [а, с-] (т. е. убывает слева от точки минимума), а при €<Ъ функция }(х) возрастает на сегменте [с, Ь] (т. е. возрастает справа от точки минимума). Эти условия будут выполнены, например, в случае, если функция }(х) два раза дифференцируема на сегменте \а, Ь], причем /'(с)=0, а !"(х) строго положительна на [а, Ь]. Однако для выполнения указанных двух условий дифференцируемость }{х), вообще говоря, не требуется. Мы сейчас укажем алгоритм построения стягивающейся системы сегментов *, содержащих точку с минимума функции Цх). Остановимся на построении первого сегмента стягивающейся системы, имея в виду, что все последующие сегменты этой системы строятся по тому же принципу, что и первый ее сегмент. Разделим сегмент [а, Ь] при помощи точек а = Хо, Х\, Х2, дез и х4 = Ь на четыре равных частичных сегмента [*ы, х{\ (1=1, 2,3,4). Данный частичный сегмент [х»-ь *,•] договоримся называть сегментом убывания, если /(х,_]) >/(хг), т. е. если значение функции 1(х) на левом его конце строго больше, чем на правом, и соответственно сегментом возрастания, если $(хс-г) <1 (Х{), т. е. если значение функции }(х) на левом конце строго меньше, чем на правом. Так как функция /(-х) имеет на сегменте [а, Ь] единственную точку минимума с, то указанная точка минимума с принадлежит одному из четырех частичных сегментов [х;-ь я,-]. Тот частичный сегмент [хм, х{\, которому принадлежит точка минимума с, можем являться либо сегментом возрастания, либо сегментом убывания, либо, наконец, сегментом, на концах которого функция }(х) имеет равные значения. * Определение и свойства стягивающейся системы сегментов см. в п. 2 Г§ 2 гл. 3.
Дополнение 289 Кроме того, из того, что по условию функция /(х) убывает слева от точки минимума с и возрастает справа от этой точки, вытекает, что если данный частичный сегмент содержит точку минимума с, то любой частичный сегмент, лежащий налево от данного, является сегментом убывания, а любой частичный сегмент, лежащий направо от данного, является сегментом возрастания. Но тогда можно утверждать, что тот частичный сегмент, ко торый содержит точку минимума с, является либо самым правым сегментом убывания, либо самым левым сегментом возрастания, либо, наконец, частичным сегментом, на концах которого 1{х) имеет равные значения. Сформулированное утверждение позволяет указать алгоритм построения первого сегмента [а\, Ъ{\ стягивающейся системы сегментов [ап, Ъп\, каждый из которых содержит точку минимума с. Рассмотрим четыре возможных случая. 1) Среди частичных сегментов [дс»_ь х{\ есть сегмент, на концах которого 1(х) имеет равные значения. В этом случае этот сегмент содержит точку минимума с*, и мы примем его за первый сегмент [а\, Ь\] стягивающейся системы. 2) Все частичные сегменты '[хг-г, х{\ (1=1, 2, 3, 4) являются сегментами убывания. В этом случае точка минимума с лежит на самом правом из частичных сегментов, т. е. на сегмецте [хз, х'*\, и мы примем этот сегмент за \а\, Ь\\. 3) Все частичные сегменты [дс»_1, х{\ {1=1, 2, 3, 4) являются сегментами возрастания. В этом случае точка минимума лежит на самом левом из частичных сегментов, т. е. на сегменте [хо, х\\, и мы примем этот сегмент за [аи Ь\\. 4) Среди частичных сегментов имеются как сегменты убывания, так и лежащие правее их сегменты возрастания. В этом случае можно утверждать, что точка минимума с лежит на объединении самого правого сегмента убывания и самого левого сегмента возрастания. Указанное объединение двух частичных сегментов мы и примем за [аи Ь\\. Тем самым мы указали однозначный алгоритм построения первого сегмента [аи Ь\\ из стягивающейся системы сегментов {[ап, Ьп}}. Второй сегмент этой системы [аг, Ь2] строится, отправляясь от [а,, Ь\], точно так же, как сегмент [аь Ь\\ строился, отправляясь от [а, Ь]. По такому же принципу, отправляясь от л-го сегмента [ап, Ьп], строится («+1)-й сегмент стягивающейся системы. * Точка минимума с не может лежать налево от частичного сегмента [Х{-и х'г], на концах которого {(х) имеет равные значения, ибо при этом указанный сегмент является сегментом возрастания. Аналогично предположение о том, что с лежит направо от частичного сегмента, на концах которого 1(х) имеет равные значения, привело бы к тому, что этот частичный сегмент является сегментом убывания. 10 Зак. 72
290 Гл. 7. Исследование графика функции Ясно, что построенная система сегментов {[ап, Ь„]} является стягивающейся и, поскольку все эти сегменты содержат точку минимума с, обе последовательности правых концов {Ьп} этих сегментов и левых их концов {ап} сходятся к точке минимума с. Аналогично строится алгоритм отыскания точки максимума функции /(х), имеющей на сегменте [а, Ь] единственную точку максимума с при условии, что эта функция возрастает слева от с при с>а и убывает справа от с при с<Ь.
Глава 8 ПЕРВООБРАЗНАЯ ФУНКЦИЯ И НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ В этой главе мы изучим операцию, обратную по отношению к операции дифференцирования, т. е. займемся вопросом о восстановлении функции по известной производной этой функции. Изучение этого вопроса естественно приведет нас к понятиям первообразной и неопределенного интеграла (уже упоминавшимся в гл. 1). Откладывая до гл. 9 вопрос о существовании первообразной, и неопределенного интеграла, мы изучим в настоящей главе важнейшие методы интегрирования и выделим классы функций, неопределенные интегралы от которых выражаются через элементарные функции. § 1. ПОНЯТИЕ ПЕРВООБРАЗНОЙ ФУНКЦИИ И НЕОПРЕДЕЛЕННОГО ИНТЕГРАЛА 1. Понятие первообразной функции. К числу важных задач механики относятся задача об определении закона движения материальной точки по заданной ее скорости, а также задача об определении закона движения и скорости материальной точки по заданному ее ускорению *. Эти задачи приводят к математической проблеме отыскания функции по заданной производной этой функции. Переходим к рассмотрению этой проблемы. Определение. Функция Р(х) называется первообразной функцией (или просто первообразной) для функции 1(х) на интервале (а, Ь), если в любой точке х интервала (а, Ъ) функция Р(.х) дифференцируема и имеет производную Р'.(х), равную !(х). Замечание. Аналогично определяется первообразная для функции {(х) на бесконечной прямой и на полупрямой**. * Вместо ускорения материальной точки можно задать действующую на эту точку силу (ибо согласно второму закону Ньютона сила определяет ускорение этой точки). ** Можно ввести первообразную для функции }(х) и на сегменте [а, Ь], понимая под такой первообразной функцию Р(х), имеющую производную Р'(х) в любой внутренней точке сегмента [а, Ь], равную 7(*)> и, кроме того, имеющую правую производную Р'(а+0), равную ^(а+0), и левую производную У7'(6—0), равную /(6—0). 10*
292 Гл. 8. Первообразная функция и неопределенный интеграл Примеры. 1) Функция Р{х) = У\—х2 является первообразной для функции /(•*:) = -т== на интервале (—1, у 1 — лс2 + 1), ибо в любой точке х этого интервала ("^1—х2)'= —-~~ 2) Функция Р(х)=&тх является первообразной для функции }(х)=со&х на бесконечной прямой (—с», +оо), ибо в каждой точке х бесконечной прямой (зт^'—сазх. 3) Функция Р(х)=\пх является первообразной для функции /(х) = — на открытой полупрямой х>0, ибо в каждой точке х л этой полупрямой (1пд;)' = —. х Если Р(х) является первообразной для функции }(х) на интервале (а, Ь), то, очевидно, и функция Р(х)+С, где С — любая постоянная, является первообразной для функции /(*) на интервале (а, Ь). Естественно, возникает вопрос, как связаны между собой различные первообразные для одной и той же функции }(х). Справедлива следующая основная теорема. Теорема 8.1. Если Р\(х) и Р%(х) — любые первообразные для функции }(х) на интервале (а, Ь), то всюду на этом интервале р1 (х) —Р2 {х) = С, где С — некоторая постоянная. Другими словами, две любые первообразные для одной и той же функции могут отличаться лишь «а постоянную. Доказательство. Положим Ф(д:) = Р\(х) — р2(х). Так как каждая из функций Р\(х) и Р2(х) дифференцируема на интервале (а, Ъ), то в силу теоремы 5.5 и функция Ф(х) дифференцируема на интервале (а, Ь), причем всюду на этом интервале Ф' (х) = /У (*) -/У (х) = / (х) -I (х) = 0. В п. 1 § 4 гл. 6 была доказана теорема 6.5 следующего содержания: если функция Ф(л:) дифференцируема всюду на интервале (а, Ь) и если всюду на этом интервале Ф'(д;)=0, то функция Ф(х) является постоянной на интервале (а, Ь). Из этой теоремы-получим, что Ф(х)=р1(х)—Р2{х) = С = сопзг, что и требовалось доказать. Следствие. Если Р(х) — одна из первообразных функций для функции /(х) на интервале (а, Ь), то любая первообразная Ф(х) для функции ((х) на интервале (а, Ь) имеет вид Ф (х) = Р (х) + С, где С — некоторая постоянная. 2. Неопределенный интеграл. Определение. Совокупность всех первообразных функций для данной функции }(х) на интервале (а, Ь) называется неопределенным интегралом от функции {(х) (на этом интервале) и обозначается символом \Н*)йх. (8.1)
§ 1. Понятие первообразной и неопределенного интеграла 2 93 В этом обозначении знак I называется знаком интеграла, выражение Цх)а'х — подынтегральным выражением а сама функция }(х) — подынтегральной функцией. Если Р(х) — одна из первообразных функций для функции }(х) на интервале (а, Ь), то в силу следствия из теоремы 8.1 11(х)11х = Р(х) + С, (8.2) где С — любая постоянная *. Подчеркнем, что если первообразная (а значит, и неопределенный интеграл) для функции }(х) на интервале (а, Ь) существует, то подынтегральное выражение в формуле (8.1) представляет собой дифференциал любой из этих первообразных. В самом деле, пусть Р{х) — любая из первообразных для функции /(*) на интервале (а, Ь), т. е. для всех х из интервала (а, Ъ) Р'{х)=1{х). Тогда 1(х)йх=Р'{х)йх=йР. Примеры. 1) ( ~* йх = ]/\— хг + С на интервале ^ V 1-х2 — 1<л:<1, ибо функция Р(х) = У\—хг является одной из первообразных для функции /(*) = г~Х на указанном интер- V1 — *а вале. 2) ] соя х их = 81я х + С на всей бесконечной прямой —оо<д:< + оо, ибо функция Р(х) = зт х является одной из первообразных для функции /(#)=созл; на бесконечной прямой. В этой главе мы не будем заниматься вопросом о существовании первообразных (или неопределенных интегралов) для широких классов функций. Здесь мы лишь отметим, что в § 4 гл. 9 будет доказано, что для всякой функции !(х), непрерывной на интервале (а, Ь), существует на этом интервале первообразная функция (и неопределенный интеграл). 3. Основные свойства неопределенного интеграла. Прежде всего отметим два свойства, непосредственно вытекающие из определения неопределенного интеграла: Г. й^{х)йх = 1{х)а'х. 2°. §аР(х) = Р(х) + С. Свойство 1° означает, что знаки а" и 5 взаимно сокращаются в случае, если знак дифференциала стоит перед знаком интеграла. Свойство 2° означает, что знаки $ и й взаимно сокращаются и в случае, если знак интеграла стоит перед знаком дифференциала, но в этом случае к Р(х) следует добавить произвольную постоянную С. * Равенство (8.2) следует понимать как равенство двух множеств.
294 Гл. 8. Первообразная функция и неопределенный интеграл Для установления свойства 1° достаточно взять дифференциал от обоих частей формулы (8.2) и учесть, что йР(х) = —Р'{х)йх=1{х)йх. Для установления свойства 2° достаточно в левой части (8.2) воспользоваться равенством йР(х)=1(х)йх. Следующие два свойства обычно называют линейными свойствами интеграла: 3°. Ш{х)±ё{х)]с1х=\1{х)йх±\ё{х)с1х. --[/-■■- 4°. Ъ[А1{х)]йх=А$1(х)йх (Л=сопз1). Подчеркнем, что равенство в формулах 3° и 4° имеет условный характер: его следует понимать как равенство правой и левой частей с точностью до произвольного постоянного слагаемого (это понятно, поскольку каждый из интегралов, фигурирующих в формулах 3° и 4°, определен с точностью до произвольного постоянного слагаемого). Поскольку две первообразные для одной и той же функции могут отличаться лишь на постоянную, то для доказательства свойства 3° достаточно доказать, что если Р{х) — первообразная для 1(х), а О(х) — первообразная для §{х), то функция Р(х)±С(х) является первообразной для функции $(х)±(у{х). Это последнее непосредственно вытекает из того, что произвольная (алгебраической) суммы функций равна сумме производных этих функций, т. е. [Р(х)±0(х)У = Р'(х)±6'(х)=[(х)±ё(х). Аналогично доказывается свойство 4°. В этом случае используется равенство [АР(х)]'=АР'(х) =А^(х). 4. Таблица основных неопределенных интегралов. В гл. 5 мы получили таблицу производных простейших элементарных функций (см. § 5 гл. 5), представляющую собой вычислительный аппарат дифференциального исчисления. Каждая формула этой таблицы, устанавливающая, что та или иная функция Р(х) имеет производную, равную }(х), приводит нас, в силу определения неопределенного интеграла, к соответствующей формуле интегрального исчисления Ц{х)йх=Р{х)+С. Таким путем мы приходим к следующей таблице основных неопределенных интегралов: 1°. $0.Ох=С. 2°. )\-йх=х+С. х*Ох = - + С (а=^ —1). а + 1 3Ч 4°. Г-^. = 1п|*|+С (Хф0). 5°. §ахйх = ах/\па + С (0<аф\), ^ехйх = ех + С.
§ 1. Понятие первообразной и неопределенного интеграла 295 6°. Г 81пхйх= —СО&Х+С. 7°. \ со8хс1х=81пх + С. 8°. Г_^_=Г(1 + 18«х)йх = ^ соз2х ^ = {§х+С (хф— +пп, л = 0, ±1, ... од Г _*!_ = Г (1 + ст§2 х) их = —с1§ х + С(хф пп, где п = 0, ±1, ...). 10-. Г •* ГагеаЬх+С, (_1<ж<1). Л у^1 —х2 I —агссозх+С ив Г <** [агсс{§л:+С, ' } 1+*2 I—агс^х+С. 12°. 1 —==- = 1п|х + К*2±1| + С (в случае знака «минус» либо х > 1, либо л;< — 1). " " 1 + х 13°. ^ _йх_ = ^ 1п 1 — х2 2 + С (\х\ф1). К этим формулам можно присоединить и соответствующие формулы для гиперболических функций: 14°. §5Ъхйх = сЪх + С. 15°. ] сЪхЛх = 5Ъх + С. 16°. Г_^1_ = Шх+С. ^ еЬ2* 17°- (,-?- = -с*^ + С (*^0)- ^ $ь2 х Сделаем замечания в отношении формул 4°, 12° и 13°. Формула 4° справедлива для любого интервала, не содержащего значения х=0. В самом деле, если х>0, то из формулы (1пх)'= — х Г их заключаем, что I = 1пх+С, , а если х<0, то из формулы [1п(—х)]'=— заключаем, что I = 1п(—х) + С. Тем самым х ^ ,х формула 4° оправдана для любого хфО. Формулы 12° и 13° занимают исключительное положение в нашей таблице, ибо эти формулы не имеют аналогов среди формул таблицы производных. Однако для проверки формул 12° и 13° достаточно убедиться в том, что производные выражений, стоящих в правых частях этих формул, совпадают с соответствующими подынтегральными функциями.
296 Гл. 8. Первообразная функция и неопределенный интеграл Наша ближайшая цель — дополнить таблицу неопределенных интегралов основными приемами и методами интегрирования. Но прежде чем приступить к реализации этой цели, сделаем одно важное замечание. В гл. 1 и 4 мы ввели понятие элементарной функции, а в п. 5 § 5 гл. 5 установили, что производная любой элементарной функции представляет собой также элементарную функцию. Иными словами, мы установили, что операция дифференцирования не выводит нас из класса элементарных функций. Отметим сразу же, что с операцией интегрирования дело обстоит иначе. Можно доказать, что интегралы от некоторых элементарных функций уже не являются элементарными функциями. Примерами таких интегралов могут служить следующие: 1°. \е~"'йх. ] соз (х2) их. ] &\&{хг)йх. С-^- (0<хф\). [^±йх (хфЩ. '2° 3° 4° 5° 6° ^^а-х. X Каждый из указанных интегралов представляет собой функцию, не являющуюся элементарной. Указанные функции не только реально существуют *, но и играют большую роль в различных вопросах физики. Так, например, интеграл 1°, называемый интегралом Пуассона или интегралом ошибок, широко используется в статистической физике, в теории теплопроводности и диффузии, интегралы 2° и 3°, называемые интегралами Френеля, широко применяются в оптике. Часто встречаются в приложениях и интегралы 4°—6°, первый из которых называется интегральным логарифмом, а последние два — интегральными косинусом и синусом. Для всех перечисленных новых функций (интеграла Пуассона, интегралов Френеля, интегрального логарифма, синуса и косинуса) составлены таблицы и графики. Ввиду важности для приложений эти функции изучены с такой же полнотой, как и простейшие элементарные функции. Вообще, следует подчеркнуть условность понятия простейшей элементарной функции. * Мы уже отмечали, что в § 4 гл. 9 будет доказано существование неопределенного интеграла от любой непрерывной функции. Существование интегралов 1°—6° обеспечивается непрерывностью подынтегральных функций.
§ 2. Основные методы интегрирования 297 § 2. ОСНОВНЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ 1. Интегрирование заменой переменной (подстановкой). Замена переменной — один из самых эффективных приемов интегрирования. Этот прием базируется на следующем элементарном утверждении. Пусть функция 1=ц>(х) определена и дифференцируема на множестве {х}, представляющем собой либо интервал, либо открытую полупрямую, либо бесконечную прямую, и пусть символ {}} обозначает множество всех значений этой функции. Пусть, далее, для функции §(^ существует на множестве {О первообразная функция 0({), т. е. §8{*)М = 0(/) + С. (8.3) Тогда всюду на множестве {х} для функции #[<р(*)]ф'(*) существует первообразная функция, равная 0[ср(л:)], т. е. 1В [<Р (х)] ср' (х) их = С [Ф (х)\ + С. (8.4) Для доказательства этого утверждения достаточно воспользоваться правилом дифференцирования сложной функции * -р{С[<р(х)]> = С'[ф(*)]ф'(*) ах и учесть, что по определению первообразной С'(?) =§■(/). Предположим теперь, что нам требуется вычислить интеграл 11(х)йх. (8.5) В ряде случаев удается выбрать в качестве новой переменной такую дифференцируемую функцию 1=у(х), что имеет место равенство /(*)=*[ф(*)]ф'(*). (8-6) причем функция %{1) легко интегрируется, т. е. интеграл \8(1)йх = 0Ц) + С просто вычисляется. Доказанное выше утверждение позволяет нам написать следующую формулу для интеграла (8.5): |/(*)Лс=е[ф(*)] + с. Этот прием вычисления интеграла (8.5) и называется интегрированием путем замены переменной. Конечно, такой прием применим не ко всякому интегралу. Кроме того, следует подчеркнуть, что выбор правильной подста- * См. п. 1 § 3 гл. 5.
298 Гл. 8. Первообразная функция и неопределенный интеграл новки в значительной мере определяется искусством вычислителя. Приведем ряд примеров, иллюстрирующих только что изложенный метод. 1°. Вычислить $&'тЗхЛх. Для вычисления этого интеграла следует сделать простейшую подстановку ^=3x, й1=Мх. В результате этой замены получим I 8шЪхс1х= 1 — &\х\1сИ= соа^ + С = созЗх-ьС. С <1х 2°. 'Вычислить I . Этот интеграл вычисляется посред- Л х + а ством замены 1=х+а, й1=йх. При этом получим С-^-=Г —=1п|<|+С = 1п|х + а|+С (хф—а). ^ х+а ^ I 3°. Вычислить ] еС05* 81п х их. Легко видеть, что этот интеграл вычисляется путем замены ^=еозх. В самом деле, при этом 6,1= —ътхйх и ^08* 81ах6х = — ]"е*Ш= —е' + С= — еС03*+С. 4°. Вычислить I ——ах. Для вычисления этого интег- ^ 1 + хг рала удобна замена ?=агсг.дл:. В самом деле, при такой замене *=-Л-.я Г <»°*««у» ах=[*»й=^+с= (агс1б*)101 +с. 1+Л"2 ^ 1+*2 3 101 101 5°. Вычислить интеграл /=5 (5л:—6)1984е?х. Конечно, раскрывая подынтегральную функцию по формуле бинома Ньютона, мы можем свести этот интеграл к сумме тысячи девятисот восьмидесяти пяти табличных интегралов. Но гораздо проще сделать замену переменной 1=Ъх—6, д,1=Ъйх, в результате которой мы получим, что 1 = ± [рт &=*?- + € = <5'-6)Ш6 +С. 5 0 9925 9925 Г их 6°. Вычислить \ . Чтобы усмотреть ту замену, посред- 0 соз л: ством которой может быть взят этот интеграл, перепишем его в виде Г ^х _ Г соьхйх _ С аххЛх ^ соз х ^ соз2 х ,] 1 — зт2 х' После этого понятно, что следует положить 1=&'тх> <Н=со&хс1х.
§ 2. Основные методы интегрирования 299 1+< 1 — I + С = 1п В результате получим (_&Г_Л_ = _1_1п 3 созх ^ 1— I2 2 С ж5 < 7°. Вычислить интеграл интеграла удобна замена 1={Ъх)5, (Н=4374х5с1х. В результате указанной замены получим хъйх *(т+т)+с- Для вычисления этого Г х^1 ) (ЗхГ хъЛх + 1 4374 I Л . агс1§/ р_ агс1§(3*)6 ^ 8°. Вычислить ] (*2 + а; *2+1 4374 ' " 4374 . Для вычисления этого интегра- 1)3/2 ла оказывается удобной тригонометрическая подстановка й= М = агс!§—, х = а\%1, их —а- . а соз2^ В результате этой подстановки интеграл принимает вид их I Г ... 1 л 51п I I (х2 + а2)3'2 *8' а2 ^ со$1сИ :,+ С=- ■ с. а2 /1 + *§2 * ' ~ а2 Ух2 + а2 9°. Вычислить —-—^-щ-. Здесь оказывается удобной подстановка / = аге8ш—, х = аь\п1, йх = а<х>ъЩ. При этом а г ах _ _1_ г <и _ \% ( 3 (а1_^3/2 -.а,}" „2 __ ^3/2 1 ЗШ С05 I с= а2 /1—з!п2* а2 /а2—х2 10. Вычислить I "1/ а**. Для вычисления этого интеграла оказывается удобной замена 2/ = агссо8—, #=асоз2/ а ' д.х= —2а 51П 21 сИ. Мы получим IV- ^^-ах=—4а[созЧсИ'- а—х ^ Ла я-^ч- соз2Л а7 = —2а/ —2а соз2/а7 = — 2а/—азШ2/ + С =
300 Гл. 8. Первообразная функция и неопределенный интеграл 2. Интегрирование по частям. К числу весьма эффективных методов интегрирования относится метод интегрирования по тетям. Этот метод основывается на следующем утверждении. Пусть каждая из функций и(х) и ю(х) дифференцируема на множестве {х} и, кроме того* на этом множестве существует первообразная для функции V(x)и/(x). Тогда на • множестве {х} существует первообразная и для функции и(x)V'(x), причем справедлива формула | и (х) V' (х) йх = и (х) V (х) — | V (х) и' (х) их. (8.8) Замечание. Определение дифференциала и свойство инвариантности его формы позволяют записать формулу (8.8) в виде 1 и &ъ — и (х) V (х)—\ьйи. (8.9) Для доказательства сформулированного утверждения запишем формулу для производной произведения функций и(х) и ь{х) [и(x)V(x)У = и(x)V'(x)+и'(x)V(x). (8.10) Умножим равенство (8.10) на их и возьмем интеграл от обеих частей полученного таким путем равенства. Так как по условию для всех х из множества {х} существует \ V (х) и'(х) а'х и '\[и(x)V(x)]^а'x=и(x)V(x) + С (см. свойство 2° из п. 3 § 1), то для всех х из множества {л:} существует и интеграл ]и{х)ь'(х)(1х, причем справедлива формула (8.8) (или (8.9)). Формула (8.9) сводит вопрос о вычислении интеграла \ийу к вычислению интеграла \ьйи. В ряде конкретных случаев этот последний интеграл без труда вычисляется. Вычисление интеграла 1ийу посредством применения формулы (8.9) и называют интегрированием по частям. Заметим, что при конкретном применении формулы интегрирования по частям (8.9) очень удобно пользоваться таблицей дифференциалов, выписанной нами в п. 6 § 4 гл. 5. Переходим к рассмотрению примеров. 1°. Вычислим интеграл 1=]хп\г\.хйх (пФ—1). Полагая их и = \пх, а"у = хпйх и используя формулу (8.9), получим а"и=- . х хп+1 V — - п+ 1 *"+1 , 1 С п * *"+1 / = ^— 1пх — Г хМх = -^— [\пх — \ +С. п+\ . л+1 ^ п+1 \ п+1 / 2°. Вычислим, далее, интеграл /= $х агс!дхйх. Полагая и-- = агс т,д*, (IV = хйх и используя формулу (8.9), будем иметь
§ 2. Основные методы интегрирования 301 /.= ■ , 6.x хг аи = , ь = —, 1 + х2 2 1 + ха -агс^л; ах =— агс1:§х & 2 ,] 1 + х2 2 2 ^ 2 ^ 2 ,) 1 + х2 2 2 _ * _~2 3°. Вычислим интеграл 1=^х2 со&хйх. Сначала применим формулу (8.9), полагая и = х2, йь=<:о$,хйх. Получим йи = 2хйх, у = ъ\пх, / = л:2з1па:—2\х зт хйх. Для вычисления последнего интеграла еще раз применим формулу (8.9), полагая на этот раз и = х, йь = ${пхйх. Получим йи — йх, ь=—сов х, 1=х2&тх + + 2х С05 X—2^С05 хйх = (х2—2) 51П Х + 2х С05 Х+С. Таким образом, интеграл 1х2созхс1х вычислен нами посредством двукратного интегрирования по частям. Легко понять, что интеграл $хпсо5хс1х (где п — любое целое положительное число) может быть вычислен по аналогичной схеме посредством л-кратного интегрирования по частям. 4°. Вычислим теперь интеграл / = $еа*со5 Ъхйх (а=соп51, 6 = соп51). Сначала применим формулу (8.9), полагая и=еах, (IV = соз Ъхйх. Получим йи=аеахйх, V = , т вах 51П ЬХ я еах Ш Ьх их. Для вычисления последнего интеграла еще раз применим формулу (8.9), полагая на этот раз и—еах, йю = &\пЪхйх. Получим . „„ . С05 Ьх аи = аеахах, V— , ъ / = Ь—-еакоо$Ьх-* /. (8.11) Ь Ь2 б2 ^ ' Таким образом, посредством двукратного интегрирования / по частям мы получим для интеграла / уравнение первого порядка (8.11). Из этого уравнения находим ' • а сок Ьх + Ь 51П Ьх а? + 1 -е?х Практика показывает, что большая часть интегралов, берущихся посредством интегрирования по частям, может быть разбита на следующие три группы: 1) К первой группе относятся интегралы, подынтегральная функция которых содержит в качестве множителя одну из следующих функций: 1пх, атс&'тх, агссозд;, агс1§лг, (агс!§д;)2, (агссозд;)2, 1пф(х),... — при условии, что оставшаяся часть по-
302 Гл. 8. Первообразная функция и неопределенный интеграл дынтегральной функции представляет собой производную известной функции (см. рассмотренные выше примеры 1° и 2°). Для вычисления интегралов первой группы следует применить формулу (8.9), полагая в ней и(х) равной одной из указанных выше функций *. ' 2) Ко второй группе относятся интегралы вида \{ах+Ь)пХ Хсо5(сх)с1х, 1(ах + Ъ)п&Щсх)йх, 1{ах+Ъ)песхйх, где а, Ь, с — некоторые постоянные, п — любое целое положительное число (см. рассмотренный выше пример 3°). Интегралы второй группы берутся путем и-кратного применения формулы интегрирования по частям (8.9), причем в качестве и(х) всякий раз следует брать (ах+Ь) в соответствующей степени. После каждого интегрирования по частям эта степень будет понижаться на единицу. 3) К третьей группе относятся интегралы вида \еах ътЪхд.ху \еах%тЪхйх, \ зт (\пх)йх, ] соз (\пх)йх, ... (см. рассмотренный выше пример 4°). Обозначая любой из интегралов этой группы через / и производя двукратное интегрирование по частям, мы составим для / уравнение первого порядка. Конечно, указанные три группы не исчерпывают всех без исключения интегралов, берущихся посредством интегрирования по частям. Приведем примеры интегралов, не входящих ни в одну из перечисленных трех групп, но вычисляемых при помощи формулы (8.9). С х Ах 5°. Вычислим интеграл /= \ . Этот интеграл не входит ^ зш2х ни в одну из упомянутых трех групп. Тем не менее, применяя формулу (8.9) и полагая в ней и=х, (IV = ■, получим 8Н12Х йи=йх, V——с1цх, соз х их 1 = -хс*§х + \ с!§хих = — хс*§х + \ ■ зюх = — хс^х+ Г^5'"^ = — хс[%х+ 1п|б1пх| +С ^ 51П X (в проведенных рассуждениях хфпп, где я=0, ±1...). « Г хйх Аналогично вычисляется интеграл I . ^ соз2 х 6°. Вычислим, наконец, весьма важный для дальнейшего интеграл К}, = Г———^-, где а = сопз!:, Я=1, 2, ... **. Этот интеграл также не входит ни в одну из упомянутых выше трех групп. * В случае, если подынтегральная функция содержит в качестве множителя {атс1цх)а, (агссоз*)2,,.., формулу интегрирования по частям (8.9) придется- применить дважды. ** Для обозначения переменной под знаком этого интеграла нам удобнее писать букву I.
§ 3. Классы функций, интегрируемых в элементарных функциях 303 Для вычисления этого интеграла установим для него рекуррент- ю формулу, сводящую вопрос о вычислении Кг. к вычислению 1. Можно записать (при Кф\): а2 } {Р + а?)% ~ а2 3 (Я + а2)я _ ~ а2 3 (*2 — а2)*'-1 2а2 ] (г2+а2)х_а2 Х~' 2а2 3 (Р + а2)х ' Для вычисления последнего интеграла применим формулу интегрирования по частям (8.9), полагая в ней и = 1, &о= %• Получим йи = сН, V— г—ь Кх=~#К*-х + 2о*(Ь-1)(**+*«)я'-1 2а2(Х-1) ^_1" Из последнего равенства получим рекуррентную формулу 2Х — 3 2а2 (Я, — 1)(^ + а2)Л-1 ' а2 (2Х — 2) Убедимся в том, что рекуррентная формула (8.12) позволяет вычислить интеграл Кх для любого К=2, 3,.... В самом деле, интеграл К\ вычисляется элементарно: I **=»_.,. Л.. -Ы-1+ -,1 ~ ^-" (8Л2) После того как вычислен интеграл К\, полагая в формуле (8.12) Я=2, мы без труда вычислим К%- В свою очередь, зная /Сг и полагая в формуле (8.12) Х = 3, мы без труда вычислим Кг- Продолжая действовать таким образом дальше, мы вычислим интеграл К% для любого натурального X, выразив его через элементарные функции. § 3. КЛАССЫ ФУНКЦИЙ, ИНТЕГРИРУЕМЫХ В ЭЛЕМЕНТАРНЫХ ФУНКЦИЯХ Хотя, как уже отмечалось выше, неопределенный интеграл от элементарной функции может не выражаться через элементарные функции, все же существуют широкие классы функций, неопределенные интегралы от которых выражаются через элементарные функции. Изучению таких классов функции и будет посвящен настоящий параграф. Наиболее важным среди указанных классов функций является класс рациональных др о б е й, представляющих собой, от-
304 Гл. 8..Первообразная функция и неопределенный интеграл ношение двух алгебраических многочленов. Изучению класса ра^ циоиальных дробей, мы предпошлем краткие сведения о -комплексных числах и об алгебраических многочленах. 1. Краткие сведения о комплексных числах. Два вещественных числа х и у мы будем называть у по р яд оченной парой, если указано, какое из этих чисел является первым, какое $то- рым. Упорядоченную пару вещественных чисел х и у будем обозначать символом (х, у), записывая на первом месте первый элемент этой пары. Комплексным числом называется упорядоченная пара (х, у) вещественных чисел, первое из которых х называется1 действительной частью, а второе у — мнимой частью этого комплексного числа, В случае, когда мнимая часть у равна нулю, соответствующую пару (х, 0) Договариваются отождествлять с вещественным числом х. Это позволяет рассматривать множество всех вещественных чисел как подмножество комплексных чисел. Два комплексных числа 2\=(х\, у\) и.г2=(х2, у2) называются равными, если Х\ — х2, У\ — у2. Говорят, что комплексное число г = (х, у) равно нулю, если х = 0 и у = 0. Определим операции сложения и умножения комплексных чисел. Поскольку вещественные числа являются подмножеством комплексных чисел, эти операции должны быть , определены так, чтобы в применении к двум вещественным числам они приводили к уже известным нам из § 4 гл. 2 определениям суммы и произведения вещественных чисел. Суммой двух комплексных чисел г\= (хи у\) и г2= (х2, г/г) назовем комплексное число г вида г={хх + х2, г/1 + г/2). (8.13) Произведением двух комплексных чисел г\ = (Х\, у г) и %2= (х2, г/г) назовем комплексное число г вида г=(х1х2—у1у2у Хху2+х2у\). (8.14) Легко проверить, что сумма и произведение комплексных чисел обладают теми же самыми свойствами, что и сумма и произведение вещественных чисел. Именно справедливы следующие свойства: 1°. г\ + гг = г2 + г\ (переместительное свойство суммы). 2°. (х\ + г2) +23 = 21+ (г2 + г3) (сочетательное свойство суммы). 3°. 2+(0, 0)=2 (особая роль числа (0, 0)). 4°. Для каждого числа 2= (х, у) существует противоположное ему число г' = (—х, —у) такое, что г+г'= (0, 0). 5°. 21'22 = 22-21 (переместительное свойство произведения). 6°. (2Г22)-23 = 21-(г2-23) (сочетательное свойство произведения). 7°. 2-(1,0) =2 (особая роль числа (1,0)).
§ 3. Классы функций, интегрируемых в элементарных функциях 30& 8°. Для любого комплексного числа г=(х, у), не равного нулю1, существует обратное ему число г'= ( , ) та- \ *2 + уг х1 + у2) кое, что г-г'= (1, 0). 9°. (21+22)-2з = г1-2з+22-23 (распределительное свойство произведения относительно суммы). Свойства 1°—9° позволяют утверждать, что для комплексных чисел полностью сохраняются все правила элементарной алгебры,, относящиеся к арифметическим действиям и к сочетанию равенств. Кроме того, эти свойства полностью решают вопрос о вычитании комплексных чисел как о действии, обратном сложению, и о- делении комплексных чисел как о действии, обратном умножению. Разностью двух комплексных чисел 21 = (х\, у\) и г2 = = (*2, #г) называется такое комплексное число г, которое в сумме с г2 дает 2\. С помощью свойств Г—4° элементарно устанавливается существование и единственность разности двух любых, комплексных чисел *. Легко проверить, что разностью двух комплексных чисел. ^1= (хь у{) и 2г= (х2, г/г) является комплексное число г вида 2=(*1—х2\ г/1—г/2)- (8.15) Частным двух комплексных чисел г\ = (хи у() и г2= {х2, у2), второе из которых не равно нулю, называется такое комплексное- число г, которое при умножении на г2 дает г\. С помощью» свойств 5°—8° легко установить, что единственным частным двух указанных комплексных чисел является комплексное число гг. вида / *1*2 + У1У2 х2у1--х1у2 \ [ х\+У22 ' х22+,у22 ]' В операциях с комплексными числами особую роль играет число, представимое парой (0, 1) и обозначаемое буквой /. Умножая эту пару самое на себя (т. е. возводя ее в квадрат), получим в силу определения произведения комплексных чисел (0, 1) • (0, 1) = (-1,0) = -1, т. е. Р= -1. Заметив это, мы можем любое комплексное число 2= (х, у), представить в виде 2= (х, у) = (д,0) + (0, у) = (х, 0) + (у, 0) • (0, 1) =х+1у. В дальнейшем мы будем широко использовать для комплексного числа 2= (х, у) представление г=х+1у. Это представление-. * Для этого следует дословно повторить рассуждения, проведенные в гл. 2: для случая разности двух вещественных чисел (см. п. 1 § 5 гл. 2).
306 Гл: 8. Первообразная функция и неопределенный интеграл и рассмотрение I в качестве множителя, квадрат которого равен — 1, позволяет производить операции с комплексными числами так же, как они производятся с алгебраическими многочленами. Комплексное число г = (х, —у)—х—1у принято называть сопряженным по отношению к комплексному числу г= (х, у) = = х + (у. Очевидно, что комплексное число равно нулю тогда и только тогда, когда равно нулю сопряженное ему число *. Для геометрического изображения комплексных чисел удобно пользоваться декартовой прямоугольной системой координат. При этом комплексное число г= (х, у) изображается или точкой М с координатами (х, у), или вектором ОМ, идущим из начала координат в точку М. При таком способе изображения сложение и вычитание комплексных чисел сводится к сложению и вычитанию соответствующих им векторов (это понятно из формул (8.13) и (8.15)). Непосредственно из определения (8.14) произведения двух комплексных чисел вытекает следующее утверждение: произведение двух (а значит, и нескольких) комплексных чисел равно нулю тогда и только тогда, когда обращается в нуль хотя бы один из сомножителей. В самом деле, если хотя бы одно из чисел г\—(х\, у{) и .22= (х2, //г) равно (0,0), то из (8.14) очевидно, что 2=2122 = = (0,0). Если, наоборот, 2=2^2 равно (0,0), то из (8.14) следует, что Х1Х2 #1#2 = "> /О -1Л'\ #1*2 + ЧУ* = °. и если 2^(0,0), т. е. х\ + у\Ф0, то (8.14') представляет собой однородную систему двух уравнений относительно двух неизвестных х2 и г/2 с определителем х\ + у\, отличным от нуля. Такая система имеет только тривиальное решение, т. е. 22=(#2, г/г) = = (0,0). Непосредственно из определения (8.14) произведения двух комплексных чисел вытекает и еще одно утверждение: комплексное число, сопряженное к произведению двух (а значит, и нескольких) комплексных чисел, равно произведению комплексных чисел, являющихся сопряженными к каждому из сомножителей, т. е. ЙГ) = гй. (8.14") * Ибо система < эквивалентна системе < ( г/ = 0 {—у = 0.
§ 3. Классы функций, интегрируемых в элементарных функциях 307 С помощью правила перемножения комплексных чисел (8.14) легко проверяется, что как правая, так и левая часть (8.14") равна одному и тому же комплексному числу {х\Х2—У\У2* —Х1У2—Х2У1). 2. Краткие сведения о корнях алгебраических многочленов. 1°. Алгебраическим многочленом я-й степени называется выражение вида 1{г)=сагп+с1г"-1 + ... + Сп-1г+сп, (8.16} где г=(х, у)=х+ьу — переменное комплексное число, а СоУ С\,..., с„ — некоторые постоянные комплексные числа, первое из которых отлично от нуля. Как известно, любой алгебраический многочлен степени я можно поделить «столбиком» на другой алгебраический многочлен степени не выше чем п. Таким путем мы приходим к следующему утверждению: каковы бы ни были два многочлена /(г) и <р(г) такие, что степень <р(г) не выше, чем степень }(г), справедливо равенство /(2)=ф(г)ч7(2)+г(2), (8.17) в котором ц(г) и г(г) — некоторые многочлены, причем степень ц(г) равна разности степеней многочленов 1(г) и <р(Х), а степень г (г) ниже степени ф (г). По отношению к фигурирующим в равенстве (8.17) многочленам {{г), ф(г), д(г) и г (г) обычно применяют вполне понятные термины «делимое», «делитель», «частное» и «остаток». Говорят, что многочлен /(г) делится на многочлен ф(г), если; в полученной посредством деления столбиком формуле (8.17) остаток г (г) = 0. Договоримся называть многочленом нулевой степени любую комплексную постоянную. Тогда совершенно ясно, что любой многочлен делится на отличный от нуля многочлея нулевой степени. Изучим вопрос о делимости многочлена 1{г) на многочлен первой степени. Определение. Назовем комплексное число Ъ корнем многочлена {(г), если {(Ь) равно нулю. Теорема 8.2. Многочлен ненулевой степени }(г) делится на двучлен (г—Ь) тогда и только тогда, когда Ъ является корнем многочлена. Доказательство. Запишем для многочленов /(г) и ф(г) = (г—Ъ) формулу (8.17). Поскольку степень остатка г(г) в этой формуле обязана быть ниже степени делителя ц>(г)=г—Ь, то г(г) — многочлен нулевой степени, т. е. г(г) =с=сопз{. Таким образом, формула (8.17) принимает вид !(г) = (г-Ь)д(г)+с. Полагая в формуле (8.18) г=Ь„ найдем, что с = /(&). По определению /(г) делится на (г—Ь) тогда и только тогда, когда ос-
308 Гл. 8. Первообразная функция и неопределенный интеграл таток в формуле (8.18) с — ЦЬ) равен нулю, т. е. тогда и только тогда, когда Ь является корнем 1(г). Теорема доказана. 2°. Естественно, возникает вопрос, всякий ли алгебраический многочлен имеет корни? Ответ на этот вопрос дает основная теорема алгебры*: всякий многочлен ненулевой степени имеет хотя бы один корень. Опираясь на эту теорему, докажем, что алгебраический многочлен п-й степени имеет точно п корней**. В самом деле, пусть !(г) — многочлен /г-й степени. Согласно основной теореме алгебры /(г) имеет хотя бы один корень Ь\, т. е. для /(г) справедливо (Представление /(2) = (2-6,)/,(2), (8.19') в котором через /1(2) обозначен некоторый многочлен степени (м—1). Если пф\, то, согласно основной теореме алгебры, Д(2) имеет хотя бы один корень Ь2, т. е. для {\{г) справедливо представление Ыг) = (г-&2)Ыг), (8-192) ъ котором через /2(2) обозначен некоторый многочлен степени {п—2). Повторяя указанные рассуждения далее, мы получим "представления Ыг) = (2-Ь3)Ы2), (8-193) /«_,(*) = (г-М Ы*)- (8.19») В последнем из этих представлений через }п (г) обозначен некоторый многочлен нулевой степени, т. е. М2) =с = соп5Х. Сопоставляя между собой равенства (8.191) — (8.19") и учитывая, что ]п(г)=с, будем иметь /(2) = (2-6,) (г-Ь2)...(г-Ьп)с (8.20) Отметим, что комплексная постоянная с не равна нулю, ибо в противном случае многочлен {(г) был бы тождественно равен нулю и не являлся бы многочленом п-й степени ***. Из равенства (8.20) очевидно, что 1(Ь\) =}(Ь2) =...=/(&„) =0, т. е. каждое из чисел Ъи Ь2, —, Ь„ является корнем многочлена $(г). Кроме того, из (8.20) очевидно, что, каково бы ни было комплексное число Ь, отличное от Ьи 62,...,ЬЛ, комплексное число * Доказательство основной теоремы алгебры обычно приводится в курсах алгебры и в курсе теории функций комплексной переменной. ** При этом, конечно, предполагается, что п>0. *** Здесь мы используем следующее утверждение: если многочлен /(г) = :=а0гп,+а1гп-:+... + ап_1г+йп тождественно равен нулю, то все его коэффициенты равны нулю. В самом деле, если /(г)=0, то при 2=0 получим ап=0. Нотогда/(г) =2[ао2п-1 + а1271_2+.-.+а,г-1] =0. Так как г^0, то выражение в квадратных скобках тождественно равно нулю, откуда при 2=0 получим О71_1=0. Продолжая аналогичные рассуждения далее, докажем, что все коэффициенты равны нулю.
§ 3. Классы функций, интегрируемых в элементарных функциях 309 [(Ь) не равно нулю*. Таким образом, многочлен }(г) имеет ровно п корней: Ьи Ь2,—,Ьп. Равенство (8.20) дает разложение многочлена /(г) на множители. Если известен вид многочлена /(г) (8.16), то мы можем определить постоянную с в равенстве (8.20). Сравнивая в равенствах (8.20) и (8.16) коэффициенты при гп, получим с — с0**. Многочлен (8.16), у которого с0=1, называется приведен- н ы м. Для приведенного многочлена формула разложения (8.20/ принимает вид / (г) = (2-6,) (г—Ь2)... (г-Ьп). (8.21) В дальнейшем, если не оговорено противное, мы будем рассматривать приведенные многочлены. Среди корней многочлена /(г) могут быть совпадающие корни. Пусть а, Ь,..., с — различные корни приведенного многочлена /(г). Тогда для этого многочлена представление вида (8.21) принимает форму следующего равенства: Дг) = (г—а)°(г—6)&...(г—ф. (8.22) В этом разложении а, р,..., у — некоторые целые числа, каждое из которых не меньше единицы, причем а+$ + ... + у = п, где п — степень многочлена /(г). . Если для многочлена {(г) справедливо разложение (8.22), то говорят, что комплексное число а является корнем {(г) кратности а, комплексное число Ь является корнем 1(г) кратности р,..., комплексное число с является корнем )(г) кратности у. Корень, кратность которого равна единице, принято называть однократным, а корень, кратность которого больше единицы, принято называть к р а т н ы м. Можно дать и другое эквивалентное определение корня данной кратности: комплексное число а называется корнем многочлена }(г) кратности а, если для $(г) справедливо представление }(г) = (г—а)аф(2), где <р(а)^=0. (8.23) 3°. Пусть теперь /(г) =2« + с12"-1 + с2г"-2 + ... + Сп (8.24) приведенный алгебраический многочлен с вещественными коэффициентами сь с2,..., сп. * Ибо произведение нескольких комплексных чисел равно нулю лишь в том случае, когда равен нулю хотя бы один из сомножителей (см. п. 1). ** Здесь мы используем утверждение: если два многочлена аогп+а1гп~1+... ~.. + ап и Ьагп + Ь-[2п-1 + ...+Ъп тождественно равны друг другу, то а0=6о. а\ — Ь\,...,ап = Ьп. Для доказательства достаточно к разности указанных многочленов применить утверждение, отмеченное в сноске *** на с. 308.
310 Гл. 8. Первообразная функция и неопределенный интеграл Докажем, что этот многочлен обладает следующим важным» свойством. Теорема 8.3. Если комплексное число а является корнем многочлена с вещественными коэффициентами (8.24) кратности Я, то и сопряженное ему комплексное число а также является, корнем этого многочлена той же самой кратности %. Доказательство. Начнем с того, что докажем следующий вспомогательный факт: если }(г) — многочлен с веществе нн ым и коэффициентами, то комплексная величина {(г} является сопряженной по отношению к величине {(г). Так как коэффициенты многочлена (8.24) являются вещественными числами, то для доказательства указанного факта достаточно убедиться в том, что для любого номера п комплексная; величина (г)" является сопряженной по отношению гп. Но это. последнее сразу вытекает из утверждения, доказанного в самом! конце п. 1, точнее, из соотношения (8.14"). Положив в этом соотношении 21=22 = 2, мы получим, что (г2) = (г)2. Далее, положив в том же соотношении (8.14"), 21 = 22, 2г=2, мы получим; (г3) = (?)2 = (7)3. Продолжая аналогичные рассуждения, мы убедимся в том, что (гч) = (г)" для любого номера п. Итак, доказано, что величина /(г) является сопряженной по- отношению к величине }(г), т. е. или, что то же самое, Г(г) = гЩ- (8-25) Пусть теперь комплексное число а является корнем многочлена с вещественными коэффициентами {(г) кратности X, т. е. справедливо представление /(2) = (г-а)*ср(2), (8.26> в котором <р(а)Ф0. (8.27) Из сопоставления (8.26) и (8.25) вытекает, что /(2) = (2-0)4(2), а последнее равенство в силу (8.14") можно переписать в виде /(2) = (2-а)*ф(г). (8.28> Заметим теперь, что в силу установленного выше соотношения (гп) = (гп) справедливо равенство (г-а)х = (Г— а)*1 = (г—а)\ (8.29)
§ 3. Классы функций, интегрируемых в элементарных функциях 311 Подставляя (8.29) и (8.28), мы получим представление Д2) = (2-0)*Ч>(2), (8.30) б котором через г|)(г) обозначена величина Ч>(2) = ффГ (8-31) Для завершения доказательства теоремы 8.3 остается убедиться в том, что ^(а)Ф0*, но это сразу вытекает из того, что «в «илу того, что согласно (8.27) ср(а) не обращается нуль**. Теорема 8.3 доказана. 3. Разложение алгебраического многочлена с вещественными коэффициентами на произведение неприводимых множителей. В дальнейшем нам придется иметь дело с многочленами от переменной, принимающей лишь вещественные значения. Поэтому эту переменную мы будем обозначать буквой х, а не г. Пользуясь теоремой 8.3, найдем разложение многочлена с вещественными коэффициентами ]{х) на произведение неприводимых вещественных множителей. Пусть многочлен \{х) имеет вещественные корни Ь\, Ь2, -.., Ьт кратности рь р2,..., рт соответственно и комплексно сопряженные пары корней а.\ и а\, а2 и а2,—,ап и ап кратности А,ь Х2, —Лп каждая пара соответственно. Тогда, согласно результатам п. 2, многочлен /(х) может быть представлен в виде /(х) = (*--&/'(х-Ь/\ . .(х-Ьт)*» х X (х—%)*"(*—а^(х—а/2(%—а/2.. .(х—ап)кп(х—а„)Ч (8.32) Обозначим вещественную и мнимую части корня ак (к=1,2, ...,п) соответственно через ик и ьк, т. е. пусть ак = ик + жк. Тогда ёк = ик—IVк. Преобразуем для любого & = 1,2,..., п выражение (х-ак)*> (*-а*)** = [(х-ак) (х-ак)р = = [(х—ик~щ) (х-ик + щ)]хк = = [(х-икГ + VI] ^ = (*» + Ркх + дк)\ (8.33) где рк= —2ик, дк = и1+у\. Используя (8.33) в (8.32), окончательно получим следующее разложение многочлена /(х) на произведение вещественных не- лриводимых множителей: * Ибо представление (8.30) при условии 1р(а)ф0 и означает по определению, что комплексное число а является корнем многочлена /(г) кратности X. ** Мы учитываем, что комплексное число равно нулю тогда и только тогда, когда равно нулю сопряженное ему комплексное число (см. п. 1 настоящего параграфа).
312 Гл. 8. Первообразная функция и неопределенный интеграл !(х) = (х-Ь1)^(х~Ь2)^. ..(х~Ьт)^ х X {х2 + Ргх + ц$* (х2 + р2х + ?/*... (х2 + рпх + дп)\ (8.34) Мы приходим к выводу, что многочлен [(х) с вещественными коэффициентами распадается на произведение (8.34) неприводимых вещественных множителей, причем множители, соответствующие вещественным корням, имеют вид двучленов в степенях, равных кратности корней, а множители, соответствующие комплексным парам корней, имеют вид квадратных трехчленов в степенях, равных кратности этих пар корней. 4. Разложение правильной рациональной дроби на сумму простейших дробей. Рациональной дробью называется отношение двух алгебраических многочленов. Всюду в дальнейшем мы будем рассматривать рациональную дробь, являющуюся отношением двух алгебраических многочленов с вещественными коэффициентами (такую дробь принято называть рациональной дробью с вещественными коэффициентами). Рациональная дробь —— называется правильной, если степень многочлена Р(х), стоящего в числителе, меньше степени многочлена С}(х), стоящего в знаменателе. В противном случае рациональная дробь называется неправильной. Докажем две вспомогательные теоремы. Р (х) Лемма 1. Пусть —— правильная рациональная дробь с вещественными коэффициентами, знаменатель 0(х) которой имеет вещественное число а корнем кратности а, т. е. <Э(х) = (х—а)аср(х), где ц>(а)фО. (8.35) Тогда для этой дроби справедливо следующее представление: Р(х) _^ А ■ ф(*) С1(х) (х—а)а (х — а)а-к<р(х) В этом представлении А — вещественная постоянная, равная Л = ——, к — целое число, удовлетворяющее условию к>-\, Ф(а) я|)(Х) — некоторый многочлен с вещественными коэффициентами такой, что последняя дробь в правой части (8.36) является пра~ вильной. Доказательство. Обозначив через А. — вещественное л Р(а) * число А = —?-г- , рассмотрим разность Ф(а) *-,.„, • (8-36) * Число А всегда определено, ибо ф(а)^0 в силу (8.35).
§ 3. Классы функций, интегрируемых в элементарных функциях 313 «-*_,..• (8-39) Р(х) А <Цх) (х-а)а " Приводя эту разность к общему знаменателю, будем иметь Р(х) А _ Р(«)-ЛФ(х) _ Ф(х) <2(х) (х — а)а (х— а)аф(х) (х — а)ац>(х)' где через Ф(х) обозначен многочлен с вещественными коэффициентами вида Ф(х)=Р{х)—Лср(х). Так как Ф (а) = Р (а)—Ац> (а) = Р (а) —^- ф (а) = 0, вещест- ф(а) венное число а является корнем многочлена Ф(л?) некоторой .кратности &>1. Это означает, что справедливо представление Ф{х) = {х—а)кЪ(х), где ${а)фО, (8.38) а $(х) — некоторый многочлен с вещественными коэффициентами. Вставляя представление (8.38) в равенство (8.37), окончательно будем иметь Р(х) А _ -ф(*) Ч (х) (х—а)а~~(х — а)а-к ф (х) Тем самым представление (8.36) доказано. Остается только убедиться в том, что дробь, стоящая в правой части (8.39), является правильной, но это сразу вытекает из того, что разность двух правильных рациональных дробей является правильной рациональной дробью (чтобы убедиться в этом, достаточно привести разность правильных рациональных дробей к общему знаменателю). Лемма 1 доказана. Р (х) Лемма 2. Пусть —— правильная рациональная дробь с вещественными коэффициентами, знаменатель которой С}(х.) имеет комплексные числа а = и+ю и а = и—ш корнями кратности Я, т. е. 0.(х) = {х2 + рх+д)\(х), где у(а)ФО, <р(а)фО, (8.40) р=— 2и, ^ = и2+V2. Тогда для этой дроби справедливо следующее представление: Р(х) _ Мх + м тк*) (84п (Щс) (х* + рх + д)Ь (х* + рх + д)х-к<р(х)' В этом представлении М и N — некоторые вещественные постоянные, к — целое число >1, а $(х) — некоторый многочлен с вещественными коэффициентами такой, что последняя дробь в правой части (8.41) является правильной.
314 Гл. 8. Первообразная функция и неопределенный интеграл Доказательство. Договоримся обозначать вещественную часть комплексной величины А символом Ке[Л], мнимую часть комплексной величины А символом 1т[Л]. Положим* УИ = — 1т Ф(а) Л^Ке Р(д) ~^1т Р(а) ф(а) Нетрудно проверить, что указанные М и N являются решением следующего уравнения: Р{а)~ (Ма+Л^)Ф(с)=0. (8.42) В самом деле, поделив это уравнение на ср(а) и приравняв нулю действительные и мнимые части, мы получим два равенства Ми + N-- Ке = 1т Р(а) Ф(а) . Р(а) . Ф(а) из которых определяются написанные выше М и N. Рассмотрим теперь разность Р (*) Мх + N л*. ■ (Цх) (х* + рх+дУ Приводя указанную разность к общему знаменателю, будем иметь Р(х) Мх + N _Р{х) — (Мх + Ю ф (х) __ Ф (х) «(*) (*2 + Р* + <?Г (^ + рх + ,)Аф(х) (^ + рл;+<?)Лф(х)' (8.43) Здесь через Ф(х) обозначен многочлен с вещественными коэффициентами вида Ф(х)=Р(х)—(Мх+Ы)у(х). Равенство (8.42) позволяет утверждать, что комплексное число а, а значит, в силу теоремы 8.3 и сопряженное ему число а являются корнями многочлена Ф(х) некоторой кратности й>1. В таком случае для многочлена Ф (х) справедливо представление Ф{х) = (х2 + рх + д)к^(х), (8.44) 'где 1%>(х) — некоторый многочлен с вещественными коэффициентами, не имеющий в качестве корней числа а и а. Вставляя представление (8.44) в формулу (8.43), пслучим представление (8.41). Тот факт, что последняя дробь, стоящая в правой части (8.41), является правильной, вытекает из того, что эта дробь равна разности двух правильных дробей. Лемма 2 доказана. Р (х) Последовательное применение лемм 1 и 2 к дроби —— по В силу (8.40) (р(а)Ф0, так что отношение Р(а) ф(а) рассматривать
§ 3. Классы функций, интегрируемых в элементарных функциях 315 всем корням знаменателя приводит нас к следующему замечательному утверждению. Р(х) Теорема 8.4. Пусть —— правильная рациональная дробь с вещественными коэффициентами, знаменатель которой имеет вид <2(*) = = (Х-Ь^ (Х~Ь/*. . . (Х-Ьт)^ (д« + рх% + ^ ...(*■ + рпХ + дп)\ (8.45) Тогда для этой дроби справедливо следующее разложение на сумму простейших дробей: С}{х) (х-Ъх) (х~ЬгГ * (х-МР' (Х—Ьт) (Х — Ьт)2 {х — ЬтУт М^х + ^Р М^х + Ы^ М-'^ + М,? + (х2 + Р1* + ?1) (^ + Р1д- + ?1)2 " ' + (х^ + р.х + д^ (х2 + р„х + 9„) (л2 + рпх + 9„)2 (^2 + РпД. + дп)л« В этом разложении В\,}, В®\ ..., Е$\, М?, М'\ • - •. Л1^, Л^ — некоторые вещественные постоянные, часть из которых может быть равна нулю. Замечание. Для конкретного определения только что указанных постоянных следует привести равенство (8.46) к общему знаменателю и после этого сравнивать коэффициенты при одинаковых степенях х в числителе. Примеры и разъяснения. 1°. Разложить на сумму простейших правильную дробь 2х» + *«, + * + 2 (х— 1)2(х2 +х+1) ' Убедившись в том, что квадратный трехчлен х2 + х+1 имеет комплексные корни, ищем, согласно теореме 8.4, разложение дроби (8.47) в виде 2х* + 4х* + х + 2 __ В1 Вг Мх + Ы 4„ (х — 1)2(*2-М-Н) (х — 1) (х — I)2 х2 + х+1 ' Приводя равенство (8.48) к общему знаменателю, получим 2х3 + 4л-2 + х + 2 _ ^1 (*8 — 1) + Ва (л:2 + х + 1) + (Мх + Щ (х2—2х + 1) (х— I)2 (л-2+ *+1) (х —1)2(*-2 + *+1)
316 Гл. 8. Первообразная функция и неопределенный интеграл Сравнивая в числителях коэффициенты при х°, ху, х2 и х3, придем к системе уравнений * 81 + М = 2, В.2 + Ы—2М = 4, 82 + М—2И=\, В± + В2 + Я = 2. Решая эту систему, найдем В\ = 2, В2=3, М = 0, N=1. Окончательно получим 2лг» + 4*« + * + 2 = 2 3 1 ,849) (х — 1)2(х2 + х+1) х— 1. (х — I)2 ' х2 + х+1 ' Только что проиллюстрированный метод отыскания разложения правильной рациональной дроби называется методом неопределенных коэффициентов. Этот метод приводит к цели всегда; доказывать разрешимость полученной в результате применения этого метода системы уравнений не нужно — разрешимость вытекает из теоремы 8.4. 2°. Проиллюстрируем метод неопределенных коэффициентов еще одним •примером. Требуется найти разложение правильной дроби Зх* + 2х=» + 3*а — 1 (х_2)(*»+1)» ' Так как квадратный трехчлен х2+1 имеет комплексные корни, ищем, согласно теореме 8.4, разложение в виде Эх* + 2x8 + Зх2 — 1 = В Л^х + А^ Мгх + Ыг (х — 2) (х2 + 1)а ~ х — 2 х2 + 1 (х2 + 1)а ' Последнее равенство приводим к общему знаменателю и после этого сопоставляем числители. Получим Зх*+2х2+Зх2—1 = =В(х*+2х2+\) + (Мхх+Ых) (х3—2х2+;с—2) + (М2х + Ы2) (х—2). Сравнивая коэффициенты при х°, х\ х2, х3 и х4, придем к системе уравнений В + Мг =3, Ы1 — 2М1 =2, \2В + М1 — 2М1 + М2 =3, 1^—2^ + ^—2^2 = 0, {В—2N1—2N2 =—1. * При этом мы используем утверждение, сформулированное в сноске * на с. 308.
§ 3. Классы функций, интегрируемых в элементарных функциях 317" Решая эту систему, найдем В = 3, М1 = 0, Л^=2, М2~1, Ы2=0. Окончательно получим 3*4 + 2х3 + Зх2 — 1 _ 3 2 х (х — 2){х2+1)2 х—2 л:2+1 (х2+1)2 (8.50) 3°. Метод неопределенных коэффициентов, как видно из рассмотренных примеров, является довольно громоздким. Естественно поэтому в тех случаях, когда это возможно, найти другой, более простой метод отыскания коэффициентов в разложении правильной рациональной дроби на сумму простейших. Пусть знаменатель ($(х) правильной рациональной дроби —— имеет вещественное число а корнем кратности а. Тогда.среди простейших дробей, на сумму которых раскладывается дробь ——, будет фигу- Я (х) рировать дробь ^—. (8.51) (х— а)а Укажем совсем простой метод вычисления коэффициента А при этой простейшей дроби. Привлекая лемму 1 и формулу (8.36), мы убедимся в том, что коэффициент А равен Л=-^, где ф(*) = -2М_ <2(а) у* ' -{х-а)* Мы приходим к следующему правилу: для вычисления коэффициента А при простейшей дроби (8.51), соответствующей вещественному корню а многочлена С} (х) кратности а, следует вычеркнуть в Р (х) знаменателе дроби —-— скобку (х—а)а и в оставшемся выражении положить х = а. Указанный прием нахождения коэффициента А обычно называют методом вычеркивания. Отметим, что этот прием применим лишь для вычисления коэффициентов при старших степенях простейших дробей, соответствующих вещественным корням С} (х). Метод вычеркивания особенно эффективен в случае, когда знаменатель (2 (х) имеет лишь однократные вещественные корни, т. е. когда С}(х) = (х—а\) {х—а2)...(х—а„). Тогда, как мы знаем, справедливо разложение Р(х)' _ Ах , У , Ак Ап (}(х) х — ах х—а2 х—ак х—ап все коэффициенты которого могут быть вычислены по методу вычеркивания. Для вычисления коэффициента Ак следует вычерк- А Р(Х) - нуть в знаменателе дроби —^- скобку (х—ак) и в оставшемся 0.(х) выражении положить х~ак.
318 Гл. 8. Первообразная функция и неопределенный интеграл Пример. Найти разложение дроби * + 1 (8.52) + (х — \)х{х — 2) ■Согласно теореме 8.4 пишем: х+1 __ Аг А2 (х—\)х(х—2) х — \ х Для отыскания А\ вычеркиваем в выражении (8.52) скобку (х—Г) ив оставшемся выражении берем х—1. Получим А\ ——2. Аналогично находим А2 = —, Л3 = 3/2. Окончательно получим —1±1 = _=!.+ _!_+—з— (853) (х — 1) х (х — 2) х — 1 1х 2(х—2) 5. Интегрируемость рациональной дроби в элементарных функциях. Теперь мы подготовлены к тому, чтобы в общем виде решить проблему об интегрировании рациональной дроби с вещественными коэффициентами. Прежде всего отметим, что эта проблема сводится к проблеме интегрирования только правильной рациональной дроби, ибо всякую неправильную рациональную дробь можно (посредством деления числителя на знаменатель «столбиком») представить в виде -суммы алгебраического многочлена и правильной рациональной дроби. ,-, ' х*—х3 + \ , 2 о ч , 4х-\-\ - Пример. :!—= (х2—-2хН ——-, ибо х2 + х + 2 х2 + х + 2 х4—х3+\ |х2+л:+2 ~%* + х3 + 2л:2 х2—2х —2л3 —2х2+1 ~— 2х3 — 2л:2—Ах остаток 1 + Ах Интегрировать многочлен мы умеем (напомним, что неопределенный интеграл от многочлена представляет собой некоторый многочлен степени, на единицу более высокой). Остается научиться интегрировать правильную рациональную дробь. В силу теоремы 8.4 проблема интегрирования правильной рациональной дроби сводится к интегрированию простейших дробей следующих четырех типов: I. -Л-- П. __б ; Ш. М* + " ; IV. Мх + " , . (8.54) х— Ь (х — ЬГ х*-+рх + я (х* + рх + <7Г Здесь {5 = 2, 3, ... ; %=2, 3 ,...; В, М, Ы, Ъ, р, д — некоторые веще-
§ 3. Классы функций, интегрируемых в элементарных функциях 319 ственные числа, причем трехчлен х2+рх+д не имеет веществен- р2 ных корней, т. е. а > 0. 4 Докажем, что каждая из четырех указанных дробей интегрируема в элементарных функциях. Дроби вида I и II элементарно интегрируются при помощи подстановки 1=х—Ъ. Мы получим [-Л—йх = в[-У- = ВЩ1\+С = В\п\х—Ъ\+С, (8.55> ^х—ь • ^м В А _ЙС М _ В 1 г_ —В 1 , г -^—$ГйХ-В}Т- (Р-1) ^-'+С"(Р-1)-(,-&)Р-1+Ь- (8.56> Для вычисления интеграла от дроби вида III представим квадратна , _.. , „_/.. , Р \2 , {„ Р2 ныи трехчлен в виде х* + рх+ <7 = ( х-\ I + (<7 и, учитывая, что ц—— > 0, введем в рассмотрение вещественную по- 4 стоянную а = ,+ |/ <?■——. Сделав подстановку 1 = х+~^ будем иметь Мр ЛИ + Л/ Мх + Ы " 1 Ч их = I <И = х2 + рх + <? ^ <а + от = _м_ гад (м_мр.) Г_*_ ~ 2 3 /2,+ а2 \ 2 ) ] (2+а2 } (2 + а2 { 2 ) а } (1 (т) 2 + 1 = — 1п (г+ огн агст§ |-С = 2 2а а = ^1п(*Ч-р* + 0 + 2Л//^^агс1ё ,-1^ + С, (8.57> 2 Р Р ■ 2у^-т \Л-т Остается вычислить интеграл от дроби вида IV. Используя введенные выше обозначения 1 = х-\-—, а—л/ц ——, будем; иметь
320 Гл. 8. Первообразная функция и неопределенный интеграл Мр Ж 4- \ N Г Мх + Ы ^_ Г V 2 / й( ^ (х* + рх + Ч)*- ) (1* + а*)х М Сау2 + а*) , (м 'Мр \ С &1 \\ 2 ) {Р + а*)х I. 2 )) (Р+а*)% ' Введем обозначения Интересующий нас интеграл будет вычислен, если будут вычислены интегралы / и К*. Интеграл / берется элементарно: (А,—1) (Р + с?)%-1 (Х-1) (х^ + рх+д)^-1 Интеграл Кх вычислен нами в примере 6 в конце § 2 настоящей главы. Там мы получили для этого интеграла рекуррентную формулу (3.12), позволяющую последовательно вычислить К*, для любого А=2, 3, ..., опираясь на то, что Мтак, нами вычислены интегралы от всех четырех простейших дробей (8.54) и доказано, что каждый из этих интегралов представляет собой элементарную функцию*. Тем самым мы приходим к следующей теореме, исчерпывающей проблему интегрирования рациональной дроби. Теорема 8.5. Всякая рациональная дробь с вещественными коэффициентами интегрируема в элементарных функциях. В заключение этого параграфа мы остановимся на примерах вычисления неопределенных интегралов от рациональных дробей. Вычислим неопределенные интегралы от трех дробей, рассмотренных в предыдущем параграфе, (8.49), (8.50) и (8.53)-. Пользуясь указанными тремя формулами, а также формулами (8.55) — (8.57), будем иметь: 1. Г 2*-г-«-1-*-т-* йх._ ^ {х- 2х3 + 4х2 + х + 2 1)2(*2 + *+1) их + х + \ : ("_А_ЙХ+ Г ^ йХ+ Г — * Точнее, выражается через логарифм, арктангенс и рациональную функцию.
§ 3. Классы функций, интегрируемых в элементарных функциях 321 РЗ* + 2,з + 3*2-1^ Г^^+Г^+Г_^ = ) ,(*-2)(*2 + 1)2 }х-2 ,)**+1 ^ (*2+1)2 = 31п|х-2|+2агс1§х + т] ^-^- = = 31п|х-2| + 2агс1ех-^-^ + С. 3. Г *-±± Лс=(,^.Лс+(,^_+Г-^_ = О <х—1)дс(дс —2) ^ дс— 1 Л 2* ,)2(х-2) = — 21п|х—1| + — 1п|х| + — 1п|х—2|+С. 6. Интегрируемость в элементарных функциях некоторых тригонометрических и иррациональных выражений. В рассуждениях настоящего пункта важную роль будет играть рациональная функция от двух аргументов. С определения такой функции и выяснения некоторых ее свойств и начнем наше изложение. Многочленом степени п от двух аргументов х и у называется выражение вида Рп(х, у) =а0о+а1оХ+ао1у + а2оХ2 + апху^ а02у2+ ... + а0пуп, в котором через а0о, а\й, ..., аоп обозначены некоторые постоянные вещественные числа такие, что среди чисел апо, Щп-щ, «(п-2)2, ... ..., а0п есть хотя бы одно число, отличное от нуля. Рациональной функцией от двух аргументов хну называется выражение вида Я(х,у) = %<*Л, <3т(х, у) в котором через Рп(х, у) обозначен произвольный многочлен от двух аргументов х и у степени п, а через Ят(х, у) обозначен произвольный многочлен от двух аргументов х и у степени т. Справедливо следующее тривиальное утверждение: если Р (х, у) — рациональная функция' от двух аргументов х и у, а •^1(0. Яг(0 и Яз(1)—три произвольных рациональных функции от одной переменной I *,. то выражение вида №Л*), Д2(0]Яз(0 (8-58) представляет собой рациональную функцию от одной переменной. Для доказательства этого утверждения достаточно заметить, что в результате применения к рациональным функциям одной пе- * Под термином «рациональная функция от одной переменной /» мы понимаем рациональную дробь с вещественными коэффициентами от аргумента <- 11 Зак. 72
322 Гл. 8. Первообразная функция и неопределенный интеграл ременной I операций сложения, вычитания, умножения и деления? мы снова получим рациональные функции одной переменной I. В дальнейшем для доказательства интегрируемости в элементарных функциях некоторых выражений мы будем посредством специально подобранной подстановки сводить интеграл от рассматриваемых выражений к интегралу от рациональной дроби*. При этом мы будем говорить, что интеграл от рассматриваемого выражения рационализируется указанной специальной подстановкой. 1°. Интегрирование некоторых тригонометрических выражений. Договоримся всюду в дальнейшем символом! Я(х, у) обозначать любую рациональную функцию от двух аргументов х и у. В этом пункте мы докажем интегрируемость в элементарных функциях любой функции вида /?(з1пл:, соз#). (8.59) Докажем, что интеграл от этой функции рационализируется подстановкой ^ = ^8—. Действительно, 81пх = - = , созд; = — = -, чм х = 2агс1§?, их так что 1-Й2' {*<вШ*. оов*)*^*^,^)^. (8.60) Если положить ^ (/) = _—, #,(*) = _^1, /^(/) = __, то. в правой части (8.60) мы получим интеграл от выражения вида (8.58), который представляет .собой интеграл от рациональной функции аргумента I. С их Пример. Вычислить интеграл 1л—\ > где а>0„ ^ 1 + а соз х аф\. Применяя универсальную тригонометрическую подстановку ^=^ё—, получим х = 2агсг§/, ах — , С08л; = 1+*2 1 + 1 * Интегрируемость в элементарных функциях рациональной дроби установлена в теореме 8.5.
§ 3. Классы функций, интегрируемых в элементарных функциях 323 /=2г * =-М—* ■*» 1+а Далее нужно отдельно рассмотреть два случая: 2) а>1. В случае 0<а<1 1) 0<а<1, Л /Г 2 :агс1§ + С = ГГ -агс *(Ут^*т)+с В случае л> 1 4 = /а2—1 1п 1+< /о — 1 1 Ка2 —1 = 1п /а—1 л: + с= /а—1 дг +с. 2°. Интегрирование дробно-линейных иррацио- юальноетей. В этом пункте мы докажем интегрируемость в элементарных функциях любой функции вида /г у сх + а) (8.61) где а, Ъ, с и й — некоторые постоянные, п — любое целое положительное число. Функцию такого вида мы будем называть дробно- линейной иррациональностью. Докажем, что интеграл от функции (&61) при ай—ЬсфО рацио- " /« + * у сх + а' иализируется подстановкой I ■■ В самом деле, <« = ах -\-Ь сх + й' <ип- а — Лп Ьгах==М-Ьфг^_^ (а— с1пУ так что И*Ч/^У*=И-^^. А {аа-Ъс)п1П'1 Л. (8.62) 3 \ V сх + 4) 3 \а—с(" ) (а —<*«)» К ' Л1*
324 Гл. 8. Первообразная функция и неопределенный интеграл Если положить /?! (/) = —, Яа (*) = *, Яз (*) = —, ^—. а — а" (а — с(п)* то в правой части (8.62) мы получим интеграл от выражения вида (8.58), который представляет собой интеграл от рациональной функции аргумента I. Тем самым доказано, что интеграл от дробно-линейной иррациональности (8.61) рационализируется подста- . . " /ах + Ь новкои 1 = Л/—!—. у сх + а Пример. Вычислить интеграл 1—\л/ —^———. Сделав ^ у 1-х 1 —х подстановку У 1—х 1—х /а—1 , 4Ш ах- Р + 1 (*2 + 1)2 и учитывая, что 1—*=2/(/2+1), получим 1 = 2 Г-^*_ = 2 [И—2 Г-^— = 21—2агс1§/ + С = д* + \ ) 3 '2+1 3е. Интегрирование квадратичных иррацио- нальностей. В этом пункте мы докажем интегрируемость в элементарных функциях любой функции вида Я[х, Уах^ + Ьх + с), (8.63) где а, Ь и с — некоторые постоянные. Функцию такого вида будем называть квадратичной иррациональностью. При этом мы, конечно, считаем, что квадратичный трехчлен ах2+Ьх+с не имеет равных корней (иначе корень из этого трехчлена может быть заменен рациональным выражением). Мы докажем, что интеграл от функции (8.63) всегда рационализируется одной из так называемых подстановок Эйлера. Сначала рассмотрим случай, когда квадратичный трехчлен ах2+Ьх+с имеет комплексные корни. В этом случае знак квадратного трехчлена совпадает со знаком а, и поскольку по смыслу квадратный трехчлен (из которого извлекается квадратный корень) положителен, то а>0. Таким образом, мы имеем право сделать следующую подстановку: 1 = Уах* + Ьх+с + хУа. (8.64) Подстановку (8.64) обычно называют первой подстановкой Эйлера. Докажем, что эта подстановка рационализирует интеграл от функции (8.63) для рассматриваемого случая. Возводя в
§ 3. Классы функций, интегрируемых в элементарных функциях 325 квадрат обе части равенства У ахг-\-Ъх + с = 1 —хУа , получим Ьх + с = Р—2Уа1х, так что 2Уа{+Ь ' У т ' 2|Л«<+6 I- Таким образом, 'Д (х, Уах2 + Ьх + с) ах -- Гп/ Р-с /а? + Ы + сУа\2 /а? +_Ы + сУа ^ ,^щ ) \ 2/а1 + Ь ' 2Уа{+Ь ) (2-/а( + Ь)г Под знаком интеграла в правой части (8.65) стоит выражение ,осш г, .... Р—с п ,,ч Уа(2 + Ы -+- сУа вида (8.58) при Я,(О = 2„-+ь . ^(0 = 2^,+ » . /?8(0 =2—-—~г_ +СУ а . Таким образом, в правой части (8.65) мы получаем интеграл от рациональной дроби. Рассмотрим теперь случай, когда квадратный трехчлен ах2+Ьх+с имеет несовпадающие вещественные корни х\ и хг. В таком случае ах2 + Ьх+с=а(х—Х\)(х—Хч). Докажем, что в этом случае интеграл от функции (8.63) рационализируется посредством подстановки X—Хх называемой обычно второй подстановкой Эйлера. В самом деле, возводя в квадрат равенство У ах2 + Ьх + с = I {х—х^ и сокращая полученное равенство на х—х\, получим а(х—хч) = = (2(х—х\), так что -ах, + х^ уахг+Ьх + с= *(*-*) , р—аг /2— а ■ (/2 —а)2 Таким образом, Г/?(дг, У ах2 + Ьх + с)Лх-= — [ #( —ах* + х1? а (*1 —*г) * \ 2а (Ч—Ч) (^ (8 67) ^ I Р— а ' Р—а) (Р—а)1 ' К ' '
326 Гл. 8. Первообразная функция и неопределенный интеграл В правой части (8.67) под знаком интеграла стоит выр'ажение вида (8.58) при ^(0= ~^+д^ , К, (0 = * (^~ **' . Я,(9 = 1 2 Таким образом, в правой части (8.67) мыполучаем интеграл от рациональной дроби. С их Примеры. 1) Вычислить интеграл /= \ г =• Поскольку квадратный трехчлен х2+х+1 имеет комплексные корни, сделаем первую подстановку Эйлера * = Ух2+х + 1 +х. Возвышая в квадрат обе части равенства Ух2 + х + 1 =1—х, получим х2+х+\ = Р^21х+х'1, или х+\ = 12—21х, так что х = ^±ш0х^2 <* + {+1 Л. 1+21 (1+2/)2 Таким образом, 7_П1 '"Т>Т1 ^ II-", В . О + 2/ (1+202 Л. Неопределенные коэффициенты А, В и Б легко вычисляются: Л=2, В = —3, /) = —3. Окончательно получим / = 21п|*|—-1п|1 + 2/| + 2 2(1+20 [ =2\п\Ухг+~хТТ + х\ —-1п\1 + 2х + 2Ухт+~х~+~1~\ + з 2(1 + 2х+2/*»+*+1) 2) Вычислить интеграл /=| , ==-• Поскольку квадратный трехчлен 1—2х—х2 имеет вещественные корни хх~ —1 + ^2 и ха ——1 — У2, сделаем вторую подстановку Эйлера (8.66) х+\+у/2 Возвышая в квадрат обе части равенства У\ — 2х—#=*1{х+\ + УТ), будем иметь (—\){х+ 1— У2) =
§ 4. Эллиптические интегралы 32Т так что Х- -1ЦУ2+1) + /2-1 Л/\_2Х-Х* = 2УГ и (*+1 *2 + 1 ^ + 2^2^+1 , _ 4/2^ 1 -Г- Г 1 /2+1 (^+1)2 Таким образом, /=-4/2"^- *" (*»+1)(*« + 2/2+1) Получаем интеграл от рациональной дроби, вычисление которого предоставляем читателю. § 4. ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ К интегралам от квадратичных иррациональностей естественно примыкают следующие интегралы: [Я(х,Уаха + Ьх2 + сх + с1 )йх, (8.68) Г Я (я, Уах* + Ьх3 + сх* + йх + е )йх, (8.69) подынтегральные функции которых содержат корень квадратный из многочленов третьей или четвертой степени (с вещественными коэффициентами). Эти интегралы весьма часто встречаются в приложениях. Отметим сразу же, что интегралы (8.68) и (8.69), вообще говоря, не являются элементарными функциями. Оба эти интеграла принято называть эллиптическими в тех случаях, когда они не выражаются через элементарные функции, и псевдоэллиптическими в тех случаях, когда они выражаются через элементарные функции *. Ввиду важности для приложений интегралов (8.68) и (8.69) возникла необходимость составления таблиц и графиков функций, определяемых этими интегралами. При произвольных коэффициентах а, Ъ, с, & и е такие таблицы и графики составить очень трудно. Поэтому возникла задача о сведении всех интегралов вида (8.68) и (8.69) к нескольким типам интегралов, содержащих по возможности меньше произвольных коэффициентов (или, как говорят, о приведении интегралов (8.68) и (8.69) кканонической форме). Прежде всего заметим, что интеграл (8.68) сводится к интегралу (8.69). В самом деле, кубичный трехчлен заведомо име- * Эти названия происходят оттого, что впервые с этими интегралами ветре- тились при решении задачи о спрямлении эллипса (см. пример 4° п. 6 § 1 гл. 10).
328 Гл. 8. Первообразная функция и неопределенный интеграл ет хотя бы один вещественный корень хо, а поэтому его можно представить в виде ах3+Ьх2 + сх+с1=а(х—х0) (х2+рх+д). Сделав подстановку х—х0 — ±12, мы, как легко видеть, преобразуем интеграл (8.68) в (8.69). Таким образом, нам достаточно рассмотреть лишь интеграл (8.69). В силу п. 3 § 3 многочлен четвертой степени можно разложить на произведение двух квадратных трехчленов с вещественными коэффициентами ах^+Ъхъ+сх2Л-йх+е=а(х2+рх+я) (х2+р'х+д'). Всегда найдется некоторая линейная или дробно-линейная подстановка, уничтожающая у обоих квадратных трехчленов линейные члены. Сделав такую подстановку, мы с точностью до слагаемого, представляющего собой элементарную функцию, преобразуем интеграл (8.69) к виду Я (/2) <И \ УА(1-\-т(*)(1 ,+ т'Р) (8.70) где Я — некоторая рациональная функция. Далее можно показать, что при любых комбинациях абсолютных значений и знаков постоянных А, т и т' может быть найдена замена, сводящая интеграл (8.70) к так называемому каноническому интегралу 7?! (22) й.2 \ У{\ — г2)(1 — кЧ1) (8.71) в котором через к обозначена постоянная, удовлетворяющая условию 0<&<1. Любой канонический интеграл (8.71) с точностью до слагаемого, представляющего собой элементарную функцию, может быть приведен к следующим трем стандартным интегралам: Г Ог Г гЧ^ } К(1 —г2)(1—й2г2) ' ) У(\— 22)(1— *222) И (8.72) * '. (0 < А < 1). 1 (1 + /122) /(1—22)(1—Й222) Интегралы (8.72) принято называть эллиптическими интегралами соответственно 1-го, 2-го и 3-го рода. Каждый из этих интегралов, как показано Лиувиллем *, представляет собой неэлементарную функцию. Эллиптические интегралы 1-го и 2-го рода содержат только один параметр, принимающий вещественные значения из интервала 0<&<1, а эллиптический инте- * Жозеф Лиувилль — французский математик (1809—1882).
§ 4. Эллиптические интегралы 329 грал 3-го рода, кроме того, содержит параметр к, который может принимать и комплексные значения. Лежандр * подверг интегралы (8.72) дальнейшему упроще- я нию, сделав замену 2 = 81пф(0<ф-<— )• С помощью этой замены первый из интегралов (8.72) преобразуется к виду & (8.73) Г При этой же замене второй из интегралов (8.73) с точностью до постоянного множителя равен разности интеграла (8.73) и следующего интеграла: | ]Л— А281паф <*<р. (8.74) Третий из интегралов (8.72) преобразуется к виду йф (8.75) Г (1 + Азт2ф) У\ — йа31Паф Интегралы (8.73), (8.74) и (8.75)-принято называть эллиптическими интегралами соответственно 1-го, 2-го и 3-го рода в форме Лежандра. Особенно важную роль в приложениях играют интегралы (8.73) и (8.74). Если считать, что оба эти интеграла обращаются в нуль при ф=0, то получатся две вполне определенные функции, которые обычно обозначают символами Р(к, ф) и Е (к, ф). Для этих функций составлены обширные таблицы и графики. Лежандром и другими математиками изучены свойства этих функций, для них установлен ряд формул. Наряду с элементарными функциями функции Е и Р прочно вошли в семейство функций, часто используемых в анализе. Здесь еще раз стоит отметить условность понятия элементарной функции. Вместе с тем следует подчеркнуть, что задачи интегрального исчисления вовсе не ограничиваются изучением функций, интегрируемых в элементарных функциях. * Андриан Мари Лежандр —- французский математик (1752—1833).
Глава 9 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ РИМАНА Во вводной главе было показано, что к понятию определенного интеграла приводят такие важные задачи естествознания, как задача о вычислении площади криволинейной трапеции и задача об определении пути, пройденного материальной точкой, двигающейся со скоростью /(х) за промежуток времени от х=а до х=&. Целью данной главы является построение строгой теории определенного интеграла Римана. § 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА. ИНТЕГРИРУЕМОСТЬ Рассмотрим функцию /(х), определенную в каждой точке сегмента [а, Ь]. Введем понятия разбиения сегмента [а, Ъ], из- мельчения этого разбиения и объединения двух разбиений. Определение '1. Будем говорить, что задано разбиение сегмента [а, Ь], если заданы точки Хо, хи ..., хп такие, что а = =х0<х{< ...<хп-1<хп = Ь. Разбиение сегмента [а, Ь] будем в даль< нейшем обозначать символом {хк}. Определение 2. Разбиение {х/} сегмента [а, Ь] называется измель чением разбиения {хк} того же сегмента, если каждая точка хр разбиения {хк} совпадает с одной из точек х/ разбиения Определение 3. Разбиение {хк} сегмента [а, Ь] называется объединением разбиений {хк'} и {хк"} того же сегмента, если все точки разбиений {хк} и {хк"} являются точками разбиения {хк} и других точек разбиение {хк} не содержит. Заметим, что объединение двух-разбиений является измельчением каждого из них. Рассмотрим на сегменте [с, Ь] функцию /(х), принимающую в каждой точке сегмента конечные значения. По данному разбиению {хк} построим число, так называемую «интегральную сумму», п а{Хк> &б) = У Н1к){Хь—хк-г), где ^ — некоторая точка сегмента к=\ [хи-\, хй\. Подчеркнем, что интегральная сумма а{хк, |а) зависит как от разбиения {хк}, так и от выбора точек %к на сегментах [хк-и хк]. Если обозначить через Ахк разность хъ.—хк-и то инте-
§ 1. Определение интеграла. Интегрируемость 331 тральную сумму, в дальнейшем часто обозначаемую просто через а, можно записать и так: п с = 2 / (&) А**, 1к е= [хк-1> хк]. к=\ Сегменты [хь-\, хк] иногда называют частичными сегментами, а точки |А — промежуточными точками. Число д. = шах Ахк* договоримся называть диаметром р а з-„> биения {хк}. Введем фундаментальные понятия предела интегральных сумм и интегрируемости функции по Риману. Определение 4. Число I называется пределом интегральных сумм о (хк, |ь) при стремлении диаметра а" разбиений {хк} к нулю, если для всякого е>0 существует такое число б = б(е) >0, что из условия й<г при любом выборе промежуточных точек \к следует неравенство \1—сг|<е. Легко убедиться в том, что может существовать только один предел интегральных сумм а при й->0. Для обозначения предела интегральных сумм употребляют символ 1=1\тпо(хк, Ь). <г-»о Определение 5. Функция Цх) называется интегрируемой по Риману на с е г мент е [а, Ь], если для этой функции на указанном сегменте существует предел I ее интегральных сумм а при стремлении диаметра а' разбиений {хк} к нулю. Число / называется определенным интегралом Ри- м ан а от функции Цх) в пределах от а до Ь и обозначается сим- ь волом Г / (х) их. ь Таким образом, по определению [{(х)йх—\ша{хк, %к). Отме- о <*-»о а тим, что число а называют нижнимпределом интегрирования, а число Ь — верхним пределом интегрирования. Переменную х под знаком определенного интеграла можно заменить на любую другую переменную, т. е. справедливы равенства | / (х) с!х = ^/ (у) йу = ] / (О'Я и т. д. а а а Выясним геометрический смысл интегральной суммы. Рассмотрим криволинейную трапецию, т. е. фигуру, ограниченную графи- * Т. е. длину наибольшего частичного сегмента.
332 Гл. 9. Определенный интеграл Римана ком непрерывной неотрицательной функции у = 1{х), заданной на сегменте [а, Ь], двумя прямыми х=а и х=Ь, перпендикулярными к оси абсцисс, и сегментом [а, Ь] оси абсцисс (рис. 9.1). Очевидно, интегральная сумма \Н(х) Рис. 9.1 а(хи, \ь), отвечающая выбранному разбиению {хк} и данному обозначенному на рисунке выбору точек \к, представляет собой площадь ступенчатой фигуры, заштрихованной на этом рисунке. В следующей главе будет сформулировано понятие площади произвольной плоской фигуры и установлено, что предел при й-*~0 площади указанной сту^ пенчатой фигуры равен площади криволинейной трапеции. Приведем простейший пример интегрируемой по Риману функции. Покажем, что функция Дх) =с=сопз1 интегрируема на любом ъ сегменте [а, Ь], причем Гсйх = с(Ь—а). Действительно, при любом а разбиении {х*} и любом выборе точек |& на сегментах [х^-и Хк] справедливо равенство /(5а) =с. Следовательно, а(хк, 1к)=сАх1 + сАх2+ ... + сАхп = = с(Дх1+Лх2 + ... +Ахп) =с(Ь—а) для любого разбиения {хк} и любого выбора ТОЧеК 7^ь€В[Хк-1, Хк]. Поэтому Г сйх = Нт<г(хк, ?•*) = Птс(Ь— а) — с(Ь—а). а Докажем следующее Утверждение. Если функция /(х) не является ограниченной на сегменте [а, Ь], то эта функция не интегрируема на этом сегменте. Пусть Дх) не ограничена на [а, Ь]. Покажем, что для любого разбиения {Хк} интегральную сумму а{хк, Ы можно сделать сколь угодно большой по абсолютной величине только за счет выбора промежуточных точек |А. В самом деле, если функция /(х) не ограничена на сегменте [а, Ь], а сегмент [а, Ь] разбит на конечное число сегментов {х^-п хк], то функция /(х) будет неограниченной хотя бы на одном частичном сегменте разбиения. Не нарушая общности, будем считать, что /(х) не ограничена на сегменте [хо, х{\. На
§ 1. Определение интеграла. Интегрируемость 333 остальных сегментах [хи х2], [х2, х3], ..., [хп-\, хп] промежуточные точки |2, |з, — > I" выберем произвольными и фиксируем. Обозначим через 01 (хк, \к) величину (Т1 = сп(**, Ы=/(ЫЛ*2+/(|з)Лхз + ... +/(5п)Дхя. Рассмотрим теперь функцию \(х) только на сегменте [х0, хЦ. Поскольку фунцкия /(л:) не ограничена на этом сегменте, то для любого наперед заданного положительного числа М найдется точка §1 из этого сегмента такая, что |КЫ|>(Ы+Л1)/д*,. Отсюда следует, что 1/(10 |Лл:1> |сч| +М, и поэтому 1 в (хк, Ш = Ю (У л**| = I / (У Д*1 + «* (хк, 1к) 1 > 6=1 >№)|Д*1-1<М**. Ы\>м. Теперь уже совсем просто убедиться в неинтегрируемости функции /(х) на сегменте [а, Ь]. В самом деле, предположим, что }(х) интегрируема на [а, Ь], т; е. для нее существует предел / интегральных сумм при стремлении диаметра разбиения й к нулю. В силу доказанного выше для разбиения с как угодно малым диаметром й и для положительного числа Л1=|/| + 1 найдется интегральная сумма о, удовлетворяющая условию |о|>|/| + 1, из которого в силу неравенства \а—/|>|а| —1/| вытекает, что \о—/|>1 (для разбиения с как угодно малым диаметром а"). Это противоречит определению 4 предела интегральных сумм. • Итак, мы доказали, что интегрируемыми на сегменте [а, Ь] могут являться только ограниченные на этом сегменте функции. Естественно возникает вопрос: всякая ли ограниченная на сегменте [а, Ь] функция является интегрируемой на этом сегменте? Докажем, что функция Дирихле О(х), равная нулю в иррациональных и единице в рациональных точках сегмента [а, Ь], представляет собой пример ограниченной и неинтегрируемой на этом сегменте функции. Для разбиения [а, Ь] с как угодно малым диаметром й, взяв в качестве всех промежуточных точек иррациональные точки, мы получим интегральную сумму оь равную нулю, а взяв в качестве всех промежуточных точек рациональные точки, мы получим интегральную сумму 02, равную Ь—а. Если бы существовал предел I интегральных сумм при стремлении й к нулю, то для положи- Ь — а , тельного числа е = и для достаточно малого а мы получили бы [0! — /|<—"~а , |02 — /|< ~й-, ОТКуДа |02—011 = = 1(02—I) + (/—01)|«:|02—Л + 1°1—1\<Ь—а, а это противоречит тому, что 02—01 = 6—а.
334 Гл. 9. Определенный интеграл Римана § 2. ВЕРХНИЕ И НИЖНИЕ СУММЫ И ИХ СВОЙСТВА 1. Определение верхней и нижней сумм. Утверждение, доказанное в § 1, дает нам основание рассматривать всюду в дальнейшем только ограниченные на данном сегменте функции (ибо неограниченные функции заведомо не являются интегрируемыми по Ри- ману). Пусть /(л;) —ограниченная на сегменте [а, Ь] функция и {хк}— произвольное разбиение этого сегмента. Так как /(*) ограничена на сегменте [а, Ь], то она ограничена и на любом частичном сегменте [Хк-и Хи], а поэтому у функции 1(х) существуют точная нижняя грань тк и точная верхняя грань Мк на частичном сегменте [Хк-и хк]- Итак, пусть тк = тГ/ (х), Мк = вир / (л;). Хк-1<*<ХЬ Хк-1^Х<*к Введем фундаментальные понятия верхней и нижней сумм. Определение 1. Суммы п 8 = МхАхх + М2Ах2 + ...+ МпАхп = ^ МкАхк 6=1 и п з = т1Ах1 + т2Ах2 + ... + тпАхп = ^ ткАхк к=\ будем называть соответственно верхней и нижней суммами функции }(х) для данного разбиения {хк} сегмента [а, Ь]. Выясним геометрический смысл верхней и нижней сумм. Рассмотрим снова криволинейную трапецию, т. е. фигуру, ограниченную отрезком [а, Ь] оси Ох, графиком неотрицательной непрерывной функции «/=/(*) :>0 и прямыми х=а, х = Ь, перпендикулярными к оси Ох (рис. 9.2). Пусть дано любое разбиение {Хк} сегмента [а, Ь]. Число Мк в случае непрерывной функции у=}(х) является ее максимальным значением на частичном сегменте [хк-и хк]. Поэтому верхняя сумма равна площади элементарной ступенчатой фигуры, содержащей криволинейную трапецию. Эта площадь заштрихована на рис. 9.2. Аналогично нижняя сумма равна площади элементарной ступенчатой фигуры, которая содержится в криволинейной трапеций (рис.-9.3). Отметим, что число тк в этом случае является минимальным значением функции у={{х) на частичном сегменте [хк-и хк]. Анализируя геометрический смысл интегральной суммы, можно ожидать, что интеграл от интегрируемой по сегменту {а, Ь] функции у=}(х) должен равняться числу, которое следует принять за площадь соответствующей криволинейной трапеции. Но к этому
§ 2. Верхние и нижние суммы и их свойства 335 же числу будут стремиться верхние и нижние суммы при стремлении диаметра разбиений к нулю. Поэтому представляется вероятным, что для интегрируемости функции необходимо и достаточно, чтобы разность между верхними и нижними суммами стремилась к нулю. Строго это будет доказано ниже. Рис. 9.2 Рис. 9.3 2. Основные свойства верхних и нижних сумм. Докажем следующие леммы. Лемма 1. Пусть а{хк, %к) — интегральная сумма, отвечающая данному разбиению {хк}. Тогда при любом выборе промежуточных точек |й всегда справедливы неравенства где 8 и 3 — соответственно нижняя и верхняя суммы, отвечающие тому же разбиению. Доказательство. По определению чисел Шк и Мк заключаем, что тк<1(1к)<-М для любого |& из сегмента [хь-и хй\- Умножая написанные неравенства на Ахк и суммируя по всем к от 1 до п, получаем требуемое утверждение леммы. Лемма 2. Пусть [хъ) — произвольное фиксированное разбиение сегмента [а, Ь], г — произвольное положительное число. Тогда можно выбрать промежуточные точки \ъ так, чтобы интегральная сумма о(Хк, |й) и верхняя сумма 8 удовлетворяли неравенству 0<5—в(хь, 1к)<е. Промежуточные точки г\к можно выбрать и таким образом, чтобы для интегральной суммы а{хп, щ) и нижней суммы з выполнялись неравенства 0*св(хь, ч\и)—5<е. Доказательство. Пусть {^ — фиксированное разбиение сегмента {а, Ь] и е>0. Докажем сначала первое утверждение леммы. Поскольку Мь = $ирНх)> то для выбранного нами е>0 най- дется точка |*сегмента [Хк-и Хк] такая,что 0<сМь—д|ь)<е/(Ь—а). Умножив эти неравенства на Ахк и просуммировав по всем к от 1 до п, получим 0<5—а{хк, Ъь)<е.
336 Гл. 9. Определенный интеграл Римана Аналогично в силу того, что тк = т1[(х), существует -такая Хк-1<*<Хк точка цк^[хк-и хк], что 0</01*)— тк<е/(Ь—а). Последние неравенства после умножения на Ахк и суммирования приводят к оценкам 0<о{хк, ць)— 5<е. Лемма доказана. Следствие. Для любого фиксированного разбиения {хь} справедливы следующие соотношения: 8 = тра(хк, %к), в = Ша(хк, тц), где тачные верхняя и нижняя грани берутся по всевозможным- промежуточным точкам. Лемма 3. При измельчении данного разбиения верхняя сумма может только уменьшиться, а нижняя сумма — только увеличиться. Доказательство. Пусть {хк}—данное разбиение, а разбиение {хи} получается из него добавлением только одной новой точки х. Легко видеть, что общий случай сводится к данному. Предположим, что х лежит внутри [хк-и хк]. Тогда в выражении для 5 слагаемое МкАхк заменится на Мк(х—хк—1) + Мк(хк—х), где Мк = зир /_(*), Мк = зир / (х). Точная верхняя грань функции на части сегмента не превосходит точной верхней грани функции на всем сегменте. Поэтому Мк'<.Мк, Мк"<Мк и Мк (х—х^) + М"к (хк—х) < Мк [(х^х^) + (**—х)] = МкАхк. Так как все другие слагаемые в выражении для верхней суммы сохранятся, то мы доказали, что при добавлении точки х верхняя сумма может только уменьшиться. Случай, когда к данному разбиению добавляется несколько новых точек, сводится, очевидно, к рассмотренному. Точно так же устанавливается, что при измельчении данного разбиения нижняя сумма может только увеличиться. Лемма доказана. Лемма 4. Для двух произвольных и, вообще говоря, различных разбиений сегмента [а, Ь] нижняя сумма одного из этих разбиений не превосходит верхней суммы другого разбиения. Доказательство. Пусть {хк} и {хк"} — два произвольных разбиения сегмента [а, Ь), а 5', 5', 5", 5" — верхние и нижние суммы этих разбиений соответственно. Обозначим через {хк} объединение разбиений {х/} и {хк"}, а через 5 и 5 верхнюю и нижнюю суммы разбиения {л:*}. Заметим, что {хк} является измельчением
§ 2. Верхние и нижние суммы и их свойства 337 как разбиения {хк'}, так и разбиения {**"}. Согласно утверждению- леммы 3 справедливы неравенства 8'^8, 5" > 5, 5' < 5, 5"<5. Кроме того, в силу леммы 1 получим, что « <5. Пользуясь свойством транзитивности для числовых неравенств и используя три подчеркнутых выше неравенства, заключаем, что 5"^5'. Анало-* гично устанавливается, что 5'^5". Лемма доказана. Следствие. Множество верхних сумм данной функции }(х),. отвечающих всевозможным разбиениям сегмента [а, Ь], ограничено снизу. Множество нижних сумм ограничено сверху. Действительно, любая верхняя сумма не меньше некоторой фиксированной нижней суммы, следовательно, множество верхних сумм ограничено снизу. Аналогично проводятся рассуждения для нижних сумм. В силу основной теоремы 2.1 из гл. 2 существуют точная нижняя грань множества {5} и точная верхняя грань множества {5}. Определение 2. Верхним интегралом Дарбу от функции }(х) называется число /*, равное точной нижней грани- множества верхних сумм {3} данной функции }(х) для всевозможных разбиений сегмента [а, Ь). Нижним интегралом Дарбу от функции {(х) называется число /*, равное точной верхней грани множества нижних сумм {«} данной функции 1(х) для всевозможных разбиений сегмента [а, Ь]. Лемма 5. Нижний интеграл Дарбу всегда не превосходит верхнего интеграла Дарбу, т. е. 1*^.1*. Доказательство. Допустим противное, т. е. предположим,, что /*>/*. Тогда /*—/* = 8>0. Для указанного е, согласно определению числа /*, найдется такое разбиение {хк'} сегмента [а, Ь], что для соответствующей верхней суммы 5' будет выполнено неравенство 5'</* + е/2. Точна так же можно указать такое разбиение {*/'} сегмента [а, Ь], чта для соответствующей нижней суммы 5" будет выполнено неравенство 5">/*—е/2. Вычтем второе неравенство из первого. Получим 5'—з"<1*—/, + е. Но /*—/*=--е, поэтому 5'—я"<0, т. е. 5">5'. Получившееся неравенство противоречит утверждению- леммы 4. Таким образом, доказываемое утверждение справедливо,, т. е. /,</*. Пусть М = $ир}(х), /я = шГ/(л:), а {хк} — ПРОИЗВОЛЬНО,*] *€[а,6] ное разбиение сегмента [а, Ь], й — диаметр этого разбиения. Обозначим через {х/} разбиение, полученное из разбиения {хк} путем добавления к нему / произвольных новых точек. Пусть 5 и 5 — верхняя и нижняя суммы разбиения {**}, а 5' и 5' — верхняя и нижняя суммы разбиения {*/}. Справедливо следующее утверждение.
338 Гл. 9. Определенный интеграл Римана Лемма 6. Для разностей 3—5' и з'—з выполняются следующие неравенства: 8—5'^СМ—гп)Ш, з'—5^(Л1—пг)Ш. Доказательство. Не ограничивая общности, мы можем провести рассуждения лишь для случая, когда к точкам разбиения {Хк} добавляется только одна новая точка х, и доказать, что ш этом случае справедливы неравенства 5—5'<(М—т)й, з'—5< <(М—т)й. Пусть вновь добавляемая точка х лежит внутри сегмента \Хк-и хь]. Тогда верхняя сумма 5 будет отличаться от верхней суммы 5' только тем, что одно слагаемое МкАхк у_ суммы 5 заменится двумя слагаемыми Мк'(х—хк-\)+Мк"\хк—х) у суммы 5' (здесь через Мк, Мк и Мк" обозначены точные верхние грани §(х) на сегментах [*й_ь хк), [хк-и х] и [а, хк] соответственно). Все остальные слагаемые у верхних сумм 5 и 5' будут общими. Отсюда следует, что 5—3'=МкАхк— \Мк'{х—хк-х) +Мк"(хк—х) ]. Из последнего соотношения, учитывая, что в силу свойств точных «раней * Мк*сМ, т<.Мк', т<МА", получим, что 8—3'^:МАхк—т [ (х—хк-1) + (хк—х)) = (М—т) Ахк^. (М—т) й. Доказательство оценки для нижних сумм аналогично. Лемма доказана. Определение 3. Число А называется пределом верхних сумм 8 при стремлении к нулю диаметра разбиений й, если для любого положительного числа е можно указать положительное число б такое, что при условии й<Ь выполняется неравенство \8—А\ <е. Для обозначения указанного предела естественно употреблять •символ Л = Нт5. <*-»о Аналогично определяется пр еде л В нижних сумме при •стремлении й к нулю. Основная лемма Дарбу. Верхний интеграл Дарбу I* является пределом верхних сумм 3 при стремлении диаметра й разбиений к нулю, т. е. /*==Пт5. Аналогично /ж = Нтз. й-зО й->0 Доказательство. Проведем доказательство первого ут- даерждения леммы. Заметим, что если функция \{х) =с = сопз1, то 3 = с{Ь—а)=1* для любого разбиения. Поэтому 1йп5 = /*. Если ■функция 1(х) непостоянна, то Л1 = зир/(х)> т= тГ/(х). Фиксиру- >ем произвольное положительное число е. По определению числа ,/* существует такое разбиение {хк*}, что верхняя сумма 5* этого * Если тк и тк" — точные нижние грани }(х) на сегментах [*ь_1, х] и %х, хк] соответственно, то, поскольку тк'^.Мк', тк"^.Мк" и т<юк', т<тк, мы получили, что т<.Мк', т<.Мк".
§ 3. Классы интегрируемых функций 339» разбиения будет удовлетворять условию 5*—/*<е/2. Обозначим» через / число точек разбиения {х^}, не совпадающих с концами; сегмента [а, Ь]. Пусть \хк) — произвольное разбиение сегмента [а, Ь], диаметр которого удовлетворяет неравенству с1<8 = е/[21(М—т)], и пусть- 5 — верхняя сумма этого разбиения. Произведем измельчение разбиения {Хк}, добавив к нему отмеченные выше / точек разбиения {л:**}. Полученное при этом разбиение обозначим символом {хь}. По лемме 6 верхняя сумма 5' этого последнего разбиения) удовлетворяет условию 0<5—5< (М—т) /4<е/2. Но разбиение {хк} можно рассматривать как измельчение разбиения {хк*}, к которому добавляются точки разбиения {хк}, не совпадающие с концами сегмента [а, Ь]. Поэтому в силу определения! /* и леммы 3 /*<5'<5*, т. е. 0<5'—/*<5*—/\ Выше было показано, что 5*—/*<е/2, поэтому 0^5'—/*<е/2.. Объединяя эти неравенства с установленными выше неравенствами 0^5—5'<е/2, получаем, что 0^5—/*<е, если только й меньше указанного выше б. Следовательно, /* = Нт5. Для нижних, сумм доказательство аналогично. Основная лемма Дарбу доказана. § 3. ТЕОРЕМЫ О НЕОБХОДИМЫХ И ДОСТАТОЧНЫХ УСЛОВИЯХ ИНТЕГРИРУЕМОСТИ ФУНКЦИИ. КЛАССЫ ИНТЕГРИРУЕМЫХ ФУНКЦИИ Доказанные выше утверждения о свойствах верхних и нижних: сумм позволяют нам установить необходимые и достаточные условия интегрируемости по Риману произвольной ограниченной; функции. 1. Необходимые и достаточные условия интегрируемости. Вспомогательная теорема. Для того чтобы ограниченная на сегменте [а, Ь] функция 1(х) была интегрируема на этом сегменте, необходимо и достаточно, чтобы выполнялось равенство* /. = /*. Доказательство. Необходимость. Пусть функция /(*) интегрируема по Риману на сегменте [а, Ь]. Тогда существует предел / ее_ интегральных сумм о при стремлении диаметра а" разбиений к нулю. По определению предела интегральных сумм для любого е>01 существует такое б>0, что для любого выбора промежуточных точек 5й разбиения {хк} с диаметром а*<8 выполняется неравенство |/—а(хк, Ь)\<ф.
340 Гл. 9. Определенный интеграл Римана •Согласно лемме 2 для данного разбиения {хк} можно так выбрать промежуточные точки Ъ,к и \к" в каждом частичном сегменте [Хк-\, хк], что будут справедливы неравенства 5—о(хк, Е*')<е/4, а(хк, 1к")—$<г1А. Подчеркнем, что, кроме того, для данного разбиения {хк} одновременно выполнены неравенства \1—о(хк, 1к')\<ф, \1-а(хк, ^")|<е/4. Заметим теперь, что 5—5= [3—а(хк, Ь')] + [о(хк, 1к')—1] + [1—а(хк, Ъ")] + + [а(хк, У)— в]. Отсюда, учитывая, что модуль суммы четырех величин не превосходит суммы их модулей, получаем, что 5—5<е. Итак, для любого е>0 существует такое 8>0, что для любого разбиения х диаметром й<Ь справедливо неравенство 5—5<е. Поскольку для любого разбиения выполнены неравенства то из неравенства 5—5<е вытекает, что 0^7*—/*<е, а отсюда .в силу произвольности е>0 вытекает, что /* = /*. Достаточность. Пусть /* = /*=А. Согласно основной лемме Дарбу /* = Пт5, /.--Птя, т. е. верхний интеграл является <г-»о й-+о 'пределом верхних сумм, а нижний интеграл — пределом нижних сумм при стремлении диаметра й разбиений к нулю. Поэтому для любого е>0 можно указать такое число 8>0, что для любого разбиения с диаметром й<Ь одновременно выполняются неравенства У*—8=А—5<е, 5—/*=5—Л<е. При любом, указанном раз- убиении любая интегральная сумма а(хк, |й) удовлетворяет неравенствам 5^сг(л:й, Ь)=^5, а значит, и неравенствам А—г<з^а(хк, |й)<5<Л + е. Отсюда \А—а{хк, 1к)\<е (для любого разбиения с диаметром .й, меньшим б). Таким образом, А = Цта(хк, §6), т. е. функция }(х) интегри- •руема. Докажем следующую теорему, имеющую важное значение в теории интеграла Римана. Основная теорема. Для того чтобы ограниченная на -.сегменте [а, Ь] функция {(х) была интегрируемой на этом сегменте, необходимо и достаточно, чтобы для любого е>0 нашлось такое разбиение {хк} сегмента [а, Ь], для которого 5—5<е. Доказательство. Необходимость. Пусть функция /(х) интегрируема на сегменте [а, Ъ). При доказательстве необходимости
§ 3. Классы интегрируемых функций 341 вспомогательной теоремы установлено, что для любого е>0 существует такое б>0, что для любого разбиения сегмента [а, Ь) с диаметром й, меньшим 6, справедливо неравенство 5—$<е. Необходимость доказана. Достаточность. Дано, что для любого е>0 существует такое разбиние {л:*} сегмента [а, Ь], что для соответствующих верхней и нижней сумм выполнено соотношение 5—5<е. Тогда поскольку то /*—/*<е. Из этого неравенства и из произвольности е заключаем, что /* = /*, а по вспомогательной теореме получаем, что функция !(х) интегрируема. Теорема доказана. 2. Классы интегрируемых функций. Выше в § 1 настоящей главы мы видели, что функция /(*), постоянная на сегменте [а, Ь], интегрируема по Риману на этом сегменте, а также что интегрируемые на данном сегменте функции обязаны быть ограниченными на этом сегменте. Естественно, возникает вопрос об описании классов функций, интегрируемых по Риману на сегменте [а, Ь). Среди этих классов важную роль играет класс непрерывных на сегменте [а, Ь] функций. Докажем следующую фундаментальную теорему. Теорема 9.1. Непрерывные на сегменте [а, Ь] функции ин- гегрируемы на этом сегменте по Риману. Доказательство. Пусть {(х) непрерывна на сегменте [а, Ь]. Выберем произвольное число е>0. Поскольку функция /(*), будучи непрерывной на сегменте, является равномерно непрерывной на нем, то для любого данного е>0 существует такое число 6>0, что если |' и |" — любые две точки сегмента [а, Ь], для которых ||'—|"|<б, то |/(|')—/(!")|<е/(Ь—а). Отсюда следует, что разность между точными верхней и нижней гранями }(х) на любом сегменте, имеющем длину, меньшую б, будет меньше числа е/(Ь—а). Выберем теперь разбиение {**} сегмента [а, Ь] с диаметром а", меньшим указанного числа б: а"<8. Пусть Мк = &ир1(х), тк=М1{х). По определению верхней и нижней сумм к=\ Используя в этом соотношении установленное для выбранного нами разбиения неравенство Мк—/пА<&/(Ь—а), утверждающее, что разность между точными гранями на любом частичном сегменте меньше е/(Ь—а), мы получим, что для выбранного разбиения
3 42 Гл. 9. Определенный интеграл Римана 5—5<—— УДХЙ=8. ь-ак По основной теореме заключаем, что функция /(*) интегрируема на [а, Ь]. Теорема доказана. Следующая теорема дает достаточное условие интегрируемости некоторого класса разрывных функций. Условимся говорить, что точка х покрыта интервалом, если она содержится в указанном интервале. Докажем следующую теорему. Теорема 9.2. Пусть функция $(х) определена и ограничена на сегменте [а, Ь]. Если для любого числа е>0 можно указать конечное число интервалов, покрывающих все точки разрыва этой функции и имеющих общую сумму длин, меньшую е, то функция }(х) интегрируема по Риману на сегменте [а, Ь]. Доказательство. Пусть М и пг — точные верхняя и нижняя грани функции /(ж) на сегменте [а, Ь]. Заметим, что если М = пг, т. е. функция }(х) постоянна, то, как мы уже доказали в § 1, она интегрируема. Поэтому будем считать, что М>т. Пусть е>0 — произвольное число. Покроем точки разрыва функции }(х) конечным числом интервалов, сумма длин которых не превосходит числа е1 = е/2-(Л1—т). Точки сегмента [а, Ь], не принадлежащие указанным интервалам, очевидно, образуют множество, состоящее из конечного числа непересекающихся сегментов. Назовем эти сегменты-дополнительными. На каждом из таких сегментов функция непрерывна, а следовательно, и равномерно непрерывна. Значит, существуют такие числа б<>0, что если ||'—|"|.<' <б/, то |/(Ю— /(Г) |<е/(2(6—а)) для всех \' и |", принадлежащих 1-му дополнительному сегменту. Пусть 6 = тт6г. Тогда если взять разбиения дополнительных сегментов на частичные сегменты так, чтобы диаметр каждого из частичных сегментов не превосходил б, то разность между точными верхней гранью Мк и нижней гранью тк функции ((х) на к-м частичном сегменте будет не больше е/(2(Ь—а)). Объединяя все разбиения дополнительных сегментов и указанные выше интервалы с присоединенными к ним концами, мы получим разбиение {хк} всего сегмента [а, Ь]. Для так построенного общего разбиения [а, Ь] п 3-8 = ^(Мк-тк) Ахк = Ъ' (Мк-тк) АхА + 2" (Мк-тк) Ахк, где в сумму с одним штрихом отнесены слагаемые, отвечающие частичным сегментам, образованным из интервалов, покрывающих точки разрыва, а в сумму с двумя штрихами — все остальные. Рассмотрим первое слагаемое правой части записанного выше
§ 3. Классы интегрируемых функций 343 равенства. Поскольку Мк—тк^М—т для любого к, то Ъ'{Мк—тк)Ахк^(М—т)Ъ'Ахк<г12. Далее, в силу сказанного выше, из свойства равномерной непрерывности функции 1(х) на дополнительных сегментах получаем, что 2" (Мк-тк) Ах < —?—- Ъ"Ахк < —^— (Ь-а) = -±~ 2(6 — а) 2(6— а) 2 Таким образом, нами указано разбиение {л:*}, для которого 5—5<е. По основной теореме получаем, что функция Ддс) интегрируема. Теорема доказана. Следствие. Ограниченная на сегменте [а, Ь] функция }(х), имеющая лишь конечное число точек разрыва, интегрируема на этом сегменте. В частности, кусочно непрерывная на данном сегменте функция интегрируема на этом сегменте. Действительно, в условии предыдущей теоремы достаточно выбрать интервалы, покрывающие точки разрыва, одинаковой длины, меньшей чем е/(2р), где р — число точек разрыва функции Замечание. Пусть функция {(х) интегрируема на сегменте '{а, Ь], а функция §(х) совпадает с функцией /(х) во всех точках сегмента [а, Ь], кроме, быть* может, конечного числа точек. Тогда функция § (х) интегрируема на сегменте [а, Ь] и ь ь Г ?(х)а'х= ^§{х)йх. а а Указание. Использовать схему доказательства следствия. Теорема 9.3. Монотонная на сегменте [а, Ь] функция 1(х) интегрируема по Риману на этом сегменте. Доказательство. Случай, когда функция /(я) постоянна на сегменте [а, Ь], можно исключить. Рассмотрим, например, неубывающую на сегменте [а, Ь] функцию ((х). Пусть е>0 — произвольное число. Выберем разбиение {хк} сегмента [а, Ь] с диаметром й<ъЩ{Ъ)—Ца)). Заметим, что поскольку }(х) не посто- п янна, то }{Ь)>}(а). Оценим разность 5—5= V (Мк~тк) Ахк, Мк и тк — верхняя и нижняя грани Цх) на [хк-и хк]. Получим П 8~8<62 {Мк—тк)1{!(Ь)— /(а)). Но для неубывающей 6=1 п функции 2 (мь—Щ) = /(6)—/ (а)*. Поэтому 5—5<е и функция 4=1 * Ибо Мк = Цхк)=тк+1 при й = 1, 2 п—1, Мп=}(Ь), т^Ца).
344 Гл. 9. Определенный интеграл Римана {(х) интегрируема. Для невозрастающей функции рассуждения аналогичны. Теорема доказана. Докажем сейчас теорему об интегрируемости суперпозиции двух функций. Теорема 9.4. Пусть функция }(х) интегрируема по Риману на сегменте [а, Ь], М и т — ее точные верхняя и нижняя грани на [а, Ь]. Пусть, далее, функция ф(х) определена на сегменте- [т, М] и удовлетворяет условию*: существует неотрицательное число С такое, что для любых Х\ и х2 из сегмента [ш, М] выполняется неравенство |<р(*1)— ф(х2)|<С|л:1—х2\; 'тогда сложная функция Н(х)=у([(х)) интегрируема по Риману на сегменте [а, Ь]. Доказательство. Пусть е — произвольное положительное число. В силу интегрируемости функции }(х) на сегменте [а, Ь] найдется такое разбиение {хк} этого сегмента, что 5—8<г/С, где 5 и 5 — верхняя и нижняя суммы функции 1(х) соответственно, С — постоянная из условий теоремы. Пусть Мк и пг'к — точные грани функции }(х) на частичном сегменте \хк-\, хк] разбиения {хк}, а Мк* и тк* — соответствующие величины для функций Н(х). Тогда в силу условия на функцию ф(*) для любых точек х и у, принадлежащих частичному сегменту [хк-\, хк] разбиения {хк}, справедливо неравенство ад-ад<|ВД-ОД1Чф[/(*)]-Ф [/(</)] 1< <С|/(*)-/(у) |<С(М*-тА). Поскольку неравенство Н(х)—п(у)^С(Мк—тк) справедливо для любых точек х и у, принадлежащих сегменту [хк-\, хк], то тем более Мк*—тк*^.С(Мк—тк), ибо найдутся две последовательности {хп} и {г/п} точек сегмента '[хк-\, хк] такие, что Н(хп)->- -+Мк*, к(уп)-+тк* при п-+оо. Пусть, далее, 5* и 5* — соответственно верхняя и нижняя суммы функции Н(х) для выбранного разбиения {хк} сегмента [а, Ь]. Тогда п п 3'—5*== ^ (М1—т1) &хк < С^ (Мк—тк) Ахк < 8. Поскольку е — произвольное положительное число, то в силу основной теоремы функция Н(х) интегрируема на сегменте [а, Ь]. Теорема доказана. Докажем теперь следующую несколько более общую теорему. * Данное условие называется условием Липшица. Ясно, что функция, удовлетворяющая на сегменте условию Липшица, непрерывна на нем.
§ 3. Классы интегрируемых функций 345 Теорема 9.4'. Пусть /(х) — интегрируемая по Риману на Сегменте [а, Ь] функция, Мит — ее точные верхняя и нижняя грани на [а,' Ь]. Пусть, далее, функция ф (х) непрерывна на сегменте [от, М]. Тогда сложная функция п(х)=у[1(х)] интегрируема по Риману на сегменте [а, Ь]. Доказательство. Пусть С= тах |ф(*)| и е — ПрО- извольное положительное число. Положим е\ = е/(Ь—а + 2С)„ Ввиду того, что ф равномерно непрерывна на [от, М], существует такое 6>0, что |ф(^)—ф(^) | <еь если |^—?2|<б и (и 12^ [от, М]. Выберем б еще и таким, что б<еь В силу интегрируемости функции 1(х) на [а, Ь] существует такое разбиение {х/г} сегмента [а, Ь], для которого 5—:5<б2. Положим Мк= зир 1(х), отА = Ы /(х), Х^Кк-1-Хк^ Х^Хк-ГХк^ М*к= зир п(х), т1= т! п(х). хЫхк_1шхк] *€[«*_!•**] Разобьем целые числа 1, ..., п на два множества А и В: число йеЛ, если Мк—отй<б, число реВ, если Мр—отр:>б. Если индекс &еЛ, то Мк—гпк<8, следовательно, в силу равномерной непрерывности функции ф(^) на сегменте [от, М] получим, что Мк*—/Па*^81. Действительно, если рассматривается индекс /геЛ, то мы получим, что Мк—тк= = зир /(х)— щГ /(х)< б, т. е. при х, у^.[Хк-и хк] разность /(х) — !(у)=^1—к по абсолютной величине не превосходит б: \^\—^|<б, где ^^=^(x), и=1{у)- Следовательно, в силу равномерной непрерывности функции ф на всем сегменте [от, М) мы получим, что 1ф(/(*))-фШ</)) I = |Ф('1)-Ф(*2) 1 <е,. Гак как последнее неравенство справедливо для любых х и у, принадлежащих сегменту [Хк-1, Хк], то и зир Ф (/(*))— 1ПГ Ф(/(х))<е1. Далее, если к^В, то, очевидно, что Мк*—отА*^2С. Запишем теперь разность (5* из* — соответственно верхняя и нижняя суммы функции к (х) для рассматриваемого разбиения {хк}) 5*-5* = ^ (М\-тк)Ьхк = ^ (м1-т1)Ахк + к=1 к€А + ^ (М1—т'к) Ахк < ех ф—а) + 2С ^ Ахк. к&в «ев
346 Гл. 9. Определенный интеграл Римана Осталось произвести оценку для величины V Ахк. Имеем» к€В п б ^ Ахк< ^ (Мк-тк) Ахк<% (Мк-тк) Ахк к&В к$В к=\ (здесь мы пользуемся тем, что все слагаемые (Мк—т^Ах^ являются неотрицательными). Учитывая, что при выбранном п разбиении V (Мк—тк)Ахк = 8—5< б2, получаем, что к=1 п б ]Г Ахк < ^ (Мк—тк) Ахк < б2, т. е. ^ Ахк < б. кев к=\ кев Окончательно получим, что 5*—з* <8!(Ь—а) + 2С ^ Ахк< лев < г1 (Ь—а) + 2СЬ<е1(Ь—а+2С) = е. (Выше мы воспользовались тем, что 8<еь) Таким образом, функция к (х) интегрируема, и теорема доказана. Следствие. Если функция 1(х) интегрируема на сегменте [а, Ь], то для любого положительного числа а функция \1(х)\а интегрируема на этом же сегменте. Действительно, достаточно рассмотреть непрерывную функцию ф(/) = |^|а и применить предыдущую теорему. Приведем несколько примеров. Примеры. 1) Пример интегрируемой функции, имеющей бесконечное число точек разрыва. Пусть на сегменте [0, 2/я] задана функция / (х) = 5§п 31П— (рис. 9.4). Указанная функция имеет разрывы 1-го рода во всех точках хк=1/пк, к=\, 2, 3, ..., а также разрыв 2-го рода в точке 0. Фиксируем произвольное число е>0. Покроем точку # = 0 интервалом (—е/4, е/4). Вне этого интервала находится лишь конечное число р точек разрыва функции. Число р зависит от заданного е. Покроем каждую из этих точек интервалом длины меньше г\2р. Тогда все точки разрыва функции /■(*)= 5&П51П— будут покрыты конечным числом интервалов, X общая сумма длин которых не превосходит — + р = 8. По теореме 9.2 функция /(*) интегрируема на сегменте [0,2/л]. * В точке *=0 эту функцию доопределяем произвольно, например, полагаем /(0)=0.
§ 4. Свойства определенного интеграла 347 2) Из интегрируемости функции \ [(х) \ не следует, вообще говоря, интегрируемость !(х). Действительно, рассмотрим функцию 0\(х), равную единице для х рациональных и минус единице для х иррациональных. Тогда | й; (х) | = 1 интегр ируем а. Точно также, как и для функции Дирихле В(х), показывается, что функция 0\(х) не- интегрируема (см. пример из §1). § 4. СВОЙСТВА ОПРЕДЕЛЕННОГО ИНТЕГРАЛА. ОЦЕНКИ ИНТЕГРАЛОВ. ТЕОРЕМЫ О СРЕДНЕМ ЗНАЧЕНИИ 1. Свойства интеграла. Выясним основные свойства интеграла Римана. а) Пусть функции }(х) и §(х) интегрируемы на сегменте [а, Ь]. Тогда функции [(х) ± ±§(х) также интегрируемы на этом сегменте, причем ь ь ь | (!(х) ±§(х)) й\х = | Цх)йх ± |§(х)ёх. а а а Действительно, при любом разбиении сегмента [а, Ь] и любом выборе промежуточных точек |* справедливы следующие равенства: 2 [/ (I*) ± § (Ш А*6 = 2 / (&) Ах, ± %§ (У Ахк. к=1 к=\ к=\ Поэтому, если существует предел правой части при стремлении диаметра разбиений к нулю, то существует предел и левой части. Из линейных свойств этого предела, которые устанавливаются точно так же, как и для предела последовательностей, вытекает доказываемое свойство. -/ 'П П +± 2л 2_ х Рис. 9.4
348 Гл. 9. Определенный интеграл Римана б) Если функция 1(х) интегрируема на сегменте [а, Ь], то функция с!(х), где с = сопз1, также интегрируема на этом сегменте, причем ь ь Г с/ (*) их = с Г / (х) их. а а В самом деле, для любого разбиения сегмента [о, 6] и любого выбора промежуточных точек \к выполнено соотношение откуда, так же как и выше, получаем доказательство утверждения б). п Следствие. Линейная комбинация V с1[1 (х) интегрируе- 1=1 мых функций /,(Х) является интегрируемой функцией. в) Пусть функциц. \{х) и §(х) интегрируешь}, на сегменте [а, Ь]. Тогда 1(х)§(х) также интегрируема на этом сегменте. Запишем очевидное тождество: 4/ (х) § (х) = [! (х) + § (х) 1 *- [/ (х) -ё (х)} \ Заметим, далее, что в силу теоремы 9.4 из интегрируемости какой- либо функции и(х) следует интегрируемость ее квадрата*. Поскольку функции }{х)+§(х) и 1(х)—д(х) по свойству а) интегрируемы, то по сказанному интегрируемы и их квадраты, а следовательно, в силу указанного, функция !(х)§(х) интегрируема. г) Пусть функция {(х) интегрируема на сегменте [а, Ь]. Тогда эта функция интегрируема на любом сегменте [с, й\, содержащемся в сегменте [а, Ь]. Выберем произвольное число е>0 и такое разбиение {хк} сегмента [а, Ь], что 5—5<е. Добавим к точкам разбиения {хк} точки сие?. Для верхних сумм 5' и нижних «' вновь полученного разбиения {хк'} в силу леммы 3 § 2 тоже будет справедлива оценка 5'—5'<е. Рассмотрим разбиение {хк} сегмента [с, й], образованное точками разбиения {хк} всего сегмента [а, Ь]. Для верхних и нижних сумм 5 и 5 разбиения {хк} выполнено, очевидно, соотношение 5—5^5'—5', поскольку каждое неотрицательное слагаемое (Мк—тк)Ахк в выражении 5—5 будет слагаемым и в выражении 5'—«'. Таким образом, 5—5<е, и функция 1(х) интегрируема на сегменте [с, й). Свойство г) доказано. * Так как и2(л:) = ф[и(лг)] при <$(() = Р и функция <р(0 удовлетворяет условию Липшица на любом сегменте [т, М], ибо для любых и и ^ из сегмента \т, М] справедливо неравенство |ф(^)—ф(У I = и21—^>2| = 1^1—^1 ■ |*1 + Ы^ ^С[/[—и\, где С — наибольшее из двух чисел 2\т\ и 2\М\.
§ 4. Свойства определенного интеграла 349- Будем по определению всегда считать, что интеграл Римана от функции*, взятый в пределах от точки а до точки а, равен а нулю, т. е. Г {(х)а'х = 0. Это свойство следует рассматривать как а соглашение. Условимся также о том, что при а<Ь по определе- а Ь нию Г / (х) их = — ( / (х) их для любой интегрируемой функции^ ь а Эту формулу следует также рассматривать как соглашение. л) Если функция 1(х) интегрируема на сегментах [а, с] и [с, Ь], то функция \{х) интегрируема и на сегменте [а, Ь], причем- ь с ь Г / (х) их = Г / (х) их + Г / (х) их. а а с При а = Ь это свойство справедливо в силу принятых выше соглашений. Предположим сначала, что а<с<Ь. Выберем произвольное число е>0. Пусть {хъ} и {хь") — такие разбиения сегментов [а, с] и [с, й], что на каждом из этих сегментов 5—5<е/2. Пусть {хк} — разбиение сегмента [а, Ь], состоящее из точек разбиений [хь'} и {Хк"). Очевидно, что разность между верхней и нижней суммами разбиения {хь} не будет превосходить е. Интегрируемость функции 1(х) на сегменте [а, Ь] доказана. Пусть теперь {хк} — произвольное разбиение сегмента [а, Ь], содержащее с. Тогда 2 / (У Ах, = 2' / (Ь) Д** + 2" / (У Ахк, где 2' берется по частичным сегментам, принадлежащим [а, с]г а 2" — по частичным сегментам, принадлежащим [с, а1]. Поскольку это верно для любого разбиения, то, перейдя к пределу при стремлении диаметра разбиений к нулю, получим, что ь с а > Г / (х) йх=и (х) их + | / (х) их. а а с Если с не принадлежит [а, Ь], то сегмент [а, Ь] принадлежит либо [с, Ь], либо [а, с]. Пусть, например, с<а<Ь. В силу свойства г) функция }(х) интегрируема на [а, Ь]. Действительно, функция Цх) интегрируема на [с, Ь] по условию, а [а, Ь] а [с, Ъ\. Далее, поскольку с<а<Ь, а Ь Ь | /(х)Ох+^(х)йх= |/(*)их. с а с * Функция в точке а определена и принимает конечное значение.
350 Гл. 9. Определенный интеграл Римана Но по принятому соглашению Г / (х) их = — Г / (х) их. Таким об- с а разом, свойство д) установлено нами и для случая, когда с лежит вне сегмента [а, Ь]. Заметим, что формулу этого свойства можно записать так: с Ь а Г / (х) ах + Г / (х) ах + Г / (х) их=о. а с Ь 2. Оценки интегралов. а) Если функция }(х) интегрируема на сегменте [а, Ь] и $(х)^0 для всех х из [а, Ь], то интеграл, от функции }(х) по этому сегменту неотрицателен. Доказательство следует из того, что для любого разбиения {ха} и любого выбора |й интегральная сумма 0 = 2/(&)***> °- В этом случае предел интегральных сумм тоже будет неотрицателен. Действительно, допустим, что предел А этих сумм отрицателен. Пусть е=|Л|. Выберем разбиение {**} такое, что |ст—А\< <\А\. Но последнее неравенство может выполняться, только если ь *о<0, что противоречит условию ст^О. Значит, С/(л:)Лс;^0. а б) Интегрирование неравенства. Если функции {(х) и &(х) интегрируемы на сегменте [а, Ь] и [(х)^§(х) для всех х из ь ь [а, Ъ], то \1(х)ах<.[§{х)ах. а а Действительно, функция §(х)—\{х) интегрируема и неотрицательна на [а, Ь], так что \{ё{х)-1{х))ах^о. а Ь Ь Но тогда в силу свойства а) из п. 1 [§{х)йх—Г {(х)йх~^0, а а ■что и требовалось установить. в) Пусть функция }(х) непрерывна и неотрицательна на сегменте [а, Ъ). Если существует хотя бы одна точка Хо сегмента [а, Ь], в которой }(х0)>0, то найдется положительное число а -.такое, что ь Г / (х) ах 5* а > 0.
§ 4. Свойства определенного интеграла 351 Действительно, пусть /(*о)=Р>0. Тогда в силу непрерывности функции 1{х) в точке Хо найдется такая окрестность точки хо, что для любого сегмента [с, й\, сфй, _ лежащего целиком в этой окрестности, будет выполнено неравенство /(х)^р/2^ Но тогда в силу оценки из п. б) " Р_^_1. Г/.(х)Лс> Г/(*)<&> Г-Ьйл; = -5-(й—с) = а>0. Следовательно, Г / (х) их > а > 0. г) Если функция 1(х) интегрируема по Риману на сегмента [а, Ь], то функция \1(х)\ интегрируема на этом сегменте и |р(х)<*х|<ф/(х)|йх. а а Рассмотрим функцию <р(0 = И1- Согласно теореме 9.4 из интегрируемости }(х) следует интегрируемость ф(/(х)) = \КХ) I (так как функция ф(0 = |^1 на любом сегменте удовлетворяет условию Липшица*). Выберем теперь число а=±1 так, чтобы а {[(х)йх^ а >0. Очевидно, что а/(х) ^С | а/(х) | = \?{х) |. Тогда в силу свойства б) ь ь ь ь I Г 1(х)йх\ = а Г / (х) 6.x = Г а/ (х) их < \\Цх)\йх, а а а а что и требовалось. д) Первая формула среднего значения. Пусть каждая из функций 1(х) и §(х) интегрируема на сегменте [а, Ь] и функция §(х),. кроме того, неотрицательна (или неположительна) на этом сегменте. Обозначим через Миш точные грани }(х) на сегменте [а, Ь]**. Тогда найдется число ц, удовлетворяющее неравенствам т^.ц^.М и такое, что справедлива следующая формула: ь ъ ^{х)ё(х)йх = ^.^{х)йх. (*> а а При дополнительном предположении о непрерывности $(х) на сег- * Функция ф(0 = 1'|. очевидно, удовлетворяет условию Липшица на любом сегменте, ибо |ф(*0—ф(*2) | =Н<1|—|<21К|<1—<2|. ** Интегрируемая на [а, Ь] функция ограничена на \а, к], и потому у нее существуют на \а, Ъ~\ точные грани. ч.* .
■352 Гл. 9. Определенный интеграл Римана менте [а, Ь] можно утверждать, что на этом сегменте найдется точка I такая, что справедлива формула ь ь $/(х) Я (*) <*х = /(|) !*(*)<**• (*•> а а 'Формулу (**) принято называть первой формулой среднего значения. Формулу (*) иногда также называют первой формулой среднего значения. Заметим сразу же, что формула (**) сразу вытекает из формулы (*) и из того, что непрерывная на сегменте [а, Ь] функция достигает на этом сегменте как своих точных граней М и пг, так и любого промежуточного значения ц,(т^ц^Л4). Таким образом, нужно доказать только формулу (*). Для доказательства формулы (*) заметим, что по определению точных траней для -любого значения х из [а, Ь] справедливы неравенства Предполагая ради определенности §{х) неотрицательной на \а, Ь], -мы получим, умножая последние неравенства на §(х), что для любого х из [а, Ь] т§(х)^(х)§(х)^М§(х). (***) Так как, кроме того, в силу свойств б) и в) из п. 1 каждая из •функций т§(х), М§(х) и !(х)§(х) интегрируема на [а, Ь], то «оценка (***) позволяет утверждать справедливость следующих неравенств: ь ь ь Г т§ (х) Лс < {I (х) § (х) их < [ М§ (х) а"х а а а или, что то же самое (в силу свойства б) из п. 1), ь ь ь т [ § (х) их < [ / (л:) ^ (х) их < М \. § {х) их. (****) Ь а а Ь Ь Могут представиться два случая: 1) Г § (х) их = О и 2) Г § (х) их > 0. а а В первом случае из неравенств (****) вытекает, что ъ и потому формула (*) справедлива при любом ц. а Во втором случае, поделив неравенства (****) на число ъ \ ё (х) Лх% мы получим, что
§ 4. Свойства определенного интеграла 353 т<^ <М. ]ё{х)Лх а Для завершения доказательства формулы (*) остается обозначить СИМВОЛОМ (Д. ЧИСЛО ъ ^1{х)ц{х)йх Р = ^-ь • 1&(.х)Лх а Следствие. Сформулируем отдельно доказанную нами теорему для частного случая #(дс) = 1. Пусть функция Цх) интегрируема на сегменте [а, Ь], а символы М и пг обозначают точные грани ?(х) на указанном сегменте. Тогда найдется число ц, удовлетворяющее неравенствам т^ц^ ^М и такое, что справедлива формула ь { ?(х)йх = \1(Ь—а). а При дополнительном предположении о непрерывности Цх) на [а, Ь] можно утверждать, что на этом сегменте найдется точка 6 такая, что справедлива формула ь |/(х)й* = /(Е)(й-а). а Последнюю формулу обычно также называют формулой среднего значения. е) Вторая формула среднего значения. Пусть функция }(х) интегрируема, а функция §(х) монотонна на сегменте [а, Ь]. Тогда на этом сегменте найдется число Е такое, что' ь Ъ Ъ ^Пх)ё{х)с1х = §(а)^(х)ах + §(Ь)^Пх)с1х. а а I Установим сначала следующий факт, которым мы воспользуемся ниже Лемма Абеля*. Пусть числа р,- удовлетворяют усло- виям р^р^О при 1^]', а числа 5г = V дк {1= 1, 2, ... , п) — * Нильс Генрих Абель — норвежский математик (1802—1829). 12 Зак. 72
354 Гл. 9. Определенный интеграл Римана неравенствам пг^З^М, где ?&, пг, М также некоторые числа. п Тогда трх < % р^ < Мрх. 6=1 Доказательство. Легко проверить, что 2 Ран = ][>* (5*-5*_,) = 2 5, (рк -рш), 6=1 6=1 6=1 где положено 5о=0, р„+1=0. Так как рь^О, р&— рй+1>0, то, заменив в последнем равенстве каждое 5* сначала на т, а затем на М, получим п п п т 2 О»*—Р*+0 < 2 Р*?* < ^ 2 'О"*—РН-0» 6=1 6=1 6=1 НО п ^ {Рк—Рк+\) = Р1—Рп+1 = Рг- к=1 Таким образом, лемма доказана. Установим теперь вторую формулу среднего значения. Допустим, что функция &(х) не возрастает на [а, Ь] и неотрицательна. Функция Т(х)§(х) интегрируема как произведение двух интегрируемых функций. Пусть Мъ. и тк — точные грани ?(х) на частичных сегментах [хь.-\, хъ\.' Тогда очевидно, что п п п ^ Шьё (**_,) Ахк < 2 / (х*_0 § {Хк-1) Ахк < ^ Мь8 (*»_,) ДхА. 6=1 6=1 6=1 В силу монотонности §{х) справедлива оценка п п ]Г {Мк—тк)§(хк-1)Ахк<8(а)'^ (Мк—тк)Ахк. 6=1 6=1 В силу интегрируемости $(х) сумма в правой, а значит, и в левой части последнего неравенства стремится к нулю при стремлении диаметра й разбиений к нулю. Следовательно, при любых числах ць таких, что /п^цй^Мй, все суммы ^Г тк§(хк-1)Ахк, ^ №(хд-0 Ахк, ^ Мк§(хк-{) Ахк 6=1 6=1 6=1 Ь стремятся при */-И) к интегралу *\Цх)%{х)йх. Это следует из
§ 4. Свойства определенного интеграла 355 двусторонней оценки для интегральной суммы функции По свойству д) настоящего пункта числа \ии, где т^ць^ ** <Мк, можно выбрать так, чтобы Г / (х) их = ]хк Ахк. *к-1 X Заметим теперь, что функция Р (х) = Г {(/) <И непрерывна а на сегменте [а, Ь], так как Х+&.Х АР = Р(х+Ах)—Р{х) = Г /(/)Л = |1Лх, X Ш1 /(*)<!*< зир /(*), и, следовательно, А^-^О при Алг-»-0. Рассмотрим следующие числа 5г = V ]^к^хк — [ / (О^- 6=1 а Ясно, что т<5г-<М, где т и М — точные грани функции Р(х) на сегменте [а, Ь]. Введем следующие обозначения: Рк=8(хк-г),, <7ь=|1*Д*й, к=1, 2,...,п. В силу монотонности и неотрицательности функции §(х) выполнимо рг>Р;^0 при г'^/. Числа рк, §к, Як удовлетворяют условиям леммы Абеля. Поэтому п "Щ (а)< 2 8 (**-0 РАч < М§ {а). 6=1 п Сумма ^ § (Хк-\) У"Ахк заключена между т§(а) и М§(а). 6=1 Устремим теперь диаметр й разбиений к нулю. Тогда и предел этой суммы будет заключен между т§(а) и М&(а), т. е. будут справедливы, неравенства ь ™8 (я)< | / (*) 8 (х)Лх <-Ме (а). Т. е. из неравенств п п п 2] «6«Г (*А-1) Л*6 < ^] I (хк-1> 8 (4-1) &Ч < 2^ МкЗ (Хк) Ахк. 6=1 6=1 6=1 12*
356 Гл. 9. Определенный интеграл Римана Непрерывная функция Р (х) = Г / {I) аЧ принимает любое а значение, заключенное между ее точными гранями т и М. Так как ь т<— <М, 8 (а) то существует точка | такая, что ь г ]Нх)г (*)ах 8 («) а Следовательно, в случае, когда ё(х) не возрастает и неотрицательна, доказана формула ъ \ §Цх)е(х)<1х = 8{а)§ПЪ(и. а а Рассмотрим теперь общий случай невозрастающей функции 8(х). В этом случае функция Н(х)=§(х)—§(Ь) не возрастает и неотрицательна. Подставив ее вместо &(х) в формулу, доказанную выше, получим, что Ь I | / (х) [8 (х) -§ (Ь)) (1х = [8 (а) -8 (&)] ( [ (х) их. а а Окончательно получаем равенство ь I ьп ■ р (х) 8 (х) Ах = 8 (а) ^1{х)йх + 8Ф)\)!{х)йх— а а а г г ь -8{Ь)р{х)йх^8(а)р(х)йх + 8{Ь)\Нх)(1х, а а * что и требовалось доказать' Рассмотрим примеры на применение оценок для интегралов. Примеры. 1) Рассмотрим функцию Эта функция }(х) непрерывна на сегменте [0,1]. Легко убедиться * Если §(х) не убывает, то заменой §{(х)= —§(х) сводим этот случай к уже рассмотренному.
§ 5. Первообразная непрерывной функции 357 с помощью вычисления производной, что эта функция достигает локального минимума при хо=\/е. При этом !(1/е) =е~1/е, и это значение является ее наименьшим значением на сегменте [0,1]. Используя свойство б) настоящего пункта, получим, что е_1/е-< 1 <Гххйд;<1,а для числа е~^е легко получить, что 6-'^=0,692.... о Заметим, что в этом случае значение интеграла нельзя определить через значения элементарных функций. 2) Если функция ?(х) не является непрерывной, то формула среднего значения (**) может быть несправедливой. Рассмотрим функцию (1/2, 0<*<1/2, 1 3/4, 1/2<х<1. 1 Тогда Г / (х) их = 5/8. Значение 5/8 не принимается функцией 1(х) о ни в одной точке 1 сегмента [0,1]. Следовательно, не существует 1 числа ^е[0, 1], для которого Г/(х)с?х = /(^). § 5. ПЕРВООБРАЗНАЯ НЕПРЕРЫВНОЙ ФУНКЦИИ. ПРАВИЛА ИНТЕГРИРОВАНИЯ ФУНКЦИЙ В предыдущих параграфах уже достаточно полно изучены свойства интеграла Римана. В частности, было показано, что, пользуясь определением интеграла, можно вычислить интеграл от некоторых простейших функций. Однако такое вычисление интеграла с помощью предельного перехода в интегральных суммах обладает рядом неудобств и приводит к значительным трудностям. Поэтому на повестку дня встает вопрос о простых правилах вычисления определенного интеграла Римана. Ниже нами будет дано одно из таких правил вычисления определенного интеграла, а именно будет доказана основная формула интегрального исчисления (формула Ньютона — Лейбница). 1. Первообразная. Рассмотрим интегрируемую на сегменте [а, Ь] функцию /(*)• Пусть р принадлежит [а, Ь]. Тогда для любого х из [а, Ь] функция {(х) интегрируема на [р, х], и поэтому на сегменте [а, Ь] определена функция Р(х)=\ ?(()(И, которая р называется интегралом с переменным верхним пределом. Аналогично определяется функция Р(х) на интервале (а, Ъ) при условии, что !(х) определена на интервале (а, Ъ) и интегрируема на любом сегменте, принадлежащем этому интервалу.
358 Гл. 9. Определенный интеграл Римана Теорема 9.5. Если функция {(х) интегрируема на сегменте {а, Ь], р — любая точка этого сегмента, то производная функции X Р(х)={[(1)<И существует в каждой точке х0 непрерывно- р сти подынтегральной функции, причем Р'(х0) = ${хо) *. Доказательство. В силу непрерывности функции ^(х) в точке хо для любого е>0 найдется такое б>0, что 1(х0)—е< <!(х)<!(хо)+е, если \х— х0\<8. Для всех I из [х0, х] выполняется неравенство |/ — #о|^|* — л:о|<б. Поэтому для всех таких I /(*о)-в<НО</(*о)+в. Согласно свойству д) п. 2 § 4 (независимо от знака разности х — хо) получим из последних неравенств х ./(*<>)—Е< ^/(0<#</(*о)+.е ПРИ \х—хй\ <б. *0 (Значение и = \ / (О (И не меняется при перестановке чи- х— х0 ^ сел х и хо, так как при этом одновременно меняется знак у вели- чины х — Хо и у интеграла ("/(/)<&.).. Но ——— | /(/)Л = Р(х) — Р(х0) , I ^с _ _\_/ \_ш^ следовательно, при \х — я01<о /(^0)-8<^(Х)~^(Д;о)</(Х0)+,8, X — #о X — #0 т. е. Р'{х) существует и равна /(*о)- Теорема доказана. Следствие. Любая непрерывная на сегменте [а, Ь] функция 1{х) имеет на этом сегменте первообразную. Одной из перво- X образных является функция Р (х) = \ / (^) 6,1. а Замечание 1. Теорема остается справедливой, если }(х) непрерывна на интервале (а, Ъ). В этом случае в качестве нижнего предела надлежит взять любую точку р этого интервала* Все рассуждения сохраняются. * Если точка дг0 совпадает с одним из концов сегмента [а, Ь], то под производной в точке х0 функции Р(х) понимается левая или правая производная соответственно. Доказательство теоремы при этом не меняется.
§ 5. Первообразная непрерывной функции 359 . Замечание 2. Можно рассматривать и функцию нижнего ч предела интеграла от 1(х), т. е. функцию Ф(х) = ]" ?(()Ш. Для такой функции Ф'(х)=-1(х). Замечание 3. Если функция /(х) интегрируема на любом сегменте, содержащемся в интервале (а, Ъ), то интеграл с переменным верхним пределом есть непрерывная на (а, Ь) функция верхнего предела. Действительно, пусть Р (х) = Г / (*) 6.1, р е (а, Ъ). Тогда р Л+Дд: АР = Р(х + Ах)— Р(х) = | Ц$41 = р&х, где 1111. /(х)<[А< вир /(х) *е|>,*+л*] *е!>,-*+д*] по первой формуле среднего значения. Если функция ^(х) интегрируема, то она ограничена, а поэтому для всех достаточно малых Ал: ограничена и величина ц,, зависящая от х и Ах. Более точно, 1П1 /(х)<[х< зир /(х)*. Поэтому АР-+0 при Дх-»-0. хысй] хеи.а] Замечание 4. Интегралы с переменным верхним (или нижним) пределом можно использовать для определения новых функций, не выражающихся через элементарные функции. X Так, например, интеграл $ег*'<И, как уже отмечалось, назы- X вается интегралом Пуассона, интеграл I , , 0< о <к<1 называется эллиптическим интегралом, интеграл * х \—— <%— интегральным синусом, \ интегральным О 1 косинусом и т. д. 2. Основная формула интегрального исчисления. Мы уже знаем из предыдущих рассмотрений, что любые две первообразные функции /(х), заданной на сегменте [а, Ь], отличаются на X постоянную. Поэтому если Р(х)— ("/(*)Л, а Ф(х)—любая дру- Здесь [с, ё] — какой-либо фиксированный сегмент, принадлежащий интервалу (а, Ь) и такой, что х&[с, а), х+Ахе=\с, О].
360 Гл. 9. Определенный интеграл Римана гая первообразная непрерывной функции {(х), то Ф(х)—Р(х) = х = С = сопзг, т. е. Ф(х)= Г/(*)Л+С (см. теорему 9.5). Положим а в последней формуле сначала х—а, а затем х = Ь. Как мы усло- о вились (см. п. 1 предыдущего параграфа), Г/(/)е^ = 0 для любой а функции, принимающей конечное значение в точке а, поэтому ь Ф(а) = С, Ф(Ъ) = ^{х)йх+С. Отсюда а Ь и(х)йх = ф{Ь)—Ф{а), а и нами получена основная формула интегрального исчисления. Сформулируем ее в виде теоремы. Теорема (основная теорема интегрального исчисления). Для того чтобы вычислить определенный интеграл по сегменту [а, Ь] от непрерывной функции 1(х), следует вычислить значение произвольной ее первообразной в точке Ъ и в точке а и вычесть из первого значения второе. Теперь мы имеем правило вычисления определенного интеграла от широкого класса интегрируемых функций. Задача вычисления определенного интеграла свелась к задаче нахождения первообразной непрерывной функции. Естественно, что не для всякой функции найти первообразную просто. Мы уже неоднократно указывали функции, первообразные которых не выражаются через элементарные функции (см. например, п. I этого параграфа). В этом случае, естественно, возникает вопрос о приближенном вычислении определенных интегралов, о чем пойдет речь ниже. Основную формулу интегрального исчисления часто записы- ь вают в форме Г / (х) их = Ф (х) | *, где введено обозначение Ф{х)\ьа = Ф(Ь)-Ф(а). 3. Важные правила, позволяющие вычислять определенные интегралы. При вычислении определенных интегралов очень часто используется правило замены переменной под знаком определенного интеграла. Пусть функция х=§{() имеет непрерывную производную на
§ 5. Первообразная непрерывной функции 361 сегменте \т, М] * и гаш §У) = а, тах §Ц) = Ь, причем Ь М ё(т)=а, ё(М)=Ь. Тогда | /(х) их = | /[#(г*)]д' (/)аЧ (при уело- а т вии, что функция !(х) непрерывна на сегменте [а, Ь]). Указанная формула называется формулой замены переменной под знаком определенного интеграла. Доказательство. Пусть Ф(х)—некоторая первообразная функции [(х). Функции Ф(х) и х=%(1) дифференцируемы на сегментах [а, Ь] и [т, М] соответственно. Поэтому, согласно правилу вычисления производной сложной функции, для всех I из [т, М] <и Заметим, что производная Ф' в выражении справа вычислена по аргументу х : Ф'(§(*)) =Ф'(х), х=§(1). Заметим также, что Ф'(х)={(х). Подставив в правую часть формулы для —— Ф (§ (г*)) это равенство, получаем .-^-ф (*(')) =/От (0)^(0. Таким образом, функция Ф(§(0) является на сегменте /п^ <^<М первообразной для функции /(Я(О)Я'(О. т- е- м | / (8 (П) 8'(1)аЧ = Ф (§ (М)) - Ф (я (ш)) = Ф (Ь) - Ф (а) т Ь согласно условию. Следовательно, с одной стороны, Г / (дс) с?ж = а М = Ф(Ь)—ф(а), а с другой стороны, Ф(Ь)—Ф(а)= \ }{§{!))§'(()Ш, т что и требовалось. Сформулируем и установим теперь правило интегрирования по частям. Пусть функции /(*) и §{х) имеют непрерывные производные на сегменте [а, Ь], тогда | /(*)8' (х)их = Г(х)8(х) \ь-$д(х)Г (х)их. * Будем говорить, что §(() имеет непрерывную производную на сегменте [ш, М], если производная ^{1) существует и непрерывна в любой внутренней точке [щ, М] и существуют конечные пределы *-»т+о (-+М—О
362 Гл. 9. Определенный интеграл Римана Действительно, —— [/ (х) § (х)] = / (х) §' (х) + /' (х) § (х). Поэтому функция ^(х)ё(х) является первообразной функции [}(х)§'(х) + +Г(х) -ё{х)]. Следовательно, ^\!(х)е,(х) + Г(х)8(х)]0х = Пх)8(х)[ьв, а и наше утверждение доказано. Последнюю формулу удобно записывать в виде (№=[^]15-[м- а а 4. Остаточный член формулы Тейлора в интегральной форме. Целью этого пункта является получение формулы Тейлора для функции {(х) в окрестности произвольной точки а с остаточным членом в так называемой интегральной форме. Пусть функция ?(х) имеет в некоторой е-окрестности точки а непрерывную производную (л+1)-го порядка. Пусть х принадлежит указанной окрестности. Рассмотрим равенство /(*)-/(а) = |Г(0Л. а Полагая и(0=Г(0> у{*)=—(х — О, применим к интегралу X X Г/'(/)«#= Ги(0^о(0 формулу интегрирования по частям. По- а а лучим /(х)-/(а)=//'(0Л=-[/'(0(*-0115 + |Г(0(*-0Л = а а = /'(а)(*—а)+| ПО (*—<)*; а Таким образом, последовательно интегрируя по частям,, получим X X а а х = Г(а)(х-а) + ±Г(а){х-аГ + ± \'Г (9 (*-*)* Я = ...
§ 5. Первообразная непрерывной функции 363 ...=/' (а) (х-а) + 1/2 /" (а) (х-а)2 +... X + ±- /<") (а) (х—а)п + ± Г /<"+') (0 (х—1)п Ш = а п = %~ЦкЧа)(х-а)Ь + Яп+1(х), где х Яп+1 (X) = -|р ^ /<"+» (0 (* - О" СИ. а Мы видим, что Кп+1{х) является остаточным членом разло^ жения Тейлора для функции }(х) в окрестности точки а. Эта форма остаточного члена и называется интегральной формой. Если применить первую формулу среднего значения (см. свойство д) п. 2 § 4), то X X о а «! п+ 1 где | — некоторая точка сегмента [а, х]. Следовательно, прв тех же предположениях мы получим остаточный член в форме Лагранжа. На самом деле, легко заключить (используя теорему Дарбу о прохождении производной через все промежуточ- ные значения), что Яп+1(х) = — ————^—лишь при усло- (п +1)! вии существования и интегрируемости р+1)(д;). Рассмотрим теперь примеры, иллюстрирующие изложенный в. этом параграфе материал. Примеры. 1) Вычислить интегралы, применяя основную формулу интегрального исчисления: ь = И^Ж(х—а)п+\ (я+ 1)1 а) Сх"( йх-- *"+' /1+1 ь ь Ь"+1-ап+1 ; , п+1 б) *\&\пхйх=—созх|* = созй—соз Ь, ь Г СОЗ Хйх = 51П Ъ — 31П О.
364 Гл. 9. Определенный интеграл Римана а о а г) С Л. з ^=4-1п<°'+л^1о='т1п2' «>°- ^ а3 + х3 3 3 2) Вычислить интегралы, применяя правило замены переменной: Я/4 Я/4 1 а) СЛ*±ах= Г-^4*== Г ад = -!_*•' = 1/5, ^ сек? х л соза х ^ 5 о 0 0 0 где * = 1§х. б) ГхУ^+^Лс^ 1ЛЙ = —*» =(2/2—1)73, где 2 = |Л+*2. 3) Вычислить интеграл, применяя правило интегрирования по частям: Я/2 Я/2 1т= [ 81Пт Х&Х =— Г 51Пт—! Х& (С05 *) = О О Я/2 = — 51пт~1 х сов х |*/2 + (т — 1) Г соз2 х $тт~2 хйх = о Я/2 = (т— 1) Г (1— $\п*х)5тт-2х(1х = {т— 1)[/т_2—/т]. Отсюда: 1т = — /от_2 при /га > 2. т Легко видеть, что /о=я/2, /1 = 1. По индукции получаем, что для т>2 2т— 1 2т—3 3 1 я _ (2т—1)11 я 2т 2т —2 "" 4 2 2 ~ (2т)!! 2 /гт+1 — 2т 2т —2 2т + 1 2т — 1 Ни 5 3 (2т)Н (2т+1)!! 4) Доказать, что для функции /(*)= (1+*)а остаточный член /?„+! в интегральной форме стремится к нулю, если |*|< <1. Заметим, что
§ 6. Неравенства для сумм и интегралов 365 #п+1 = а (а — 1) .. ■ (а — п) X Г (1+ <)«-»-« (х—<)" Л. Из очевидных неравенств Цх^О, 1—л:>0 следует, что г= — (1— х)>0 или -^—^> л; л; х 1 -< \—1. х Далее, поскольку х и х — I — числа одного знака, то х — I = 1 <1— *=|1—Ц или 1—* <|*|. Следовательно, х х |^-Й^-(1 + 0в-,л|<1*1,,[(1+0в-,А = С(*,а)|*|». о о где С(х, а) не зависит от л. Иными словами, |Я„+1|<С(*, о)-|а(а— 1)... (а—л)| |*|»/л!=рп. Рассмотрим какое-либо число ц, удовлетворяющее' условию \х\<д<1. Так как - -+\х\ (п-»-оо), Рп я+1 то найдется такой номер ЛГ, что Рп+1 Рп < <7 при гС^Ы. Отсюда вытекает, что Рп^^:РN^п~N при п^Ы. Устремляя в этом неравенстве л к со, убеждаемся в том, что рп, а следовательно, и Яп+1 стремится к нулю. § 6. НЕРАВЕНСТВА ДЛЯ СУММ И ИНТЕГРАЛОВ В этом параграфе мы получим некоторые важные неравенства для сумм и интегралов. 1. Неравенство Юнга*. Рассмотрим два неотрицательных числа а и Ь и два числа р и ?, превосходящие единицу и такие, что 1/р+1/<7=1. Докажем следующее неравенство Юнга: а6< 1-ар + — Ьч. р я Доказательство. Рассмотрим функцию ^(х)—х1/р— — х1р при х>0. Поскольку !'(х) = ^-(хг1"'—1), то Г(*)>0 Вилиам Юнг — английский математик (1882—1946).
366 Гл. 9. Определенный интеграл Римана при 0<#<1 и /'(л:)<0 при х>\. В точке х=1 функция }(х) принимает наибольшее значение, причем /(1) = 1 =—.• р я Следовательно, л1/р—х/р < \Щ при всех х>0. В последнем неравенстве полагаем х=аР/Ь^, ЬфО. Неравенство Юнга при ЬфО, таким образом, установлено. При 6 = 0 оно очевидно. 2. Неравенство Гёльдера * для сумм. Пусть аи а2,...,ап и Ъ\, Ь2,...,Ьп — какие угодно неотрицательные числа. Тогда ■ЕаА<(Ев?Г(Е*),/*. 1 = 1 1=1 где 1/р+1/<7=1, р>>\, а~^\. Это неравенство называется неравенством Гёльдера для сумм. Доказательство. Заметим, что указанное неравенство однородно в том смысле, что если оно выполнено для чисел а*, Ь,-, то оно справедливо и для чисел 1щ, кЪи Поэтому доста- п п Щп точно установить, что ^ а{Ь[ < 1 при условии Уор=1, V Ь1 = 1=1 1=1 1=1 = 1, так как мы всегда можем разделить числа а, и Ь{ соот- п п ветственно на величины /V а?]1 р и (Х\ Ь4^14 **. Записав не- 1=1 1=1 равенство Юнга для таких чисел а« и ^ и просуммировав эти неравенства по 1, получим 1 = 1 1=1 1=1 п Поэтому Л, а& "С 1 = 1» что и требовалось. ла р я 1=1 Замечание. В случае р = 2, <7=2 неравенство Гёльдера превращается в неравенство ^а^Ь^<±ау±^<\ 1=1 1=1 1=1 называемое неравенством Коши — Буняковско- го *** для сумм. * О. Гёльдер — немецкий математик (1859—1937). ** Мы предполагаем, что хотя би одно из чисел а* и хотя бы одно и» чисел Ьг отлично от нуля. В противном случае неравенство очевидно. *** Виктор Яковлевич Буняковский — русский математик (1804—1889).
§ 6. Неравенства для сумм и интегралов 367 3. Неравенство Минковского* для сумм. Пусть аи а2, ... ..., ап и Ьи Ь2 Ьп — произвольные неотрицательные числа, число р>1. Тогда справедливо следующее неравенство Минковского для сумм: п 1/Р {=•1 1=1 1=1 Доказательство. Запишем равенство Ё (а,- + Ьс)" = ^ Щ (а, + Ь)"-14- ^ Ь, (а, + &,)'- «=1 1=1 1=1 К каждой из сумм, стоящих в правой части, применимо неравенство Гёльдера. Если 1/р+1/?=1, р>1, <7>1. то (р—1)?= =р, ——. . Поэтому <? Р 2 (а, + Ы < (^ а?),/р (^ {а, + &,)<р - '»)•/< + 1=1 «=1 (=1 П + (Е#Г(Е(«.-+ад(*-1)«)1/'== 1=1 (=1 ={(1</р+(1^Г)[Е(а'+6')РГ- ■> 1=1 1=1 1 = 1 п Поделив обе части последнего неравенства на [V (с* 4- (=1 р-1 + 64-)р| р , получим доказываемое неравенство. 4. Неравенство Гёльдера для интегралов. Пусть }(х) и ^(я) —две произвольные интегрируемые на сегменте [а, Ь] функции, пусть р и <7 — два числа, превосходящие единицу, и 1/р+1/<7 = 1. Тогда справедливо неравенство 'Гёльдера для интегралов \^(х)8(х)ах\<^\Г(х)\'Ох)1"'^\8{х)\''ах Уч (все написанные интегралы существуют в силу следствия из теоремы 9.4'). * Герман Минковский — немецкий математик и физик (1864—1909).
368 Гл. 9. Определенный интеграл Римана Заметим, что, как и в п. 2, достаточно рассмотреть случай, ь ь когда [ \1(х)\рйх< 1 и [\§{х)\чйх^.\, и доказать неравен- а Ъ ство I Г 1(х)§(х) йх\ < 1. Запишем неравенство Юнга в любой а точке х для функций \НХ)\ и \&(х) |. Получим Р Я Интегрируя это неравенство, получим ||/(*)1 \ё(х)\йх<\, а но, согласно свойству д) п. 2 § 4 \1!{х)8{х)йх\<^\!(х)\\ё{х)\йх. а а Поэтому доказательство завершено. Как и при выводе неравенства Гёльдера для сумм, мы ъ ь предполагали, что Ш(х)\йх фО и [\ц(х)\йхф$. В противном а а случае неравенство очевидно. Замечание. В случае р — 2, ^ = 2 неравенство Гёльдера превращается в неравенство \р(х)ё(х)йх\<^\нх)\2аху/2^\§(х)\чху/2, а а а которое называется неравенством Коши — Буняков- ского для интегралов. 5. Неравенство Минковского для интегралов. Пусть }(х) и §{х)—любые две неотрицательные и интегрируемые на сегменте [а, Ь] функции и число р>1. Тогда справедливо неравенство Минковского для интегралов {$и(х) + 8{х))р<1х}1»'<$(Г(х)аху» + (§8'(х)4х) 1/Р Заметим, что согласий следствию из теоремы 9.4' все подынтегральные функции интегрируемы. Доказательство. Точно так же, как и при доказательстве неравенства Минковского для сумм, запишем равенство
§ 7. Дополнительные сведения об интеграле Римана 369 а Ь Ь = | / (*) (/ (*) + 8 (х))"-1 <Ь+$8 (х) (/ (х) + 8 (х))р-> Же. а а Далее применяем к интегралам, стоящим справа, неравенство- Гёльдера и, как и в п. 3, получаем доказательство. По индукции можно доказать и более общее неравенство для функций М*)> Ь(х),...,!п(х), неотрицательных и интегрируемых на сегменте [а, Ь]: {{(Ы*) + М*)+... + Ш)"<ь}1/р< а а а а § 7. ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ОПРЕДЕЛЕННОМ ИНТЕГРАЛЕ РИМАНА 1. Предел интегральных сумм по базису фильтра. Рассмотрим множество всех разбиений {хи} сегмента [а, Ь]. Обозначим это множество* всевозможных разбиений символом Р*. Каждому фиксированному разбиению ИеР* отвечает некоторая интегральная сумма а. Таким образом, получается отображение множества разбиений в множество интегральных сумм. Выберем в Р* базис фильтра (базу) В* = {Ва*} с элементами Вл* = {{хк}е=Р*:<1<6}. Эта запись означает: элемент В6* есть разбиение {хь} с диаметром й, меньшим б. Вспоминая общее определение предела по базе (базису фильтра), мы можем записать, что ь Г $(х) йх = \\то, а где предел означает предел числовой функции а (интегральной суммы функции 1(х)) по базису фильтра (й-+0). В силу свойств предела по базе такой предел является единственным. Ясно, что все теоремы предыдущих параграфов, где использовался предел сумм при стремлении диаметра разбиений к нулю,. * Предполагается, что каждому разбиению отвечает и некоторый выбор, промежуточных точек.
:370 Гл. 9. Определенный интеграл Римана можно сформулировать, используя понятие предела по базису фильтра. 2. Критерий интегрируемости Лебега. Будем говорить, что множество Л точек сегмента [а, Ь] имеет меру нуль, если для любого 8>0 можно указать не более чем счетную систему интервалов, покрывающую все точки множества А и имеющую сумму длин, не большую чем е. Заметим, что число интервалов может быть и бесконечным, однако они имеют длины ап такие, что если 8п = а1+а2+ ...+ап, то 1ип5„ = /< е. В теории, изучающей меру множеств, доказывается следующий критерий интегрируемости функции ^(л:) на сегменте [а, Ь] по Риману. Теорема 9.6 (критерий Лебега). Для того чтобы ограниченная на сегменте [а, Ь] функция {(х) была интегрируемой по Риману на этом сегменте, необходимо и достаточно, чтобы множество точек разрыва этой функции имело меру нуль. Доказательство этой теоремы можно найти в книге В. А. Ильина, Э. Г. Позняка «Основы математического анализа», II, с. 265—266. ДОПОЛНЕНИЕ 1 НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ Изученное в гл. 9 понятие определенного интеграла Римана •существенно использовало два обстоятельства: 1) тот факт, что ^промежуток [а, Ь], по которому требуется произвести интегрирование, является конечным; 2) тот факт, что подынтегральная ■функция }(х) является на рассматриваемом промежутке ограниченной. , В настоящем дополнении будет дано обобщение понятия определенного интеграла Римана на два случая: 1) на случай, когда промежуток, по которому требуется произвести интегрирование, является бесконечным*; 2) на случай, когда подынтегральная функция 1(х) является неограниченной в окрестности некоторых точек области интегрирования. Возникающее при таком обобщении понятие интеграла принято называть несобственным интегралом соответственно первого или второго рода. Т. е. представляет собой полупрямую или всю бесконечную прямую.
Дополнение 1. § 1 37 Ь $ /. Несобственные интегралы, первого рода 1. Понятие несобственного интеграла первого рода. Перенесем; понятие определенного интеграла на случай, когда область, по которой производится интегрирование, является бесконечной. На прямой —оо<х< + оо существует три типа бесконечных связных, замкнутых множеств: 1) полупрямая а^лг<4-°°; 2) полупрямая —оо<х^й; 3) вся бесконечная прямая —оо<л:< + оо. Ради определенности рассмотрим подробно первое из указанных множеств, т. е. полупрямую а^д:< + 0(:)- Предположим, что функция }(х) определена на полупрямой а^д;< + оо и что для любого числа А, удовлетворяющего неравен- А ству А^а, существует определенный интеграл Римана | ?(х)с1х. а Этот определенный интеграл мы обозначим символом А Р(А)=\[(х)йх. (9.1.1> а Естественно, возникает вопрос о существовании предела функции Р(А) при Л->-+°° А 1\тР(А) = 1\т [Цх)йх. (9Л.2> Определение. Предел (9.1.2) в случае, если он существует, называется несобственным интегралом первого' рода от функции $(х) по полупрямой [а, +оо) и обозначается символом +°° ]"/(*)<&. (9.1.3)* а При этом говорят, что несобственный интеграл (9.1.3) сходится, и пишут равенство + а> А Г I (х) 6.x = 11т Г / (х) их. а а Впрочем, символ (9.1.3) употребляют и в случае, если указанного выше предела (9.1.2) не существует, но в этом случае говорят, что несобственный интеграл (9.1.3) расходится. Совершенно аналогично определяются несобственные интегралы по полупрямой —°о<лгг^Ь и по всей бесконечной прямою — оо<л;<-|-оо.
372 Гл. 9. Определенный интеграл Римана Первый из этих интегралов определяется как предел ь ь Пт Г / (х) их и обозначается символом Г / (х) их. Л-*—со -' ^ А —оо оо Что же касается интеграла Г/(л;)йл;, то он определяется как — СО предел А" Пт Г 1(х)йх А'-*—со • Л"-»+со Л при независимом друг от друга стремлении А' к —оо и А" к +°°- Из этих определений следует, что если для некоторого вещественного числа а сходится каждый из несобственных интегралов а -{-со \?(х)(1х и \[(х)с1х, то сходится и несобственный интеграл — ос а + х \ $(х)с1х, причем справедливо равенство СС -}-оо а\ -{-со Г / (х) Лх= I / (х) Ах + Г / (х) их. Заметим еще, что если сходится несобственный интеграл —(-со 1(х)йх и Ь — любое число, превосходящее а, то сходится и а -["СО -{-©О Ъ несобственный интеграл \^(х)йх, причем \{{х)с1х— \}(х)с1х + Ь а а + 00 + \^{х)йх. Это утверждение непосредственно вытекает из опре- ь деления сходимости несобственного интеграла. Примеры. 1) Изучим вопрос о сходимости несобственного интеграла Г .) 1+х2 о ' Поскольку функция /(л:) = при любом Л>0 интегрируема на сегменте [О, А], причем для нее А ? (А) = Г —^-г =агс1ёл"!^=сагс^Л, о
Дополнение 1. § 1 373 то ИтР{А) = итагс\§А = л/2. -|-00 Поэтому несобственный интеграл \ ^- сходится и для + 0= него справедливо равенство \ = — ^ 1 + х2 2 о 2) Изучим вопрос о сходимости несобственного интеграла I —^-. где а и к — произвольные вещественные числа, первое а из которых положительно (с>0). Так как функция {(х) = 1/хк при любом А>0 интегрируема на сегменте [а, А], причем '«)-№- ХХ-Х А А1-Х_а1-* 1-Я. 1 при А Ф 1, то при а>\ предел Р(А) при Л->- + оо существует и равен л при Ж1 указанный предел не существует. Я-1 +» I С их Таким образом, при Я>1 несобственный интеграл \ —,^- а сходится и равен , а при Х<1 несобственный интеграл Л — 1 их —%г расходится. а 2. Критерий Коши сходимости несобственного интеграла первого рода. Достаточные признаки сходимости. Вопрос о сходимости несобственного интеграла 1-го рода эквивалентен вопросу о А существовании предельного значения функции Р (А) = Г ((х) их 6 при А-*-+оо. Как известно*, для существования предельного значения функции Р(А) при Л->-+-оо необходимо и достаточно, чтобы она удовлетворяла следующему условию Коши: для любого е>0 можно указать такое В>а, что для любых' Ах и Л2, превосходящих В, выполняется неравенство * Гл. 3, § 4, п. 3.
374 Гл. 9. Определенный интеграл Римана \Р(А2)-Р(А1)\ = ||/(*)Дх|<е. А Таким образом, справедливо следующее утверждение. Утверждение 1 (критерий Коши сходимости несобственного интеграла). Для сходимости несобственного интеграла (9.1.3) необходимо и достаточно, чтобы для любого 8>0 можно было указать такое В>а, что для любых А\ и А2, превосходящих В, А, I Г [(х) их I < е. А Замечание. Отметим, что из сходимости несобственного интеграла не вытекает даже ограниченность подынтегральной +°° функции. Например, интеграл \$(х)йх, где функция 1(х) рав- о на нулю для всех нецелых х и равна п при х=п, где п — целое число, очевидно, сходится, хотя подынтегральная функция не ограничена. Поскольку критерий Коши мало удобен для практических применений, целесообразно указать различные достаточные признаки сходимости несобственных интегралов. В дальнейшем мы все время будем считать, что функция {(х) задана на полупрямой а<л:< + оо и для любого А>а существует А обычный интеграл Г / (л;) их. а Докажем следующее утверждение. Утверждение 2 (общий признак сравнения). Пусть на полупрямой а<х< + °° |/(*)1 <*(*). (9-1.4) Тогда из сходимости интеграла Г § (х) Лх вытекает сходимость а интеграла Г / (х) их. а +со Доказательство. Пусть Г §{х)йх сходится. Тогда, а согласно критерию Коши, для любого е>0 найдется такое В>а, что для любых А\>В и А2>В выполняется неравенство А, \\ё(х)(1х\<г. (9.1.5) Л
Дополнение 1. § 1 375 Согласно известным неравенствам для интегралов и неравенству ^*2 **2 -"2 (9.1.4) получим I Г / (х) их I < Г | / (х) \ их < Г § (х) их. Отсюда и из \ л1 л, неравенства (9.1.5) вытекает, что для любых А\>В и А2>В спра- а% ведливо неравенство Г/(д;)йх<е. Следовательно, интеграл А +со Г 1{х)йх сходится. а Утверждение 3 (частный признак сравнения). Пусть на полупрямой 0<а<д:< + оо функция $(х) удовлетворяет соотношению \}(х) \<.с/х\ где с и К — постоянные, 1>1. Тогда + 00 интеграл С / (х) их сходится. Если же существует такая посто- а янная с>0, что на полупрямой 0<а<^.х< + оо справедливо со- + 00 отношение 1(х)>>с/хк, в котором Л<1, то интеграл Г/(х)йх а расходится. Утверждение этой теоремы вытекает из утверждения 2 и примера, рассмотренного в предыдущем пункте (достаточно положить &(х) =с/хх). Следствие (частный признак сравнения в предельной форме). Если при К> 1 существует конечный -|-оэ предел Ит\[(х)\хк = с, то интеграл [[(х)йх сходится. Если а же при Я<1 существует положительный предел Пт/(л;)хя = с> *->+(» + 00 > 0, то интеграл Г / (х) их расходится. а Убедимся в справедливости первой части следствия. Для этого заметим, что из существования предела при х-*- +<х> вытекает ограниченность функции \}{х) \хх, т. е. с некоторой постоянной со>0 выполняется неравенство \{(х) | <с0/л:\ После этого применяется первая часть утверждения 3. Справедливость второй части следствия вытекает из следующих рассуждений. Так как с>0, то можно указать столь малое е>0, что с—е>0. Этому е отвечает такое В>0, что при х>-В выполняется неравенство с—г<1{х)хк (это неравенство следует из определения предела). Поэтому }(х)>(с—г)1хх, и в этом случае действует вторая часть утверждения 3. 3. Абсолютная и условная сходимость несобственных интегралов. Введем понятия абсолютной и условной сходимо-
376 Гл. 9. Определенный интеграл Римана сти интегралов. Пусть /(х) интегрируема по любому сегменту [а, А] *. +00 Определение 1. Несобственный интеграл { 1(х)йх на- а зывается абсолютно сходящимся, если сходится | \Пх)\йх. а Определение 2. Несобственный интеграл \((х)йх на- а зывается условно сходящимся, если он сходится, а ин- теграл С \1(х)\йх расходится. а Замечание. Положив в утверждении 2 §(х) = \{(х) \, мы получим, что из абсолютной сходимости несобственного интеграла вытекает его сходимость. Отметим, что утверждения 2 и 3 позволяют установить лишь абсолютную сходимость исследуемых несобственных интегралов. Приведем еще один признак сходимости 'несобственного интеграла первого рода, пригодный для установления и условной сходимости этого интеграла. Утверждение 4 (признак Дирихле — Абеля).. Пусть выполнены следующие три условия: 1) функция 1(х) непрерывна на полупрямой а<:х< + оо и име* ет ца этой полупрямой ограниченную первообразную Р(х) **; 2) функция §(х) определена и монотонно не возрастает на полупрямой а<х< +оо и имеет равный нулю предел при Х-н- + оо; 3) производная §'(х) функции &(х) существует и непрерывна в каждой точке полупрямой а<х< +оо. При выполнении этих трех условий несобственный интеграл \Цх)В(х)йх (9.1.6) а сходится. Доказательство. Воспользуемся критерием Коши сходимости несобственных интегралов. Предварительно проведем * Тогда и функция \1{х)\ интегрируема по любому сегменту [а, А]. ** Это означает, что первообразная Р(х), которую можно определить как X 1 {(1)й1, удовлетворяет для всех х^а неравенству | .Р (х) | ^.К, где К — по- а стоянная.
Дополнение I. § 1 377 интегрирование по частям интеграла Г/(х)<1х на произвольном сегменте [Аи А2], А2>А\ полупрямой а<д;< + оо. Получим А* А ]Пх)е (х) йх=Р (х) § (х) \АА]-^Р (х) ё' (х) их. (9.1.7) А А1 По условию теоремы Р(х) ограничена: \Р(х)\*сК. Так как §(х) не возрастает и стремится к нулю при л:-»--(-оо, то §{х)^0, а #'(л:)«:0. Таким образом, оценивая (9.1.7), получим 1]7 (*) 8(х)<Ь\<К [8 (4) + в (А*)] + К | (-§' (х)) их. Так как интеграл в правой части этого неравенства равен 8(А1)— 8(А2), то, очевидно, \§Нх)8(х)<1х\<2К8(А1). (9.1.8) •"1 Используя это неравенство, нетрудно завершить доказательство теоремы. Пусть е — произвольное положительное число. Так как &(х)->-0 ПРИ *->- + °о, то по данному е можно выбрать В так, что при Ах>-В выполняется неравенство 8(А\) <е/(2/С). Отсюда и из неравенства (9.1.8) следует, что для любых А\ и Л2, больших Аг В, выполняется неравенство I Г ^ (х) 8 (х) их I < е, которое, сог- Аг ласно критерию Коши, гарантирует сходимость интеграла (9.1.6). Утверждение доказано. Замечание. Требование 3) в утверждении 4 является лишним и обусловлено лишь методом доказательства (желанием применить формулу интегрирования по частям). Для того чтобы доказать утверждение 4 без требования 3), достаточно Аг применить для оценки интеграла Г / (х) 8 (х) их вторую форму- I лу среднего значения (см. свойство п. 2 § 4 гл. 9). Убедитесь в этом сами. Пример 1. Рассмотрим интеграл +-» Г -55г-Ле. «>0- (9Л.9) 1
378 Гл. 9. Определенный интеграл Римана Полагая ?(х)=&тх, §(х) = \/ха, легко убедиться что для этого интеграла выполнены все условия утверждения 4. Поэтому интеграл (9.1.9) сходится*. Пример 2. Рассмотрим интеграл Френеля Г $\пх2йх. о Согласно п. 1 этого дополнения его сходимость вытекает из схо- димости интеграла Г в\ах2йх = Г х$1пх2—их. Полагая Цх) — 1 Г1 = х&'тх2, §(х) = 1/х, легко убедимся, что выполнены все условия утверждения 4. Поэтому интеграл Френеля сходится. 4. Замена переменных под знаком несобственного интеграла » формула интегрирования по частям. В этом пункте мы сформулируем условия, при которых действуют формулы замены переменных и интегрирования по частям для несобственных интегралов первого рода. Рассмотрим сначала вопрос о замене переменной под знаком несобственного интеграла. Мы будем предполагать выполненными следующие условия: 1) функция }(х) непрерывна на полуоси а<л;< + оо; 2) полуось а<д;< + оо является множеством значений некоторой строго монотонной функции х—§({), заданной на полуоси а<^< + °° (или —оо<^<а) и имеющей на этой полуоси непрерывную производную; 3) §(а)=а. При этих условиях из сходимости одного из следующих несобственных интегралов +(|7 (х) их и ^ (8 (0) §' (О Л (или -]Г(М (0) §' (О Л) (9.1.10> а а —со вытекает сходимость другого и равенство этих интегралов. Сформулированное утверждение устанавливается с помощью следующих рассуждений. Рассмотрим произвольный сегмент [а, А]. Этому сегменту 'отвечает, согласно строгой монотонности функции §№), сегмент [а, р] (или [р, а]) оси I такой, что при изменении на сегменте [а, р] значения функции х = §^) заполняют сегмент {а, А], причем §(р)=А. Таким образом, для указанных сегментов выполне- 1 1 +Г ** * Так как |$шл: | > зтгл: = -— — — со$2* и интеграл \ —"^"при 0<а<1 2, Л «/ 2.x 1 + °= - соз2л: г* С05 2Х расходится (см. пример 2 из п. 1 § 1), а интеграл I а их сходится (в V 2>Х 1 силу утверждения 4 при /(х)=соз 2х, ё(х) = 1/(2ха)), то при 0<а<1 интеграл (9.1.9) сходится условно.
Дополнение 1. § 2 379 ны все условия п. 3 § 5 гл. 9, при которых действует формула замены переменной под знаком определенного интеграла. Поэтому имеет место равенство | / (х) ах = | / {ё (0) 8' (О <И (или = -1 / (§ (0) ё' (0 Л). (9.1.11) а а р В силу строгой монотонности функции х—§{1), Л^+оо при р->- + оо и, обратно, р->- + оо при Л->- + оо (или Л-э-+оо при р->—оо и р->—оо при Л-> + оо). Поэтому из формулы (9.1.11) вытекает справедливость сформулированного выше утверждения. Перейдем теперь к вопросу об интегрировании по частям несобственных интегралов первого рода. Докажем следующее Утверждение. Пусть функции и(х) и у(х) имеют непрерывные производные на полупрямой а<х< + °° и, кроме того, существует предельное значение Нт [и (х) V (х)] = Ь. При этих х-*.-)-00 условиях из сходимости одного из интегралов Г и (х) V' (х) их и Г V (х) и' (х) их (9.1.12) а а вытекает сходимость другого из этих интегралов и справедливость формулы 4~оо -{-оо Г и(х)^ (х)йх = Ь—и(а)ю(а)— Г V(х)и' (х)их. (9.1.13) а а Для доказательства сформулированного утверждения рассмотрим произвольный сегмент [а, А]. На этом сегменте действует обычная формула интегрирования по частям. Поэтому А. А А {и (х) у' (х) их = [и {х) V (х)]а — Г у (х) и' (х) их. а а Так как при Л->- + оо выражение [и{х)у{х)'\аА стремится к Ь—и (а) у (а), то из последнего равенства следует одновременная сходимость или расходимость интегралов (9.1.12) и справедливость формулы (9.1.13) в случае сходимости одного из интегралов (9.1.12). $ 2. Несобственные интегралы второго рода В этом параграфе будет дано обобщение понятия определенного интеграла на случай неограниченных функций.
380 Гл. 9. Определенный интеграл Римана Пусть на полусегменте [а, Ь) задана функция !(х). Точку Ь мы будем называть особой, если функция не ограничена на полусегменте [а, Ь), но ограничена на любом сегменте [а, Ь—а] а>0, заключенном в полусегменте [а, Ь). Будем также предполагать, что на любом таком сегменте функция }(х) интегрируема. При наших предположениях на полусегменте (0, Ь—а) задана функция аргумента а Ь—а Р(а)= Г Цх)йх. а Исследуем вопрос о правом пределе функции Р(а) в точке а = 0: Ь—а 11Ш а-Ч-0 \!(х)йх. (9.1.14) а Определение. Правый предел (9.1.14) в случае, если он существует, называется несобственным интегралом второго рода от функции 1(х) по сегменту [а, Ь] и обозначается символом {/<*> их. (9.1.15) При этом говорят, что несобственный интеграл (9.1.15) сходится Ь Ь—а и пишут равенство ("/( х)йх = \\т Г }(х)(1х. •) а->-+0 Л а а Символ (9.1.15) употребляют и в случае, если указанного выше предела (9.1.14) не существует, но в этом случае говорят, что несобственный интеграл (9.1.15) расходится. Замечание. Понятие несобственного интеграла второго рода легко переносится на случай, когда функция {(х) имеет конечное число особых точек. . Пример. Рассмотрим на полусегменте [а, Ь) функцию 1(х) = 1/(6—х)\ Л>0. Ясно, что точка Ъ является особой точкой для этой функции. Кроме того, очевидно, что' функция интегрируема на любом сегменте [а, Ъ—а], а>0, причем ь-а { (*-*)'~Х "~а _ (й-а)1-*--^-* пт . , Г «х % =\ Г=Т~ „ Т^1 *У*ЬФ1. I (ь-х) ( _ 1п(6—х)\ьсГ'х = 1п(Ь—а) — 1па при Я,= 1. гл ,■ Г Лх (Ь—ау~к Очевидно, предел пт I х-существует и равен — ' о->+о ^ (6— ху 1 —Я, а при Х<\ и не существует при А<>1. Следовательно, рассматриваемый несобственный интеграл сходится при я<1 и расходится при Х>1.
Дополнение 1. § 2 381 Сформулируем критерий Коши сходимости несобственного- интеграла второго рода. При этом мы будем предполагать, что функция }{х) задана на полусегменте [а, Ъ) и Ь — особая точка этой функции. Утверждение 5 (критерий Коши). Для сходимости несобственного интеграла второго рода (9.1.15) необходимо и достаточно, чтобы для любого е>0 можно было указать такое 6>0, что для любых а' и а", удовлетворяющих условию 0<а"< <а'<6, справедливо неравенство Ь—а" I Г / (х) йх I < е. Ь-а' Справедливость этой теоремы вытекает из того, что понятие сходимости интеграла по определению эквивалентно понятию существования предельного значения функции ^(а), введенной в: начале этого пункта. Мы не будем подробно развивать теорию несобственных интегралов второго рода. Это объясняется тем, что- основные выводы и теоремы предыдущего параграфа без труда могут быть перенесены на случай интегралов второго рода. Поэтому мы ограничимся некоторыми замечаниями. 1°. При некоторых ограничениях на подынтегральные функции интегралы второго рода сводятся к интегралам первого рода. Именно: пусть функция /(х) непрерывна на полусегменте [а, Ь) и Ъ — особая точка этой функции. При этих условиях в интеграле Ь—а Г ${х)йх, сс>0, мы можем произвести следующую замену переменных: х = Ь —, йх = —, <*< — I 1г Ь — а а В результате этой замены переменных мы получим равенство Ь—а. 1/<х | ■/(*)</*= | !(Ь-^±сН. (9.1.16> 1/(6-а) Пусть интеграл \$(х)йх сходится. Это означает, что сущест- а Ь—а вует предел Пт Г }(х)йх. Обращаясь к равенству (9.1.16),. а—Н> а мы видим, что существует также и предел при 1/а-»-+оо выражения в правой части (9.1.16). Тем самым доказана сходимость несобственного интеграла первого рода
.382 Гл. 9. Определенный интеграл Римана Т'М-)>< 1/(6-0) Ь ж равенство этого интеграла интегралу Г / (х) Лс. Очевидно, а -сходимость только что указанного несобственного интеграла пер- ь зого рода влечет сходимость интеграла ^[(х)а"х и равенство а этих интегралов. Итак, из сходимости одного из интегралов Ь +ое а \1ф~а) • следует сходимость другого и равенство этих интегралов. 2°. Для несобственных интегралов второго рода легко доказываются утверждения, аналогичные утверждениям п. 2 предыдущего параграфа, которые можно объединить общим наименованием «признаки сравнения». Отметим, что во всех формулировках функция 1(х) рассматривается на полусегменте [а, Ь), где Ь — особая точка функции. Частный признак сравнения будет иметь следу- лощий вид. Если |/(л;)|<с(Ь—х)~\ где Х<1, то несобственный интеграл (9.1.15) сходится. Если же /(х)>с(Ь—х)~\ где с>0 и Х>1, то ..несобственный интеграл (9.1.15) расходится. Доказательство вытекает из общего признака сравнения и примера, рассмотренного выше. В полной аналогии с п. 4 предыдущего параграфа для несобственных интегралов второго рода формулируются правила интегрирования путем замены переменной и интегрирования по частям. $ 3. Главное значение несобственного интеграла Определение. Пусть функция ((х) определена на прямой —оо<х< + со и интегрируема на каждом сегменте, принадлежащем этой прямой. Будем говорить, что функция {(х) интегри- А руема по Коши, если существует предел Пт {Цх)йх. Этот предел мы будем называть главным значением ..несобственного интеграла от функции \(х) (в смысле Коши) и обозначать символом * * V. р. — начальные буквы французских слов «Уа1еиг рппараЬ, обозначаю- яцих «главное значение». Подчеркнем, что, в отличие от понятия несобственного
Дополнение 1. § 3 383» + 00 А V. р. С 1{х)йх= Нт Г }(х)с1х. ^ А-*+к> ^ . Пример 1. Найдем главное значение интеграла от функции* х. Поскольку в силу нечетности х, А +оо Г х их = 0, то V. р. Г х их = 0. —А —6о + 00 Точно так же заключаем, что V. р. Г 51пл;^л; = 0. 00 Справедливо следующее Утверждение. Пусть функция 1(х) интегрируема на каждом сегменте прямой —оо<д:< + оо. Если эта функция 1(х) нечетна, то она интегрируема по Коши и главное значение интеграла от нее равняется нулю. Если функция }(х) четна, то она интегрируема по Коши тогда, и только тогда, когда сходится несобственный интеграл +=° | 1{х)йх. (9.1.17). о Первая часть этого утверждения является очевидной. Для доказательства второй части достаточно воспользоваться равенством А А ( }(х)йх = 2 Г/(*)<!»;, справедливым для любой четной функ- 'а о ции, и определением сходимости несобственного интеграла- (9.1.17). Понятие интегрируемости по Коши можно ввести и для несобственных интегралов второго рода в случае, когда особая точка! является внутренней точкой сегмента, по которому производится; интегрирование. Определение. Пусть функция \(х) определена на сегменте [а, Ь], кроме, быть может, точки с, а<с<Ь, и интегрируема на любом сегменте, принадлежащем либо \[а, с), либо (с, Ь]. Будем говорить, что функция 1(х) интегрируема по Коши, если: существует предел А" интеграла I / (дг) их, определяемого как предел Игл Г ?(х)йх при ■) А'-*— с», Л"-»+оо ■>, — 00 А' независимом стремлении А' к —оо, А" к +°о, интеграл по Коши определяется как предел при Л->+оо интеграла в симметричных пределах. ]" ?(х)Лх. —А
384 Гл. 9. Определенный интеграл Римана Игл ( Г 1{х)йх+ | Цх)йх\ = V. р. \1{х)йх, а > О, а с+а а называемый главным значением интеграла в смысле Коши. Пример 2. Функция 1/(х—с) не интегрируема на сегменте [а, Ь], а<с<Ь, в несобственном смысле, однако она интегрируема по Коши. При этом Ь с—а, Ь их ,. 1С их Г их \ , Ъ — с = 1П . у.р. Г_^_ = Игл ( [-^-+ (-*- ^ х — с а->+0 \^ л:—с ^ д: — I а с-\-а ДОПОЛНЕНИЕ 2 Интеграл Стилтьеса * Понятие интеграла Стилтьеса является непосредственным обобщением понятия интеграла Римана, построению которого была посвящена гл. 9. В настоящем дополнении мы приведем основные сведения об интеграле Стилтьеса. 1. Определение интеграла Стилтьеса и условия его существования. Понятие интеграла Стилтьеса реализует идею интегрирования функции Дх) относительно другой функции и(х). Пусть функции /(х) и и(х) определены и ограничены на сегменте [а, Ь] и {хк} — разбиение этого сегмента **: а = Х0<Х1<...<Х1-1<Х1<...<Хп = Ь. Сумму вида о- = /(Ы:[и(*1)—ы(*о)] +••• + /(!«) [и{х{)—и{х1-{)\ +... (9.2.1) - + 1(1п){и{хп)—и(хп-1)], где д;[-_1<|г<х,-, 1=1, 2,..., п, называют интегральной суммой Стилтьеса. Число / называют пределом интегральных сумм (9.2.1) при тах Ах,-*•(), если для любого е>0 найдется 8>0 такое, что при тах Ах1 < б справедливо неравенство \а—/|<е. 1<1<га Определение. Функция \(х) называется интегрируемой по функции и(х) на сегменте [а, Ь], если существует конечный предел интегральных сумм (9.2.1) при тах Ахг->-0. Указанный предел называется интегралом * Т. Стилтьес — голландский математик (1856—1894). ** Мы предполагаем, что а<6. Случай а>Ь сводится к рассматриваемому.
Дополнение 2 385 Стилтьеса (или интегралом Римана—Стилтьеса) от функции [(х) по функции и(х) на сегменте [а, Ь] и обозначается символом ь /=|/(х)Жф). (9.2.2) а Функцию и (х) иногда называют интегрирующей функцией. Т. Стилтьес пришел к идее такого интеграла, рассматривая положительное «распределение масс» на прямой, заданное возрастающей функцией и(х), точки разрыва которой соответствуют массам, «сконцентрированным в одной точке». Интеграл Римана представляет собой частный случай интеграла Стилтьеса, когда в качестве интегрирующей функции взята функция х+с, где с=соп81. Укажем ряд условий существования интеграла Стилтьеса (т. е. условий, когда функция }(х) интегрируема по функции и(х)). Предположим, что интегрирующая функция и (х) является возрастающей. Отсюда следует, что, поскольку а = Хо<Х1<...<Х1-1<Х1<...<хп=Ь, все Д«(*,•) = и(х{) — и(*,■_!) >0. Это позволяет, заменяя Дат, на Аи(х^, повторить почти все построения, проводимые для интеграла Римана. Аналогично суммам Дарбу для обычного интеграла Римана вводятся верхняя и ниж«яя суммы Дарбу—Стилтьеса л п 3='^М1[и(х1)—и(х^1)], & = %т1[и(х1) — и(х{-1)], (9.2.3) 1=1 1=1 где М.1 и т,- — точные верхняя и нижняя грани функции {(х) на сегменте [хг-и х{\. Суммы (9.2.3) называются соответственно верхней и нижней суммами Дарбу—Стилтьеса. Как и в случае сумм Дарбу (т. е. в простейшем случае и(х)=х+с, с = сопз1) при одном и том же разбиении выполнены неравенства 5<а<5, причем 5 и 5 служат точными гранями для стилтьесовых сумм а, отвечающих всевозможным выборам промежуточных точек |,- на частичных сегментах. Суммы Дарбу—Стилтьеса обладают (как и в простейшем случае) свойствами: а) если к имеющимся точкам разбиения добавить новые точки, то нижняя сумма Дарбу—Стилтьеса может от этого лишь возрасти, а верхняя сумма — лишь уменьшиться; б) каждая нижняя сумма Дарбу—Стилтьеса не превосходит любой верхней суммы, отвечающей тому же или другому разбиению сегмента [а, Ь]. 13 Зак. 72
386 Гл. 9. Определенный интеграл Римана Аналогично тому, как это сделано при построении интегра-. ла Римана, вводятся верхний и нижний интегралы Дарбу— Стилтьеса: /* = т.{5}, /.=зир{5}, где нижняя и верхняя грани берутся по всевозможным разбиениям сегмента [а, Ь]. Легко проверить, что справедливы соотношения Точно так же, как и в случае обычного интеграла Римана, в случае интеграла Стилтьеса доказывается, что верхний интеграл Дарбу—Стилтьеса является пределом верхних сумм 5 при стремлении диаметра разбиений к нулю. Аналогично нижний интеграл Дарбу—Стилтьеса есть предел нижних сумм я (см. п. 2, § 2, основную лемму Дарбу). Сформулируем теперь теорему, которая является обобщением основной теоремы п. 1 § 3 и справедлива в случае интеграла Римана—Стилтьеса. Основная теорема. Для того чтобы ограниченная: на сегменте [а, Ь] (а<Ь) функция 1(х) была интегрируемой на этом сегменте по возрастающей функции и(х), необходимо и достаточно, чтобы для ^любого е>0 нашлось такое разбиение {хк} сегмента [а, Ь], для которого 3—5<е. Доказательство этой теоремы (как, впрочем, и других упомянутых выше фактов- и свойств) является дословным повторением рассуждений, проведенных для интеграла Римана. Укажем теперь некоторые классы интегрируемых по Рима- ну — Стилтьесу функций. 1. Если функция \(х) непрерывна, а и(х) возрастает на сег- ь менте [а, Ь], то интеграл Стилтьеса [?{х)йи{х) существует. а Доказательство этого факта полностью аналогично доказательству теоремы 9.1 (см. п. 2 § 3). Замечание. Указанный выше факт справедлив и в том случае, когда функция и(х) является функцией ограниченной вариации*. Так называются функции и(х), определенные на сегменте [а, Ь], а<Ь и обладающие тем свойством* что для любого разбиения Хо = а<Х1<Х2<...<Х1<Х1+1<...<Хп= Ь п—1 числовое множество У[{*Л] = V \и(х{+\) — и(х{)| ограниче- но сверху. * Или ограниченного изменения.
Дополнение 2 387 Точная верхняя грань множества {У[{#*}]} называется полным изменением или полной, вариацией функ- ъ ции и(х) на сегменте [а, Ь] и обозначается символом Уи(х) = а = зир {V [{хк}]}. Для функций ограниченной вариации справедлив следующий основной критерий: Для того чтобы функция и(х) имела на сегменте [а, Ь] ограниченную вариацию, необходимо и достаточно, чтобы она представлялась на этом сегменте в виде разности двух возрастающих и ограниченных функций: и{х)=§{х)—Н{х). Таким образом, в случае, когда и(х) — функция ограниченной вариации, сумму Стилтьеса, отвечающую функции и{х), можно записать в виде а=2 / (У а» (*,)=2 / (ь)А^ &) -1 / (&)АН &)=<* -а» 1=1 {=1 1=1 где Аи{х1)=и(х:)—и{х1-г), Д#(х,-) = §(*«) — §(*м), ДМ**) = = М*<) — й (*,•_!). Суммы 01 и 'Ог стремятся к конечным пределам при стремлении диаметра разбиений к нулю, так как §(х) и п(х) — возрастающие функции. Поэтому существует конечный предел и сумм а при стремлении диаметра разбиений к нулю. Следовательно, теорию интеграла Стилтьеса можно строить и в случае, когда интегрирующая функция и(х) имеет ограниченную вариацию, вполне аналогично случаю возрастающей функции и(х). Выделим еще один класс функций, для которых существует интеграл Стилтьеса. 2. Интеграл Стилтьеса (9.2.2) существует при условии, что функция 1(х) интегрируема на сегменте [а, Ь] по Риману, а функция и(х) удовлетворяет на этом сегменте условию Липшица, т. е. условию \и\х')—и(х")\<с\х'—х"\, где с=сопз1, для любых х' и х" из [а, Ь]. Так как функция, удовлетворяющая условию Липшица, является функцией с ограниченной вариацией, то для доказательства этого критерия, очевидно, достаточно рассмотреть лишь случай возрастающей функции и(х), удовлетворяющей условию Липшица, и заметить, что 5 — «= V (АГ, — гщ) Аи (х{) < С У (М{ — да,) Д*„ (9.2.4) аз*
388 Гл. 9. Определенный интеграл Римана где Мг = зир/(х), т( = т1/(л:), хе|д;и, *,-], Аи(Х1)ши(х1)— —и(х1-\), с — постоянная из условия Липшица. Выражение п V (М1 — т1)Ах1 в неравенстве (9.2.4) может быть сделано, 1=1 в силу интегрируемости по Риману функции /(х), сколь угодно малой величиной за счет выбора разбиения сегмента [а, Ь]. Следовательно, величина 5—5 также может быть сделана меньше наперед заданного числа е>0, если выбрать диаметр разбиения достаточно малым. Согласно утверждению основной теоремы функция }(х) интегрируема по Стилтьесу. В общем случае функции и(х), удовлетворяющей условию Липшица, также можно рассмотреть представление и{х) =сх—[сх—и(х)] = щ(х)—и2(х). В этом представлении обе функции и\(х) и и%{х) удовлетворяют условию Липшица и возрастают *. В таком случае доказательство завершается так же, как и выше. Укажем, наконец, еще один класс интегрируемых по Стилтьесу функций. 3. Если функция \(х) интегрируема на сегменте [а, Ь] по Риману, а функция и(х) допускает представление в виде интеграла с переменным верхним пределом X а где <р(|) — интегрируемая на сегменте [а, Ь] по Риману функция, то интеграл (9.2.2) существует. Действительно, так как <р(|) интегрируема по Риману, то она ограничена: |ф(&) | </С=сопз1. Следовательно, \и(х')-и(х")\=\]<р(Ъ)(11\<К\х'-х"\. ж' ' Поэтому справедливость этого критерия вытекает из справедливости предыдущего. Заметим, что в ряде случаев интеграл Стилтьеса ь / = Г / (х) йи (х) сводится к интегралу Римана по формуле а Ь Ь и(х)йи(х)=и(х)ч(х)йх. (9.2.5) а а * Для функции иг(х) при х">х", очевидно, можно записать соотношение иг(х')—и2(х")^с(х'-х")+[и(х')-и(х")]>0.
Дополнение 2 389 В частности, равенство (9.2.5) имеет место в случае, если и(х) имеет ограниченную и интегрируемую в смысле Римана на сегменте [а, Ь] производную и'(х). В этом случае ф(х) = = и'(х). 2. Свойства интеграла Стилтьеса. Сформулируем ряд свойств интеграла Стилтьеса, непосредственно вытекающих из его определения. а) Линейное свойство как относительно интегрируемой, так и относительно интегрирующей функции (при условии существования каждого из интегралов Стилтьеса в правой части): ь ь ь | (а/а + Р/2) Ли = а | /^ц + р | /2йм, Г }(1 [ош1 + р«2] = а Г /сЦ + Р Г /йы8, а а а здесь а, р — произвольные числа. б) .Если выполнено условие а<с<,Ъ, то ь с ь |7 (х) йи (х) = Г / (х) <2и (х)+ [ / (х) с?ы (х), а а а в предположении, что существуют все три интеграла. Подчеркнем, что из существования обоих интегралов ^(х)а"и(х) и [[(х)йи(х), вообще говоря, не вытекает су- а с Ь ществование интеграла Г/(х)с(и(х). Вот соответствующий пример: О, если — 1 < х < О, если 0 < х < 1, А Ф 0; 0, если — 1 < х < 0, и (х) = , I В, если 0<х<1, ВФО. О 1 Интегралы $1(х)йи{х), |/(х)йи(х) оба существуют и рав- —1 0 ны нулю, так как соответствующие им суммы Стилтьеса все равны нулю. Действительно, в первом интеграле }(х)=0, — 1<л:<0, во втором Аи(х1) = и(х1)—«(х,_1)=0 для любого 1 разбиения сегмента [—1, 1]. Однако интеграл ('/(х)йц(х)
390 Гл. 9. Определенный интеграл Римана не существует. В самом деле, пусть {х*} — разбиение сегмента [—1, 1], не содержащее в качестве точки разбиения точку 0. п Тогда в сумме Стилтьеса о*=V /(&) &и(х{) остается лишь 1=1 одно слагаемое, а именно слагаемое /(Е*) [и(**)-"(**-!)]= Я/(Ы. ВфО, для которого точка нуль содержится в сегменте [х*-ь Хь\- В зависимости от того, будет ли |* удовлетворять условию |а<0 или |й>0, мы получим, что о=0 или а=А-ВфО, так что ; а не имеет предела при стремлении диаметра разбиений к ну- : лю. Указанный факт связан с тем, что как у функции {(х), так и у функции и(х) точка 0 является точкой разрыва. в) Для интеграла Стилтьеса (9.2.2) справедлива формула среднего значения. Пусть функция /(х) ограничена на сегменте [а, Ь], так что т<1(х)<М, а функция и{х) возрастает на этом сегменте. Тогда найдется такое число ц, удовлетворяющее неравенствам т<ц<;И, что для интеграла Стилтьеса справедлива формула среднего значения ь Г / (х) йи (х) = ц [и (Ь)—и (а)]. а В частности, если дополнительно предположить непрерывность /(х) «а сегменте ,[а, Ь], то найдется точка |е[а, Ь] такая, что ц=/(|). Доказательство этой формулы вполне аналогично доказательству формулы среднего значения для интеграла Римана (см. п. 2, § 4).
Глава 10 ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА § 1. ДЛИНА ДУГИ КРИВОЙ 1. Понятие простой кривой. Начнем наше рассмотрение с выяснения понятия кривой. Пусть на сегменте [а, р] заданы две непрерывные функции <р{{) и 1|)(0- Аргумент этих функций будет в дальнейшем называться параметром. Рассмотрим плоскость (х,у), т. е. совокупность всевозможных упорядоченных пар (х,у) чисел лиг/. Каждая такая пара называется точкой плоскости, а числа л: и у называются координатами этой точки. Точка (х, у) может обозначаться также одной буквой М, при этом запись М(х, у) означает, что точка М имеет координаты х и у. Если рассматривать параметр I как время, то уравнения *=<р(0» г/=,Ф(0. «<*<Р (ЮЛ) определяют закон движения точки М с координатами х и у на плоскости. Множество {М) точек М, отвечающих всевозможным значениям параметра I из [а, р] можно рассматривать как след точки М, движущейся по закону (10.1). В общем случае даже для непрерывных функций ср(^) и /ф(?) этот закон движения может быть очень сложным. Например, можно так подобрать непрерывные на сегменте а</<р функции ср(0 и 1р(0> чт0 пРи изменении параметра I на этом сегменте точки {М(х, у)} заполняют целый квадрат*. Введем понятие простой плоской кривой. Определение. Множество {М} всех точек М, координаты х и у которых определяются уравнениями х=ц>({), у=^(() при I из [а, р], называется простой плоской кривой Ь, если различным значениям параметра I из [а, р] отвечают разные точки множества {М}. Каждую точку множества {М}, определяющего простую плоскую кривую, называют точкой этой кривой, причем точки, отвечающие граничным значениям аир параметра I, называются граничными точками простой кривой. При этом говорят, что «уравнения (10.1) определяют простую плоскую кривую Ь» или «простая плоская кривая Ь параметризована при помощи уравнений (10.1)». _* См. Бибербах. Дифференциальное и интегральное исчисление, ч. 1,
392 Гл. 10. Геометрические приложения определенного интеграла Примером простой кривой является график полуокружности радиуса г, лежащей в верхней полуплоскости с центром в начале координат: лг=гсо5^, у = г$'т1, при 0-<^<я. Более общим примером простой кривой является график непрерывной на сегменте [ее, р] функции у = {(х); параметризацию этой кривой вводят по правилу х = 1, г/ = /(0 при ге[а, р]. Заметим, что простые кривые не исчерпывают всего множества кривых, которые могут быть определены уравнениями (10.1). В следующем пункте мы рассмотрим более общие кривые, определяемые этими уравнениями. В заключение этого пункта сделаем два замечания. Замечание 1. Одна и та же простая кривая Ь может быть параметризована различными способами. Целесообразно рассматривать только те параметризации, которые получаются из данной путем представления параметра I в виде непрерывных строго монотонных функций другого параметра 5. При таких преобразованиях параметра сохраняется порядок следования точек на кривой Ь. Замечание 2. Пусть Ь^ и Ь% —■ две простые кривые, причем граничные точки кривой Ьх совпадают с граничными точками кривой Ь2, а любые не граничные точки кривых Ь{ и Ь2 различны. Кривая Ь, полученная объединением кривых Ь{ и Ь2, называется простой замкнутой кривой. 2. Понятие параметризуемой кривой. В предыдущем пункте мы рассматривали простые кривые. Следует заметить, что в математическом анализе часто приходится рассматривать кривые, не являющиеся простыми, например кривые, имеющие точки самопересечения или целые участки самоналегания. В связи с этим возникает необходимость ввести в рассмотрение понятие так называемой параметризуемой кривой. Будем считать, что множество {/} представляет собой либо сегмент, либо полусегмент, либо интервал, либо числовую прямую, либо открытую или замкнутую полупрямую. Введем понятие разбиения множества {/}. Будем говорить, что конечная или бесконечная система сегментов {[^-1, ^г]} разбивает множество {т}, если, во-первых, объединение всех этих сегментов представляет собой все множество Щ и, во-вторых, общими точками любых двух сегментов системы могут быть лишь их концы. Рассмотрим примеры разбиений некоторых из указанных выше множеств {{}. 1) Система сегментов [0, 1/2], [1/2, 1], очевидно, разбивает сегмент [0, 1].
§ 1. Длина дуги кривой 393 2) Система сегментов [га—1, га], где л=1, 2, ..., разбивает полупрямую [0, оо). 3) Система сегментов [га—1, л], где п — любое целое число, очевидно, разбивает всю числовую прямую. Пусть множество Ц} представляет собой одно из указанных выше множеств, а функции <р(?) и г)з(^) непрерывны на этом множестве. Введем понятие параметризуемой кривой. Определение. Будем говорить, что уравнения *=<р(0, У=Ъ(1) (Ю.2) задают параметризуемую кривую Ь, если существует такая система сегментов {[^-1, и]}, разбивающих множество {I}, что для значений I из каждого сегмента этой системы уравнения (10.2) определяют простую кривую. Между точками кривой Ь можно ввести некоторое отношение порядка. Пусть точка М1 соответствует значению параметра и, а точка М% — значению 4- Мы скажем, что точка М4 предшествует точке М% (и запишем М^Мг) если ^^<^2. Заметим, что точки, отвечающие различным значениям параметра, всегда считаются различными. Таким образом, параметризуемую кривую можно рассматривать как объединение простых кривых, причем эти простые кривые последовательно пробегаются точкой М, координаты которой определяются уравнениями (10.2), когда параметр I, монотонно возрастая, пробегает множество {(}. Замечание 1. Простую кривую можно рассматривать как частный случай параметризуемой кривой. В этом случае система сегментов, разбивающих сегмент [а, р], состоит из одного сегмента, а именно из самого сегмента [а, р]. Замечание 2. Про параметризуемую кривую, определяемую уравнениями (10.2), говорят также, что эта кривая параметризована при помощи уравнений (10.2). Заметим, что одна и та же кривая Ь может быть параметризована различными способами. Мы будем рассматривать всевозможные параметризации кривой Ь, получающиеся из любой данной параметризации путем представления параметра ( в виде непрерывных, строго возрастающих функций другого параметра 5. Только при таких преобразованиях параметра сохраняется порядок следования точек на кривой Ь. Замечание 3. Понятие пространственной кривой вводится в полной аналогии с понятием плоской кривой. Так же, как и для плоской простой кривой, пространственная простая кривая — это множество {М} точек пространства, координаты х, у, г которых определяются уравнениями * = ф('). «/='Ф(0. 2 = Х(0. а<*<р, (Ю.З)
394 Гл. 10. Геометрические приложения определенного интеграла при условии непрерывности функций ср(^), ^Ц), %(0 на сегменте [а, р] и при условии несовпадения точек множества {М}, отвечающих различным значениям параметра I. Используя понятие простой пространственной кривой и понятие разбиения множества {1} изменения параметра, так же как и в плоском случае, дается определение параметризуемой пространственной кривой (задаваемой уравнениями (Ю.З)). Приведем примеры параметризуемых кривых. 1) Пусть плоская кривая Ь задается уравнениями Х = С05^, у = 5\Г\{, 0<^<3я. Очевидно, сегмент [0,Зя] можно разбить на сегменты [0,л], [я, 2я], [2я, Зя] такие, что для значений I из каждого указанного сегмента выписанные уравнения определяют простую кривую, а именно полуокружность. В данном случае кривая Ь представляет собой окружность, у которой полуокружность, лежащая в верхней полуплоскости, проходится дважды. 2) Уравнения Х = СОЗ^, г/ = 31П^, 2—1, — 00<^<00, задают простую пространственную кривую, называемую винтовой линией. 3. Длина дуги кривой. Понятие спрямляемой кривой. В этом пункте мы введем понятие длины дуги параметризуемой кривой и рассмотрим некоторые свойства кривых, имеющих длину дуги (такие кривые принято называть спрямляемыми). Условимся называть прямой линию, определяемую парамет. рическими уравнениями х = а1 + Ь, у = с1+й. Всегда можно выбрать так постоянные а, Ь, с и с?, чтобы прямая проходила через две данные точки М\.(х1, у{) и М2(х2, г/г). Участок прямой между точками Му и М2 называется отрезком, соединяющим эти точки, а совокупность конечного числа примыкающих друг к другу отрезков называется ломаной. Пусть плоская кривая Ь параметризуется уравнениями *=<?(*)» У=Ц(1), ^[«. Р]- Пусть, далее, Т — произвольное разбиение сегмента [а, р] точками а = 2'о<^<4< ... <^п = р*. Обозначим через М0, Ми...,Мп соответствующие точки кривой Ь, т. е. точки с координатами Мо(Ф(М> Ч>('о)), МЫ*!), *(*1», Ма(<р(*я), 4>(*а)),... ..., ЛМ<р(*п).1|>('п))- Возникающую при этом ломаную 1{и)=МоМцМг... Мп будем на- * В гл. 9 разбиение сегмента мы обозначали символом {<*}.
§ 1. Длина дуги кривой 395 зывать ломаной, вписанной в кривую Ь и отвечающей разбиению Г сегмента [а, р]. Длина |/,| звена /,-=.М(-_1.Мг этой ломаной есть расстояние между точками Мг_д (ф(^_1), \|;(^_1)) и М(ф(Ь)',Ф(*|)).Поэтому-|/,| = 1/[ф (^)-ф(^-1)]2 + № &) -ф {*[-х)Г и длина |/| всей ломаной /=МоМ1М2... Мп будет равна {=1 1=1 Введем понятие спрямляемой кривой. Определение. Кривая Ь называется спрямляемой, если множество {\1\} длин вписанных в кривую Ь ломаных 1 = 1 (^»), отвечающих всевозможным разбиениям Т сегмента [а, р], ограничено. При этом точная верхняя грань множества {\1\} называется длиной дуги кривой Ь и обозначается символом \Ь\. Из сформулированного определения нетрудно заключить, что длина \Ь\ дуги Ь кривой всегда положительна. Замечание 1. Существуют неспрямляемые кривые. Пример неспрямляемой кривой можно найти в книге В. А. Ильина и Э. Г. Позняка «Основы математического анализа», 1 (М., 1982, с. 382—386). Докажем следующее вспомогательное утверждение. Лемма. Пусть |/0| — длина ломаной, вписанной в кривую Ь и отвечающей разбиению Г0 сегмента [а, р], а \и\ — длина ломаной, вписанной в кривую Ь и отвечающей разбиению Тъ полученному из разбиения Г0 посредством добавления одной или нескольких новых точек. Тогда |/о|<|/1|. Доказательство. Достаточно рассмотреть случай, когда к разбиению Г0 добавляется одна точка у. В этом случае ломаная, отвечающая разбиению Го, отличается от ломаной, отвечающей разбиению Ти только тем, что одно звено МкМк+1 ломаной, отвечающей разбиению Го,"заменяется двумя звеньями МкИ и ЫМь+1* ломаной, отвечающей разбиению Т1 (все остальные звенья у ломаных, отвечающих разбиениям Г0 и Ти являются общими). Так как длина одной стороны треугольника МъМь+±Ы не превосходит суммы длин двух других его сторон, то \МкМк+1\<3 <\МкЫ\-\-\ЫМь+1\, а это и означает, что |/о|<|/1|. Лемма доказана. Приведем некоторые свойства спрямляемых кривых: 1°. Если кривая Ь спрямляема, то длина \Ь\ ее дуги не зависит от параметризации этой кривой. Действительно, пусть имеются две параметризации кривой ^, а ^ я з — параметры этих параметризаций, определенные соответственно на сегментах [а, р] и [а, Ь]. Так как I представляет собой строго монотонную и непрерывную функцию от 5, а * Мы обозначили через N точку, отвечающую значению параметра 1—у.
396 Гл. 10. Геометрические приложения определенного интеграла 5 — строго монотонную и непрерывную функцию от I, то каждому разбиению Т сегмента [а, Р] соответствует определенное разбиение Р сегмента [а, Ь] и наоборот. Очевидно, что вписанные в Ь ломаные, отвечающие соответствующим разбиениям сегментов [а, р] и [а, Ь], тождественны, и поэтому их длины равны. Но тогда и точные верхние грани двух тождественных числовых множеств равны, т. е. равны длины кривой Ь при двух различных параметризациях. 2°. Если спрямляемая кривая Ь разбита при помощи конечного числа точек М0, Ми ..., Мп на конечное число кривых I,,-, причем точки Мо, Ми...,Мп соответствуют значениям и, и,..., 1п параметра I и а = и<и< ... <^п = р, то каждая из кривых Ь^ спрямляема и сумма длин \Ьг\ всех кривых Ьг равна длине \Ь\ кривой Ь. Очевидно, это свойство достаточно доказать для случая, когда кривая Ь разбита точкой С на две кривые Ь1 и Ь2. Обозначим через у значение параметра I, которому отвечает точка С. Тогда точки кривой Ьг соответствуют значениям параметра I из сегмента [а, у], а точки кривой Ь% соответствуют значениям параметра I из сегмента [у, р]. Пусть 7\ и Т2 — произвольные разбиения указанных сегментов, а Т— разбиение сегмента [а, р], полученное объединением разбиений Т1 и Г2. Если |^|, \к\, |/| — длины ломаных, вписанных в кривые Ьи Ьг и Ь и отвечающих разбиениям Ти Т2 я Т указанных выше сегментов, то, очевидно, 1М + 1ЫЧ*|. 0°-4) Поскольку числа |/1|, |/21 и |/| положительны, то из равенства (10.4) и спрямляемости кривой Ь следует, что множества длин вписанных в кривые Ьг и Ьг ломаных, отвечающих всевозможным разбиениям сегментов [а, -у] и [?> Р]. ограничены, т. е. кривые Ь\ и ^2 спрямляемы. Отметим, что из равенства (10.4) и из определения длины дуги кривой следует, что длины \Ь\\, \Ь2\ и \Ь\ дуг кривых ^1, ^2 и Ь удовлетворяют неравенству \и\ + \Ц\<\Ц. (Ю.5) Действительно, из равенства (10.4) вытекает, что для любых разбиений 7\ и Т2 сегментов [а, у] и [у, р] справедливо неравенство |М1| + |М<:|/|. Из этого неравенства и определения точной верхней грани получим неравенство (10.5). Покажем, что в неравенстве (10.5) на самом деле знак неравенства можно заменить на знак равенства. Предположим противное, т. е. предположим, что | Ь\ | + | Ь2 \ < \ Ь \. Тогда число |1|-(|1,| + |12|)=е (10.6) положительно. Из определения длины \Ь\ дуги кривой Ь вытекает, что для положительного числа е можно указать такое разбиение Т0 сегмента [а, р], что длина | /о| ломаной /о, вписанной в кривую Ь и отвечающей этому разбиению, удовлетворяет нера-
§ 1. Длина дуги кривой 397 венству \Ь\ — |/0|<е. Добавим к разбиению Т0 точку у и обозначим полученное при этом разбиение через Т. Тогда, в силу доказанной выше леммы, длина |/| ломаной, отвечающей разбиению Т, тем более удовлетворяет неравенству \Ь\ — |/|<е. Так как разбиение Т сегмента [а, (3] образовано объединением некоторых разбиений Тх и Т2 сегментов [а, у] и [-у, р], то длины |/1'| и |/а| ломаных, отвечающих этим разбиениям, удовлетворяют соотношению (10.4). Поэтому справедливо неравенство \Ь\ — (|/1| + \к\) <*• Так как |^| + |/г| < |^1| + |^-2|, то тем более справедливо неравенство \Ь\ — (\Ь^\ -4- \Ьъ\) <е. Но это неравенство противоречит равенству (10.6). Полученное противоречие доказывает, что предположение о том, что 17^11 —}— | Л-21 < \Ь\ является неверным, и, следовательно, \Ь^ + \Ь.г\ = |Л|. Свойство 2° полностью установлено. Замечание 2. Понятие длины дуги пространственной кривой, заданной параметрическими уравнениями (10.3), вводится точно так же, как и понятие длины дуги плоской кривой. Точно так же, как и в плоском случае, рассматриваются длины |/| ломаных, вписанных в кривую Ь, причем I п = ^ И(ф&)-ф (и-!)]*+[*(^>—Ч'(^-1)]я+[х (^)-х (^■-1)]2. 1—1 Пространственная кривая Ь, определяемая уравнениями (10.3), называется спрямляемой, если множество {|/|} длин ломаных I, вписанных в эту кривую, ограничено. Точная верхняя грань \Ь\ этого множества называется длиной дуги Ь. Пространственные спрямляемые кривые обладают свойствами 1° и 2°, приведенными выше для плоских кривых. Доказательство этих свойств аналогично доказательствам для плоских кривых. 4. Критерий спрямляемости кривой. Вычисление длины дуги кривой. Приведем достаточное условие спрямляемости кривой и формулу для вычисления длины ее дуги. Договоримся об употреблении следующей терминологии. 1°. Будем говорить, что функция }(1) имеет на сегменте [а, р] н е п р е р ы вн ую первую производную, если производная /'(^) существует и непрерывна в любой внутренней точке этого сегмента и если, кроме того, существуют конечные пределы Нт /' (0 и Пт /' ({). <-кх+0 ^[3—0 При таком определении функция /'(г) окажется непрерывной на сегменте [а, {$], если значения этой функции на концах указанного сегмента положить равными пределам Пт /' ({) и Пт/'(/) /-мх+0 <-*р—0 соответственно *. * Если в условиях определения 1° дополнительно потребовать существования односторонних производных /'(а+0) и /"'(б—0), то в силу п. 3 § 4 гл. 6 ШпПх)=Па + 0), НтП*)-ПР-0). .х-кх+0 х-*Ь—0
398 Гл. 10. Геометрические приложения определенного интеграла 2°. Будем говорить, что функция Д/) имеет на сегменте [а, р] ограниченную первую производную, если !'(() существует и удовлетворяет соотношению |/'(^) | <М, где М — некоторая постоянная, для всех внутренних точек сегмента 3°. Будем говорить, что производная функции /(^) интегрируема на сегменте [а, р], если \'{I) существует для всех внутренних точек этого сегмента и после доопределения произвольными конечными значениями на концах этого сегмента представляет собой интегрируемую на этом сегменте функцию. Теорема 10.1. Пусть функции лг=<р(*) и у = ^^) непрерывны и имеют непрерывные первые производные на сегменте [ос, р]. Тогда кривая Ь, определяемая параметрическими уравнениями х=у(1), у=^{1) при'1 из [а, р], спрямляема и длина \Ь\ ее дуги может быть вычислена по формуле Р / Ш=]к чЛо + чЛО*. (Ю.7) а Доказательство. Сначала докажем, что кривая Ь спрямляема. Рассмотрим формулу для длины |/| ломаной /, вписанной в кривую /, и отвечающей произвольному разбиению Т сегмента [а. Р]: 1=1 Для каждой из функций ф(^) и -ф(^) выполнены на каждом частичном сегменте [^_ь Щ (при 1=1, 2 п) все условия теоремы 6.4 Лагранжа *. В силу этой теоремы между ^^-^ и и найдутся точки >|{ и г\и такие, что будут справедливы равенства ГДе Мг = и 1г-1. Следовательно, \1\=^У^'\Ь)+^'гЫ^1- (Ю.8) 1=1 По условию теоремы функции ф(^) и г|з(/) имеют на сегменте [а, р] непрерывные, а потому и ограниченные первые производные, т. е. для всех I, лежащих внутри сегмента [а, р], справедливы неравенства \у'{1)\<М., |г|/(?) |<ЛГ. Поэтому из формулы (10.8) следует, что * Т. е. каждая из функций ф(0 и а|)(0 непрерывна на любом частичном сегменте [<*_1, 1{\ и дифференцируема во внутренних точках этого сегмента.
§ 1. Длина дуги кривой 399 О < I/К ^ УМ* + М2 Д*, = М\Г2 ^ &1 = М\/~2 (р—а). 1= 1 1=1 Таким образом, множество {|/|} длин вписанных в кривую Ь ломаных, отвечающих всевозможным разбиениям Т сегмента [а, р], ограничено, и по определению кривая Ь спрямляема. Докажем теперь, что длина |1.| кривой ^ может быть вычислима по формуле (10.7). Введем в рассмотрение следующую конкретную интегральную сумму интегрируемой функции V ф' (/) + ф'я(0 : *&. ь)=2/ф',(ь)+*',(ь) дь. отвечающую разбиению Т сегмента [а, р] и выбору промежуточных точек ||{, определенному в формуле (10.8). Пусть й — диаметр разбиения Т, т. е. й = гаахЛ^. Докажем, что для любого положительного числа е можно указать такое 8>0, что при е?<б выполняется неравенство ||/|_/|<-|-. (10.9) где I — предел при й-*~0 интегральных сумм а (и, ^). т- е- /= Г У ф'2(/) +-ф'г(/) сИ. Другими словами, мы покажем, что мож- а но выбрать столь малым диаметр разбиения Т, что длина |/| ломаной /, вписанной в кривую Ь и отвечающей этому разбиению Т, отличается от интеграла / на величину, меньшую, чем наперед заданное число е/2. Заметим, что ** * Интегрируемость этой функции вытекает из ее непрерывности на сегменте [а, р]. ** Первое из этих неравенств вытекает из следующих оценок, справедливых для любых чисел а, Ь, &4: . . О - - . У а* + Ъ\ + Уа* + 2>2 \Ь1-Ь\.\Ь1+Ь\ Второе из этих неравенств очевидно, так как разность любых значений функции «е больше разности ее точных граней.
400 Гл. 10. Геометрические приложения определенного интеграла I /ф'2 (ь)+^,2к) - Уу'\ь) + у\ы I < <1Ф'(%)-*'(У1<ЛГ(-/п„ где Мг и Шг — точные грани функции г|з(/) на частичном сегменте Поэтому 11 /1 - <т I = Ё (^чЛй) + Ъ'\\) - ^Ф'2&) + Л) )ы\< 1=1 < ё | ^ф'2&) + ч>'2(%) -^ф'2(^)+<ч>'*(&) I ^ < 1=1 <^(Л11-т1.)А/1. = 5-5, (10.10) 1=1 где 5 и 5 — соответственно верхняя и нижняя суммы функции я|/(/) для разбиения Т сегмента [а, р]. Функции к ф'2 (0 + 'Ф'2 (0 и ф'(0 непрерывны, а значит, и интегрируемы на сегменте [а, р], поскольку по условию на [а, р], непрерывны ф'(/) и г|/(/). Из определения интегрируемости и из основной теоремы § 3 гл. 9 вытекает, что для любого е>0 можно указать такое б>0, что при диаметре разбиения ё<8 выполняются неравенства И'<. Ь)-/К-Ь 5-е<-г- (Ю-11) 4 4 Поэтому при с?<6 в силу (10.10) и (10.11) справедливы неравенства ||Л_/| = ц/|_<г + а-/|<||Л-(г| + |а-/|<-5- + -5-=-^, 4 4 2 и справедливость неравенства (10.9) доказана. Докажем теперь, что среди всевозможных ломаных /, длины |/| которых удовлетворяют неравенству (10.9), имеются ломаные, длины которых отличаются от длины \Ь\ дуги кривой Ь меньше чем на е/2. Действительно, \Ь\ —■ точная верхняя грань множества {|/|} длин ломаных /, вписанных в кривую Ь и отвечающих всевозможным разбиениям сегмента [ее, р]. Поэтому найдется такое разбиение Т *, что длина | /* | соответствующей этому разбиению ломаной /* удовлетворяет неравенству 0<|1|-|П<-|- (10.12)
§ 1. Длина дуги кривой 401 Подвергаем теперь разбиение 7* измельчению, добавляя к нему новые точки разбиения так, чтобы в результате добавления этих точек получилось разбиение 7 с диаметром й, меньшим б. При этом, как мы показали, длина |/| ломаной /, отвечающей этому разбиению 7, удовлетворяет неравенству (10.9). Так как все вершины ломаной, отвечающей разбиению 7*, являются также вершинами ломаной, отвечающей разбиению 7, то, согласно доказанной в п. 3 лемме, 0< |/*| < |/| < \Ь\. Поэтому неравенства (10.12) дают право утверждать, что 0<|Ц-|/|<-|-. (10.13) Итак, мы доказали, что среди множества ломаных {/}, длины которых удовлетворяют неравенству (10.9), имеются ломаные, длины которых удовлетворяют и неравенству (10.13). Из неравенств; (10.9) и (10.13) получаем, что ||1|-/|<е. Поскольку е — произвольное положительное число, то \Ь\=1 из теорема полностью доказана. Замечание 1. Если функции ср(/) и ■ф(^) непрерывны и: имеют на сегменте [а, р], ограниченные первые производные, та- кривая Ь, определяемая уравнениями х=<р(^), г/ = ф(0> спрямляема. Действительно, в ходе доказательства теоремы 10.1 мы установили, что если функции ф(^) и ф(^) непрерывны на [а, р], то при- условии ограниченности на сегменте [а, р] первых производных функций ф(^) и ф(0 длины |/| ломаных, вписанных в кривую I и отвечающих всевозможным разбиениям 7 сегмента [а, р], ограничены. Замечание 2. Формула (10.7) для вычисления длины дуги справедлива, если функции ф(^) ы ■ф(^) непрерывны, а производные ф'(^) и я|/(0 только интегрируемы на сегменте [а, р]. В самом деле, из интегрируемости этих производных следует их ограниченность, а поэтому, в силу замечания 1, и спрямляемость кривой Ь. Для вывода неравенств (10.10), (10.11), а следовательно, и неравенства (10.9) достаточно лишь непрерывности ф(^) и ■$(!) и интегрируемости ф'(^) и 1|/(0 на сегменте [а, р], так как отсюда, согласно теореме 9.4 (см. гл. 9), вытекает интегрируемость на сегменте [а, р] функции V ф'2(0 4- ^'2(0 - Все остальные рассуждения такие же, как и при доказательстве теоремы (10.1). Замечание 3. Если кривая Ь является графиком функции У = [(х), непрерывной и имеющей на сегменте [а, Ь] непрерывную-
■402 Гл. 10. Геометрические приложения определенного интеграла ■производную }'(х), то кривая Ь спрямляема и ее длина \Ь\ может чбыть найдена по формуле ь / 17-1 = ^ К \+Г\х) их. (10.14) а Действительно, график рассматриваемой функции представляет «собой кривую, определяемую параметрическими уравнениями х = 1, _У = /(0> й<^<Ь. При этом все условия теоремы 10.1 выполнены. Полагая в формуле (10.7) ф(^)=/, 1р(0=/Ч0 и заменяя переменную интегрирования I на х, получим формулу (10.14). Замечание 4. Если кривая Ь определяется так называемым полярным уравнением г<=г($), 01<0<02 и функция г(0) непрерывна и имеет на сегменте [01, 02] непрерывную производную, ~то кривая Ь спрямляема и ее длина определяется равенством е, \Ц=^У г2{Щ+г'г(ЩМ. (10.15) в, Для доказательства надо воспользоваться формулами перехода от полярных координат к декартовым х=г(0)созО, г/ = г(0)з1П0. Таким образом, кривая Ь определяется параметрическими уравнениями ф = г(8)соз0, ■ф = г(0)51п0, 0е[01, 02], причем выполнены все условия теоремы 10.1. Простые вычисления приводят к формуле (10.15). Замечание 5. Если рассматривается пространственная параметризуемая кривая Ь, заданная уравнениями х=ф(^), у = г|)(/), г=%{1), и функции *${1), ^(0, х(0 непрерывны и имею! непрерывные первые производные на [а, р], то кривая спрямляема и длина \Ь\ ее дуги может быть найдена по формуле р , \Ц = |К Ф'2(0 + Ч>'2(0 + X'2(0й1. (10.16) а Доказательство аналогично доказательству теоремы 10.1. Замечание 6. Если функции у(0> Ф(0< х(0 непрерывны и имеют ограниченные на сегменте [а, р] первые производные, то кривая Ь, определяемая уравнениями (10.3), спрямляема. Если при этом производные указанных функций, интегрируемы на сегменте [а, р], то длина \Ь\ дуги кривой Ь может быть также вычислена по формуле (10.16) (см. замечания 1 и 2). 5. Дифференциал дуги. Пусть функции х=<${1), у=•§{{) непрерывны и имеют на сегменте [а, р] непрерывные первые производные. В этом случае переменная длина дуги Ь{1), отвечающая значениям параметра из сегмента [а, Ц, как это следует
§ 1. Длина дуги кривой 40* из теоремы 10.1, представляется в виде 1(/) = |Кф'2(т) + 'ф'2(т) их. (10.17> а Подынтегральная функция в правой части формулы (10.17) непрерывна, поэтому функция Ь(1) дифференцируема и справедливо равенство Ь'({) = У<?'\*) + У\(). Возводя полученное равенство в квадрат и умножая на (сН)2,, будем иметь [1'(0^]2=[ф'(0^]2+|У(0Л]2- (10.18) Поскольку Ь'{1)й1=с1Ь, ц' (1)й1=йх, ^'{1)й1=йу, из формулы. (10.18) получаем {йЬ)2={йх)2+{йу)2. (10.19) Если рассматривается пространственная кривая, определяемая* уравнениями (10.3), то при условии непрерывности функций ф(^), я|>(^) и х(0 и их производных первого порядка на сегменте [а, Ц для дифференциала йЬ пути пространственной кривой справедлива формула 1 {Щ2=(с1х)2+(с1у)2+(с1г)2. (10.202» 6. Примеры. 1) Найдем длину \Ь\ части дуги астроиды х= = асо5г{, г/ = азт3/, лежащей в первой четверти. Этой части, как нетрудно видеть, соответствует изменение параметра I от 0 доя/2. В рассматриваемом случае ф'(^) =—Засоз2^зт^ *|/(^)=- = 3а зт2 ^соз I. Поэтому по формуле (10.7) получим Я/2 „ Я/2 2) Вычислим длину |Ь| дуги параболы у = ах2, 0<л:<1. Поскольку у' = 2ах, по формуле (10.14) получим 1 \ц = ^У\+Аагх2йх. о Неопределенный интеграл /= [ V1 + 4а2л;2 их вычислим,. следующим образом. Сначала проинтегрируем его по частям, затем к числителю дроби, получившейся под знаком интеграла,, прибавим и вычтем единицу, произведем деление и проинтегрируем одну из получившихся дробей. Получим
404 Гл. 10. Геометрические приложения определенного интеграла 4а2х2йх = хУ\ + $а2х2 — |1Л+4а2х2б/х + Г—й* + 4а2х2 = ху\+ 4а2х2 —/ + — 1п 2ах + У\ + 4аЪс2 2а Нами получено уравнение относительно величины /. Решив его, находим, что /=— х1Л+4а2л:2 + — 1п|2ах + /1 + 4а2х2 | + С. 2 4а Таким образом, 1 . , |Ц = Г У\ + 4а2х2с1х = — ]Л + 4а2 + —1п \2а + |Л +4а2| . .> 2 4а 0 3) Найдем длину дуги логарифмической спирали г=аеьч> от точки (фо, Го) до точки (ф, г). По формуле (10.15) имеем, что \Ц = \ УаЧ2Ь* + а2Ь2е^ е?ф = а V1 + Ь2 Г фо Фо = — УТ+Ь2 (е6*—е6<Р»)= 2СШ1 (г—г0). ь ь 4) Найдем переменную длину дуги эллипса ——\--^—= а2 б2 <=1, а>й, отсчитываемую от точки М0(0, Ь). Рассмотрим параметрическое уравнение эллипса лг=а-зт^, г/ = йсоз/, ^=[0, 2я]. По «формуле (10.17) получим < I I (*) = Г /а2 сое2 т + б2 81п2 т Л = а С ^/1 — е2 81п2 т их = аЕ (е, *)• о 6 (10.21) тт /а2—Ь2 Число е = -1— называется эксцентриситетом а эллипса. ' Первообразная функции У\—е281п2^, обращающаяся в нуль при ^ = 0, называется эллиптическим интегралом 2-го рода (см. § 4 гл. 8). Этот интеграл обозначается символом Е(&, Ц и не выражается через элементарные функции.
§ 2. Площадь плоской фигуры 405 § 2. ПЛОЩАДЬ ПЛОСКОЙ ФИГУРЫ В этом параграфе мы изучим вопрос об определении и о существовании площади так называемой плоской фигуры, под которой мы фактически будем понимать произвольное ограниченное множество точек плоскости. Мы начнем наше рассмотрение с уточнения понятия такой фигуры и ее границы. 1. Понятия границы множества и плоской фигуры. Рассмотрим множество всех точек плоскости и фиксируем одну из этих точек А. Договоримся называть г-окре'стностью точки А множество тех точек плоскости, которые расположены внутри круга радиуса е с центром в точке А. Пусть теперь {М} — какое угодно множество точек плоскости. Точку М множества {М} назовем внутренней точкой этого множества, если найдется е>0 такое, что е-окрест- ностъ точки М также принадлежит множеству {М}. Точку М, не принадлежащую множеству {М}, назовем внешней точкой множества {М}, если найдется е>0 такое, что е-окрестность точки М также не принадлежит множест- ву №*. Точку М назовем граничной точкой множества {М}, если эта точка не является ни внутренней, ни внешней точкой этого множества **. Совокупность всех граничных точек множества {М} назовем границей этого множества. Замечание. Для простейших типов множеств {М}, представляющих собой часть плоскости, ограниченную простым замкнутым контуром или несколькими такими контурами, введенное нами понятие границы множества укладывается в наглядное интуитивное представление о границе. Для множеств произвольной природы граница в определенном нами смысле может иметь весьма причудливый вид и не укладываться в интуитивное представление о граничном многообразии. Так, для множества {М} тех точек круга, абсцисса и ордината которых являются рациональными числами, границей в определенном нами смысле является весь указанный круг. * Внешняя точка множества {М} является, очевидно, внутренней точкой дополнения этого множества. ** Заметим, что точка М является граничной точкой множества {М} тогда и только тогда, когда для любого е>0 в е-окрестности точки М содержатся как точки, принадлежащие множеству {М}, так и точки, ему не принадлежащие. В самом деле, если бы в некоторой е-окрестности точки М не нашлось либо точек, принадлежащих множеству {Щ, либо точек, ему не принадлежащих, то точка М оказалась бы либо внешней, либо внутренней точкой множества {М} и не являлась бы граничной точкой этого множества.
406 Гл. 10. Геометрические приложения определенного интеграла Множество {М} точек плоскости будем называть ограниченным, если существует круг, содержащий все точки этого множества. В дальнейшем мы будем рассматривать произвольное ограниченное множество Р точек плоскости и будем называть это множество плоской фигурой. Границу плоской фигуры Р будем обозначать символом дР. 2. Площадь плоской фигуры. Для введения понятия площади плоской фигуры будем отправляться от специального частного вида плоских фигур, так называемых многоугольных фигур. Многоугольной фигурцй на плоскости мы назовем множество, составленное из конечного числа лежащих на этой плоскости ограниченных многоугольников. Из курса средней школы известно понятие площади многоугольной фигуры. В дальнейшем мы будем обозначать символом ц(Р) площадь многоугольной фигуры Р. Напомним, что площадь многоугольной фигуры является неотрицательным числом, обладающим следующими тремя свойствами: 1° (Аддитивность). Если Р\ и Р2 — две многоугольные фигуры без общих внутренних точек и символ Р\[]Р2 означает объединение этих фигур, то (х(Р1иР2)=й(Л)+ц(Я2). (10.22) 2° (Инвариантность). Если многоугольные фигуры Р\ и Р2 равны между собой *, то 11(Р1)=^(Р2). (10.23) 3° (Монотонность). Если многоугольная фигура Р\ содержится^ многоугольной фигуре Р2, то ц{Р\) <ц(Р2). Заметим, что свойство монотонности является логическим следствием свойства аддитивности и свойства неотрицательности площади. В самом деле, если Р\ содержится в Р2 то Р2 = = Р111(Р2\Р1)**, а потому в силу того, что Р\ и Р2\Р1 не со-, держат общих внутренних точек, и в силу свойства аддитивности ц(Р2) =\х(Р\) +\х(Р2\Р\). Остается заметить, что [х(Р2\Р1)>0. Замечание. Полезно подчеркнуть, что площадь многоугольной фигуры естественно считать равной одному и тому же числу независимо от того, с границей или без границы рассматривается эта многоугольная фигура. При рассмотрении разности двух многоугольных фигур Р2\Р1 можно договориться считать * Напомним, что две фигуры /^ и Р2 называются равными, если существует взаимно однозначное соответствие с сохранением расстояния между точками, при котором фигура Р^ отображается на г г. ** Причем разность -РяХА двух многоугольных фигур представляет, собой также многоугольную фигуру.
§ 2. Площадь плоской фигуры 407 фигуру Рг взятой с границей, а фигуру Рх взятой без границы. При такой договоренности разность РгЧЛ будет представлять собой некоторую многоугольную фигуру, взятую с границей. Перейдем теперь к определению площади некоторой произвольной плоской фигуры Р (т. е. некоторого произвольного ограниченного множества точек плоскости). Рассмотрим всевозможные многоугольные фигуры Р, целиком содержащиеся в Р, и многоугольные фигуры 0, целиком содержащие Р. Фигуры Р будем называть вписанными, а фигуры <2 — описанными. Числовое множество {(х(Р)} площадей всех вписанных многоугольных фигур Р ограничено сверху (например, площадью любой описанной многоугольной фигуры (?). Числовое множество {(г((2)} площадей всех описанных вокруг фигуры ф многоугольных фигур (2 ограничено снизу (например, нулем). Поэтому существуют точная верхняя грань. 1*. = М*) = зир|*0Р) (Ю-24) РСР площадей всех многоугольных фигур, вписанных в фигуру Р, и и точная нижняя грань |г* = ц* (/=■) = ш!IX (<3) (10.25) площадей всех многоугольных фигур, описанных вокруг Р. Заметим, что если в фигуру р нельзя вписать ни одного многоугольника, то по определению полагается |х* = 0. Величину ц* называют нижней площадью фигуры Р, а р.* — верхней площадью этой фигуры. Из того, что площадь любой вписанной фигуры не больше, чем площадь любой описанной фигуры, следует, что Макроопределение 1. Плоская фигура Р называется к в ад- р и р у е мой (или имеющей площадь), если верхняя площадь [I* этой фигуры совпадает с ее нижней площадью \х*. При этом число ц. = [1{Р) =ц* = ц* называется площадью фигуры Р. Ясно, что всякая многоугольная фигура Р является квадрируе- мой в смысле данного нами определения и для нее площадь ;(х(Р) = ц* (Р) ==-{*»4Е), являющаяся точной нижней гранью площадей описанных многоугольных фигур и точной верхней гранью площадей вписанных фигур, совпадает с исходной величиной площади, заимствованной из элементарного курса. Таким образом, мы распространили понятие площади многоугольников на некоторый более широкий класс фигур. Сохранение свойств аддитивности, инвариантности и монотонности будет доказано ниже.
408 Гл. 10. Геометрические приложения определенного интеграла Начнем с доказательства следующего критерия квадрируемости плоской фигуры. Теорема 10.2. Для квадрируемости плоской фигуры Р необходимо и достаточно, чтобы для любого е>0 нашлись такая описанная вокруг Р многоугольника фигура (2 и такая вписанная в Р многоугольная фигура Р, для которых (х(0)-ц(Р)<е. (10.26) Доказательства. Необходимость. Пусть фигура Р квад- рируема, т. е. ц,* = ^,. По определению точных граней (10.24) и (10.25) для любого фиксированного нами е>0 найдутся вписанная многоугольная фигура Р и описанная многоугольная фигура С такие, что I*.—|-< и(^)<!*.. и-*<И0)<и* + -!р Из этих неравенств и из равенств ^* = ц* заключаем, что ц,((?)—ц(Р)<е. Необходимость доказана. Достаточность. Пусть для любого е>0 существуют многоугольные фигуры С} и Р, указанные в формулировке теоремы. Тогда из неравенства (10.26) и из соотношений и(Я)<(1.<:|И<:|1((г) получаем, что 0<|Х*—Ц.<Ц-(<2)— ц(Р)<8. Поскольку е — произвольное положительное число, то из условия 0<|х*—[х*<е вытекает, что ц* = [х*, т. е. доказано, что фигура Р квадрируема. Теорема доказана. Теорема 10.2 допускает простое, но важное обобщение: в ее формулировке вместо описанной и вписанной многоугольных фигур С} и Р можно взять произвольные описанную и вписанную квадрируемые плоские фигуры (2 и Р. Именно справедлива теорема. Теорема 10.2'. Для квадрируемости плоской фигуры Р необходимо и достаточно, чтобы для любого е>0 нашлись такие содержащая Р квадрируемая плоская фигура С} и такая содержащаяся в Р квадрируемая плоская фигура Р, для которых ц(<3)-ц(Р)<е. Необходимость доказательства не требует, ибо многоугольные фигуры С} п Р являются квадрируемыми. Докажем достаточность. Фиксируем произвольное е>0 и построим по нему квадрируемые плоские фигуры (} и Р, первая из которых содержит Р, а вторая содержится в Р, такие, что ]1((1)-\1(Р)<~: (10.26')
§ 2. Площадь плоской фигуры 409 Так как С} к Р — квадрируемые плоские фигуры, то найдется многоугольная фигура <$, содержащая <2, и многоугольная фигура Р, содержащаяся в Р, такие, что И3)-К0)<^-. и(^)-иСР)<~ 4 4 Из двух последних неравенств и из (10.26') вытекает, что И- (О—1*(^)<«. Но тогда, поскольку многоугольная фигура & содержит Р, а многоугольная фигура Р содержится в Р, фигура Р квадрируема в силу теоремы 10.2. Установим теперь еще одну эквивалентную формулировку теоремы 10.2. Пусть Р — произвольная плоская фигура, С} — многоугольная фигура, взятая вместе с границей и содержащая фигуру Р, а Р — многоугольная фигура, содержащаяся в фигуре Р и взятая без границы. Тогда разность (2\Р представляет собой многоугольную фигуру, взятую вместе с границей и содержащую все точки дР фигуры Р*. В силу свойства аддитивности площади многоугольной фигуры справедливо равенство ц((3\.Р) =|х((2)—у.(Р), из которого следует, что неравенство (10.26) в формулировке теоремы 10.2 может быть переписано в виде ,1(<г\Р)<е. (10.26") Договоримся о следующей терминологии. Определение 2. Множество точек плоскости назовем множеством площади ну ль, если оно содержится в многоугольной фигуре сколь угодно малой площади. Неравенство (10.26") и тот факт, что многоугольная фигура (?\Р содержит все точки границы дР плоской фигуры Р, дают нам право следующим образом переформулировать теорему 10.2. Теорема 10.2". Плоская фигура Р квадрируема тогда и только тогда, когда ее граница дР имеет площадь нуль. Необходимость условия теоремы очевидна. Остановимся на доказательстве достаточности. Впишем плоскую фигуру Р в квадрат Е со сторонами, параллельными координатным осям, и прямыми, параллельными этим осям, разобьем квадрат Е на элементарные квадраты со стороной Н. Это разбиение квадрата Е договоримся называть с е т к о й с шагом п. Докажем сначала, что если граница дР фигуры Р содержится в многоугольной фигуре площади, меньшей е, то при доста- * Это следует из того, что любая внутренняя точка многоугольной фигуры Р является внутренней точкой Р, а любая внешняя точка многоугольной фигуры О является внешней точкой Р. Достаточно учесть, что разность <2\Р содержит все точки плоскости, кроме внешних точек (2 и внутренних точек Р.
410 Гл. 10. Геометрические приложения определенного интеграла точно малом шаге к сетки граница дР фигуры Р содержится в объединении элементарных квадратов сетки, общая площадь которых меньше 32 е. В самом деле, достаточно заметить, что любая многоугольная фигура, площади меньшей е, представляет собой сумму конечного числа треугольников, не имеющих общих внутренних точек; каждый треугольник равен объединению двух прямоугольных треугольников (без общих внутренних точек); каждый прямоугольный треугольник содержится во вдвое большем по площади прямоугольнике; каждый прямоугольник содержится в объединении не более чем вдвое большей по площади сумме конечного числа квадратов; каждый квадрат содержится во вдвое большем по площади квадрате со'сторонами, параллельными осям координат. Итак, любая многоугольная фигура площади, меньшей е, содержится в объединении конечного числа квадратов со сторонами, параллельными координатным осям общей площади, меньшей 8е. Из указанного конечного числа квадратов выберем квадрат с наименьшей стороной (если таких квадратов несколько, то выберем один из них) и возьмем шаг Н сетки равным половине длины стороны этого квадрата. При таком выборе К каждый указанный квадрат (со сторонами, параллельными координатным осям) будет содержаться в объединении элементарных квадратов сетки, общая площадь которых не больше учетверенной площади квадрата. Поэтому вся многоугольная фигура, площади меньшей е, содержится в объединении элементарных квадратов сетки, общая площадь которых меньше 32 е. Значит, если граница дР плоской фигуры Р имеет площадь нуль, то для любого е>0 при указанном выше выборе шага сетки Н вся эта граница дР будет содержаться в объединении элементарных квадратов сетки, общая площадь которых меньше 32 е. Для завершения доказательства достаточности заметим, что объединение всех элементарных квадратов, состоящих только из внутренних точек фигуры Р, представляет собой многоугольную фигуру Р, содержащуюся в Р, а объединение этой фигуры Р со всеми элементарными квадратами сетки, содержащими точки границы дР фигуры Р, представляет собой многоугольную фигуру С}, содержащую фигуру Р, причем \1((2)—р{Р)<32е. Пользуясь этой теоремой, установим квадрируемость широкого класса плоских фигур. Докажем следующую лемму. Лемма. Всякая спрямляемая кривая имеет площадь нуль.
§ 2. Площадь плоской фигуры 411 Доказательство. Пусть Ь — спрямляемая кривая, а \Ь\ ее длина. Разобьем эту кривую с помощью л+1 точек на части, длина каждой из которых равна \Ь\/п. (Возможность такого разбиения не вызывает сомнений.) Примем каждую из этих п+\ точек за центр квадрата со стороной 2\Ь\/п. Сумма этих квадратов представляет собой многоугольную фигуру, описанную вокруг кривой Ь, а площадь этой многоугольной фигуры не превосходит суммы площадей составляющих ее 4 IЬI2 квадратов, т. е. числа —!—Мга+1). Так как \Ь\ фиксировать но, а п можно выбирать произвольно большим, то число 4 I /-I2 ■ (п + 1) может быть сделано меньшим любого наперед заданного числа е>0. Следовательно, кривую Ь действительно можно заключить внутрь многоугольной фигуры сколь угодно малой площади. Лемма доказана. Из этой леммы и теоремы 10.2" вытекает следующая теорема. Теорема 10.3. Всякая плоская фигура, граница которой состоит из одной или нескольких спрямляемых кривых, квад- рируема. Покажем теперь, что введенное нами понятие площади плоской фигуры обладает свойствами аддитивности (см, (10.22)), инвариантности (см. (10.23)) и монотонности. Убедимся сначала в аддитивности площади. Пусть Р\ и Р2 — квадрируемые фигуры без общих внутренних точек и Р ■— их объединение. Тогда Р квадрируема и 11(Р)=ц(Р1)+ц(Р2). (10.27) Квадритируемость фигуры Р следует из теоремы 10.2" и из того, что ее граница др составлена из множества площади нуль, поскольку др является частью объединения границ дРг и дР2 фигур Т7! и Р2. (Очевидно, что всякая часть множества площади нуль сама является множеством площади нуль.) Докажем справедливость равенства (10.27). Рассмотрим многоугольные фигуры Р\ и Р2, вписанные в Р\ и Р2 соответственно, \и многоугольные фигуры (^ и <д2, описанные соответственно вокруг Р\ и Рг. Фигуры Р\ и Р2 составляют фигуру Р и не имеют общих внутренних точек. Поэтому, согласно (10.22), 1л(Р)=ц(РгиР2)-ц(Р1)+11(Р2). Многоугольные фигуры (З1 и <22, возможно, пересекающиеся, в сумме составляют многоугольную фигуру ^, площадь которой не превосходит 11{(21) + ц{(22) ■ Поэтому
412 Гл. 10. Геометрические приложения определенного интеграла 1г(Р) = (г(Р1) + ^(^2)<^(^)<ц(С)<:{х(<Э1) + И(02). С другой стороны, в силу определения квадрируемости, для фигур Рг и Р2 справедливы неравенства р,(-Р1)<1Д.(^1)<^(Ф1) и цС^^И-С^^м^Фг). из которых следует, что Й(Л) + Й(Л0<^1) + ^2)<[Х№) + Ц(32). Таким образом, обе величины и(Р) и цДЛ) + \х(Р2) заключены между двумя числами МФО+цСЭг)] и [\1(Рг)+ц(Р2)], разность между которыми Ы<2>)+ц(<22)]-ЫЛ) + ^2)]= может быть сделана как угодно малой. Следовательно, указанные две величины равны, т. е. справедливо равенство (10.27). Свойство инвариантности площади произвольной плоской фигуры непосредственно вытекает из инвариантности площади для многоугольных фигур (см. (10.23)) и из самого способа определения площади квадрируемои фигуры через площади многоугольных фигур. Наконец, свойство монотонности площади непосредственно вытекает из определения квадрируемости плоской фигуры. Замечание. Пересечение двух квадрируемых фигур есть квадрируемая фигура. Действительно, пусть Р — Р^Рг, и Р\ и Р2 квадри- руемы. Каждая точка, граничная для Р, является граничной либо для Р\, либо для Р2. Поэтому «аше утверждение следует из теоремы 10.2" и того факта, что объединение двух множеств площади нуль само имеет площадь нуль. Введенное в этом пункте понятие площади называют понятием площади по Жор да ну* или мерой Жор- дана. Выше мы убедились, что площадь по Жордану обладает свойством аддитивности, т. е. если Р=Р\\}Р2, а Р\ и Р2 — квад- рируемые фигуры без общих точек, то Р квадрируема и \х(Р) = ц(р1) + у,(Р2). Указанное свойство, очевидно, справедливо и для объединения любого конечного числа Р\, Р2,..., Рп квадрируемых фигур без общих внутренних точек. Если 1=1 * Камилл Жордан — французский математик (1838—1922).
§ 2. Площадь плоской фигуры 413 п то Р квадрируема и (х(р) = V\л(р;) (свойство конечной 1=1 аддитивности). Однако площадь по Жордану (мера Жордана) не обладает свойством счетной аддитивности, т. е. объединение счетной совокупности квадрируемых фигур Рг, Р2,... без общих внутренних точек не обязано быть квадрируемой фигурой. Проиллюстрируем этот факт примером. Рассмотрим на плоскости квадрат Б: 0<х<1, 0<г/<1. Отметим в квадрате Б точки, у которых обе координаты рациональны. Нетрудно показать, что таких точек счетное множество. Расположим их в виде последовательности гг= (Хи Г/0, 22= (х2, у2), ». 2п=(хп, «/„),.... Фиксируем число е>0 и построим круг 0\ с центром в точке 2\ радиуса Г1<е/2, целиком содержащийся в квадрате Б. Первую из точек г2, г3,..., не попавшую в круг 0\, обозначим через 2„2 и построим круг 02 с центром в точке 2Пг радиуса г2<е/22, не пересекающийся с кругом 0\ и целиком лежащий в квадрате Б. Продолжая эти рассуждения далее, мы построим последовательность содержащихся в квадрате Б непересекающихся кругов Ои 02,..., Оп,... радиусов гь г2, ....,г„,.... Каждый из этих кругов квадрируем и имеет площадь (меру Жордана), равную я г„2 (л=1, 2,...).. Убедимся в том, что объединение Р счетного числа указанных кругов Р=0\[}02[)... представляет собой фигуру, не квад- рируемую по Жордану. Пусть <2 — любая многоугольная фигура, содержащая фигуру Р. Заметим, что в любой е-окрестности каждой точки квадрата Б есть точки последовательности {гп}, т. е. есть точки фигуры Р. Но это означает, что любая точка квадрата Б является внутренней либо граничной точкой фигуры Р, т. е. многоугольная фигура С? содержи-г весь квадрат Б и, значит, 11(0)>1х(Б) = 1. Пусть, далее, Р —• любая многоугольная фигура, содержащаяся в Р. Тогда площадь ц(Р) не превосходит сумму площадей всех кругов (2ь 0_2,..., т. е. МЯ)<я(г? + г1 + ...)<яе*(.±- + -1-+...)=-^. Итак, ц((2)>1 и ц(Р)<—— для любой многоугольной фигуры С, содержащей Р, и любой многоугольной фигуры Р>
-414 Гл. 10. Геометрические приложения определенного интеграла содержащейся в Р. Но это и означает, что при малом е разность ^(0)—1*-(Р) больше 1 и не может быть сделана как угодно малой, т. е. фигура Р не квадрируема по Жордану. Отметим, что можно ввести другое обобщение понятия площади, так называемую меру Лебега*, которая уже будет обладать и свойством счетной аддитивности. Такое обобщение понятия площади выходит за рамки приложений интеграла Ри- мана и его естественно рассматривать при изучении так называемого интеграла Лебега. 3. Площадь криволинейной трапеции и криволинейного сектора. криволинейной трапецией называется фигура, ограниченная графиком заданной на сегменте [а, Ь] непрерывной и неотрицательной функции \(х), перпендикулярными к оси Ох прямыми х=а и х=Ь и отрезком оси Ох между точками а и Ь (рис. 10.1). Справедливо следующее Утверждение. Криволинейная трапеция представляет со- •бой квадрируемую фигуру Р, площадь которой \х{Р) вычисляется по формуле ь ц(Р) = ^1(х)ах. (10.28) Доказательство. Непрерывная на сегменте [а, Ь] «функция 1(х) интегрируема, поэтому для любого положительного числа е можно указать такое разбиение сегмента [а, Ь], для которого разность между верхней суммой 5 и нижней суммой 5 'будет меньше е. Но 5 и 5 равны соответственно ц((?) и ц(Р), где 1(,((2) и ц(Р) — площади многоугольных фигур, первая из которых содержит криволинейную трапецию, а вторая содержится в криволинейной трапеции (на рис. 10.1 изображены также и ука- У 0 1 а а \ ?0 с V, а \ л _/ ~п-1 " Ъ "п & Рис. 10.1 Рис. 10.2 Анри Лебег — французский математик (1875—1941).
§ 2. Площадь плоской фигуры 415- занные многоугольные фигуры). Таким образом, ц.(С?)—ц,(Р)<8„ и в силу теоремы 10.2 криволинейная трапеция квадрируема. Поскольку для любой интегрируемой функции предел при стремлении диаметра разбиения к нулю как верхних 5, так и нижних. сумм 5 равен [1{х)йх и 5<ц(/г)<5, то площадь \х,(Р) криво- а линейной трапеции находится по формуле (10.28). Замечание. Если функция {(х) непрерывна и неположи- ь тельна на сегменте [а, Ь], то значение интеграла [$(х)йх рав- а но взятой с отрицательным знаком площади криволинейной трапеции, ограниченной графиком функции |/(х)|, ординатами в точках а и Ь и отрезком оси Ох между точками а и Ь. Поэтому ь если /(х) меняет знак, то ("/(%) их равен сумме взятых с опре- а деленным знаком площадей криволинейных трапеций, расположенных выше и ниже оси Ох, причем площади первых берутся= со знаком +, а вторых — со знаком —. Перейдем теперь к рассмотрению площади так называемого криволинейного сектора. Пусть кривая Ь задана в полярной системе координат уравнением г = г(8), ос<0<р (рис. 10.2), причем функция г(9) непрерывна и неотрицательна на сегменте {а, р]. Назовем криволинейным сектором плоскую фигуру, ограниченную кривой Ь и двумя лучами, составляющими с полярной осью углы аир. Докажем следующее Утверждение. Криволинейный сектор представляет собой квадрируемую фигуру Р, площадь \ь(Р) которой может быть- вычислена по формуле [Х(/7)=т1г2(е)й9- (10-29> а Доказательство. Рассмотрим разбиение сегмента [а,. Р] точками а = 0о<01<...<0л=р и для каждого частичного сегмента {бг-ь 0;] построим круговые секторы, радиусы которых, равны минимальному г,- и максимальному #,- значениям функции г (6) на сегменте [0,_ь 0,]. В результате получатся две квадри- руемые фигуры, первая фигура А содержится в криволинейном) секторе, а вторая В содержит этот сектор (см. рис. 10.2). Площади ц(Л) и ц(В) указанных квадрируемых фигур А и; п п В соответственно равны —V] г? (0?—б»-^ и —\^#?(0,- — б,--^- 1=1 1 = 1
416 Гл. 10. Геометрические приложения определенного интеграла Обратим внимание на то, что первая из этих сумм является нижней суммой 5, а вторая — верхней суммой 5 функции ■г2 (6) на сегменте [ос, р] для указанного разбиения этого сегмента. Так как непрерывная на [а, р] функция —г2 (6) интегрируема на этом сегменте, то для любого е>0 найдется разбиение, для которого разность 5—з = ц(В)—\л(А) меньше е. Так как А и В — две квадрируемые фигуры, первая из которых содержится в криволинейном секторе Р, а вторая содержит Р, то в силу теоремы 10.2' криволинейный сектор квадрируем. Справедливость для его площади формулы (10.29) вытекает из того, что эта площадь ц(Р) заключена между 5 = (г(Л) и 5 = р,(В), а обе суммы 5 и 5 стремятся к интегралу, стоящему в правой части (10.29), при стремлении диаметра разбиения к нулю. 4. Примеры вычисления площадей. 1.° Найти площадь \1(Р) фигуры Р, ограниченной графиками функции у = ха и х=уа, а>1 (рис. 10.3). Поскольку фигура Р симметрична относительно биссектрисы первого координатного угла, то ее площадь может быть получена посредством вычитания из единицы (площади квадрата) удвоенной площади криволинейной трапеции, задаваемой графиком функции у = ха, а>1, на сегменте [0, 1]. Таким образом, по формуле (10.28) мы получим, что р(Р)= 1 — 2 \ #*0х = 1 — 2 *<*+' сс+ 1 а+ 1 2°. Через три точки с координатами (—к, у0), (0, у{), (к, у2) проходит только одна парабола у=Ах2+Вх+0 (или прямая, если эти точки лежат на одной прямой). Рис. 10.3 Рис. 10.4 В самом деле, условия уасположения точек (—к, у0), (0, г/0, {к, у2) на параболе приводят к системе уравнений относительно А, В, И
§ 3. Объем тела в пространстве 417 АН2—ВН + 0 = уо, Ак2+Вк+0=у2. Эта система имеет единственное решение Л = Уо-2У1 + у2, В= у*~Ув , В = »1. 2/12 2/г ' »! Найдем площадь ^(Т7) криволинейной трапеции /\ определяемой указанной параболой, ординатами в точках (—к, 0) и (к, 0) отрезком оси Ох между этими точками (рис. 10.4). По формуле (10.28) н $(Р)=\ (Ах* + Вх + П)йх = —к Ах* , Вх> , п 3 2 2ЛАЗ ■2Ш. д\^1 1 \ \ \ \ \ \ \ \ \ \ \ \\ \ // : (Г^~ ^у х Рис. 10.5 Рис. 10.6 Подставляя найденные значения А и И через ординаты г/о, У\ и у2 и величину к, получим \л(Р) = — (г/0 + Ауг + уг). 3°. Найти площадь ц(Р) трилистника г = асоз39 (рис. 10.5). Из рисунка можно заключить, что достаточно вычислить площадь части трилистника, отвечающей изменению 6 от 0 до л/6, и полученный результат умножить на шесть. Поэтому по формуле (10.29) получаем, что ,!(/?)= 6^- |С05236Й6 = Я/6 = 3а*$- 1 + соз 66 йШ = За2 я 12 5Ш 60 12 я/6 о 4 54 Зак. 72
418 Гл. 10. Геометрические приложения определенного интеграла § 3. ОБЪЕМ ТЕЛА В ПРОСТРАНСТВЕ Основные определения и утверждения настоящего параграфа аналогичны соответствующим определениям и утверждениям § 2. Это позволяет нам ограничиться основными формулировками. 1. Объем тела. Рассмотрим множество всех точек пространства и фиксируем одну из этих точек А. 8-о крестностью точки А будем называть множество всех тех точек пространства, которые расположены внутри шара радиуса е с центром в точке А. Точку А будем называть внутренней [внешней] точкой произвольного множества точек пространства {М}, если найдется е>0 такое, что г-окрестность точки А целиком принадлежит [целиком не принадлежит] множеству {М}. Точки множества {М}, не являющиеся ни внутренними, ни внешними, назовем граничными точками множества {М}, а совокупность всех граничных точек назовем границей множества {М}. Множество {М} точек пространства назовем ограниченным множеством или телом, если найдется шар, содержащий все точки этого множества. Среди всех тел выделим так называемые многогранные тела, представляющие собой объединение конечного числа ограниченных многогранников. Объем многогранного тела заимствуем из курса средней школы. Подчеркнем, что этот объем (как. и площадь многоугольной фигуры) обладает свойствами аддитивности, инвариантности и монотонности. Рассмотрим произвольное тело Р, а также всевозможные многогранные тела Р, содержащиеся в Р, и всевозможные многогранные тела (2, содержащие Р. Назовем верхним объемом тела Сточную нижнюю грань числового множества (м.(<2)} объемов всех многогранных тел (^, содержащих Р т. е. число Аналогично назовем нижним объемом тела р точную верхнюю грань числового множества {ц(Р)} объемов всех многогранных тел Р, содержащихся в Р, т. е. число ^, = М^) = 5иРИ^)- РаР Из этих определений очевидно, что (х*<{х*. Определение 1. Тело Р называется кубируемым (или имеющим объем), если ц* = ц*. При этом число (х = (х (/г) =ц* = ц* называется объемом тела Р. В полной аналогии с теоремой 10.2 доказывается следующее утверждение.
§ 3. Объем тела в пространстве 419 Теорема 10.4. Для кубируемости тела Р необходимо и достаточно, чтобы для любого е>0 нашлись такое содержащиеся в Р многогранное тело Р и такое содержащее Р многогранное тело <2, для которых \ь{(})—ц(Р)<е. Замечание. В формулировке теоремы 10.4 вместо многогранных тел Р и (2 могут быть взяты произвольные к у- бируемые тела Р и (?, удовлетворяющие всем другим условиям этой теоремы. Определение 2. Множество точек пространства назовем множеством объема нуль, если это множество содержится в многогранном теле сколь угодно малого объема. Теорема 10.4 может быть переформулирована. Теорема 10.4'. Тело Р кубируемо тогда и только тогда, когда его граница имеет объем нуль. Введенное нами понятие объема тела обладает свойствами аддитивности, инвариантности и монотонности. 2. Некоторые классы кубируемых тел. Цилиндрическим телом будем называть тело, ограниченное цилиндрической поверхностью с образующими, параллельными некоторой оси, и двумя плоскостями, перпендикулярными этой оси. Эти плоскости в пересечении с цилиндрической поверхностью образуют плоские фигуры, называемые основаниями цилиндрического тела, а расстояние А между основаниями цилиндрического тела называется его высотой (рис. 10.6). • Справедливо Следующее Утверждение. Если основанием цилиндрического тела Р является плоская квадрируемая фигура С, то тело Р кубируемо, причем объем \ь(Р) этого тела равен \х,(С)п, где ц(С) —• площадь основания С, а А — высота.этого цилиндрического тела. Доказательство. Поскольку плоская фигура О квад- рируема, то для любого е>0 можно указать такие описанную и вписанную в эту фигуру многоугольные фигуры С} н Р, что »{<Э)—ц{Р)<е/Н. Объемы цилиндрических многогранных тел Ря и РР, основанием которых служат многоугольные фигуры С} п Р, а высота которых равна А, равны соответственно ц{(})п и \к(Р)Н. Поэтому |1(С)А—|х(Р)А = Так как многогранное тело Рс? содержит Р, а многогранное тело Рр содержится в Р, то в силу теоремы 10.4 тело Р кубируемо. Поскольку |1(Р)/к[а(0)/к^((2)А, то объем цилиндрического тела Р равен ц(С)п. Из свойства аддитивности объема и из доказанного утверждения вытекает кубируемость ступенчатых тел (ступенчатым телом называется объединение конечного числа цилиндрических тел, расположенных так, что верхнее основание каждого идо-ир) А<—А = н г. 14*
420 Гл. 10. Геометрические приложения определенного интеграла предыдущего из этих тел находится в одной плоскости с нижнил Ьснованием последующего; см. рис. 10.7). Рис. 10.7 Рис. 10.8 Из предыдущих рассуждений непосредственно вытекает утверждение. Если для любого положительного числа г можно указать такое содержащее Р ступенчатое тело Р\ и такое содержащееся в Р ступенчатое тело Р2, что ц(Р\)—\к(р2)<&, то тело Р ку- бируемо. Пользуясь этим, докажем кубируемость тела вращения. Утверждение. Пусть функция у—\(х) непрерывна на сегменте [а, Ь]. Тогда тело Р, образованное вращением вокруг оси Ох криволинейной трапеции, ограниченной графиком функции \Цх)\ ординатами в точках а и Ъ и отрезком оси Ох от а до Ьг- кубируемо и его объем ц(Р) может быть найден по формуле ь р{Р) = п\р{х)йх. (10.30) а Доказательство. Разобьем сегмент [а, Ь] на частичные сегменты точками а = х0<Х1<...<хп = Ь. Пусть /п,- и ЛГ,- — точные грани }(х) на частичном сегменте [хм, х{\. На каждом таком сегменте построим два прямоугольника с высотами т,- и М{ (на рис. 10.8 эти прямоугольники изображены только на одном сегменте <[Х{-1, х{\). В результате получатся две ступенчатые фигуры, одна из которых содержится в криволинейной трапеции, а другая содержит ее. При вращении криволинейной трапеции и этих ступенчатых фигур мы получим тело Р и два ступенчатых тела, одно из которых <2 содержит Р, а другое Р содержится в Р. Объемы этих тел С} и Р равны соответственно
§ 3. Объем тела в пространстве 421 ц (0) = л^ М\Ахи, ц (Р) = я^ т2Ах{. 1 = 1 1=1 ' Легко видеть, что эти выражения представляют собой верхнюю и нижнюю суммы для функции я/2(х). Поскольку эта функция интегрируема, то разность указанных сумм для некоторого разбиения сегмента [а, Ь] будет меньше наперед взятого положительного числа е. Следовательно, тело кубируемо. Поскольку предел указанных сумм при стремлении диаметра разбиения сегмента [а, Ь] к нулю равен я Г/а(л:)Лс, то объем р,(.Р) тела Р вычйс- а ляется по формуле (10.30). 3. Примеры. 1) Найти объем ц(Р) шара Р радиуса г. Рас- смотрим этот шар как результат вращения полуокружности у = ^г2—х2 , —г<л;<:г, вокруг оси Ох (рис. 10.9). По формуле (10.30) получим ц (Р) = я Г (г2—х2) их = пг2х лх? л/-3. 2) Найдем объем \г(Р) прямого кругового конуса с высотой, равной Н, и радиусом основания г. Рассматривая указанный конус как тело, полученное вращением треугольника с вершинами в точках (0,0), (п, 0) и (А, г) вокруг оси Ох (рис. 10.10), получим, согласно формуле (10.30), 14 (^ = "7Г 1 хЧх 3/г2 пг2к у\ -г О г х Рис. 10.9 Рис. 10.11 3) Найдем объем тела Р, полученного вращением вокруг оси Ох синусоиды г/=зтх на сегменте [0, я]. Имеем (рис. 10.11): \и(Р) = я Г 81п2 хйх = я С о о 1 — сов 2х А Я" ах =—. 2
Глава 11 ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛЕНИЯ КОРНЕЙ УРАВНЕНИЙ И ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ В этой главе рассматриваются приближенные методы нахождения корней алгебраических и трансцендентных уравнений и вычисления определенных интегралов. § 1. ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛЕНИЯ КОРНЕЙ УРАВНЕНИЙ В этом параграфе мы займемся приближенным вычислением одного из корней уравнения {(х)=0, где у=^((х) — некоторая, во всяком случае, непрерывная функция. Мы будем считать, что интересующий нас корень этого уравнения изолирован на некотором сегменте [а, Ь], т. е. будем считать, что этот корень является внутренней точкой сегмента [а, Ь], не содержащего других корней рассматриваемого уравнения. На практике обычно путем грубой прикидки определяют размеры указанного сегмента [а, Ь] *. 1. Метод «вилки». Мы начнем наше знакомство с метода, который часто используется для приближенного вычисления корней на современных быстродействующих математических машинах. Основой этого метода служит новое доказательство теоремы 4.12 о прохождении непрерывной функции через нуль при смене знака. Изложим это доказательство. Требуется, доказать следующее Утверждение. Если функция }(х) непрерывна на сегменте [а, Ь] и если значения этой функции Да) и ^{Ь) на концах сегмента [а, Ь] суть числа разных знаков, то внутри сегмента [а, Ь] найдется такая точка с, в которой значение функции /(с) равно нулю, т. е. с является корнем уравнения /(*) = 0. Договоримся называть «вилкой» любой сегмент, на концах которого функция 1(х) имеет значения разных знаков. По условию сегмент [а, Ь] является «вилкой». Пусть ради определенности /(а)<0, 1(Ь)>0. Разделим сегмент [а, Ь] пополам. При этом может представиться два случая: 1) значение функции в середине сегмента [а, Ь\ равно нулю (в этом случае теорема доказана), 2) указанное значение не равно нулю. В этом случае одна * При этом может быть использована вытекающая из физического содержания задачи дополнительная информация о расположении корня.
§ 1. Приближенные методы вычисления корней уравнений 423 из половин сегмента [а,- Ь] является «вилкой». Эту половину мы обозначим [а[у Ь\]. Очевидно, что $(а{)<Ъ, /(&0 >0. С сегментом \а\, Ъ\\ поступим точно так же, как с сегментом [а, Ь], т. е. разделим сегмент [а.\, Ь\] пополам. Продолжая аналогичные рассуждения далее, мы будем иметь две возможности: 1) либо описанный выше процесс оборвется вследствие того, что значение функции в середине некоторого из сегментов окажется' равным нулю (в этом случае теорема доказана), 2) либо описанный процесс можно продолжать неограниченно, и мы получим стягивающуюся систему сегментов — «вилок» [а\, Ь\], [иг, Ь2], ..., [ап, Ьп], ..., причем для любого номера п /(а„)<0, /(6П)>0. Согласно следствию из теоремы 3.15 указанная стягивающаяся система сегментов имеет одну общую точку с, к которой сходятся каждая из последовательностей {ап} и {Ьп}. Докажем, что Дс)=0. Поскольку функция /(х) непрерывна в точке с, то каждая из последовательностей /(а„) и !(Ьп) сходится к /(с). Но тогда из условий /(ап)<0 и ЦЬп)>0 в силу теоремы 3.13 получим, что одновременно справедливы неравенства /(с)<0 и /(с)>0, т. е. /(с)=0. Утверждение доказано. Предположим теперь, что в условиях доказанного выше утверждения сегмент [а, Ь] содержит только один корень с уравнения }(х)—0*. Тогда за приближенное значение этого корня аП ~\~ Ьп г > 1 можно взять точку , т. е. середину сегмента [ап, Ъп\. Поскольку длина сегмента [ап, Ъп] равна ~ , то число — — отличается от точного значения корня не более чем на . Таким образом, описанный выше процесс последовательного деления сегментов — «вилок» пополам позволяет вычислить искомый корень с с любой наперед заданной степенью точности. Так как описанный процесс приводит к многократному повторению однотипных вычислительных операций, он особенно удобен для проведения вычислений на быстродействующих математических машинах. 2. Метод итераций**. Излагаемый в этом пункте метод лежит в основе многих других приближенных методов. Этот метод применяется для решения уравнения х=Р{х). (11.1) * Т. е. предположим, что корень с является изолированным на сегменте [а, Ь]. ** Этот метод называют методом последовательных приближений.
424 Гл. 11. Приближенные методы Введем понятие итерационной последовательности. Последовательность хо, х\, ..., хп, ... будем называть итерационной, если для любого «>1 элемент хп выражается через элемент хп-\ по рекуррентной формуле хп = Р {хп-\), а в качестве х0 взято любое число из области задания функции Р(х). Мы докажем, что при определенных условиях итерационная последовательность сходится к корню уравнения (11.1) и, значит, ее элементы могут быть взяты за приближенные значения этого корня. Справедливо следующее. Утверждение 1. Пусть функция Р(х) непрерывна на сегменте [а, Ь], и пусть все элементы итерационной последовательности х0, Х\, ..., хп, ... лежат на этом сегменте. Тогда, если эта последовательность сходится к некоторому числу с, то указанное число с является корнем уравнения (11.1). Доказательство. Так как последовательность {хп} сходится к с и все ее элементы принадлежат сегменту [а, Ь], то и предел с принадлежит сегменту [а, Ь] (см. следствие 2 из теоремы 3.13). По условию функция Р(х) непрерывна в точке с, и поэтому последовательность {Р{хп-\)} сходится к Р{с). Таким образом, равенство хп = Р(хп-\) в пределе при л-^-оо переходит в равенство с = Р(с), т. е. с является корнем уравнения (11.1). Доказанное утверждение будет существенно использовано нами в п. 3 для обоснования метода хорд и касательных. Докажем еще одно утверждение, часто используемое для приближенного вычисления корня уравнения (11.1) с помощью итерационной последовательности. Утверждение 2. Пусть с — корень уравнения (11.1), и пусть в некотором симметричном относительно точки с сегменте [с—е, с + е] производная функции Р(х) удовлетворяет условию \Р'(х) | <а<1. Тогда итерационная последовательность х0, Х\, ..., ..., хп, ••., у которой в качестве х0 взято любое число из сегмента [с—е, с + е], сходится к указанному корню с. Доказательство. Прежде всего докажем, что все элементы итерационной последовательности {хп} принадлежат указанному сегменту [с—г, с+е). В самом деле, х0 принадлежит этому сегменту по условию. Поэтому достаточно, предположив, что хп-1 принадлежит этому сегменту, доказать, что ему принадлежит и хп. Для этого применим формулу Лагранжа к разности Р{хп-\)—Р{с) и учтем, что р(с)=с, хп = Р{хп-\). Получим х„—с = .?(*„_,)—/■ (с) =^'(|) (*„_,—с), (11.2) где | — некоторая точка, лежащая между хп-\ и с и, значит, принадлежащая сегменту [с—г, с+е]. Так как \Р'(1) | <а<1, то из равенства (11.2) получим \хп—с|<а|д:„_1—с\. (П-3)
§ 1. Приближенные методы вычисления корней уравнений 425 Из (11.3), поскольку 0<а<1, в свою очередь, получим |*„—с|<|*„_1—с|. (11.4) Неравенство (11.4) устанавливает,. что каждый последующий элемент хп расположен к с ближе, чем предыдущий элемент л'п-ь и, значит, так как хп-\ принадлежит сегменту [с—е, с+е] и так как этот сегмент симметричен относительно точки с, то и хп принадлеоюит этому сегменту. Остается доказать, что последовательность {Хп} сходится к с. Поскольку неравенство (11.3) справедливо для всех номеров п, то с помощью этого неравенства получим |*п—с| «хп|хо—с|. (П.5) Из последнего неравенства очевидно, что хп^-с, ибо а™-»-0. Утверждение 2 доказано. Сделаем практические замечания относительно только что доказанного утверждения. Предположим, что путем предварительной прикидки мы установили, что интересующий нас корень уравнения (11.1) изолирован на некотором сегменте [а, Ь], на котором производная функции Р{х) удовлетворяет условию \Р'{х) |<<х<1. Так как сегмент [а, Ь], вообще говоря, не является симметричным относительно искомого корня, то, естественно, возникает вопрос о том, как выбрать нулевое приближение Хо, с тем, чтобы можно было применить доказанное выше утверждение 2. Заметим, что где бы внутри сегмента [а, Ь] ни находился искомый корень с, хотя бы один из двух симметричных относительно с сегментов [а, 2с—а], [2с—Ь, Ь] (рис. 11.1) целиком принадлежит сегменту [а, Ь]. Поэтому хотя с 2с-а бы одна из точек а или Ь принадле- ао—'■—о о- 0& щит симметричному относительно корня с сегменту, всюду на котором о о ^ / 0^ \Р'(х)\<а<1. Значит, по крайней мере одну из р ... точек а или Ь можно, согласно доказанному выше утверждению 2 выбрать за хо. Конкретно за х0 следует выбрать ту из двух точек а или Ь, для которой приближение Х1 = Р(хо) не выходит за пределы сегмента [а, Ь]. На практике чаще всего встречается случай, когда производная Р'(х) имеет на сегменте [а, Ь] определенный знак. Если этот знак положителен, то из формулы (11.2) следует, что последовательность {хп} монотонна. Этот случай приводит к так называемой ступенчатой диаграмме, изображенной на рис. 11.2. Если же производная Р' (х) отрицательна на сегменте [а, Ь], то из той же формулы (11.2) видно, что любые два последовательных элемента хп-1 и хп лежат по разные стороны от корня с.
426 Гл. 11. Приближенные методы Рис. 11.2 Рис. 11.3 Этот случай приводит к так называемой спиралеобразной диаграмме, изображенной на рис. 11.3. Замечание. Возникает вопрос об оценке погрешности метода итераций, т. е. об оценке отклонения «-го приближения х„ от точного значения корня с. Из формулы (11.5) непосредственно вытекает следующая оценка: \хп—с|<ап(Ь—а), где а — точная верхняя грань функции \Р'(х)\ на сегменте [а, Ь], на котором изолирован рассматриваемый корень. Если производная Р' (х) отрицательна на сегменте [а, Ь], то, как указано выше, хп-\ и хп лежат по разные стороны от корня с, и поэтому справедлива следующая оценка: Если же в рассматриваемом случае взять за приближенное значение корня полусумму двух последовательных приближений * хп + хп-\ Хп- - , то получим следующую оценку погрешности: \хп-с\< I*"-*"-11. 3. Методы хорд и касательных. К числу широко распространенных приближенных методов решения уравнения }(х)=0 от-' носятся метод хорд и метод касательных, каждый из которых является одним из конкретных вариантов метода итераций. Прежде всего рассмотрим метод хорд. Пусть искомый корень уравнения
§ 1. Приближенные методы вычисления корней уравнений 427 /(*)-=0 (11.6) изолирован на некотором сегменте [а, Ь]. Предположим, что функция у = }(Х) имеет на сегменте [а, Ь] монотонную и непрерывную производную, сохраняющую определенный знак. При этом возможны четыре случая: 1°. /;(х) не убывает и положительна на [а, Ь]\ 2°. /'(я) не возрастает и отрицательна на [а, Ь]; 3°. I'(х) не возрастает и положительна на [а, Ь]; 4°. I'(х) не убывает и отрицательна на [а, Ь]. Ради определенности подробно рассмотрим случай 1°. Рассмотрим вместо уравнения (11.6) уравнение вида х = Р(х), Р(х) = х-{Ь~х){(хГ . (11.7) К ПЬ)-(х) к Легко видеть, что изолированные на сегменте [а, Ь] корни уравнений (11.6) и (11.7) совпадают, и поэтому на сегменте [а, Ь] эти уравнения эквивалентны. Для решения уравнения (11.7) применим к этому уравнению метод итераций, выбрав за нулевое приближение Хо точку а. Как обычно, определим последовательность {хп} по рекуррентной формуле хп=-Р (хп-\), п—1, 2 Докажем, что последовательность {хп} сходится к искомому корню с. Для этого, в силу утверждения 1 из п. 2, достаточно доказать, что все хп лежат на сегменте [а, Ь] и что последовательность {хп} сходится. Применяя метод индукции, докажем, что все хп лежат на сегменте [а, Ь], точнее, на сегменте [а, с], где с — искомый корень. Так как х0 лежит на сегменте [а, с], то для проведения индукции достаточно, предположив, что хп лежит на указанном сегменте, доказать, что хп+1 также лежит на этом сегменте. Поскольку хп+1 = Р(х,) = хп- <»-*">Кх"> , (Ц.8) то, учитывая, что /(с)=0. будем иметь ** х х ^ (Ь-хп)П*п) _ (Ь-Хп)\Цс)-Цха)] П+1 " Г(Ь)-Цхп) 1ПЬ)-[(с)] + [}(с)-Пхп)] Применяя к выражениям в квадратных скобках формулу Ла- гранжа, получим * При этом мы считаем, что Р(Ь)=Ь——— . Тогда функция Р(х) ГКО) оудет непрерывна на всем сегменте [а, Ь]. ** В дальнейшем мы предполагаем, что хп<с, ибо если хп — с, то [(хп) = =/(с)=0 и, значит, хп.) 1=--хн^с, т. е. принадлежность хп+1 сегменту [а, с] установлена.
428 Гл. 11. Приближенные методы Хп1-1 Хп~ ' (Ь — хп)}' (Ъп)(с—хп) (Ь-с)Г(С) + (с-хп)Г(1п) (11-в) где хп<1п<с, с<1п*<Ь, т. е. 1„<|„*. В силу неубывания и положительности производной /'(х) можем записать 0</'(|„)<Г (!"*)• Отсюда, так как Ь—с>0 и <;—х„>0, получим (*-с)/'(1п*) + {с-хп)П1п) > [<6-с) + (с-*„Ш'(Ы = = (&-*„)/'№»)■ Таким образом, из равенства (11.9) найдем хп+1—хп<с—хп, или хп+1<с, т. е. индукция проведена. Докажем теперь, что последовательность {хп} является неубывающей. Для этого достаточно доказать, что дробь, стоящая в правой части равенства (11.8), является неположительной. Так как производная ['(х) положительна на сегменте [а, Ь], то функция [(х) возрастает на этом сегменте, и поэтому из неравенств х„<с<Ь следует, что /(*„) </(с) =0, }(Ь)—}(хп)>0. Отсюда и вытекает неположительность указанной дроби.' Итак, последовательность {хп} не убывает и ограничена сверху числом с. По теореме 3.15 эта последовательность сходится. В силу утверждения 1 п. 2 пределом ее является искомый корень. Дадим геометрическую иллюстрацию рассмотренного выше случая 1°. Из формулы (11.8) вытекает, что хп+\ является абсциссой точки пересечения хорды, соединяющей точки Ап(хп, [(хп)) и В(Ь, [(Ь)) графика функции у = }(х) с осью Ох (на рис. 11.4 изображены точки А\. и Л2). Как уже указано выше, кроме рассмотренного выше случая Г возможны еще следующие три случая: 2° производная ?'(х) не зозрастает и отрицательна на сегменте [а, Ь], 3° производная }'{х) не возрастает и положительна на сегменте [а, Ь], 4° производная не убывает и отрицательна на сегменте [а, Ь]. Эти случаи изображены соответственно на рис. 11.5, 11.6, 11.7. В случае 2° уравнение (11.6), так же как и выше, заменяется уравнением (11.7) и в качестве нулевого приближения берется точка х0 = а (при этом последовательность {хп} также оказывается неубывающей). В случаях 3° и 4° уравнение (1.1.6) заменяется .не уравнением (11.7), а следующим уравнением Л—Аа Рис. 11.4
§ 1. Приближенные методы вычисления корней уравнений 429 /(а)—/(*) и в качестве нулевого приближения берется точка Хо = Ь (при этом последовательность {хп} оказывается невозрастающей). Рис. 11.5 Рис. 11.6 с уравнения (11.6) изо- Цх) имеет непрерывную Приведенная выше геометрическая иллюстрация является источником наименования метода хорд. Перейдем теперь к изложению метода касательных или метода Ньютона. Пусть, как и выше, искомый корень лирован на сегменте [а, Ь], на котором и монотонную первую производную, сохраняющую определенный знак. При этом возможны те же самые четыре случая, которые отмечены при изложении метода хорд. Ради определенности рассмотрим подробно случай 1°, т. е. предположим, что производная I'{х) не убывает и положительна на сегменте [а, Ь]. Заменим уравнение (11.6) эквивалентным [а, Ь] уравнением Рис. 11.7 ему на сегменте х = Р(х), где Р(х) = х- (11.10) и будем решать последнее уравнение методом итераций, приняв за нулевое приближение Хо точку Ъ и определив последовательность {хп} рекуррентной формулой Хп+1 ~~ г \Хг) — Хп~ Г (*») (11.11) Чтобы доказать, что последовательность {хп} сходится к искомому корню с, достаточно в силу утверждения 1 п. 2, доказать, что все хп лежат на сегменте [а, Ь] и что последовательность {хп} сходится. Применяя метод индукции, докажем, что все хп лежат на сегменте [а, Ь], точнее, на сегменте [с, Ь], где с — искомый корень. Так как х0 = Ь лежит на сегменте, \с. Ь], то для проведения ин-
430 Гл. П. Приближенные методы дукции достаточно, предположив, что хп лежит на сегменте [с, Ь], доказать, что и хп+\ также лежит на этом сегменте. Если хп = с, то /(*„)=-/(с) =0, и из формулы (П.П) следует, что хп+х~хп = с, т. е. индукция проведена. Пусть теперь хп>с. Тогда из формулы (11.11), учитывая, что /(с)=0, получим „ у ... Г(хп)-Нс) Применяя к выражению, стоящему в числителе последней дроби, формулу Лагранжа, найдем /' (Ев) (хп—с)- Г (ха) где с<\п<хп. Б силу неубывания и положительности производ- ной дробь г положительна и не превосходит единицы, т. е. /' (хп) Хп—Хп+1<СХп—С ИЛИ Л;,г+1>С. Таким образом, индукция проведена. Из положительности производной /'(*") следует возрастание функции /(х), а поэтому из неравенства с<.хп следует, что 0 = /(с) </(*„). Таким образом, 1(хп)1}'{хп)>-0, Отсюда в силу формулы (11.11) хп+1<-Хп, т. е. последовательность {хп} не возрастает. Так. как эта последовательность, кроме того, ограничена снизу числом с, то по теореме 3.15 она сходится. В силу утверждения 1 из п. 2 пределом ее является искомый корень с. Дадим геометрическую иллюстрацию рассмотренного нами случая 1°. Из формулы (11.11) вытекает, что хп+\ является абсциссой точки пересечения с осью Ох касательной к графику функции у — }(х) в точке В„(хп, 1(хп)) (на рис. 11.8 изображены точки Во, В\ и В2). Приведенная геометрическая иллюстрация является источником наименования метода касательных. Предлагаем читателю самостоятельно разобрать м'етод касательных для случаев 2°, 3°, 4°, указанных при изложении метода хорд. Замечание 1. Возникает вопрос об оценке погрешности метода хорд и касательных, т. е. об оценке отклонения п-го приближения от точного значения корня с. Применяя к выражению /(*п)=/(*л)— Нс) формулу Лагранжа, будем иметь /(*„) = = (хп—с)/'(|„). Отсюда получим следующую оценку: |хге_с1<-ШМ1, (11Л2) т где т — минимальное значение \1'(х)\ на сегменте [а, Ь]. Формула (11.12) позволяет-оценить отклонение хп от точного значения корня с через значение модуля заданной функции у=/(х) в точке хп-
§ 2. Приближенные методы вычисления определенных интегралов 431 Замечание 2. На практике часто используют комбинированный метод, заключающийся в поочередном применении метода корд и метода касательных. Ради определенности остановимся на подробно рассмотренном выше случае 1°, т. е. предположим, Что !'(х) не убывает и положительна на сегменте [а, Ь] (рис. 11.9). Определим х\ по методу касательных, взяв за нулевое приближение точку Ь: После этого определим Хг, применяя Рис. 11.8 Рис. 11.9 метод хорд, но не к сегменту [а, Ь], а к сегменту [а, х\\. Далее, определим" хъ по методу касательных, исходя из уже найденного Х\, а дг4 по. методу хорд, применяя его к сегменту [х2, х3]. Указанный процесс иллюстрируется на рис. 11.9. Преимущества комбинированного метода состоят в следующем: во-первых, он дает более быструю сходимость, чем метод хорд, и, во-вторых, поскольку последовательные приближения хп и хп+\ комбинированного метода с разных сторон приближается к корню, то разность \хп+\—хп\ дает оценку погрешности этого метода. Если за приближенное значение корня взять хп* = = (хп +хп+\)/2, то для погрешности получим оценку \хп*—с\< <\хп-п—хп\/2. § 2. ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛЕНИЯ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ 1. Вводные замечания. При решении ряда актуальных физических и технических задач встречаются определенные интегралы от функций, первообразные которых не выражаются через элементарные функции. Кроме того, в приложениях приходится иметь дело с определенными интегралами, сами подынтегральные функции которых не являются элементарными. Это приводит к
432 Гл. 11. Приближенные методы необходимости разработки приближенных методов вычисления определенных интегралов *. В этом параграфе мы познакомимся с тремя наиболее употребительными приближенными методами вычисления определенных интегралов: методом прямоугольников, методом трапеций и методом парабол. Основная идея этих методов заключается в замене подынтегральной функции 1{х) функцией более простой природы — многочленом, совпадающим с /(х) в некоторых точках. Для уяснения этой идеи рассмотрим при малых с интеграл у_ ^(х)йх, представляющий собой площадь узкой криволинейной трапеции, лежащей под графиком функции у=!(х) на сегменте [—с, с] (рис. 11.10). Заменим функцию ]{х) многочленом нулевого порядка, а именно константой ДО). При этом интеграл Iе 1(х)йх, приближенно заменится площадью прямоугольника, заштрихованного на рис. 11.11. Ниже мы покажем, что при определенных требованиях на 1(х) ошибка, совершаемая при такой замене имеет порядок с3. Заменим, далее, функцию 1(х) многочленом первого порядка, а именно линейной функцией у = кх+Ь, совпадающей с \(х) в точках —с и с. При этом интеграл Г^_ 1(х)йх приближенно за- -с 0 с ее, Рис. 11.10 * Заметим, что приближенными методами часто пользуются и для вычисления интегралов, выражающихся' через элементарные функции.
§ 2. Приближенные методы вычисления определенных интегралов 43& менится площадью прямоугольной трапеции, заштрихованной на рис. 11.12. Ниже мы покажем, что ошибка, совершаемая при, такой замене, также имеет порядок с3. Заменим, наконец, функцию Цх) многочленом второго порядка, т. е. параболой у=Ах2 + Вх+С, совпадающей с }(х) в точках —с, 0 и с. При этом интеграл Гс 1{х)йх приближенно заменится площадью, лежащей под параболой фигуры, заштрихованной на рис. 11.13. Ниже мы покажем, что при определенных требованиях на функцию 1(х) ошибка, совершаемая при такой замене, имеет порядок с5. Если потребуется вычислить интеграл [ь I (х) а"х по любому сегменту \а, Ь], естественно разбить этот сегмент на достаточно большое число малых сегментов и к каждому из этих сегментов применить изложенные выше рассуждения. При этом мы и придем к методам прямоугольников, трапеций и парабол в их общем виде. Для того чтобы оценить ошибку, возникающую при применении методов прямоугольников, трапеций и парабол, мы подойдем к изложению этих методов с другой точки зрения. Прежде всего введем понятие усред- нения «чисел. Пусть Я,ь Яг, -., кп — какие угодно положительные числа. Любое число с вида „ Я* • I (*1) + Ч (*«) + • • ■ + К1\хп) Рис. 11.13 %1 + Я2 + ■ Ля (11.13> назовем усреднением п чисел 1{х\), /(л^). •••, !(Хп)- Очевидно, что если все числа /(да), /(яг), •••, 1(хп) заключены- между числами ш и М(т^М), то и любое усреднение с этих чисел удовлетворяет неравенствам т^с*сМ. Предположим далее, что функция 1(х) непрерывна на сегменте [а, Ь] и все значения Х\, ~х<1, ..., хп лежат на этом сегменте. Тогда, какое бы усреднение п чисел $(х\), ${хч), ..., 1{хп) мы ни взяли, на сегменте [а, Ь\ найдется точка | такая, что это усреднение равно значению [(§) в точке |. В самом деле, так как функция ${х) непрерывна на сегменте [а, Ь], то все значения этой функции на указанном сегменте заключены между ее наибольшим значением М и наименьшим значением т. Значит, и любое- усреднение с чисел Цх\), [(х2), ..., 1{хп) заключено между т и М. Но, каково бы ни было это промежуточное значение с, согласно теореме 4.12 на сегменте [а, Ъ] найдется точка % такая, что» с=/(5).
434 Гл. 11. Приближенные методы Таким образом, для непрерывной на сегменте [а, Ь] функции формулу (11.13) можно переписать в виде ^1/ (хг) + Я.д/ (х2) +■■■+ ^чг! (Хп) _ * /^\ /11 1л\ Л.! -)- Х% + • • ■ + Лп или в виде Ч (*) + Ы(**) + ...+ К}(*п) (Ь—д) = Ц1) ф—д). (11.15) ^1 + ^2 + •••-{- Хп С другой стороны, для непрерывной на сегменте [а, Ь] функции, согласно п. 2 § 4 гл. 9, найдется точка |' из сегмента [а, Ь] такая, что справедлива формула среднего значения [Пх)йх = !{1')ф-ау (11.16) а Сопоставление формул (11.15) и (11.16) позволяет сделать предположение о том, что при некотором разумном выборе чисел 1\, А,2, ..., кп и точек х\, х2, ..., хп вычисление интеграла ^1(х)йх а можно с большой точностью заменить вычислением суммы, стоящей в левой части формулы (11.15). Именно на этой идее разумного выбора чисел %\, Х2 Яп и точек х\, х% ..., хп и основаны приближенные методы вычисления интеграла. Переходим'к изложению этих методов. 2. Метод прямоугольников. Будем считать, что функция 1(х), интеграл от которой нам требуется приближенно вычислить, имеет на рассматриваемом сегменте непрерывную вторую производ- ную. Начнем с рассмотрения .интеграла в симметричных пределах с [}(х)с1х. Для вычисления этого интеграла будем исходить из —с формул (11.15) и (11.16), в которых положим п=\, а =—с, Ъ = = с, #1 = 0, Я,1 = 1. Тогда, очевидно, 5 = 0 и правая часть (11.15) равна /(0)-2с. Таким образом, С ' р(*)<*х = /(0)-2с + #, (11.17) —с где символом /? обозначен остаточный член (т. е. отклонение числа /(0)-2с от точного значения интеграла). Для того чтобы оценить величину остаточного члена /?, обозначим через Р{х) первообразную функции {(х). Поскольку в силу формулы Ньютона— с Лейбница Г /(х)их = Р(с)—Р(—с), то Я=Р(с)—Р{—с)—1(0)-2с. (11.18)
§ 2. Приближенные методы вычисления определенных интегралов 435- Разложим по формуле Маклорена функцию ^(х)=Р(х)— •—Р(—х). Беря остаточный член в форме Лагранжа и обозначая через I' возникающее при этом промежуточное значение аргумента из интервала (0, с), будем иметь у(с) = Р(с)—Р(—с) = ^(0) + ^^с + -^Шс2 +^ОИсз. (П.19> 11 2.- о\ Подсчитаем входящие в эту формулу значения ф(0), •ф'(О), 1|/'(0),, ■§"'(1'). Имеем ф (х) = Р (х) -Р (-х); Ъ(0)=Р(0)-Р(0)=0; $'(х) =Р'{х) +Р'(-х) =1(х)+1(-х); т|/(0) =1(0) +1(0) =2/(0); $"(х) =1'{х)-Г(-х); Г(0) =Г(0)-Г(0) =0; Г' (х) = Г (х) + Г(-х)\ Ч/" (Г) = 21Нг')+/'(-5')1 = 2Гш. (В последнем равенстве мы воспользовались формулой (11.14)» при га = 2, ?ч = А2=1, Х\ = %, Х2 =—|' и обозначили через | некоторую точку из интервала (—с, с) на котором по предположению- непрерывна функция 1"(х).) Вставляя вычисленные значения в формулу (11.19), будем иметь Ц(с) = Р(с) — Р(—с) = 2[(0)с+2-^-^с?. (11.20> Сопоставляя последнюю формулу с формулой (11.18), окончательно получим Я=2_П12сз =Х_Ш(2с)3, — с<1<с. (11.21)' 3! 24 ч V ' Из полученной оценки остаточного члена видно, что формула (11.17) тем точнее, чем меньше величина 2с. Поэтому для вы- ь числения интеграла Г /(л;)их удобно разбить сегмент [а, Ь] на а достаточно большое число га частей и к каждой из этих частей применить формулу приближенного интегрирования (11.17). Считая, что функция Дх) имеет на сегменте [а, Ь] непрерывную вторую производную, разобьем этот сегмент на 2га равных частей; при помощи точек а-=Хо<Х2<...<Х2П = Ь. Обозначим через х2к+\ среднюю точку сегмента [х2к, #24+2]. Тогда \1(х)йх = ^^[!(х1) + !(х3)+ ...+!(х2п-1)] + Я, (11.22> а где
436 Гл. 11. Приближенные методы ["(1),а<1<Ь. (11.23) (Здесь мы воспользовались для }"(х) формулой усреднения (11.14) при А,1=Л2 = ... = Яп = 1 и обозначили через % некоторое .промежуточное значение аргумента из интервала (а, Ъ).) Формула (11.22) называется фор м у л о й прямоугольников. Ее геометрический смысл ясен из рис. 11.14: площадь кри- Рис. 11.14 Рис. 11.15 гаолинейной трапеции, лежащей под графиком Цх) на сегменте [а, Ь], приближенно заменяется суммой площадей, указанных на этом чертеже прямоугольников. 3. Метод трапеций. Пусть, как и выше, функция }(х) имеет ;на рассматриваемом сегменте непрерывную вторую производную. с Снова начнем с вычисления интеграла ^${х)йх, но на этот — с фаз будем исходить из формул (11.15) и (11.16), считая, что п = 2, а = —с, Ь = с, х\ = —с, Х2 = с, А,1 = ^2=1- Тогда § Пх)<1х = -±-[П-с) + Пс)]-2с + К,- (11.24) —с где Я — остаточный член, подлежащий оценке. Обозначая, как и в п. 2, через Р(х) первообразную функции с Лх) и учитывая, что Г /(х)их = Р(с) — Р(—с), будем иметь —с К = Р{с)-Р(-с)-±[1{с) + П-с)]-2с. (11.25) Пусть, как и в методе прямоугольников, ^(х)=Р(х)—Р(—х). Разлагая функции ${х) и \|/ (х) по формуле Маклорена с остаточным членом в интегральной форме (см. п. 4 § 5 гл. 9) и полагая .х = с, будем иметь
§ 2. Приближенные методы вычисления определенных интегралов 437 = ч>(0)- Ъ(с) = Р(с)-Р(-с) = 1! 2! С2+ 2 ]4>"'(*)(с-*)2 ИХ, с ^(^) = /(с) + /(-с) = ^(0) + ^Рс + ^г|а1)"'(л:)(с-х)^. о Подставляя в эти формулы значения а|)(0), ■ф'(О), я|/'(0), вычисленные в п. 2, получим с Р(с) — Р(—с) = 2{ (0) с + ±-\гр'" (х) (с—х)Чх, /(с) +/(-с) = 2/(0) +1 У" (х) {с-х)с1х. о Подставляя последние два выражения в (11.25), получим с _. с Д= [у"'(х)\ — (с— х)2 —с(с—х)]йх= -Г $'" (х)(с2—х2) их. Имея в виду, что функция с2—х2 неотрицательна на сегменте {0, с), применим к последнему интегралу первую формулу среднего значения (см. п. 2 § 4 гл. 9). Учитывая, что г]/"(х) = = /"(х)+/"(—х), и обозначая через |' некоторое значение аргумента из сегмента [0, с], получим Д = ПЮ+ГЧ-Г) Г/,2 [(с2—х2)с1х= — " ПГ)+/"(-Б') 2 2сЗ 3 Применяя к выражению в квадратных скобках формулу усреднения (11.14) при я = 2, Л,1 = А,2= 1 и обозначая через | некоторое значение аргумента из сегмента [—с, с], окончательно получим Я=-Г(9~=—^(2с)3. Для вычисления интеграла Л(х)йх, как и в методе прямоуголь- а ников, разобьем сегмент [а, Ъ] на п равных частей при помощи точек а = х0<Х1<...<хп = Ь и применим формулу (11.24) к каждому из частичных сегментов. Получим
438 Гл. 11. Приближенные методы Ъ га—1 хк+1 = Ц {^Т^ [Нч) + 1(хм)] + Ъ } = к=0 Ь- - Щ {*,) + ! {х1)\ + [Цх1)+[(х2)) + 2п п—1 /(а)+/.(&)+2^]/(**)}+#, (11-26) 2я /е=1 где /? = /?„ + /?!+.-..+7?^= - Г (&») + Г &)+^ ■ ■ + Г &-1) (6_а)8 = = —ТТТ- (6-°)8- а < * < й- (11 -27) 12л2 (Мы воспользовались формулой усреднения (11.11).) Формула (11.26) называется формулой трапеций. Геометрический смысл этой формулы ясен из рис. 11.15: площадь криволинейной трапеции, лежащей под графиком функции {(х) на сегменте [а, Ь] приближенно заменяется суммой площадей, указанных на этом чертеже прямолинейных трапеций. Сравнение остаточного члена (11.27) с остаточным членом (11.23) показывает, что метод трапеций не дает увеличения точности по сравнению с методом прямоугольников. 4. Метод парабол. На этот раз предположим, что функция имеет на рассматриваемом сегменте непрерывную четвертую про- с изводную, и снова начнем с вычисления интеграла Г / (х) их. —с Как и выше, будем исходить из формул (11.15) и (11.16), но при этом положим в этих формулах и=3, а=-—с, Ь = с, ?ц = = Яз=1, Яг = Х (числом Л распорядимся в дальнейшем!), Х\=—с, *2 = 0, #з = с. Тогда I где Я — подлежащий определению остаточный член. Для оценки остаточного члена обозначим, как и выше, через Г(х) первооб-
§ 2. Приближенные методы вычисления определенных интегралов 439 разную функции 1(х) и учтем, что Г /(х)Ах = Р(с)—Р(—с). По- —с лучим, что Я = /Г(с)_/г(_с)_ Г(-с)+у(0) + Пс) 2с_ (П28) 2 + 1 Пусть, как и выше, ^(х) = Р{х)—Р(—х). Разложим функции \|з(#) и т|/(х) по формуле Маклорена с остаточным членом в интегральной форме. Подставляя в эти разложения значения г|з(0), 1|/(0), $"(0), вычисленные в п. 2, и учитывая, что г|)(4>(0)=0, будем иметь чНс) = Р(с)-Р(-с) = = 2/(0)с- 2!" (0) 3! с3 + -^[$ь(х){с—х)Чх, (11.29) С У (с) = /(с) + / (-с) = 2/(0) + 2-№ с2 + ± | ^> (х) (с_х)з ^. Из последней формулы вытекает, что 2 + 1 2с = = 2[{0)с+ ^^-2с3 + ~-^— [^(х) (с—х)3их. (11.30) 2 + Х 2 + Х Из формулы (11.28) видно, что остаточный член /? равен разности выражений (11.29) и (11.30). Чтобы сделать этот остаточный член более высоким по порядку малости, выберем значение А, так, чтобы вторые члены в правых частях формул (11.29) и 2- 2 (11.30) совпадали, т. е. положим -оу- = 2_(_. ■ т. е. А. = 4. При таком значении разность формул (11.29) и (11.30) дает с 1 я=$*(5)(*) [-Ь{с~ху—^{с-х)3 йх = —М™ (с—х)3 их. Имея в виду, что функция (С-Х)*[-^-+Х неотрицательна
440 Гл. 11. Приближенные методы на сегменте [0, с], применим к последнему интегралу первую формулу среднего значения. Учитывая, что ^Цх)=^1(х) + + /(4)(—х)> и обозначая через |' некоторое значение аргумента из сегмента [0, -с], получим Я /(4)(Г)+/(4)(-Г) 24 /(4)(Г)+/(4)(-|') 2 (2с)5 йх = 2880 Применяя к выражению в квадратных скобках формулу усреднения (11.14) при п = 2, А,1 = А2=1 и обозначая через ^ некоторое значение аргумента из сегмента [—с, с\, окончательно получим я- Г(4)(Ю 2880 (2с)8 Для вычисления интеграла [{(х)йх разделим сегмент [а, Ь] на а п равных частей точками а = Хо<Х2<х^...<Х2П = Ь и положим хшк±*аа±ш Получим Х2к+1 — ' п—1 Ь. п—1 *2й+2 0 6=0 *2А ( (хм) + 4/ (ж2Ь+1) + ? (х2к+2) — 2^ \(Х2к+2— Х2к) > (а) + /(&) + 2 ^ / (*«) + 4 ^ / (хй+1) й=0 Ь —а п—1 п—1 где ы /? = А=1 *=0 (11.31) /(4) (Ы +/4)(6|) + ---+/(4)(Ь.-1) №_а)б = 2 880я& 2880«4 (11.32) (Здесь мы применим формулу усреднения (11.14).) Формула (11.31) называется формулой Симпсона или формулой парабол. Геометрический смысл этой формулы
§ 2. Приближенные методы вычисления определенных интегралов 441 &0 С<?7 0^2 2к-1 ясен из рис. 11.16: площадь криволинейной трапеции, лежащей под графиком функции 1(х) на сегменте [а, Ь] приближенно заменяется суммой площадей, заштрихованных на этом чертеже фигур, лежащих под параболами. Для того, чтобы убедиться в этом достаточно заметить, что выражение, стоящее в фигурных скобках в формуле (11.31), численно равно площади фигуры, лежащей на сегменте [х2к, х2ь+2] под параболой у=Ах2 + Вх+С, совпадающей с }(х) в точках х2к, х2к+и хк+2 (см. пример 2 п. 4 § 2 гл. 10)., Сравнивая остаточный член (11.32) с остаточными членами (11.23) и (11.27), мы убеждаемся в том, что формула Симпсона дает большую точность, чем формулы прямоугольников и трапеций. В качестве иллюстрации применения формулы Симпсона об- *? ратимся к вычислению интеграла /(х0)= \е~х2<Хх*, ограничиваясь о для простоты значениями х0 из сегмента 0<л;о<1. Полагая $(х) = е~хг и вычисляя производную /(4>{х) = 4(4л:4—\2х2 + 2>)е-х' без труда убедимся в том, что для всех х из сегмента 0<л:< 1 во всяком случае |/№(х)|<20. Исходя из оценки (11.32), можем утверждать, что /? < .Значит, разбив сегмент [0, Хо] всего на 5 равных частей и заменив рассматриваемый интеграл суммой, стоящей в правой части формулы Симпсона, мы вычислим этот интеграл с точностью до ,,, ,. < Рис. 11.16 144-54 90 000 * Рассматриваемый интеграл, как уже неоднократно отмечалось, не выражается через элементарные функции, но имеет большое значение в статистической физике, теории теплопроводности и диффузии. ** На ручном электронном калькуляторе, вычисляющем значения элементарных функций, авторы вычислили за несколько минут указанный интеграл для *о = 1, п = Ъ и получили результат 7(1) =0,7468251, который, в силу сказанного выше, содержит пять верных десятичных знаков после запятой.
Г л ав а 12 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ Многие вопросы естествознания приводят к рассмотрению такой зависимости между несколькими переменными величинами, при которой значения одной из переменных величин полностью определяются значениями остальных переменных. Так, например, при рассмотрении каких-либо физических характеристик тела (например, его плотности р или температуры 7") нам приходится учитывать изменение этих характеристик при переходе от одной точки тела к другой. Поскольку каждая точка тела определяется тремя декартовыми координатами х, у и г, то рассматриваемые характеристики (плотность р или температура Т) определяются значениями трех переменных х, у и г. При рассмотрении физических процессов, меняющихся во времени, значения физических характеристик определяются значениями четырех переменных, трех координат точки х, у, г и времени I. Например, при изучении звуковых колебаний газа плотность р этого газа и его давление р определяются значениями четырех переменных х, у, г и I. Для изучения такого рода зависимостей в этой главе вводится понятие функции нескольких переменных и развивается аппарат для исследования таких функций. Первая часть настоящей главы посвящена построению дифференциального исчисления функций нескольких переменных. На случай функции нескольких переменных будут распространены понятия и утверждения, установленные нами ,в гл. 3—7 для функции одной переменной. В одном из дополнений к настоящей главе изучаются элементы дифференциального исчисления для абстрактных функций, представляющих собой результат отображения одного нормированного пространства в другое. Частным случаем такого отображения является довольно часто встречающееся отображение евклидова пространства размерности пг в другое евклидово пространство размерности п. § 1. ПОНЯТИЕ ФУНКЦИИ ш ПЕРЕМЕННЫХ 1. Понятие т-мерного координатного и т-мерного евклидова пространств. При изложении теории функций т переменных удобно использовать геометрическую терминологию, обобщающую и
§ 1. Понятие функции т переменных 443 формализующую наши представления о плоскости и о реальном (трехмерном) геометрическом пространстве. Назовем т-и ерным координатным пространством множество всевозможных упорядоченных совокупностей (х^ х% ... ..., хт) вещественных чисел х\, х2, ..., хт. Будем обозначать т-мерное координатное пространство символом Ат. Каждую упорядоченную совокупность {Х\, х2,..., хт) мы будем называть точкой т-мерного координатного пространства и обозначать одной буквой М. При этом числа Х\, х2,...,хт мы будем называть координатами точки М. Запись М(хи х2,...,хт) означает, что точка М имеет координаты Х\, Х%, ... Хт. Замечание 1. Если рассматривать координатное пространство Ат как множество всех векторов х с координатами (#1, Хг,...,хт) и назвать суммой векторов х= (хи Хг,...,хт) и У=(Уь г/2, .», Ут) вектор с координатами {хх+уи х2+у2,-,хт.+ + ут), а произведением вектора х= (хь х%,..., хт) на вещественное число А — вектор с координатами (%хи Кх2, ..., ,?ата), то координатное пространство Ат превращается в линейное пространство *. Из курса аналитической геометрии читатель хорошо знаком с понятиями координатной плоскости и трехмерного координатного пространства. Обобщением этих понятий и является т-мерное координатное пространство Ат. Понятия координатной плоскости и трехмерного координатного пространства являются источниками удобной геометрической терминологии, употребляемой при изучении /п-мерного координатного пространства Ат. Заметим теперь, что для наших целей оказывается недостаточно понятия т-мерного координатного пространства Ат. Мы не обойдемся без измерения расстояний между точками этого пространства. Для введения понятия расстояния между точками координатного пространства Ат естественно отправляться от понятия расстояния между двумя точками координатной плоскости и двумя точками трехмерного координатного пространства (соответствую- * Напомним, что линейным пространством называется совокупность векторов х, у, г, ... любой природы при условии, что для элементов этой совокупности определены операция сложения векторов и операция умножения вектора на вещественное число, причем эти операции удовлетворяют восьми аксиомам: 1) х + +У=У+Х; 2) (х+у)+2=х+(у+г); 3)-существует нулевой вектор 0 такой, что х4-0 = х для любого вектора х; 4) для любого вектора х существует противоположный ему вектор х' такой, что х+х'=0; 5) Х(х + у) =Ъс+Ау; 6) (Л+ц)х = = Лх + (1х; 7) Я((.1х) = (Я(х)х; 8) 1-х = х. Легко проверить, что координатное пространство А™ с определениями операции сложения векторов и операции умножения вектора на число, данными в замечании 1, удовлетворяет восьми указанным аксиомам и, значит, является линейным пространством.
444 Гл. 12. Функции нескольких переменных щие формулы хорошо известны читателю из курса аналитической геометрии). Определение. Координатное пространство А™ называется т-м е рным евклидовым пространством, если между двумя любыми точками М'(х\, х{,..., хт') и М"(х"и Хг",..., хт") пространства Ат определено расстояние, обозначаемое символом р(М', М") и выражающееся соотношением р(М', М") = У(х[-хр + (х'2-хр+ ...+(х'т-х"т)\ (12.1) Будем обозначать т-мерное евклидово пространство символом Ет. Введенное нами понятие т-мерного евклидова пространства Ет является естественным обобщением понятий евклидовой плоскости и трехмерного евклидова пространства, изученных в курсе аналитической геометрии. Замечание 2. В курсе линейной алгебры дается общее определение евклидова пространства как такого линейного пространства, для которого указано правило, ставящее в соответствии любым двум элементам х и у этого пространства вещественное число, называемое скалярным произведением этих элементов и обозначаемое символом (х, у), при условии, что это правило удовлетворяет четырем аксиомам: 1) (х, У) = (У, х); 2) (х + у, 2) = (х, 2) + (у, 2); 3) (Хх, у) = = Цх, у); 4) (х, х)>0, причем (х, х)=0 только для нулевого элемента х=о. Легко проверить, что если в пространстве Ат, элементы которого рассматриваются как векторы х с координатами {хи х2,... ...,хт), определить скалярное произведение двух элементов х = = (хь хг, -, Хт) и у= (уи г/2, ..., ут) соотношением (х, у) =х1г/1+х2у2+ ... +хтут, (12.2) то будут выполнены четыре указанные аксиомы и пространство Ат превратится в евклидово пространство (сточки зрения общего определения евклидова пространства). Напомним, что линейное пространство называется нормированным, если указано правило, ставящее в соответствие каждому элементу х вещественное число, называемое нормой этого элемента и обозначаемое символом ||х||, причем указанное правило удовлетворяет трем аксиомам:. 1) ||х+у1]<:||х|| + ||у!|; 2) ||Ях||= \1\ «ИхИ; 3) ||х||>0, причем ||х|| = 0 только для нулевого элемента х *. * В аксиоме 3) можно опустить требование ||х||>0. В самом деле, это требование является логическим следствием аксиом 1) и 2) и предположения о том, что ||х|| = 0 только для нулевого элемента х (достаточно в аксиоме 1) положить У=—х).
§ 1. Понятие функции т переменных 445 В курсе линейной алгебры доказывается, что всякое евклидово пространство является нормированным: достаточно опре- делить норму любого элемента х соотношением ||х|| = У (х, х)*. Нормированное пространство всегда является так называемым метрическим пространством, т. е. таким пространством, в котором указано правило, ставящее в соответствие любым двум элементам х' и х" вещественное число, называемое расстоянием между этими элементами и обозначаемое символом р(х', х"), при условии, что это правило удовлетворяет трем аксиомам: 1) р(х, у) =р(у, х); 2) р(х, у)<р(х, г) +р(г, х); 3) р(х, у)>0, причем р(х, у)=0, только когда х=у**. Достаточно определить расстояние р(х', х") соотношением р(х', х") = ||х'-х"|| = К(х'~х", х'-х"). Если учесть, что координатное пространство Лт является евклидовым пространством со скалярным произведением, определяемым соотношением (12.2), то мы придем к следующему выражению для расстояния р(х', х") между двумя элементами х'=(л:1/, х'г,..., х'т) их"=(^1//, Хг", ■■■, хт") пространства Ат- р(х', х") = К(х'-х", х'-х") = = У(х[-ф+ (х'2-х;г+... + {хт-ху. Полученное выражение в точности совпадает с величиной,, стоящей в правой части (12.1). 2. Множества точек т-мерного евклидова пространства. Если у функции у=1{х) одной независимой переменной х, областью определения которой является некоторое множество {х} точек одномерного евклидова пространства Е1, заменить это множество {х} некоторым множеством {М} точек т-мерного евклидова пространства Ет, то мы естественно придем к понятию функции т независимых переменных. Отсюда ясно, что введению функции т переменных должно > предшествовать описание важнейших типов множеств точек т-мерного евклидова пространства Ет. Перейдем к описанию таких множеств. 1°. Множество {М} всевозможных точек М пространства Ет координаты х\, х2,..., хт которых удовлетворяют неравенству (XI—Х1)2+ (Х2—Х2)2+ ... + (Хт—Хт)2<Я2, называется открытым т-мерным шаром радиуса Я. с центром в точке М0(х1, Хг, ..., хт). * См., например: В. А. Ильин, Э. Г. Позняк. Линейная алгебра. ** В аксиоме 3) можно опустить требование р(х, у)>0. В самом деле, это« требование является логическим следствием аксиом 1) и 2) и предположения о
446 Гл. 12. Функции нескольких переменных Иными словами, открытый т-мерный шар радиуса Я с центром в точке Мо — это множество всех точек М, для каждой из которых расстояние от фиксированной точки М0 удовлетворяет неравенству р(М, Мо)<Я. 2°. Множество {М} всевозможных точек М пространства Ет, координаты Хи х%, ••-, хт которых удовлетворяют неравенству (х\—Х\)2+ ... + (хт—хт)2<Яг, называется замкнутым т-м ер - н ы м шаром радиуса Я с центром в М0. 3°. Множество {М} всевозможных точек М пространства Ет, координаты хи х%> ■■■, хт которых удовлетворяют равенству {хх—м)2+ (хг—х2)2+ ... + (хт— хт)г = Яг, называется т-м е р н о й •сферой радиуса Я с центром в точке Мо. Замечание 1. Отметим, что если к открытому т-мерному шару радиуса /? с центром в точке М0 присоединить т-мерную •сферу радиуса Я с центром в точке М0, то получится замкнутый ;т-мерный шар радиуса # с центром в точке М0. 4°. Открытый т-мерный шар радиуса е>0 с центром в точке Мо будем называть е-окрестностью точки М0. 5°. Множество {М} всех точек М, координаты Х\, Хг, ••■, хт, которых удовлетворяют неравенствам |*г— лп| <й\, \хг—х%\ <йг,..., \хт—хт\«1т, где йи &г, •••, с1т — некоторые положительные числа, называется открытым т-м ерным координатным параллелепипедом с центром в точке М0{хи Хг,...,хт) или прямоуголь: ной окрестностью точки Мо. Справедливо следующее элементарное утверждение: любая е-окрестность точки М0 содержит некоторую прямоугольную окрестность этой точки; любая прямоугольная окрестность точки М0, содержит некоторую г-окрестность точки М0 *. 6°. Точка М множества {М} точек пространства Ет называется внутренней точкой этого множества, если существует некоторая е-окрестность точки М, все точки которой принадлежат множеству {М}. 7°. Точка М пространства Ет называется внешней точкой множества {М}, если существует некоторая е-окрестность точки М, все точки которой не принадлежат множеству {М}. том, что р(х, у)=0, только когда х=у (достаточно в аксиоме 2) положить- У=х). *_В самом деле, если для фиксированного е>0 положить й1 = йг=-.=йт = =.е/1/т, то прямоугольная окрестность точки М0 с указанными йи й2, ..., йт будет содержаться в е-окрестности точки Мо. Если для фиксированных а^Х), -с/г>0, ..., йт>0 положить е=гшп{«?1, й2, ..., йт}, то е-окрестность точки Мо- будет содержаться в прямоугольной окрестности точки М0 с указанными йи йг, ...,
§ 1. Понятие функции т переменных 447 8°. Точка М пространства Ет называется граничной точкой множества {М}, если эта точка не является ни внутренней, ни внешней точкой указанного множества *. Замечание 2. Граничная точка М множества {М} может как принадлежать, так и не принадлежать этому множеству. Так любая точка т-мерной сферы радиуса Я с центром в точке М0 является граничной как для открытого т-мерного шара радиуса Я с центром в точке М0, так и для замкнутого т-мерного шара радиуса Я с центром в точке М0. Но любая точка указанной сферы не принадлежит открытому шару радиуса Я с центром в М0 и принадлежит замкнутому шару радиуса Я с центром в М0. 9° Произвольное множество М точек пространства Ет называется открытым, если любая точка этого множества является его внутренней точкой **. 10°. Произвольное открытое множество, содержащее данную точку Мо, принято называть окрестностью точки М0. 11°. Произвольное множество {М} точек пространства Ет называется замкнутым, если это множество содержит все свои граничные точки. Чтобы сформулировать другое эквивалентное определение замкнутого множества, введем понятие предельной точки произвольного множества М в пространстве Ет. 12°. Точку А пространства Ет назовем предельной точкой множества {М}, если в любой е-окрестности точки А содержится хотя бы одна точка этого множества, отличная от А. Убедимся в том, что множество М замкнуто тогда и только- тогда, когда оно содержит все свои предельные точки. В самом деле, если множество М замкнуто, то оно содержит все точки пространства Ет, кроме своих внешних точек. Поскольку среди внешних точек множества М нет его предельных точек, то множество М содержит все свои предельные точки. Если же множество {М} не содержит хотя бы одной своей граничной точки М0, то эта точка М0, очевидно, является предельной точкой множества {М}. Доказанное утверждение позволяет дать другое эквивалентное определение замкнутого множества: множество М называется замкнутым, если оно содержит все свои предельные точки***, * Заметим, что точка М является граничной точкой множества {М} тогда к только тогда, когда в любой е-окрестности точки М найдутся как точки, принадлежащие множеству {М}, так и точки, ему не принадлежащие. В самом деле, если в некоторой е-окрестности точки М не найдется точек, принадлежащих. {М} [не принадлежащих {М}], то точка М является внешней [внутренней] точкой М и не является граничной точкой этого множества. ** Т. е. если любая точка М множества {М} принадлежит этому множеству вместе с некоторой своей е-окрестностью. *** Еще одним эквивалентным определением замкнутого множества является следующее определение: множество М пространства Ет называется замкнутым, если его дополнение является открытым множеством.
<448 Гл. 12. Функции нескольких переменных 13°. Множество {М} точек пространства Ет называется ограниченным, если найдется т-мерный шар, содержащий все точки этого множества. 14°. Введем понятие непрерывной кривой в т-мерном евклидовом пространстве Ет. Непрерывной кривой I в пространстве Ет мы будем •называть множество {М} точек этого пространства, координаты .XI, х%,..., хт которых представляют собой непрерывные функции лараметра I: « *1 = 'ф1(0. *2 = ф2(0>-. *т = фт(0. «<^<Р- (12.3) Мы будем говорить, что точки М'(ххг, х2', ..., хт') и М" {хх", х2",... ,хт") пространства Ет м о ж н о соединить непрерывной кривой Ь, если существует такая непрерывная кривая Ь, определяемая параметрическими уравнениями (12.3), что *1' = ф1(а), л:2/ = ф2(сс), ..., хт'=(фт(а), х//=<р1(р), лг2'" = ф2(Р),...,л:т//=фт(р). Понятие непрерывной кривой в пространстве Ет позволяет нам швести понятие связного множества. 15°. Множество {М} точек пространства Ет называется связным, если любые две тонки этого множества можно соединить непрерывной кривой, все точки которой принадлежат этому множеству. Убедимся в том, что всякое связное множество {М} в пространстве Ет обладает следующим свойством: если множество {М} связно, то не существует двух непустых непересекающихся открытых множеств Си С" таких, что пересечение каждого из этих множеств с {М} не пусто и множество {М} содержится в объединении О' и О". Проведем доказательство этого свойства от противного. Предположим, что два указанных множества С и О" существуют. Так как пересечение каждого из этих множеств с {М} не пусто, то найдутся две точки М' и М" множества {М}, первая из которых принадлежит О', а'вторая О". Чтобы получить противоречие, завершающее наше доказательство, нам достаточно установить, что точки М' и М" нельзя соединить непрерывной кривой, все точки которой принадлежат множеству {М}. Пусть Ь — любая непрерывная кривая в пространстве Ет, определяемая уравнениями (12.3) и соединяющая указанные точки М' и М". Упорядочим все точки кривой ^ по возрастанию параметра I, который изменяется в пределах сегмента а<^<р. Обозначим через у точную верхнюю грань тех значений параметра I, для которых отвечающие им точки кривой Ь принадле-
§ 1. Понятие функции т переменных 449 жат множеству С, а через N точку кривой Ь, отвечающую значению параметра {=у. Достаточно доказать, что указанная точка N не принадлежит множеству {М}, а для этого достаточно убедиться, что эта точка N не принадлежит ни множеству С, ни множеству О". Если бы точка N принадлежала С, то, поскольку множество С является открытым, нашлась бы некоторая е-окрестность точки М, также принадлежащая С, т. е. нашлись бы точки кривой Ь отвечающие значениям параметра {, превосходящим у, принадлежащие С, а это противоречит тому, что у является точной верхней гранью значений параметра I, для которых соответствующие точки кривой Ь принадлежат С. Аналогично если бы точка N принадлежала О", то.она принадлежала бы этому множеству вместе с некоторой своей е-ок- рестностью, т. е. нашлись бы точки кривой Ь, отвечающие значениям параметра (, меньшим ^, принадлежащие О" и потому не принадлежащие С, а это противоречит тому, что у является точной верхней гранью значений параметра I, для которых соответствующие точки кривой Ь принадлежат множеству С. Итак, точка N не принадлежит ни С, ни О", и сформулированное свойство доказано. Мы не будем останавливаться на доказательстве обратного утверждения о том, что если множество {М} в пространстве Ет обладает указанным выше свойством, то оно является связным, а лишь отметим, что установленное нами свойство может быть положено в основу другого «топологического» определения понятия связного множества. 16°. Всякое открытое и связное множество в пространстве Ет принято называть областью. 17°. Если множество {М} представляет собой область, то множество {М}, полученное присоединением к множеству {М} всех его граничных точек, называется замкнутой областью. Открытый т-мерный шар и открытый /п-мерный координатный параллелепипед являются ограниченными, связными и открытыми множествами, т. е. дают примеры ограниченных областей в пространстве Ет. /л-мерная сфера в пространстве Ет дает пример замкнутого и ограниченного множества. Замкнутый т-мерный шар представляет собой ограниченную замкнутую область в Ет. Дополнение к открытому т-мерному шару представляет собой неограниченное замкнутое множество. Совокупность двух непересекающихся областей в пространстве Ет дает пример несвязного множества. 3. Понятие функции пт переменных. Теперь мы подготовлены для того, чтобы ввести понятие функции т переменных. ' 15 Зах. 12
450 Гл. 12. Функции нескольких переменных Если каждой точке М из множества {М} точек т-мерного евклидова пространства Ет ставится в соответствие по известному закону некоторое число и, то говорят, что на множестве {М} задана функция и = и{М) или и = [(М). При этом множество {М} называется областью задания функции и = 1(М). Число и, соответствующее данной точке М из множества {Щ, будем называть ч астны м значением функции в точке М. Совокупность всех частных значений функции и = {(М) называется множеством значений этой функции. Так как точка М определяется координатами х\, х2, ..., хт, то для функции и= =/(М) т переменных используется также обозначение ы=/(хь Х2, ..., Хт). Рассмотрим примеры функций т переменных. Начнем с примеров функций двух переменных. 1°. « = У"4—х2—у2. Областью задания этой функции является круг радиуса 2 с центром в начале координат, а множество значений представляет собой сегмент 0<и<2. 2°. и—[У~х2+ у2—4]-1. Областью задания этой функции является множество точек, лежащих вне круга радиуса 2 с центром в начале координат, а множество значений представляет собой открытую полупрямую ц>0. 3°. и = угсоз(х2+ у2). Областью задания этой функции является множество {М} точек, координаты которых удовлетворяют неравенству соз(х2 + г/2) >0. Это неравенство эквивалентно неравенствам 0<х2 + г/2<—, 2Ы — <х2 + у2 <2&л + — при к = = 1, 2,.... Таким образом, {М} состоит из круга радиуса ]/я/2 с центром в точке О (0,0) и кольцеобразных областей (рис. 12.1). Приведем теперь примеры функций т переменных. 4°. Пусть и = '\г\—х\—х\—...—хК Областью задания этой функции служит, очевидно, т-мерный шар радиуса 1 с центром в точке О (0, 0,..., 0). Множеством значений рассматриваемой функции является сегмент [0, 1]. 5. Пусть и= —. Областью зада- 1 / , х\ Х2 хт ния этой функции является множество {М} всех точек М пространства Ет, координаты хи х2,..., хт которых удовлетворяют неравенству Х\ Хп Х~~ (при этом предполагается, что аи а2,..., ат — некоторые положительные числа).
§ 2. Предел функции т переменных 451 Очевидно, указанное множество {М} будет представлять собой область в пространстве Ет, все точки которой лежат внутри так •называемого т-мерного эллипсоида, представляющего со- *бой множество точек, координаты которых удовлетворяют уравнению ■ + + + • = 1. Множеством всех значений указанной функции являет-' ся полупрямая и> >1. Мы видим, что область задания функции т переменных представляет собой некоторое множество точек т-мерного евклидова пространства Е™, а множество всех значений этой функции представляет собой некоторое множество одномерного (евклидова пространства Е1. Таким образом, введенную нами функцию т переменных можно рассматривать как отображение некоторого множества в пространстве Еш в некоторое множество в пространстве Е1. Рис. 12.1 § 2. ПРЕДЕЛ ФУНКЦИИ ш ПЕРЕМЕННЫХ 1. Последовательности точек пространства Ет. Введем понятие последовательности точек т-мерного евклидова пространства Ет. Пусть каждому числу п натурального ряда чисел 1, 2,... ставится в соответствие точка Мп евклидова пространства Ет. Возникающий при этом ряд точек Мъ М%,..., Мп,..., рассматриваемый в указанном порядке, называется последовательностью точек евклидова пространства Ет. Мы будет кратко обозначать эту последовательность символом {Мп}. Введем, далее, понятие сходящейся последовательности точек пространства Ет и ее предела. Последовательность {Мп} точек евклидова пространства Ет называется сходящейся, если существует точка А пространст- 15*
452 Гл. 12. Функции нескольких переменных ва Ет такая, что для любого положительного числа г можно указать отвечающий ему номер N такой, что при п^>Ы выполняется неравенство р{Мп, А)<е. При этом точка А называется пределом последовательности {Мп}. Для обозначения предела А последовательности {Мп} используется следующая символика: '•^ \\тМп = А, или Мп-+А при я-»-оо. Установим следующую лемму. Лемма 1. Последовательность {Мп} точек т-мерного евклидова пространства Ет сходится к точке А этого пространства тогда и только тогда, когда числовые последовательности {*(,п,}> {х^}, ..., {х^} координат точек Мп сходятся соответственно к числам аи а2,..., ат, представляющим собой координаты, точки А. Доказательство. Сначала докажем первую часть леммы. Так как последовательность {Мп} сходится к точке А, то для любого е>0 можно указать номер N такой, что при я>./У выполняется неравенство р(Мп, Л)<е. Пусть {х[п\ х{2п\ ..., х^}— координаты точки Мп, а (й1, а2,..., аш) — координаты точки А. Тогда неравенство р(Мп, А)<г можно записать следующим образом: У {хЫ-а1У + (4п)-«2)2 + • • • + (х$~ат)2 < е. (12.4) Отсюда следует, что при п^-Ы выполняются неравенства Ип)—«Ц.К8» |х(2"'-а2|<е, ..., \х$—ат\<ъ. Иными словами, последовательности {х'"1}, {х<2">}, ...„{^^координат точек Мп сходятся соответственно к числам аи а2,..., ат. Первая часть леммы доказана. Перейдем к доказательству второй части леммы. Предположим, что указанные последовательности координат точек Мп сходятся соответственно к числам аи а2,...,ат. Тогда для любого е>0 можно указать номера Ыи Ы2,..., Ыт такие, что при п>>Ыи п>>Ы2,..., л» >Л/т соответственно выполняются неравенства Отсюда следует, что при л>Лг = тах{Л^1, Ы2,..., Nт} выполняется неравенство (12.4). Иными словами, при п^Ы выполняется неравенство р(Мп, А)<г, где А — точка Ет с координатами аи а2, ... ..., ат. Таким образом, последовательность {Мп} сходится к-точке А. Лемма доказана. Введем теперь понятие фундаментальной последовательности точек пространства Ет. Последовательность {Мп} точек пг-мернот. го евклидова пространства называется фундаментальной или после дов ательн остью Ко щи, если для любого положи-
§ 2. Предел функции т переменных 453 тельного числа е можно указать отвечающий ему номер N такой, что при п>-Ы и при любом целом р>0 выполняется неравенство р(Мп+р, Мп)<е. В полной аналогии с леммой 1 может быть доказано следующее утверждение. Лемма 2. Последовательность {Мп} точек гп-мерного евклидова пространства Ет является фундаментальной тогда и только тогда, когда является фундаментальной каждая из числовых последовательностей {х<">}, {х(2">}, ..., {х%>} соответствующих координат точек Мп. Доказательство. Для доказательства первой части леммы предположим, что последовательность точек {Мп} является фундаментальной, т. е. для любого е>0 найдется номер N такой, что при п>-Ы и для любого целого р>0 справедливо неравенство р(Мп+р, Мп)<е или, что то же самое, неравенство у (л^+р) _х(п))2+ (Х(п+Р) _Х№) + ... + (х<2+р>—хЮ)* < е. (12.4*) Из этого неравенства вытекает, что при л>Л/ и для любого целого р>0 справедливы неравенства |х<»+р>—х(">|< е, |4П+Р)—4"М< е \х%+»—Х%\< г, которые и устанавливают фундаментальность каждой из числовых последовательностей соответствующих координат точек Мп. Для доказательства второй части леммы предположим фундаментальность каждой из числовых последовательностей соответствующих координат точек Мп. Тогда для любого е>0 можно указать номера Ыи Ы2,..., Ыт ггакие, что соответственно при п^Ыи п>-Ы2, ..., п>>Кт и для любых целых р>0 будут справедливы неравенства |х(п+Р)_х(П)|< * |^+р)_4»)|< -^-, .... |^+Р)_х(п)|< - " ,. У т у т т _ т у^т Отсюда следует, что при л>Л/ = тах{Л^, Ы2,.... Ыт) и для любого целого р>0 будет справедливо неравенство (12.4*), которое и означает фундаментальность последовательности точек {Мп}. Лемма 2 доказана. С помощью лемм 1 и 2 легко доказывается критерий Кош и сходимости последовательности точек прост^ р а н с т в а Ет; для того чтобы последовательность {Мп} точек пространства Ет была сходящейся, необходимо й достаточно, что-: бы она была фундаментальной. В самом деле, если последовательность точек {М„} является фундаментальной, то в силу леммы 2 является фундамен: тальной и каждая из числовых последовательностей соответствую-^ щих координат точек {Мп}. В силу критерия Коши сходимости числовой последовательности указанные числовые последователь-
454 Гл. 12. Функции нескольких переменных ности соответствующих координат сходятся к некоторым числам аи аг,..., ат соответственно. Но тогда в силу леммы 1 последовательность точек {Мп} сходится к точке А {а\, а%,..-, ат). Если, наоборот, последовательность точек {Мп} сходится к некоторой точке А пространства Ет, то в силу леммы 1 каждая из числовых последовательностей соответствующих координат точек {Мп} сходится к соответствующей координате точки А. Но тогда (в силу критерия Коши сходимости числовой последовательности) каждая из числовых последовательностей соответствующих координат точек {Мп} является фундаментальной и, значит, в силу леммы 2, является фундаментальной и последовательность точек {Мп}, 2. Свойство ограниченной последовательности точек Ет. Введем понятие ограниченной последовательности точек пространства Ет. Последовательность {Мп} точек т-мерного евклидова пространства называется ограниченной, если существует такое число а>0, что для всех п выполняется неравенство р(0, Мп)<а, где О — точка, все координаты которой равны нулю. Иными словами, ограниченность последовательности точек {Мп} означает, что все точки этой последовательности принадлежат замкнутому шару достаточно большого радиуса с центром в начале координат О. Установим следующее важное свойство ограниченной последовательности точек пространства Ет. Если п\, «2,..., Пк,...— произвольная строго возрастающая последовательность целых положительных чисел, то мы будем называть последовательность точек Мя,, МПг, .... ЛЦ, ... подпоследовательностью последовательности точек Ми М2,.... Мп,.... Теорема 12.1 (теорема Больцано — Вейерштрас- с а). Из любой ограниченной последовательности {Мп} точек т-мерного евклидова пространства можно выделить сходящуюся подпоследовательность. Доказательство. Убедимся, во-первых, что последовательности {4П))> {*2П)Ь • • • > \хт) координат точек {Мп} являются ограниченными. Действительно, так как последовательность {Мп} ограничена, то для всех п выполняется неравенство р(0, Мп)<а. Поскольку р(0, Мп) = У[х^]2 + [4П>]2 + • • • + №тТ> отсюда следует, что для всех п выполняются неравенства|х(,п)|< а, |хМ|-<а, •■■> \х(т\ Ка- Иными словами, последовательности {х*"'}, {х$}}, •••• №т} координат точек Мп ограничены. В силу теоремы Больцано — Вейерштрасса для числовых последовательностей (см. п. 1 § 3 гл. 3) из последовательности {х^} можно выделить под-
§ 2. Предел функции т переменных 455 последовательность {я}"*»'}, сходящуюся к некоторому числу аь Рассмотрим соответствующую подпоследовательность {х^1} последовательности вторых координат точек Мп- В силу той же теоремы из подпоследовательности {х^} можно выделить подпоследовательность {^ }> сходящуюся к некоторому числу а2. Заметим, что подпоследовательность {*',"*«} последовательности (х" } сходится к числу й1. Итак, подпоследовательности {х{"к2} и^"**'} сходятся к числам а4 и а2 соответственно. Очевидно, что если мы из подпоследовательности {х{"кз)} последовательности третьих координат точек Мп выделим сходящуюся к числу а3 подпоследовательность {х{"кз)}, то подпоследовательности {х{"кз>}, {х^кз)}, {х{^кз)} сходятся соответственно к числам аь а2, а3. Продолжая эти рассуждения, мы, наконец, получим сходящуюся к некоторому числу ат подпоследовательность {х^т} последовательности т — х координат точек Мп, причем подпоследо- вательности {х1 т), {х2 т}, ..., {хтту сходятся к числам аи а2,..., ат соответственно. Но тогда в силу леммы 1 подпоследовательность {Мп. } после- довательности точек {Мп} сходится к точке А с координатами сц, а2,..., ат- Теорема доказана. Замечание. Предел А последовательности {Мп} точек, принадлежащих замкнутому множеству {М}, также принадлежит этому множеству. Чтобы убедиться в этом, достаточно заметить, что в любой е-окрестности точки А имеются точки {Мп}, т. е. точки множества {М}, и поэтому точка А является либо внутренней, либо граничной точкой {М}, а следовательно, принадлежит {М}. 3. Предел функции т переменных. Рассмотрим функцию и = 1(М), определенную на множество {М} точек т-мерного евклидова пространства Ет, и точку А пространства Ет, быть может и не принадлежащую множеству {М}, но обладающую тем свойством, что в любой е-окрестности этой точки А содержится хотя бы одна точка множества {М}, отличная от А *. Определение 1 (предел функции в точке А по Гейне). Число Ъ называется пределом (или предельным значением) функции и=}(М) в точке А (или при М-+А), если для любой сходящейся к А последовательности {Мп} точек множества {М} задания этой функции, все элементы Мп которой отличны от А, соответствующая числовая последовательность значений функции {{(Мп)} сходится к числу Ь. * Это означает, что точка А является предельной точкой множества {М} (см. п. 2 § 1 настоящей главы, определение 12е).
456 Гл. 12. Функции нескольких переменных Определение 1* (предел функции в точке А до Кош и). Число Ь называется пределом (или предельным значением) функции и=}(М) в точке А (или при М-*-А), если для любого положительного числа е найдется отвечающее ему положительное число б такое, что для любой точки М из множества {М) задания этой функции, удовлетворяющей условию 0<р(М, Л)<б, справедливо неравенство |/(М)—Ь\<е. Для обозначения предела функции и=/(М) в точке А используется следующая символика: Пт/(Л1) = 6 или Нт $(хх, х2, ..., хт) =Ь. М-*А *1-*а, хт*ат (Здесь (а4, а2,..., ат) — координаты точки А.) Доказательство эквивалентности определения 1 и 1* проводится точно так же, как и для функции одной переменной. Следует лишь в рассуждениях теоремы 3.19 (см. п. 2 § 4 гл. 3) заменить последовательность {хп} последовательностью точек {Мп}, точку а — точкой А(аи а2 ат), разности |х—а| и \хп—а\ — расстояниями р(М, А) и р(Мп, А) соответственно, а числовую последовательность {{(хп)} заменить числовой последовательностью {/(М„)}. Введем теперь понятие предела функции и = $(М) при М-*-оо. Для этого предположим, что множество {М}, на котором задана функция и = }(М), для любого б>0 имеет хотя бы один элементМ,, лежащий вне шара радиуса б с центром в точке О(0, 0 0). Ограничимся определением соответствующего предела функции по Коши. Определение 2. Число Ь называется пределом функции и = $(М) при М-+оо, если для любого положительного числа е найдется отвечающее ему положительное число б такое, что для всех точек М из множества {М} задания функции, удовлетворяющих условию р(0, М)>8, справедливо неравенство \[(М)—6|<е. Для обозначения предела функции ы = /(М) при М-+оо используется символ Пт/(М) = Ь. Так же, как и для функции одной переменной, легко убедиться в том, что арифметические операции над функциями пг переменных, имеющими предел в данной точке А [или при ЛГ->оо], приводят к функциям, также имеющим предел в точке А [соответственно при .М—^оо]. Сформулируем соответствующее утверждение для случая предела в точке А. Пусть две функции [(М) и §(М) заданы на одном и том же множестве {М} и имеют в точке А пределы, соответственно рав'
§ 2. Предел функции т переменных 457 ные Ъ и с. Тогда функции ^(М)+§(М), ЦМ)—§(М), {(М)-д(М) и 1(М)/§(М) имеют в точке А пределы, соответственно равные Ь+с, Ь—с, Ь-с и Ь/с (в случае частного нужно дополнительно требовать, чтобы с было отлично от нуля). Доказательство этого утверждения совершенно аналогично доказательству теоремы 3.21 (см. п. 4 § 4 гл. 3), только вместо определения по Гейне предела функции одной переменной следует использовать определение по Гейне предела функции пг переменных. Установим теперь критерий Коши существования предела функции пг переменных. Определение 3. Будем говорить, что функция пг переменных !(М) удовлетворяет условию Коши в точке М = А [соответственно при М->-оо], если для любого положительного числа г найдется отвечающее ему положительное число б такое, что для любых двух точек М' и М" из множества {М} задания функции, удовлетворяющих условиям . 0<р(М/, Л)<6, 0< <р(М", Л)<6 [соответственно условиям р(М', 0)>6, р(М", 0,)> >б], справедливо неравенство |/(М')—1{М")\<г. Теорема 12.2 (критерий Коши существования предела функции пг переменных). Для того чтобы функция и = ](М) имела конечный предел в точке М=А [при, М-*-оо], необходимо и достаточно, чтобы эта функция удовлетворяла в точке М=А [при Л4->-оо] условию Коши. Доказательство этой теоремы полностью идентично доказательству теоремы 3.20 (см. п. 3 § 4 гл. 3) и может быть получено из него формальной заменой букв хна буквами М и А и выражений типа \х—а\ символом р(М, А). (Весьма полезно заметить, что определение предела функции пг переменных и=[(М) в точке А и при М->-ос укладывается в общее определение предела по базе, введенное в § 5 гл. 3. Рассмотрим сначала предел функции и = 1(М) в точке А. Договоримся называть проколотой б-о к р е стн о сть к> точки А открытый т-мерный шар радиуса б с центром в точке А, из которого удалена сама точка А. Подчеркнем, что 1(М) задана на таком множестве {М}, которое для любого б>0 имеет хотя бы одну точку М, лежащую в проколотой б-окрестности точки А. Обозначим символом Св проколотую б-окрестность точки А и положим В5={Л1}ПС'в. Очевидно, совокупность В={В,} множеств Вь при всех б>0 образует базу множества {М}, ибо каждое множество В& (при любом б>0) не является пустым и пересечение любых двух множеств совокупности {Въ} представляет собой множество той же совокупности *. Эту базу естественно обозначить символом М-*-А, ибо, как I легко проверить, определение предела по такой базе совпадает * Определения понятий базы и предела функции по базе см. в § 5 гл. 3.
458 Гл. 12. Функции нескольких переменных с определением 1* предела функции и = {(М) в точке А по Кош и. Для случая предела функции ы = [(М) при М->-оо эта функция должна быть задана на таком множестве {М}, которое для любого 6>0 имеет хотя бы одну точку М, удовлетворяющую условию р(М, 0)>6, где О — точка с координатами (0,0,..., 0). Обозначим символом Сб множество всех точек М пространства Ет, удовлетворяющих условию р(М, 0)>б, и положим Вй={М}[)Съ. Легко проверить, что совокупность {В6} множеств Вь при всех 6>0 образует базу множества {М}, ибо каждое множество В6 не является пустым и пересечение любых двух множеств совокупности {Вб} представляет собой множество той же совокупности. Эту базу естественно обозначить символом М-+оо, ибо, как легко проверить, определение предела по такой базе совпадает с определением 2 предела функции и=/(ЛГ) при М-^оо. В заключение отметим, что теорема 12.2 (т. е. критерий Ко- ши существования предела функции н = /(М) в точке А и при М-»-оо) вытекает как частный случай из теоремы 3.22, устанавливающей критерий Коши существования общего предела функции по базе. 4. Бесконечно малые функции т переменных. Функция и = {(М) называется бесконечно малой в точке А (при М->~А), если М->-А Легко убедиться, что функция /(М) = (хг—а1)"1 + (х2—а2)"' + + ... + (хт—ат)"т, где Пи пг пт — положительные числа, является бесконечно малой в точке А (аи а2, ..., ат) *. Если функция и=1(М) имеет равное Ь предельное значение в точке А, то функция а(М)=[(М)—Ь является бесконечно малой в точке А. Имеем: Нта(М)= Пт[/(М)—Щ= Пт /(М) — Пт6 = 0. Ис- М-+А М-+А М-+А М-+А пользуя этот результат, мы получим специальное представление для функции, имеющей равный Ь предел в точке А :}(М)=Ь + а(М), где Пта(М) = 0. М-*А Сравнение бесконечно малых функций нескольких переменных производится точно так же, как это указано в п. 5 § 4 гл. 3 для бесконечно малых функций одной переменной. Отметим, что, как и в случае одной переменной, под символом о(р) мы будем понимать любую бесконечно малую в данной точке А функцию бблее высокого порядка малости, чем бесконечно малая в данной точке А функция р(М). * Достаточно учесть, что каждая из функций одной переменной ^ (**)=» ~(Хк—аъ)пк является бесконечно малой в точке х*=а*.
§ 2. Предел функции т переменных 459 5. Повторные пределы. Для функции и=Цх\, Х2,..-,хт) нескольких переменных можно определить понятие предела по одной из переменных хк при фиксированных значениях остальных переменных. В связи с этим возникает понятие повторного предела. Уясним это понятие на примере функции и=1(х, у) двух переменных хну. Пусть функция и = 1(х, у) задана в некоторой прямоугольной окрестности \х—Хо\<а'и \у—г/о|<^2 точки М0(хо, г/о), за исключением, быть может, самой точки М0. Пусть для каждого фиксированного у, удовлетворяющего условию 0<|г/—г/0|<^2, существует предел функции и = \{х, у) одной переменной х в точке х = Хо Нт 1(х, у) = Ц>(у), (/—фикс и пусть, кроме того, существует предел Ь функции ф(г/) в точке У = Уо Нтф(г/) = й. У-*У« В этом случае говорят, что существует повторный предел Ь для функции и = 1(х, у) в точке М0, который обозначается следующим образом: НтНт/(л;, г/) = Ь. 1/-И/0 Х-*Х0 Аналогично определяется повторный предел Нт Пт/(л:, у). х-+х„ у-+у<, Установим достаточные условия равенства двух введенных повторных пределов. Теорема 12.3. Пусть функция и=1(х, у) определена в некоторой прямоугольной окрестности \х—#о|<^1, \у—уо\<й2 точки Мй{хй, г/о) и имеет в этой точке предел, равный Ь. Пусть, кроме того, для любого фиксированного х, 0<|х—Хо\<с1и существует предел г|з (х) ='Нт / (х, у) и для любого фиксированно- У-*Уо го у, 0< | у—г/о | <<^2, существует предел ф (у) — Нт/(х, у). Тогда повторные предела Пт Пт/(х, у) и НтНт/(х, у) существуют х^-Хц у-+уа г/-м/„ х-+х0 и оба равны Ь. Доказательство. Так как функция и=/(х, у) имеет в точке М0{хо, г/о) предел Ь, то для любого е>0 можно указать такое 6>0, что при \х—Хо|<6 и \у—г/о|<б выполняется неравенство Ц(х, у)—Ь\<г. Таким образом, в прямоугольной окрестности \х—х0|<6 и \у—г/о|<б точки М0 значение функции }{х, у) отличается от Ь не больше чем на е. Но тогда пределы 1|з(х) и ф(г/), указанные в формулировке теоремы при х и у,
460 Гл. 12. Функции нескольких переменных удовлетворяющих неравенствам \х—#о|<б и \у—г/о|<б, также отличаются от Ь не больше чем на е. Следовательно, и пределы этих функций в точках х0 и у0 соответственно существуют и равны Ъ. Теорема доказана. Можно определить понятие повторного предела для так называемых двойных последовательностей {атп}, элементы атп которых определяются двумя индексами тип. Именно символ Пт \\татп означает, что сначала определяет— ся последовательность {Ьп}, Ьп= Пт атп, а затем находится ОТ->-оа предел этой последовательности {Ьп}. Рассмотрим, например, двойную последовательность {атп}, где атп = со5т2пп\х, х — фиксированное число. Докажем, что .. ,. _ . П, если х—рациональное число, Нт Нт созт 2лп\х={ ' ■ г п-м»т-м» [0, если х—иррациональное число. В самом деле, если х=р\ц, где р и ц — целые числа, второе из которых положительно, то при «>^ имеем соз2ял!л:=1, и поэтому Нт С08т2я/2!#= 1. Иными словами, если х — рацио- нальное число, то НтНтсозт2л«!д:=1. Если же х—ирра- циональное число, то при любом п справедливо неравенство |соз2я«!л:| <1, и поэтому Пт со8т2лл!# = 0, т.е. Пт Пт со8т2пп\х = 0. т-*ао т-»оо п-*со Замечание. Используя полученный результат, мы можем аналитическим способом задать функцию Дирихле (см. п. 1 § 4 гл. 3) как повторный предел Пт Птсо5т2я«!л;. и-»оо т-»оо § 3. НЕПРЕРЫВНОСТЬ ФУНКЦИИ т ПЕРЕМЕННЫХ 1. Понятие непрерывности функции т переменных. Рассмотрим функцию тпеременных ы=/(Л1), заданную на некотором множестве {М} пространства Ет. Пусть А — некоторая точка Ет, принадлежащая множеству {М} и такая, что в любой б-окрестности точки А содержатся точки множества {М}, отличные от А. * Форм альное определение непрерывности функции в точке. Функция и={(М) называется непрерывной в точке А, если предел этой функции в точке А существует и равен частному значению }(А). * Это означает, что А является предельной точкой множества {М}.
§ 3. Непрерывность функции т переменных 461 Заметим, что поскольку 'А=\'\т М, то условие непрерывнос- М->-А ти функции /(М) в точке Л можно символически записать в виде Пт/(Л1) = /(ПтЛ1). М-*А М-+А • Таким образом, для непрерывной в данной точке А функции символ Нт предела и символ / характеристики функции можно менять местами. Точки пространства Ет, в которых функция и = }(М) не обладает свойством непрерывности, называются точками разрыва этой функции. Используя определение предела функции в точке А по Гейне и по Коши, мы придем к определениям непрерывности функции в данной точке по Гейне и по Коши. Определение 1* (непрерывность функции в данной точке по Гейне). Функция и = }(М) называется непрерывной в точке А, если для любой сходящейся к А последовательности {М„} точек множества {М} задания этой функции соответствующая числовая последовательность {}(Мп)} значений этой функции сходится к числу !(А). Определение 1* (непрерывность функции в данной точке по Коши). Функция и = 1(М) называется непрерывной в точке А, если для любого положительного числа г найдется отвечающее ему положительное число б такое, что для Любой точки М из множества {М} задания этой функции, удовлетворяющей условию р(М, Л)<6, справедливо неравенство М(М)-!(А)\<е. Заме-чание. В отличие от определения предела по Гейне, мы опускаем в определении 1 требование МпфА. Это можно сделать в силу того, что функция }(М) определена в точке А и добавление к последовательности {}{Мп)}, сходящейся к числу /(Л), любого количества новых элементов, равных /(Л), не нарушит сходимости этой последовательности к /(Л). Аналогично, в отличие от определения предела по Коши, мы опускаем в определении 1* требование р(М, Л)>0 или, что то же самое, МфА. Это можно сделать в силу того, что функция }{М) определена в точке Ли при М = А неравенство }(М)— /(Л) | <е справедливо для любого е>0. I Можно сформулировать и еще одно эквивалентное определе- ! ние непрерывности функции [(М) в данной точке Л. Определение 1**. Функция }(М) называется непре- ] рыв но й в точке А, если для любой окрестности точки ' /(Л) пространства Е1 найдется такая окрестность точки А про- ! странства Е™, что образ всех точек множества задания функции, ; лежащих в этой окрестности точки А, при отображении, осуществляемом функцией /, целиком лежит в указанной окрест- I ности точки /(Л).
462 Гл. 12. Функции нескольких переменных Пусть теперь {М} — множество точек пространства Е"1, в любой б-окрестности каждой точки М которого содержатся другие точки этого множества*. Такое множество {М} называется плотным в себе**. Определение 2. Функция и=}(М), определенная на множестве {М}, называется непрерывной на этом множест- в е, если она непрерывна в каждой точке М этого множества. Назовем приращением или полным приращением функции и = [(М) в точке А функцию Аи, определяемую формулой Аи=ПМ)-Т(А), (12.5> где М — любая точка из области задания функции. Пусть точки А и М имеют соответственно координаты а^ а2,..., ат и х\, х2,..., хт. Обозначим XI—а1 = Дл:1, х2—а2=Ах2,..., хт—ат — Ахт. Используя эта обозначения, получим для приращения функции Да, соответствующего приращениям аргументов Ахи Ах2,..., Ахт, следующее выражение: Аи = }(а1 + Ахи а2+Ах2,...,ат+АХт)—{(аи а2,...,ат). (12.6)? Очевидно, для непрерывности функции и — ?(М) в точке А необходимо и достаточно, чтобы ее приращение Аи представляло' собой бесконечно малую в точке А функцию, т. е. необходимо ш достаточно, чтобы НтД«- Пт(((М)—/(Л)) = 0, или Пт Ди = 0. (12.7) М-+А М-+А Дх,->.0, Дх,—О, Условие (12.7) естественно назвать разностной формой условия непрерывности функции и={(М) в точке А. 2. Непрерывность функции т переменных по одной переменной. Для функции и = 1(хи х2,..., хт) нескольких переменных можно- определить понятие непрерывности по одной из переменных при фиксированных значениях остальных переменных. Для введения этого понятия рассмотрим так называемые частные приращения функции и = 1(хи ..., хт) в точке М{хи х2,...,хт), принадлежащей области определения функции. Зафиксируем все аргументы, кроме первого, а первому аргументу придадим произвольное приращение Дл^ такое, чтобы точка с координатами Х1+Дд::, х2,...,хт находилась в области задания функции. Соответствующее- * Это означает, что любая точка М множества {М} является предельной точкой этого множества. ** Примером плотного в себе множества могут служить любое непустое' открытое множество и любая замкнутая область, а также множество всех точек, содержащихся в открытом множестве и таких, что все координаты этих точек являются рациональными числами.
§ 3. Непрерывность функции т переменных 463 приращение функции называется частным приращением* функции в точке М(Х1, лг2,..., *т), соответствующим приращению Д#1 аргумента х\, и обозначается А*, и. Таким образом, -Д*,и = /(*!+ Ах1? х2, .... хт)—1{х1, х2, ..., хт). (12.8) Аналогично определяются частные приращения функции, соответствующие приращениям других аргументов: А х*и == / (-^1 > х2-г Ах%, х§, ..., хт) —[ (х^, х2, ..., хт), (12.9) АХти = 1(х1, х2, •••» хт^1, хт-\- &хт) I (XI, х2, ..., хт). Введем теперь понятие непрерывности функции ы=Д#ь Хг, ... ..., Хт) по одной из переменных. Функция и=1(хи Хг, ...,Хт) называется не прерывной в точке М(хи Х2,...,хт) по переменной хь, если частное приращение Ах и этой функции в точке М представляет собой бесконечно малую функцию от Длгй, т. е. если Пт А* ы = 0. д*й-о При фиксированных значениях всех переменных, кроме переменной Хи, функция и = ((Хи Хг, ..., хт) представляет собой функцию одной этой переменной. Отметим, что непрерывность функции по переменной хк означает непрерывность указанной функции одной переменной. Очевидно, из условия непрерывности функции и = }(х1, Хг,..., хт) ъ данной точке М вытекает непрерывность этой функции в точке М по каждой из переменных Х\, х%,.., хт. Однако из непрерывности функции в точке М по каждой из переменных Хи Хг, ..., хт не вытекает, вообще говоря, непрерывность функции в этой точке. Чтобы убедиться в этом, рассмотрим следующие примеры. 1°. Мы будем говорить, что функция и = /(М) =}(х, у) непрерывна в точке М на прямой, проходящей через эту точку, если для любой последовательности точек {Мп} этой прямой, сходящейся к точке М, соответствующая последовательность {/(М„)} значений функции имеет пределом частное значение !{М) функции в точке М. Так как на прямой функция и = = /(*, у) представляет собой функцию одной переменной, то понятие непрерывности функции на прямой совпадает, очевидно, с понятием непрерывности указанной функции одной переменной. В частности, непрерывность функции в точке М по отдельным переменным х и у представляет собой непрерывность ее на прямых, * Термин «частное приращение» употребляется для того, чтобы отличить это приращение от полного приращения (12.6), соответствующего произвольным приращениям Д*ь Ах2, ..., Дл:т всех аргументов *1, Хг, ..., хт.
464 Гл. 12. Функции нескольких переменных проходящих через точку М и параллельных координатным осям. Докажем, что функция ху при х2 + у2ф0, ц= х* + у* "*"* л ^* ^"' (12.10) I 0 при х2 + у2 = 0 непрерывна в точке 0(0, 0) по каждой из переменных х и у, т. е. непрерывна на каждой из координатных осей, но не является непрерывной на всех остальных прямых,, проходящих через эту точку, "и поэтому" не является непрерывной в точке 'О'. Каждая прямая, отличная от координатных осей и проходящая через точку 0(0, 0), может быть представлена уравнением у = кх, где кфО. В каждой точке прямой у = кх при кфй, за исключением точки 0(0, 0) функция (12.10) принимает одно и то же постоянное значение 1+к* ' Отсюда следует, что если последовательность {Мп} отличных от О точек такой прямой сходится к точке О, то соответствующая последовательность значений функции имеет предел —..Так как при кФО этот предел отличен от нуля и не совпадает с частным значением функции в точке О, то функция разрывна в этой точке на рассматриваемой прямой. Непрерывность функции на координатных осях вытекает из того, что ее значения на этих осях эавны нулю. Может сложиться впечатление, что если функция двух переменных непрерывна на любой прямой, проходящей через данную точку, то эта функция непрерывна в указанной точке. Следующий пример показывает, что это, вообще говоря, не так. 2°. Рассмотрим функцию х/»л ( **у при х*+и*ф0, I 0 при х*+г/2 = 0. Докажем, что, хотя указанная функция непрерывна на любой прямой, проходящей через точку 0(0, 0), она не является непрерывной в этой точке. В самом деле, значения этой функции на прямой у = кх равны ———-, и поэтому и-»-0 при х-+0. Непрерывность этой функци на оси Оу вытекает из того, что ее значения на этой оси равны нулю. С другой стороны, значения функции на параболе у = рх2 постоянны и равны -, и поэтому предельное значение функции при стремлении точки М к точке О по указанной параболе также равно . Так как
§ 3. Непрерывность функции т переменных 46& при рфО этот предел отличен от нуля и не совпадает с частным значением функции в точке О, то функция разрывна а этой точке. 3. Основные свойства непрерывных функций нескольких переменных. В этом пункте мы перечислим основные свойства непрерывных функций нескольких переменных. Поскольку доказательства этих свойств в основном аналогичны доказательствам соответствующих свойств функций одной переменной, то, как правило, мы будем давать лишь краткие пояснения, предоставляя детали доказательства читателю. 1°. Арифметические операции над непрерывными функциями. Если функции }(М) и ё(М) заданы на одном и том же множестве {М} и непрерывны в некоторой точке- А этого множества, то функции }(М)-\-@(М), 1(М)—§{М)Г. }(М) -§(М) и — также непрерывны в точке А (в случае частот (Щ ного нужно дополнительно потребовать, чтобы §(А)фО). Это утверждение сразу же вытекает из соответствующего» утверждения об арифметических операциях над функциями, имеющими предел (см. п. 3 § 2 настоящей главы). 2°. Непрерывность сложной функции. Введем понятие сложной функции нескольких переменных. Пусть функции |*1 = Х% = . хт = = Ф1 = ф2 = <Рп (4, (4- &. 4,- 42| • • '2» " •> 4)> •' 4)» •-. 4) заданы на множестве {Щ евклидова пространства Ек^и 4, •»- ..., 4 — координаты точек в этом пространстве). Тогда каждой точке N(^1, 4>—> 4) множества {Л^} ставится в соответствие с помощью формул (12.11) точка М (х\, Х2,...,хт) евклидова пространства Ет. Обозначим через {М} множество всех таких точек. Пусть и=1{х1,....,хт)—функция т переменных, заданная на указанном множестве {М}. В этом случае мы будем говорить, что на множестве {Щ евклидова пространства Ек определена сложная функция ы = /(#1, Х2,...,хт), где х\, Х2,...,хт являются функциями переменных и, 12,..., 4, причем эти функции определяются соотношениями (12.11). Справедливо следующее Утверждение. Пусть функции л:] = ф1 (^1 4), #2=<Р2(4 •■• ..., 4),..., *т=<Рт(4..., 4) непрерывны в точке А(аи аг,...,^), а функция и=[(х\, х2,...,хт) непрерывна в точке В(Ьи Ь2,...,Ьт), где &г = Фг(аь а2,...,аь), 1=1, 2,...,т. Тогда сложная функция и = =!(хи Х2,...,хт), где х\, Х2,...,хт представляют собой определенные выше функции аргументов 1\, 4, •••, 4, непрерывна в точке А(аи а2,...,ак).
466 Гл. 12. Функции нескольких переменных Для доказательства этого утверждения рассмотрим произвольную сходящуюся к А последовательность точек Л^п=(^1(п), ^(п\ — ..., 4(п)) множества {Ы}. Обозначим через {Мп} соответствующую лоследовательйость точек пространства Ет, координаты Х\(п\ Х2(п),..., хт(п) которых равны *{<п>=<р<=(#п)=Ч><(<1(п\ *2<п>,...»'*(п>), »'=1. 2,..., т. Из непрерывности функций фг(Л0 в точке А и из определения непрерывности по Гейне вытекает сходимость последовательности точек {Мп} к точке В (Ьи Ь2, ...,Ьт). Далее из непрерывности функции « = ДМ) в точке В и из •определения непрерывности по Гейне вытекает сходимость последовательности {}(Мп)} к числу ЦВ). Но это и означает, что последовательность ПфП-Л/п), ф2(ЛГ„),...,фт(Л^п)] значений этой •сложной функции сходится к частному значению этой -сложной функции }[$1(А), ф2(Л), ...,фт(Л)], т. е. непрерывность сложной функции в точке А. 3°. Теорема об устойчивости знака непрерывной функции. Теорема 12.4. Если функция и = /(М) непрерывна в точке А евклидова пространства Ет и если {(А)Ф0, то существует та- >кая 8-окрестность точки А, в пределах которой }(Щ не обращается в нуль и имеет знак, совпадающий со знаком {(А). Справедливость этой теоремы почти непосредственно 'вытекает из определения непрерывности функции /(М) в точке А по Коши. В самом деле, из этого определения вытекает, что для любого е>0 найдется отвечающее ему 6>0 такое, что 1(А) — г<1(М)<1(А) + г всюду в б-окрестности точки А. Если в этих рассуждениях взять в качестве е положительное число |/(Л)|/2, то мы получим, что все три числа /(Л) —г, ?(А) и /(Л)+е будут •одного знака, и потому 1{М) имеет тот же знак, что и /(Л) всюду в б-окрестности точки А. 4°. Теорема о прохождении непрерывной функции через любое промежуточное значение. Теорема 12.5. Пусть функция и = /(М) непрерывна во всех точках связного множества {М} евклидова пространства Е™, причем ((А) и /(В) —значения этой функции в точках А и В этого множества. Пусть, далее, С ■— любое число, заключенное между }(А) и 1(В). Тогда на любой непрерывной кривой Ь, соединяющей точки А и В и целиком располагающейся в {М}, найдется точка N такая, что }(Ы) =С. Доказательство, Пусть Х1=<р\^), *2 = ф2(0.-.*т=<Рт(0> а<^<р, — уравнения непрерывной кривой Ь, соединяющей точки А и В множества {М} и целиком располагающейся в {М} (См. л. 2 § 1). На сегменте [а, р] определена сложная функция и = =Кхи х2, ..., хт), где х,-=<р«(*), 1=1, 2, ..., га, а<^<р.
§ 3. Непрерывность функции т переменных 467" Очевидно, значения этой функции на сегменте [а, р] совпадают со значениями функции и=!(М) на кривой Ь. Указанная" сложная функция одной переменной ^, в силу утверждения раздела 2° этого пункта, непрерывна на сегменте [а, р] и, согласно- теореме 4.13, в некоторой точке | сегмента [а, р] принимает значение С. Поэтому в точке N кривой Ь с координатами Ф1(?),- Ф2(|), ••-, фт(Е) получим ${Ы)=С. Теорема доказана. 5°. Ограниченность функции, непрерывной на, замкнутом ограниченном множестве. Теорема 12.6. (первая теорема Вейерштрасса). Если функция и = ?(М) непрерывна на замкнутом ограниченном множестве [М], то она ограничена на этом множестве. Для того чтобы убедиться в справедливости этой теоремы, выделим (как и в доказательстве аналогичной теоремы 4.14) последовательность {Мп} точек множества {М}, для которых |/(Л1п)|> >я. В силу теоремы Больцано—Вейерштрасса (см. п. 2 § 2) из; {Мп} можно выделить сходящуюся подпоследовательность {Л1*„}„ предел М которой в силу замечания к теореме Больцано-Вейер- штрасса принадлежит множеству {М}. Очевидно, последовательность {[(Мьп)} бесконечно большая. С другой стороны, в силу непрерывности функции в точке М эта последовательность {/(М*п)}' должна сходиться к ?(М). Полученное противоречие доказывает теорему. 6°. Достижение функцией, непрерывной на замкнутом ограниченном множестве, своих точных граней. Точной верхней гранью функции /(.М) на множестве {М} называется такое число й, которое удовлетворяет двум требованиям: 1) }(М)^.й для всех точек М множества {М}; 2) для любого е>0 найдется хотя бы одна точка М множества {М}, для которой }(М)>й — е. Аналогично определяется точная нижняя грань и функции 1{М) на множестве {М}. Для обозначения точных граней функции {(М) на множестве используют следующую символику: м = зир/(М), и = Ш[(М). {м} ~ {м} Теорема 12.7 (вторая теорема Вейерштрасса), Если функция и = {(М) непрерывна на замкнутом ограниченном множестве {М}, то она достигает на этом множестве своих точных верхней и нижней граней. Доказательство этой теоремы почти дословно повторяет доказательство теоремы 4.15 (т. е. второй теоремы Вейерштрасса для; функции одной переменной). Читатель без труда проведет это доказательство сам.
468 Гл. 12. Функции нескольких переменных 79. Понятие равномерной непрерывности функции нескольких переменных. Функция и = [(М) называется равномерно непрерывной на множестве {М}* евклидова пространства Ет, если для любого положительного числа е можно указать такое положительное б, зависящее только от е, что для любых двух точек М' и М" множества, удовлетворяющих условию р(М', М")<8, выполняется неравенство \}(М')-!(М")\<г. Имеет место следующая теорема. Теорема 12.8. (теорема о равномерной непрерывности). Непрерывная на замкнутом ограниченном множестве функция равномерно непрерывна на этом множестве. Доказательство этой теоремы совершенно аналогично доказательству теоремы 4.16 и получается из него путем замены терми- «а «сегмент [а, Ь]» термином «множество {М}», замены буквы х на букву М и замены выражений типа \х' — х"\ на символ Р(М',М"). Замечание. Назовем диаметром ограниченного множества М точную верхнюю грань чисел р(М', М"), где М' и М"—всевозможные точки множества {М}. Используя понятие диаметра множества, отметим следующее свойство непрерывных на замкнутых ограниченных множествах функций. Пусть функция м = [(М) непрерывна на замкнутом ограниченном множестве {М}. Тогда для любого положительного числа г можно указать такое -8>0, что на каждом принадлежащем множеству {М} замкнутом подмножестве {Щ диаметр которого меньше б, колебание со ** функции {(М) меньше е. Доказательство этого свойства совершенно аналогично доказательству следствия из теоремы 4.16. Замечание. Множество {М} т-мерного евклидова пространства называется компактом, если из любой системы открытых множеств, покрывающих множество {М}, можно выделить конечную подсистему, также покрывающую это множество. Точно так же, как и для пространства всех вещественных чисел Е1 (см. п. 3 § 7 гл. 4), доказывается, что множество пг- мерного евклидова пространства Ет является компактом тогда и только тогда, когда оно является замкнутым и ограниченным. Таким образом, первая и вторая теоремы Вейерштрасса и теорема о равномерной непрерывности справедливы для, функции, непрерывной на компакте. * При этом предполагается, что множество {М} плотно в себе, т. е. в любой 6-окрестности каждой точки М этого множества имеются отличные от М •точки множества {М}. ** Колебанием со функции $(Щ на множестве {М} называется разность меж- _ду точной верхней и точной нижней гранями функции {(М) на этом множестве.
§ 4. Производные и дифференциалы 469 § 4. ПРОИЗВОДНЫЕ . И ДИФФЕРЕНЦИАЛЫ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 1. Частные производные функции нескольких переменных. Пусть М (хи Х2 хт) — внутренняя точка области задания функции и = }{хи х^ Хт). Рассмотрим в данной фиксированной точке М(х\, Х2 хт) отношение частного приращения Д*А« (см. п. 1 § 3, формулы (12.8) и (12.9)) к соответствующему приращению Ахь аргумента хк: ^ _ Я*1, ■ ■ ■ , **.!, Хк + &Хк, Хк+1, ... , Хт)—Д*!, Х2, ... , Хт) Ахк Ахк (12.12) Отношение (12.12) представляет собой функцию от Ахк, определенную для всех отличных от нуля значений Ахк, для которых точка М(х1, Х2 Хк-и Хи+Ахи, хк+\, ■■■, хт) принадлежит области задания функции и=1(х\, х%,...,хт). Определение. Если существует предел отношения (12.12) частного приращения АХки функции в точке М{х\, х%,...,хт) к соответствующему приращению Ахк аргумента хк при Ах^О, то этот предел называется частной производной функции и = =}(хи х2, ..., хт) в точке М по аргументу хк и обозначается одним из следующих символов: ди д} ' г' ~дТк' дхк'их^ Гхк- Таким образом, — = Нт -^-. (12.13) дхк Дж.,^0 &хк Отметим, что частная производная функция и = [(хи х2,..., хт) по аргументу хк представляет собой обыкновенную производную функции одной переменной хк при фиксированных значениях остальных переменных. Поэтому вычисление частных производных производится по обычным правилам вычисления производных функций одной переменной. Примеры 1) ы = агс1§(л:г/2), 2ч ди^ у* ди 2ху дх \+хгу* ду 1+х2у* ^- ди 2х ^-У- 2) и = е 2 ,-^-= -^-е г , дх г ди 2у ^- ди х* + у* -^- _^„ ду г дг г2 Замечание 1. Из существования у функции в данной точке всех частных производных, вообще говоря, не вытекает непре-
470 Гл. 12. Функции нескольких переменных рывность функции в этой точке. Мы уже убедились, что функциям (12.10) ху х' + у' 0 при х2 + у2 Ф О, при х2 + у2 = О не является непрерывной в точке О(0, 0) (см. пример 1° п. 2 § 3).. Однако в этой точке указанная функция имеет частные производные по х и у. Это следует из того, что /(*, 0)=0, ДО, г/)=0, и; поэтому Ж. дх (0,0) 0, Л. ду = 0. (0,0) Мо^о,!/,) Замечание 2. Подчеркнем, что данное нами определение понятия частных производных всегда пригодно для внутренних точек области задания функции, но для граничных точек этой области, вообще говоря, непригодно. Это связано, в частности,, с тем, что в граничных точках области задания функции не- всегда можно вычислить частные приращения функции; (так, например, обстоит дело- с граничной точкой Мо области, изображенной на рис 12.2). В связи со сказанным принято определять частные производные в граничных точках как пределы этих производных при стремлении точек к границе. Рис. 12.2 2. Дифференцируемость функции нескольких переменных. Напомним, что приращением (или полным приращением) функции « = /(*!, Х2,...,хт) в точке М (хи х2,...,хп) соответствующим приращениям Ахи Ах2,..., Ахт аргументов, называется выражение* Аи~{(х1-\-Ахи х2+Ах2,..., хт+Ахт) —!(хи х2,....,хт). Определение. Функция и=}(хи х2,...,хт) называется дифференцируемой в данной точке М {хх, х2,..., хт), если ее полное приращение в этой точке может быть представлено в. виде Аи=А\Ахх-\-А2Ахг-1г... +ЛтДхто-г-а1Д#1-|-а2Дл:2-г-... +атДхт, (12.14> * См. п. 1 § 3, формулы (12.5) и (12.6).
§ 4. Производные и дифференциалы 471 где А\, А%...,Ат— некоторые не зависящие от Ах\, Ах2,..., Ахт числа, а а\, а2, ..., си — бесконечно малые при Дх1-»-0, ДХ2-*-0> — ..., Ахт->0 функции, равные нулю при А^1=Ал:2= ... Ал:т=0. Соотношение (12.14) называется условием дифференцируемости функции в данной точке М. Условие (12.14) дифференцируемости функции можно записать также в иной форме. Для этого рассмотрим бесконечно малую при Ах1->-0, Длг2->- -О,..., Дхт-»-0 функцию р: V Ах\ + х\ + Ахп. и отметим, что эта функция обращается в нуль лишь при Ах1 = Ах2= ... ... = Ахт=0. Убедимся теперь, что входящая в правую часть соотношения (12.14) сумма а1Ал:1-г-а2Д.х."2+ ••• +атАхт представляет собой бесконечно малую более высокого порядка функцию по сравнению с р. Иными словами, убедимся, что эта сумма представляет собой выражение о(р). В самом деле, при р#0 справед- | Ахг-1 ^ , ливо неравенство -* <1, и поэтому 1^^ + а2Ал;2 + • • . + атДл;т|< < К| 1^1+|а2| I АА-2 | + ... +|ат| \Ах~ Р <{|а1| + |а2|+ ... +|ащ|}р=о(р). ■)р< Таким образом, условие (12.14) дифференцируемости функции может быть записано в следующей форме: Аи=А1Ах1+А2Ах2+ ...+АтАхт+о(р). (12.15) При этом величину о(р) мы считаем равной нулю при р = 0. Чтобы доказать, что условие (12.15) эквивалентно условию (12.14), нужно убедиться, что из представления (12.15), в свою очередь, вытекает представление (12.14). Для этой цели, считая, что не все Ах\, Ах2 Ахт равны нулю**, представим о(р) в виде о(р) = Г о(р) Ах,. 1 1 Р Р . о(р) р Р Р Ахг+ 2 0(р) Д4 + А-«2+---!+Дд:т Р Р Г о(р) Ахг 1 + _ _ _ + р р .1 с(р) Ахт . Р Р . Ахт. _-, о(а) Ахг- , Полагая -^ • — =а, и учитывая, что а{ является бесконечно Р Р малой при р-»-0 (а значит, и при Д*1-»-0, Длгг-^0,..., Дхт-*-0) функцией, мы придел* 1 к пре; оставлению (12.14). * Геометрически эта функция представляет собой расстояние между точками М(Хи Хг, ..., Хт) И М'(Х1+Ах1, *2 + ДдС2, ..., Хт + АХт). ** Если все Д*; равны нулю, то все члены в первой части формул (12.14) и ((12.15) равны нулю.
472 Гл. 12. Функции нескольких переменных Итак, условие дифференцируемости функции можно записать как в виде (12.14), так и в виде (12.15). Если хотя бы одно из чисел А\, Л2,..., Ат отлично от нуля, то сумма А\Ах\-\-А2Ах2-\- ...-\-АтАхт представляет собой главную, линейную относительно приращений аргументов часть приращения дифференцируемой функции. Отметим, что при определении понятия дифференцируемости функции мы не исключали возможности обращения всех чисел А\, Л2,..., Ат в нуль, и поэтому если приращение функции может быть представлено в влде (12.14) или (12.15) при Л1 = 0, Л2 = 0, ...,Лт = 0, то функция дифференцируема в данной точке. Справедлива следующая теорема. Теорема 12.9. Если функция и = 1{х\, х2,..., хт) дифференцируема в точке М(х\, Х2,..., хт), то в этой точке существуют частные производные по всем аргументам, причем = А(, где Ах определяются из условия (12.14) или (12.15) дифференцируемости функции. Доказательство. Из условия (12.14) дифференцируемости функции в точке М(х\, Х2,...,хт) вытекает, что ее частное приращение Ахи в этой точке равно Ахи = А1 Ах{ + а,Дх,-. Отсю- Дд и да вытекает, что ^ = А{ + аг,и поэтому, так как аг—>0 при Дхг->-0, \\т —-— = = Л;. д^.->-0 Ахг- дх/ Следствие 1. Условие (12.15) дифференцируемости функции в данной точке М можно записать в следующей форме: Ди=^-Дх1 + -|^Д*2 + ... + -^-Дхш+о(р). (12.16) дхг дхг ахт Следствие 2. Если функция и = /(хь х2, ••-, хт) дифференцируема в точке М(х\, х2,...,хт), то представление ее приращения Дм в форме (12.14) или (12.15) единственно. В самом деле, коэффициенты Л* этих представлений равны частным производным —— в данной точке М и поэтому опреде- 0X1 ляются единственным образом. ■ Убедимся в справедливости следующего важного свойства дифференцируемых функций. Если функция и = {(Х[, х2,...,хт) дифференцируема в. точке М(хи х%, ...,хт), то она и непрерывна в этой точке. В самом деле, из условия (12.14) дифференцируемости функции в точке вытекает, что Пт Ди =0, а это озна-
§ 4. Производные и дифференциалы 473 чает, что функция непрерывна в точке М (см. п. 1 § 3, формула (12.7)). 3. Геометрический смысл условия дифференцируемости функции двух переменных. В случае функции и = }(х, у) двух переменных условие дифференцируемости может быть иллюстрировано геометрически. Введем понятие касательной плоскости к поверхности в точке. Плоскость П, проходящая через точку Ы0 поверхности, называется касательной плоскостью в этой точке, если угол между этой плоскостью и секущей, проходящей через точку Л/о и любую точку М\ поверхности; стремится к нулю, когда точка Л^1 стремится к Ы0 (рис. 12.3). Если в точке Лга существует касательная плоскость, то очевидно, что касательная в точке А/о к любой кривой расположенной на поверхности и проходящей через Л/о, лежит в указанной плоскости. Убедимся, что из Условия дифференцируемости функции и = [(х, у) в данной точке Мо{ха, уо) вытекает существование касательной плоскости к графику 5 этой функции в точке М0(х0, у0, и0). Положим Ах—х—х0, Ау = =у — Уо, Аи = и — «о, где и0 = }(х0, у0), и=}(х, у). Очевидно, условие (12.14) дифференцируемости в рассматриваемом случае можно записать следующим образом: и — и0=А (х — *0) +В {у — у0) +аД*+рДг/ =А (х — х0) + +В(у-у0)+о(р), «г. ди ди где А и В— постоянные, равные частным производным—— и —— дх ду в точке М0, а а и р — бесконечно малые при Дх-Я) и Дг/-»-0 функции р= /Дх2 + Ауг . Рассмотрим следующее уравнение: V — и0=А(х — х0)+В(у — у0). VI „>' />^Ах2+Ау2 Рис. !2.3
474 Гл. 12. Функции нескольких переменных Из аналитической геометрии известно, что это уравнение определяет в декартовой системе координат (х, у, II) некоторую плоскость П, проходящую через точку Ы0(хо, у0, и0) и имеющую нормальный вектор п = {Л, В, —1}*. Докажем, что эта плоскость П является касательной плоскостью в точке Л?о поверхности 5. Для этого достаточно убедиться, что: 1) плоскость П проходит через точку А/о поверхности 5 и 2) угол ф между нормалью п этой плоскости и любой секущей /УоЛ^ стремится к я/2, когда точка Л/\ поверхности 5 стремится к точке Щ. Утверждение 1) очевидно. Перейдем к доказательству утверждения 2). Вычислим косинус угла <р, воспользовавшись известной формулой для косинуса угла между двумя векторами. Так как координаты вектора п равны А, В, —1, а координаты вектора Л^Л^ секущей равны х — х0, у — г/о, " — "о (см. рис. 12.3), то С08ф=... Л(х — дг0)+ В(у — г/о)—(» — ц,) УЛ* + В*+1 У(х-Хо)*+(у-уп)*-\-(и-и0)* • Из условия дифференцируемости функции и = }(х, у) вытекает, что А(х — х0),+В(у — г/о) — (и — «0)=о(р). Поэтому |созф|<- лГ ^р)| —— ' р ->-0, когда р^-0, У(х — -ч)2+(у — г/о)2 р т. е. Нгпф= —. Утверждение 2) доказано. Таким образом, дифференцируемость функции и = {(х, у) & точке М0(ха, г/о) с геометрической точки зрения означает наличие касательной плоскости к графику функции и={(х, у) в точке #0(*о, г/о, щ). Так как коэффициенты А и В равны соответственно частным производным, вычисленным в точке М0(х0, г/о), то уравнение касательной плоскости может быть записано в виде и~ио = ~^~(х — *оУЛ ^г(У — Уо)■ ах оу касательной плоско- тт „ Г ди ди , Нормальный вектор п= I , , —1 { дх ду сти принято называть нормалью к поверхности и = }(х, у) в точке Л/*0(#о, г/о, г0). 4. Достаточные условия дифференцируемости. Займемся выяснением достаточных условий дифференцируемости функции т. переменных. Докажем следующую теорему. Теорема 12.10. Если функция и = }(хи х2,...,хт) имеет частные производные по всем аргументам в некоторой окрестности * Нормальным вектором плоскости называется любой ненулевой вектор п, перпендикулярный к этой плоскости. .
§ 4. Производные и дифференциалы 475 точки Мо(х\°, Х2°, ...,х°т), причем все эти частные производные непрерывны в самой точке Мо, то указанная функция дифференцируема в точке М0. Доказательство. Для сокращения записи проведем доказательство для функции двух переменных и = }(х, у). Итак, пусть обе частные производные ^х' и $у' существуют в окрестности точки М0(хо, г/о) и непрерывны в этой точке. Дадим аргументам х и у ■столь малые приращения Ад: и Ау, чтобы точка М(х0+Ах, Уо+Ау) не выходила за пределы указанной окрестности точки Мо. Полное приращение Ды = /(лго+Ах, у0+Ау0)—/(#о, г/о) можно записать в виде Аи= [}(х0+Ах, уо+Ау) — Цх0, у0+Ау)] + + [{(хо, Уо+Ау) — /(дто, «/о)]. Выражение [I (х0-\-Ах0, уо+Ауо) —${хо, у0-\-Ау)] можно рассматривать как приращение функции ?{х, уо+Ау) одной переменной х на сегменте [х0, #о+Дх]. Поскольку функция и — 1(х, у) имеет частные производные, указанная функция $(х, Уо+Ау) дифференцируема и ее производная по х представляет собой частную производную $х'- Применяя к указанному приращению формулу Лагранжа, найдем такое 01 из интервала О<01<1, что [!(х0+Ах, уо+Ау) —!(х0, у0+Ау)]=}х'(хо+Ъ1Ах, у0+Ау)Ах. Рассуждая совершенно аналогично, получим [Д*о, Уо+Ау) —[{хо, Уо))=!у{хо, у0+'д2Ау)Ау, О<02<1. Так как производные }х' и // непрерывны в точке М0, то 1/(х0+^Ах, у0+Ау) =//(*о, У о) +а, 1у'{хо\ уо+в2Ау)=1у'(х0, у0).+Р, где аир — бесконечно малые при Ах->-0 и Ау-^-0 функции. Отсюда, учитывая приведенные выражения для {?(ха+Ах, уо+Ау)—}(х0, Уо+Ауо)] и [}(х0, у0+Ау) -~!(х0, у0)] и выражение для Аи, найдем Ди=У(*0, уо)Ах+1у'{х0, у0)Ау+аАх+$Ау. Следовательно, функция и={(х, у) дифференцируема в точке М0. Для функции т переменных и = 1{х\, Х2,...,хт) рассуждения аналогичны, нужно только полное приращение Аи такой функции представить в виде Ди —/ (*» + Д*!,*» + Ах„ ...,х°т + Ахт) — !(х°,х°2 х*т) = т. = ^ [/ (*?, ...,*»_,, х° + Ах,, х°+1 + Ах1+1, ...,х1+ Ахт) - 1=1 - } (х», .... *<>_,, х% *°+1 + Ах1+1 х^ + Ахт)\.
476 Гл. 12. Функции нескольких переменных Теорема доказана. 5. Дифференциал функции нескольких переменных. Определение. Дифференциалом йи дифференцируемой в точке М(хи х2,...,хт) функции и=1(хи х2,...,хт) называется главная линейная относительно приращений аргументов часть приращения этой функции в точке М. Если все коэффициенты Л, в представлении (12.14) приращения дифференцируемой функции равны нулю, то дифференциал йи функции в точке М считается равным нулю. Таким образом, дифференциалом йи дифференцируемой в точке М функции и = 1(хи х2,...,хт) называется выражение йи = А1кх1+А2И!>.Х2+... .-\-АтЬхт. (12.18) Используя теорему 12.9, мы можем, очевидно, переписать выражение (12.18) для дифференциала йи следующим образом: ^ = -^.Дх1 + ^-Дх2+ ... + -^-Дхт. (12.19) ох, дх$ дхт Введем понятие дифференциала йхх независимой переменной х\. Под дифференциалом йх^ независимой переменной Х{ можно понимать любое (не зависящее от х\, х2,...,хт) число. Договоримся в дальнейшем брать это число равным приращению &Хг независимой переменной Хг. Эта договоренность позволяет нам переписать формулу (12.19) в виде аи = ^-йг1+^-йх2+ ... + -^-йхт. (12.20) № ох2 охт Подчеркнем, что формула (12.20) установлена нами лишь для случая, когда аргументы х\, х2,..., хт являются независимыми переменными. Однако ниже, в п. 7 этого параграфа, мы докажем, что формула (12.20) остается справедливой и для случая, когда аргументы х\, х2,...,хт не являются независимыми переменными, а сами представляют собой дифференцируемые функции некоторых новых переменных. 6. Дифференцирование сложной функции. В этом пункте мы рассмотрим вопрос о дифференцировании сложной функции вида и—/(*ь х2,...,хт), где Х\ = Ф1 (^1> '2> • • • » '*)> . х2 — Фг(^1> ^2> • • • » **)> (12.21) хт — Фш(^1> ^2' ■ ■ ■ » '*)■ Мы докажем, что при определенных условиях эта сложная функция является дифференцируемой функцией своих аргументов и, (2,..., ^к- При этом частные производные указанной сложной функции по аргументам ^, 12,..., 4 выражаются через частные
§ 4. Производные и дифференциалы 477 ди д1г ди ~дЦ ди Шк ди дхх ди дх1 ди дхх дхх Щ дхх ~дк дхг д(к дхт ди дхт ди д1х дхт д1г дхт производные функции и = }(хи х%, ...,хт) и через частные производные функций (12.21) по следующим формулам: ди дх2 , , ди дхт ■ дх2 д(х . ди дх2 дх2 д12 + — -^-4 ... + -^--^т.. (12.22) дх2 д(к дхт д(к Докажем следующую основную теорему. Теорема 12.11. Пусть функции (12.21) дифференцируемы в некоторой точке М(и°, ^2° 4°), а функция и = }{хи Х2,...,хт) дифференцируема в соответствующей точке Л^(х1°, х2°,..., х°т), где *г°=фг(^10. 4°, ••-.4°), '=1, 2,..., т. Тогда сложная функция и = = 1{х\, Х2,...,хт), где х\, Х2,...,хт определяются соотношениями (12.21), дифференцируема в точке М. При этом частные производные этой сложной функции в точке М определяются формулами (12.22), в которых все частные производные , , ... „ дх1 дх2 —— берутся в точке N. а все частные производные —'- функций (12.21) по аргументам и, ^2,—,^к берутся в точке М. Доказательство. Придадим аргументам 1\, 1% ■■■, 4 в точке М^\°, ^20,■■■,^к0) произвольные приращения Д^, Д/г, ■•-, А4, не равные одновременно нулю. Этим приращениям соответствуют приращения Ахх, Ах2,...,Ахт функций (12.21) в точке М. Приращениям Ах\, Ах2,..., Ахт, в свою очередь, соответствует приращение Дм функции и = 1(х\, Х2,—,хт) в точке N. Поскольку функция м = /(*1, Х2,...,Хт) предполагается дифференцируемой в точке Л^, указанное приращение Аы этой функции может быть записано в виде А« = —— Ах, + —— Ах, 4- ... 4- —— Ахт 4 аЛхг + аЛх2 + .. . о*1 дх2 дхт ...+ атАхт, (12.23) ди ди ди „ А, где частные производные ——, ——, .... —— берутся в точке N. дхг дх2 дхт а аь аг,..., ат — бесконечно малые при Дх1->-0, Ах2-+0,..., Ахт-+0 функции, равные нулю при Ах1 = Ах2= ...—Ахт = 0. Подчеркнем,, что в соотношении (12.23) Ах\, Ах2,..., Ахт представляют собой приращения функций (12.21), отвечающие выбранным приращениям Д^ь Д4, •••, А{к аргументов этих функций. В силу дифференцируемое™ функций (12.21) в точке М((]°, /2°, ■••, 4°) указанные приращения Д#, можно записать в следующей форме:
478 Гл. 12. Функции нескольких переменных Ах, = -^ Мг + -^ Д*2 + ... + 4г А^ + ° (Р)> (12-24> 1=1, 2, ..., т, где частные производные ——, ——, ..., берутся в точке М, №1 д(2 д(ь а р = У(Щ2 + (Д^2)3 + ... + (А^)2 . Мы должны убедиться в том, что после подстановки в правую часть (12.23) выражений (12.24) приращение Аи может быть приведено к виду Аи = АхАи+А2А12+...+АкА1к+о(р), (12.25) тде Л = ди дХ1 I ди д*2 I | ди дхт И 2 26) ' дхг д1с дхг д(; ' дхт д(г- Тем самым доказательство теоремы будет завершено, ибо формула (12.25) устанавливает факт дифференцируемости сложной функции, а выражение (12.26) представляет собой частную производную указанной сложной функции по переменной ^ {см. тео- ,рему 12.9). При подстановке в правую часть (12.23) выражений (12.24) :кроме группы слагаемых А1А11+А2А12+....Л-АкА1к мы получим и другие группы слагаемых. Нам нужно убедиться в том, что все другие группы слагаемых представляют собой величину о(р). Действительно, подставляя выражения (12.24) в формулу -(12.23), получим т т \ Ах, + V а,Дл:, = ^ дхг- ' 4-1 ^ ' 1 = 1 1=1 т к т 1=1 1=1 1=1 к гп т т /=1 1=1 1=1 г=1 к т т /=1 (=1 1=1 Последние две суммы написанной выше формулы представляют собой величину о(р). В самом деле, величины берутся ОХг
§ 4. Производные и дифференциалы 479» Ли <и ди йхх ! ди дхг <И дх2 йх2 <а в точке N и поэтому представляют собой постоянные не завися- I» щие от р числа. Следовательно, \ ——о(р)=о(р). Далее, вели- чины Ахг для г'=1, 2,..., т удовлетворяют в силу формулы (12.24) неравенству |Д^|<сопз1-р, а величины ш = о(1) для 1 = 1, 2, ...,/71». ибо все сц- являются бесконечно малыми при Дх1-*-0, Дхг-^О,... ..., Дхт->-0, а из дифференцируемости и вытекающей из нее непрерывности в точке М функций (12.21) следует, что Ах\, Ах2,..., Ахт т стремятся к нулю при р->0. Поэтому \аДкг = о(р). Теорема до- 1 = 1 казана. Замечание. Рассмотрим важный частный случай, когда функции (12.21) зависят от одного аргумента I. Тогда мы имеем- сложную функцию одной переменной I: и=1(х\, Х2,...,хт), где л;г = фг(0- Производная —- этой сложной функции определяется» формулой + ...+-^--^-- (12.27). дх,п сН Применим формулу (12.27) для доказательства теоремы Эйлера об однородных функциях. Функция и = }(хь Х2,...,хт) заданная на множестве {М}, называется однородной функцией степени р на этом множестве, если для каждой точки М {х\, х%,...,хт) множества {М} и для каждого числа I, для которого точка N (1х\, 1х2,..., ^xт) принадлежит множеству М , выполняется равенство Д*хь гхг,...,1хт)=&1{хи х2,...,хт). (12.28) Теорема 12.12 (теорема Эйлера об однородных функциях). Если и=?(хи х2,..., хт) является в некоторой области {М} дифференцируемой однородной функцией степени р, то- в каждое, точке М{х\, Х2,...,хт) области {М} справедливо равенство ди , ди , ди ,,п ол. ——х1 + ——х2+...+-—хт = ри. (12.29)» дх1 дх2 дхт Доказательство. Пусть Мо(х1°, Х2°,...,х°т)—произвольная точка области {М}. Рассмотрим сложную функцию и = [(хи Х2,-,хт), где x^ = ^x^0 (1=1, 2,...,т), т. е. функцию и = Д*#10,. 1х2°,...,1хйт). Так как при ^=^ функции Кг = (х^ дифференцируемы и функция и = 1(х\, Х2,...,хт). дифференцируема в соответствующей точке Мо, то согласно теореме 12.11 и замечанию к этой тео- Ли „ реме мы можем вычислить производную указанной сложною си
480 Гл. 12. Функции нескольких переменных •функции в точке ^=1 по формуле (12.27). Так как —-=#9, то Ли Л( = "?-*? +-Г1 *°+--- +-Г1-^. (12-3°) (=1 дхх дх2 л дх„ *-т где производные берутся в точке М0. С другой стороны, в 0X1 силу (12.28) рассматриваемая сложная функция может быть лредставлена следующим образом: ы = /(**,°, 1х2й,...,1х?т)=Щ{х1й, х2°,...,х*т). (12.31) Из (12.31) вытекает, что — = р&-1Пх\,х\ <,), т. е. Ли ~л7 ^Р1(х\,х1,...,х1)=ри. (12.32) Сравнивая (12.30) и (12.32), мы и получим соотношение (12.29) для точки Мо. Так как точка А1а — произвольная точка области {М}, то теорема доказана. 7. Инвариантность формы первого дифференциала. В п. 5 мы ввели понятие первого дифференциала йи функции нескольких переменных и установили, что когда аргументы х\, х2,...,хт являются независимыми переменными, то дифференциал йи можно представить в виде йи^—йХ1 + —йх2+ ... +—йхгп. (12.20) дх1 дх2 дхт В этом пункте мы докажем, что формула (12.20) является универсальной и справедлива и в том случае, когда аргументы х\, Х2,—,хт сами являются дифференцируемыми функциями некоторых новых переменных 1\, 12,..., 4, которые мы можем считать ^независимыми. Указанное свойство первого дифференциала обычно называют свойством инвариантности его формы. Итак, пусть аргументы х\, х2,...,хт функции и — ^(хи х2,...,хт) представляют собой дифференцируемые в точке Л(^°, У, —, 4°) функции Х{ = фг(^, к,...^к), а сама функция и = {{хи х2,...,хт) дифференцируема в точке В(х\°, х2°, ...,х°т), где Хг° = <рг(и°, к0,— ..., 4°)- В таком случае мы можем рассматривать и как сложную функцию независимых переменных и, 12,..., 4, которая в силу теоремы 12.11 является дифференцируемой в точке А. Поэтому дифференциал йи этой сложной функции можно представить в виде йи=-^-Л1 + —Л.+ ... +—Лй, " (12.33) где —— определяются из соотношений (12.22). Подставляя
§ 4. Производные и дифференциалы 481 из (12.22) в (12.33) и собирая коэффициенты при ди/дх{, получим дх1 \ д^ ' д(2 2 д1к ) дхт \ д1г Х д1г 2 д1к Остается заметить, что в последнем соотношении коэффициент при ди/'дх{ равен дифференциалу йх{ функции x^=^>^(^и к ^к)■ Мы получим для дифференциала йи сложной функции формулу (12.20), в которой дифференциалы д.Хх будут дифференциалами функций х<=фг(1а, к, —,к). Инвариантность формы первого дифференциала установлена. Свойство инвариантности формы первого дифференциала позволяет установить следующие правила дифференцирования. Пусть и и V — дифференцируемые функции каких-либо переменных. Тогда а"{с-и)=с-йи (с=сопз1), й(и±ю)=йи±йу, й(ии) =ийу-\-уйи, , I и \ и Ли — ийл) Докажем, например, справедливость третьей из указанных формул. Рассмотрим функцию хю = ию двух переменных и и V. Дифференциал этой функции йгш равен . дт , , да) , ахю = аи -\ аи. ди до Так как ——=V и —- = и, то йш = ийи-\-ьа'и. В силу инвари- ди до ■ антности формы первого дифференциала выражение ийь-\-^йи будет дифференциалом функции ко ив случае, когда и и V сами являются дифференцируемыми функциями каких-либо переменных. 8. Производная по направлению. Градиент. Начнем с рассмотрения функции трех независимых переменных и = Цх, у, г). Предположим, что эта функция определена в некоторой окрестности точки Мо(х°, у0, 2°) пространства Ег и дифференцируема в точке М0. Рассмотрим всевозможные лучи, выходящие из точки М0. Каждый такой луч задается единичным вектором е с координатами (соза, созр\ соз7) * и определяет некоторое направление. * Из курса аналитической геометрии известно, что если единичный вектор е составляет с осями координат углы, соответственно равные а, (3, •у, то коор- 16 Зак. 72
482 Гл. 12. Функции нескольких переменных Фиксируем некоторый луч, выходящий из точки Мо и определяемый единичным вектором е с координатами соз а, созр, соз у. Взяв на прямой, содержащей этот луч, произвольную отличную от Мр точку М, рассмотрим вектор или направленный отрезок М0М и обозначим через / величину этого направленного отрезка на оси, определяемой единичным вектором е=(соза, соз р, соз у) *. Ясно, что вектор МоМ имеет координаты (/соза, /созр, /созу). С другой стороны, если координаты точки М равны (х, у, г), то вектор МоМ имеет координаты, равные (х — х°, у — у0, г — г°). Сопоставляя два полученных нами соотношения для координат вектора МоМ, мы приходим к равенствам х=х°+1со$а, у=у°+1 соз р, г=г°+1со5у. (12.34) Равенства (12.34) показывают, что на прямой, проходящей через точку М0 и определяемой единичным вектором е=(соза, созр, соз у), функция и={(х, у, г) представляет собой сложную функцию одной независимой переменной / вида и = {(х°-{-1со$аг г/°+/созр, 20+/соз7). Определение 1. Производную указанной сложной функции по переменной I, взятую в точке 1 = 0, назовем производной функции и = 1(х, у, г) в точке Мо по направлению, определяемому единичным вектором е, и будем обозначать символом ди/де. Итак, по определению ди ди (М0) соз а + — (М0) соз р + — (Мв) соз у. (12.35) де дхх ду дг Введем понятие градиента дифференцируемой в данной точке Мо(х0, г/о, 20) функции и = }(х, у, г). Определение 2. Градиентом функции и = $(х, у, г) в данной точке М0(х°, у°, г°) называется вектор, координаты которого имеют вид ^-{М0),^-(М0),^-(М0). дх ду дг Для обозначения градиента функции и = {(х, у, г) обычно используют символ §та<1и. динаты этого вектора равны ссз а, соз В, соз -у. Указанные три косинуса принято называть направляющими косинусами вектора е. * Величиной / направленного отрезка М0М оси, определяемой единичным вектором е, называется число, равное длине отрезка МоМ, взятой со знаком «плюс», если векторы МоМ и е направлены в одну сторону, и со знаком «минус», если эти векторы направлены в разные стороны.
§ 4. Производные и дифференциалы 483 Итак, по определению ёгас1 и (М0) = [^- (М0), ^- (Мй), -|- (Л*0)). (12.36) Так как скалярное произведение двух векторов равно сумме произведений одноименных координат этих векторов, то выражение (12.35) для производной по направлению, определяемому вектором е, можно рассматривать как скалярное произведение вектора (12.36) и е=(соза, созр, созу). Итак, мы получаем, что -^- = (е,§гааы). (12.37) ае С помощью равенства (12.37) убедимся, что градиент функции и = }(х, у, г) в точке М0 характеризует направление и величину максимального роста этой функции в точке Мо. Точнее, докажем два утверждения: 1) производная функции и={(х, у, г) в точке М0 по направлению, определяемому градиентом этой функции в указанной точке, имеет максимальное значение по сравнению с производной в этой точке по любому другому направлению: 2) значение производной функции и={(х, у, г) по направлению, определенному градиентом этой функции в данной точке, равно |&гас!и|, г. е. равно длине вектора %тайи в данной точке. Для доказательства указанных двух утверждений заметим, что скалярное произведение двух векторов равно произведению длин этих векторов на косинус угла между ними *. Поэтому выражение (12.37) можно переписать в виде = |е| |§гас!и| созф, де где ф — угол между векторами е и §гас!ы. Учитывая, что |е| = 1, мы получим, что —— =■= |§гаа"и|со5ф. де Из последнего равенства вытекают оба утверждения 1) и 2). Вди самом деле, максимальное значение производной полуде чится при созф=1, т. е. при совпадении направления е с направлением §гайи, причем производная ди/де в этом направлении равна |§га(1и|. Доказанные два утверждения позволяют утверждать, что градиент не зависит от выбора системы координат (ибо и направле- * Этот факт устанавливается в аналитической геометрии. 16*
484 Гл. 12. Функции нескольких переменных ние, и длина вектора §гас1и в каждой данной точке инвариантны относительно выбора системы координат). Для выяснения геометрического смысла вектора §гас1 и целесообразно ввести понятие поверхностей уровня функции и=}(х, у, г), понимая под этим термином те поверхности, на которых функция и = 1(х, у, г) сохраняет постоянное значение, т. е.. удовлетворяет соотношению 1(х, у, 2)=с = сопзх. Если в каждой точке М0{х°, у°, г°) поверхности уровня 1(х, уг %)=с построить касательную плоскость, то легко убедиться в том, что нормальным вектором такой плоскости будет являться вектор (12.36), т. е. &гад.и*. Отсюда следует, что вектор §гайи в каждой точке М поверхности уровня /(*, у, г)=с ортогонален к этой поверхности. Совершенно аналогично определяются производная по направлению и градиент для дифференцируемой в данной точке Мо(х\°, Х2°,..., х°т) функции т переменных. п „ . ди Для такой функции производная в данной точке де ЛГо(х1°, Х2°,..., х°т) по направлению, определяемому единичным вектором е=(соза1, созаг, ...,еозат) **, вводится как обычная производная по переменной / сложной функции и = Д#1°+ +/соза1, л:20+/соза2,...,л:0т.+/созат) взятая в точке /=0. Для любой дифференцируемой в данной точке М0(д;10, х2°,... ...,х°т) функции и = }(Х1, Х2,...,хт) производная в этой точке по направлению, определяемому вектором е=(созаь созаг,...» ..., созат), равна ди ди ,,. ч , ди .,, ч , , ди ,,. ч (М0) соз ах + —— (М0) соз а2 + ... + -т— (М0) сов ат. де дхх дх2 дх„ (12.35*) Градиентом дифференцируемой в данной точке М0(#1°, Х20,... —, х°т) функции и={(х1, Х2,...,хт) называется вектор, обозна- * Напомним, что нормальным вектором плоскости называется ненулевой вектор, перпендикулярный к этой плоскости. В п. 3 настоящего параграфа было установлено, что для поверхности, определяемой уравнением /(х, у)=г, нормальный вектор касательной плоскости в каждой точке этой поверхности имеет вид • , —1 , Аналогично устанавливается, что для поверхности, опреде- дх ду / ляемой уравнением Нх, у, г)=с, нормальный вектор касательной плоскости в каждой точке этой поверхности равен -г-' —Г"' ~;— =§гаам. V дх йу дг / ** Так как все координаты единичного вектора по модулю не превосходят единицы, то для каждой из этих координат найдется угол а, такой, что соответствующая (=я координата равна соз а* (при этом можно считать, что О^-сц^я). Таким образом, единичный вектор е можно записать в виде (соз си, соз а2, ..., ..., созат). Величины соз ои, созаг, ..., соз ат принято называть направляющими косинусами.
§ 5. Производные и дифференциалы высших порядков 485 чаемый символом §гас1 и имеющий координаты (-^(М0),^{М0) ^.(М0) \ дх1 дх2 дхт Так как скалярное произведение двух векторов пространства Ет равно сумме произведений одноименных координат этих векторов, то равенство (12.35*) позволяет утверждать, что —^- = (е, §га^и). де ■ Из неравенства Коши—Буняковского, справедливого для двух любых векторов пространства Ет *, вытекает, что -^- <|е| \%хъ&и\ = |§га<1ы|, де причем знак ^ переходит в знак = только в случае, когда векторы е и §тай и коллинеарны. Отсюда следует, что вектор §гаа! «ив пространстве Ет обладает теми же двумя свойствами 1) и 2), что и в пространстве ^3. Заметим, что в случае функции и = 1(х, у) двух переменных х и у единичный вектор е, определяющий направление в точке М0, имеет координаты соз а и зт а. Поэтому в указанном случае формула (12.35) принимает вид ди ди , ди ■ соз а Н 8Ш а. де дх ду § 5. ЧАСТНЫЕ ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 1. Частные производные высших порядков. Пусть частная производная по аргументу Х{ функции и = {(хи Х2,...,хт), опре- дх1 деленной в области {М}, существует в каждой точке области {М}. В этом случае указанная частная производная представляет со- * Для любых двух векторов а и Ь пространства Ет справедливо неравенство Коши—Буняковского (а, Ь)2^(а, а) (Ь, Ь) или, что то же самое, |(а,Ь)|<3 <|а| |Ь|, причем в этом неравенстве знак ^ переходит в знак = только в случае, когда векторы а и Ь коллинеарны. В самом деле, при любом вещественном Я справедливо неравенство (Яа—Ь, Яа—Ъ)=Я2(а, а)—2Я(а, Ь) + (Ь, Ь)>0, причем в этом неравенстве знак ^ переходит в знак = только в случае, когда вектор Яа—Ь является нулевым, т. е. когда а и Ь коллинеарны. Исключая случай нулевого вектора а, когда доказываемое неравенство заведомо справедливо со знаком =, мы можем утверждать, что дискриминант квадратного трехчлена Я2 (а, а)—2Я(а, Ь) + (Ь, Ь) удовлетворяет неравенству 4[(а, Ь)2—(а, а) (Ь, Ь)]<0, причем в этом неравенстве знак ^ переходит в знак = только в случае, когда векторы а и Ь коллинеарны.
486 Гл. 12. Функции нескольких переменных бой функцию переменных х\, Х2,—,хт, также определенную в области {М}. Может случиться, что эта функция имеет частную про- изводную по аргументу хи в некоторой точке М области {М}. Тогда указанную частную, производную по аргументу хи называют второй частной производной или частной производной второго порядка функции и = 1{х\, х2,..., хт) в точке М сначала по аргументу Х{, а затем по аргументу хи и обозначают одним из следующих символом: д2и г(2) (2) ~дх^х~ ' А*Л' "*'**' При этом если гфк, то частная производная НаЗЫ- вается смешанной частной производной второго порядка. После того как введено понятие второй частной производной, можно последовательно ввести понятие третьей частной производной, затем четвертой и т. д. Если предположить, что нами уже введено понятие (п—1)-й частной производной функции и = }(х\, х2,...,хт) по аргументам Х{х, Х[г, ... , Хсп (отдельные или даже все номера которых могут совпадать) и что эта (п—-1)-я частная производная имеет в точке М частную производную по аргументу лг,-п, то указанную частную производную называют л-й частной производной (или частной производной я-го порядка) функции ы = = {(хи х2,..., хт) в точке М по аргументам х,,, Хс2, ... , хсп. Таким образом, мы вводим понятие я-й частной производной индуктивно, переходя от первой частной производной к последующим. Соотношение, определяющее га-ю частную производную по аргументам хсг, хсг, ... , ХсП1Хсп имеет вид 1 / д"-1и \ "» \ д%.1---д\дхн ) дх, дх,- ... дх, дх, дх, 1п 'п_1 *» 11 Если не все индексы 1\, 1% ..., 1„ совпадают между собой, то частная производная х х—х— называется смешанной частной производной л-го порядка. Так как частная производная функции по аргументу *«• определяется как обыкновенная производная функции одной переменной х{ при фиксированных значениях остальных переменных, то методика вычисления частных производных высших порядков предполагает умение вычислять только обыкновенные производные первого порядка. В качестве примера вычислим частные производные второго порядка функции и = агс!§ у
§ 5. Производные и дифференциалы высших порядков 487 Имеем ди дх д2и дх2 д2и У хг + у2 1ху (х2 + у2)2 х2 —у2 ди ду д2и дхду д2и X Х2 + У2 X2 — У2 (х2±у2)2 2ху дудх (х2 + у2)2 ду2 (х2 + у2)2 В рассмотренном примере смешанные частные производные д2и д2и г> « и равны друг другу. Вообще говоря, значения смешан- дхду дудх ных производных зависят от порядка, в котором производятся последовательные дифференцирования. Убедимся, например, что д2и д2и . смешанные частные производные и функции и = ху х' —у* дудх дхду при х2 + у2ф0, х2 + у2 О при х2+у2 = 0 в точке (0, 0) существуют, но не равны друг другу. Действительно, ди дх У (х*у* + 4х2у2) (х2 + у2)2 0 при х2 + у2ф0, при х2 + у2 = 0. Поэтому д2и дудх \х=о. у=о у-*о ди дх х=0, у-ф-0 ди ~дх~ *=0. у=0 = —1. д2и дхду = 1. *=0, у=0 Проводя аналогичные вычисления, получим Таким образом, в точке (0, 0) Ф дхду дудх Выясним достаточные условия независимости значений смешанных производных от порядка, в котором производятся последовательные дифференцирования. Введем важное понятие функции т переменных, п раз дифференцируемой в данной точке. Определение. Функция и = 1(х\, х2, ..., хт) называется п раз дифференцируемой в точке М0{х\°, х2°, ..., хт°), если все ее частные производные порядка п—1 являются дифференцируемыми в этой точке функциями. Из этого определения вытекает, что если функция и = }(хи х2,... —, хт) п раз дифференцируема в точке М0, то при я>1 любая ее
488 Гл. 12. Функции нескольких переменных частная производная первого порядка п—1 раз дифференцируема в точке Мо, при л>2 любая ее частная производная второго порядка п—2 раз дифференцируема в точке М0 и т. д. Укажем достаточное условие п-кратной дифференцируемости функции в данной точке. Для того чтобы функция и=1(х\, х% ..., хт) была п раз дифференцируемой в точке М0(х1°, Х2°, ..., хт°), достаточно, чтобы все ее частные производные п-го порядка были непрерывными точке Мо. Справедливость этого утверждения вытекает из определения дифференцируемости функции и теоремы 12.10 о достаточных условиях дифференцируемости. Теорема 12.13. Пусть функция и={(х, у) дважды дифференцируема в точке М0{х0, уо). Тогда в этой точке частные производные />,/2) и /у*'2) равны. Доказательство. Так как функция и = }(х, у) дважды дифференцируема в точке Мо(х0, уо), то частные производные // и /У определены в некоторой б-окрестности точки Мо и представляют собой дифференцируемые функции в этой точке. Рассмотрим выражение Ф=[(х0+к, у0+п)—}(хо+п, уо)—Цх0, уо+Н) +/(*,,, уо), (12.38) где к— любое столь малое число, что точка М(хо+к, г/о+А) находится в указанной ■у-окрестности точки Мо. Выражение Ф можно рассматривать как приращение Л<р = ф(л:о + А)—ц>(хо) дифференцируемой на сегменте[х0, х0+п] функции ф(х) ~^{х, уо+к)—Цх,у0) одной переменной х. Поэтому по формуле Лагранжа, обозначая через 6 некоторое число из интервала О<0<1, можно записать: ф=Дф=ф'(хо+0/1)/г = = [^'(*о + 8й, уо+к)— {/{хо + вк, у0))к = (12.39) = {[//(хо + е/г, Уо+А)■—/*'(*<>, Уо)]—[1х(х0+вк, у0)—!х'{хо, Уо)))к. Так как частная производная // является дифференцируемой в точке Мо функцией, то [//(*О+0А, уо + к)—{х'(хо, г/0)] = = !тхх{хо, Уо)М+Ттху(х0, Уо) Н+а&к+кН, \1х'(х0+вк, Уо)—!*(хо, Уо)] = Ц2)хх(хо, «/0)9Л + а29А, где аь Р1 и аг — бесконечно малые при й-»-0 функции. Подставляя найденные выражения для \}х {хо+Ък, уо + к)—{х'(хо, г/о)] и [//(•Хо + ЭА, уо)—{х'(хо, уо)] в формулу (12.39), получим Ф = [/(2)*Л*о, Уо)+а\к\ (12.40) где а=а19 + Р1—агЭ — бесконечно малая при й-»-0 функция. Сдру-
§ 5. Производные и дифференциалы высших порядков 489 гой стороны, выражение Ф, определяемое соотношением (12.38), можно рассматривать как приращение Ат|; = ф(г/о+й)—яИ#о) дифференцируемой на сегменте [у0, у0+Н] функции •${у)=!{х0+к, у) — г(хо, у)- Применяя формулу Лагранжа и учитывая дифференци- руемость частной производной /„' в точке Мо, мы получим совершенно аналогично предыдущему следующее выражение для Ф: Ф = 1РУ*(*о, Уо)+№2, (12.41) где р — бесконечно малая при й->0 функция. Приравнивая правые части соотношений (12.40) и (12.41) и сокращая обе части полученного равенства на к2, найдем, что Ц2)ху(хо, г/о)+а= = }{2)ух(хо, г/о) +р. Так как аир — бесконечно малые при /г->0 функции, то из последнего равенства следует, что ^2)Ху(Хй, г/о) = ~1{2)ух{хо, г/о). Теорема доказана. Теорема 12.13 утверждает, что в данной точке Мо{хо, г/о) имеет место равенство ^2)ху = Ц2)Ух, если в этой точке дифференцируемы и' и //■ Из дифференцируемое™ \х' и $у' в точке М0 вытекает существование в этой точке всех частных производных второго порядка. Однако равенство 1(2)ху и ^2)ух имеет место и при условии существования лишь производных /(2)жу и Ц2)ух, но при дополнительном требовании непрерывности этих производных в рассматриваемой точке. Именно справедлива следующая теорема. Теорема 12.13*. Пусть в некоторой окрестности точки М0(*о> г/о) функция и={(х, у) имеет частные производные }/, //, !{2)ху, !(2)Ух- Пусть, кроме того, производные р2)ху и Ц2)ух непрерывны в точке Мо. Тогда в этой точке !{2)ху = !(2)ух- Для доказательства воспользуемся выражением Ф, определенным соотношением (12.38). Из (12.39) вытекает, что Ф представляет собой умноженную на к разность значений функции [х'(х, у) в точках (хо+вк, уо + к) и (хо + дк, г/0)- Применяя к этой разности формулу Лагранжа конечных приращений по переменной у на сегменте [г/о, Уо+к], получим Ф = Р*„(*о+вй, у0 + &хк)к2, где 0<9,<1. В силу непрерывности /(2)Ж1/ в точке Мо(хо, г/0) из последнего равенства получаем Ф = [/(2)*г/(*о, у0)+а(к)]к2, где а(к)-*0 при й-»-0. С другой стороны, эта же величина Ф представляет собой умноженную на к разность значений функции !/{х, у) в точках {х0+к, уа+В2к) и (х0, г/о+92Л)..Применяя к этой разности формулу Лагранжа конечных приращений по переменной х на сегменте [*о, х0+к] и учитывая непрерывность /(2>жу в точке М0(х0, г/о), получим Ф = [/<%*(*), г/о)+Р(А)]Л2, где р(/г)->0 при к-+0.
490 Гл. 12. Функции нескольких переменных Приравнивая последние два выражения для Ф и рассуждая так же, как и в конце доказательства теоремы 12.13, мы убедимся в справедливости нужного нам равенства Р*»(*о,0о)=Ру*(*о,й>). Докажем теперь теорему о независимости значения любой смешанной частной производной я-го порядка от порядка, в котором производятся последовательные дифференцирования. Теорема 12.14. Пусть функция и=1(х\, х%, ..., хт) п раз дифференцируема в точке М0(хлй, лг2°,..., Хт0). Тогда в этой точке значение любой смешанной частной производной п-го порядка не зависит от порядка, в котором производятся последовательные дифференцирования. Доказательство. Очевидно, достаточно доказать независимость значения любой я-й смешанной производной от порядка проведения двух последовательных дифференцирований. Иными словами, достаточно доказать равенство __ ?^_ = дЛИ _. (12.42) дх1п.. .дх<к+1дх;к.. .дхк дхг-п... дх1кдх!к+1. ..дх^ Рассмотрим функцию Эта функция представляет со- дх1к_Г..дХ11 бой дважды дифференцируемую функцию переменных х,- и XI Поэтому в силу теоремы 12.13 д*+1ц дь+1и дХ'к+1дХ<кдХ'к-1- -дхи дх^дх'к+1дХ'к-1- ■ -дХк Отсюда и вытекает справедливость равенства (12.42). Теорема доказана. Отметим, что в случае я раз дифференцируемой в точке Мо функции и — 1{х\, Х2 хт) любую ее частную производную п-го порядка можно записать в виде дх^дх%* ... дх%т где аь а2, ..., ат — целые числа, удовлетворяющие условиям: 0<а,<:я, а1 + а2+ ... +ат—п. 2. Дифференциалы высших порядков. Выше мы использовали для обозначения дифференциалов аргументов функции ■ и = = 1(х\, #2, •••, хт) и для обозначения дифференциала самой этой функции символы йх\, йх2, ..., йхт и йи соответственно. Теперь нам придется использовать для обозначения дифференциалов аргументов указанной функции и дифференциала самой этой функции и другие символы. В частности, мы будем обозна-
§ 5. Производные и дифференциалы высших порядков 491 чать дифференциалы аргументов функции м=/(лгь лг2, ..., хт) и дифференциал самой этой функции символами Ьхи 8x2, ■■■, 8хт и бы соответственно. В этих обозначениях инвариантное по форме выражение для первого дифференциала этой функции (12.20) (см. п. 7, § 3), будет иметь вид . ди . ди . . ди . Ш = -— 6хх + —— 8х2+ ... +—— 8хт. дхг дхг охт Возвращаясь к прежним обозначениям, рассмотрим выражение (12.20) для первого дифференциала дифференцируемой в данной точке М(хи х2, ..., хт) функции ы=/(*ь х2, ..., хт): йи==^-йХ1 + —их.+ ...+ —йхт. (12.20) дхх дхг дхт Предположим, что величина, стоящая в правой части (12.20), представляет собой функцию аргументов х\, х2, ..., хт, дифференцируемую в данной точке М{х\, х2, ..., хт). Для этого достаточно потребовать, чтобы функция и = ((х\, х% ..., хт) была два раза дифференцируема в данной точке М(х\, х%, ..., хт), а аргументы Х\, Х2, ..., хт являлись либо независимыми переменными, либо два раза дифференцируемыми функциями некоторых независимых переменных ^1, 12, ••• , 1к- При этих предположениях мы можем рассмотреть дифференциал т *=1 от величины (12.20). Определение 1. Значение Ь{с1и) дифференциала от первого дифференциала (12.20), взятое при 8х1 = а'хи 8x2 = ^X2, ..., 8хт=йхт, называется вторым дифференциалом функции и = — }(хи х2, ..., хт) (в данной точке М(хи хг, ..., хт) и обозначается символом й2и. Итак, по определению* йги = Ь(йи) 6х1=4хи *=1 «*„,=<?*„ дх1=*1х1. §Хг=йхг, их _,=<**_ Дифференциал йпи любого порядка п введем по индукции. * Символ{ } 6хг=4хг, обозначает, что в выражении, заключенном в фи- 6хт='"ст гурные скобки, следует положить 6х1=</х1, Ьхг=йхг 6хт=<1х„
492 Гл. 12. Функции нескольких переменных Предположим, что уже введен дифференциал йп~1и порядка- п—\ и что функция ц = /(х1, х2 хт) п раз дифференцируема в данной точке М(х\, х2, ••• > хт), а ее аргументы х\, х2, ..., хт являются либо независимыми переменными, либо я раз дифференцируемыми функциями некоторых независимых переменных 1\, 1%,... .... **. Определение 2. Значение б(йп_1и) дифференциала от (п—\)-го дифференциала йп~хи, взятое при §х\ = йх\, 8х2 = йх2, ... ..., Ьхт = йхт, называется п-м дифференциалом функции «= =*/(*!, х2,..., хт) (в данной точке М(хи х2,...,хт)) и обозначается символом йпи. Итак, по определению йпи = Ь{йп-Ч) 6х,=Лх2, При вычислении второго и последующих дифференциалов йи приходится существенно различать два случая: 1) случай, когда аргументы х\, х2, ..., хт являются независимыми переменными, 2) случай, когда аргументы х\, х2, ..., хт являются соответствующее число раз дифференцируемыми функциями некоторых независимых переменных /ь 12, •••, и. Рассмотрим сначала первый случай. Если х\, х2, ..., хт являются независимыми переменными, то мы имеем право считать, что йх\, йх2, ..., йхт не зависят от х\, х2, ..., хт. Каждый дифференциал йхи мы можем взять равным одному и тому же приращению Дл:^ для всех точек М(х\, х2, ..., хт). При этом мы получим, что т Последнее соотношение и правила дифференцирования, установленные в конце п. 7 § 3, позволяют нам записать для два раза дифференцируемой в данной точке М функции ы=/(лгь х2, ..., хт), следующую цепочку равенства: а2и = б'Щ 6х1=/1х1, [Е- й=1 ди 1 дхк йхь т т *-1 Л* =Лг *=1 бхт=ах„
§ 5. Производные и дифференциалы высших порядков 493 т т т т к=\ 1=1 = V V 8х1йхк к=И=1 бхт=ахп т д2и бх1=ах1. А=1 1=1 (М.ы воспользовались еще и тем, что для два раза дифференцируемой функции смешанные производные второго порядка не зависят от того, в какой последовательности производится дифференцирование). Итак, мы получаем, что в случае, когда аргументы х\, х2, ..., хт являются независимыми переменными, для второго дифференциала два раза дифференцируемой в данной точке функции и= =}(хи #2, ..., хт) справедливо представление т т (Ри =У У-^—йх1(ик, (12.44) ЛтЛ Лш^ дх/дхь 1=1 А=1 Замечание 1. Функция т переменных 1\, 1% —, 1к вида т т Ф — К\ V аМ& гДе а*ь — постоянные вещественные числа, на- <=1 к=\ зывается квадратичной формой от переменных 1и 1% ..., ^к, .а числа а<& —• ее коэффициентами. Квадратичная форма называется симметричной, если ее коэффициенты удовлетворяют условию а-^ — аы (для всех 1 = ■=1, 2, ..., т\ к=\, 2, ..., т). Полученное нами выражение (12.44) позволяет утверждать, что для случая, когда аргументы Х\, х% ■■■, хт являются независимыми переменными, второй дифференциал два раза дифференцируемой :в данной точке М функции и = 1(х\, х%, ..., хт) представляет собой -симметричную *, квадратичную форму от переменных йхи йх%, ... ..., йхт, коэффициенты которой равны соответствующим частным .производным второго порядка функции и — }(х\, х2, ..., хт), взятым ;В данной точке М. Отметим, что полученное нами выражение для дифференциала .второго порядка (12.44) можно переписать и в другом виде, используя формальный символ й = йхх-— + йх,- [- ... +йхт • (12.45) дхг дх2 дхт * Симметричность этой квадратичной формы вытекает из равенства д2и д2и Ш)=-^-Ш). >дх,дхь дхьдх;
494 Гл. 12. Функции нескольких переменных С помощью этого символа выражение (12.44) может быть переписано в виде д N2 й2и= I йхх Н с1х2 |- дхх дх2 . + йх„ и. (12.46) По индукции легко убедиться в том, что в случае, когда аргументы Х\, х2, ..., хт п раз дифференцируемой в данной точке М(х\, х2, ..., Хт) функции «=/(*!, х2, ..., хт) являются независи- мыми переменными, для /1-го дифференциала этой функции справедливо представление т т т «4=1 »'г=1 «я=1 д"и дХ; дХ; . . .ЭХ; ■йх^йх^...йх1 Это представление с помощью формального символа (12.45) может быть переписано в виде йпи = (йхх дх» их, дхг ■ +йх„ д дх„ и. (12.47) Совершенно другой вид имеют представления для второго и последующего дифференциалов в случае, когда аргументы Х\, х% ..., хт функции и=\{х\, х2, •■•, хт) являются соответствующее число раз дифференцируемыми функциями некоторых независимых переменных 1\, 12, ..., 1ы- Обращаясь к этому случаю, установим выражение для второго дифференциала два раза дифференцируемой в данной точке М(хи х2, ..., хт) функции и=}(хи х2, ..., хт), аргументы хи х2, ... ..., хт которой являются два раза дифференцируемыми функциями некоторых независимых переменных 1\, 12 1ь. Повторяя рассуждения из цепочки (12.43), мы на этот раз получим бхт=ах„ й=1 т т т *=1 <=1 их =Ае.._ *=1 Ьхт=.'йх„ Заметим, что в силу определения второго дифференциала функции и—хч (где к — любой из номеров 1, 2, ..., т) [«(<***)] 6х1=(1х1, -■ йгХи.
§ 5. Производные и дифференциалы высших порядков 495 Учитывая это соотношение, мы приходим к следующему представлению для второго дифференциала: т т т 1Л Ли дхгдхк ' * ^1 дхк * *=1 1=1 к= 1 или (с использованием символа (12.45)) й2и = I йхх [■- йхг (-••«+ Ахт ) и + \ дх! дх2 дхт/ + (^а% + -^сГх2+...+-р-сРхт). (12.48) \ дхх ох% дхт I Сравнивая полученное нами представление (12.48) с представлением (12.46), мы убедимся в том, что (в отличие от первого дифференциала) второй дифференциал уже не обладает свойством инвариантности формы. Тем более не обладают свойством инвариантности формы все последующие дифференциалы. Замечание 2. Укажем важный частный случай, когда второй и последующие дифференциалы функции т переменных и= = /(*ь Хг, ..., хт) все же обладают инвариантностью формы и определяются той самой формулой (12.47), что и для случая независимых переменных х\, х%, ..., хт. Будем говорить, что переменные х\, х% ..., хт являются линейными функциями независимых переменных 1\, 1ч, — , (к, если они определяются равенствами *г = а(Ч, + ап*1 + а,-2*2+ ... + а1к1к (1=1, 2, ..., т), в которых через а-о, ап, ..., щк обозначены некоторые постоянные. Заметим, что если функция и = }(хи х2, ..., хт) является п раз дифференцируемой в данной точке М(х\, Хг, ..., хт), а ее аргументы х\, х% ..., хт являются линейными функциями независимых переменных и, 1% ..., 1к, то п-й дифференциал функции и = }(хи хч, ... ..., хт) определяется той же самой формулой (12.47), что и для случая независимых переменных Х\, Х2, ..., хт. Для того чтобы убедиться в этом, заметим, что поскольку ?ь 12, ..., 1к являются независимыми переменными, то п-й дифференциал XI как функции аргументов 1\, 12, ..., /* определяется равенством типа (12.47), а точнее, равенством \ &! д1г д(к I Но любая частная производная выше первого порядка от линейной функции хг равна нулю. Значит, с12Х1 = 0, й3л:; = 0, ..., а"пХ1=0.
496 Гл. 12. Функции нескольких переменных Равенство с?2л:, = 0 (при всех 1=1, 2, ..., т) и представление (12.48) дают право заключить, что й2и определяется равенством (12.46). Совершенно аналогично, используя соотношения #л;, = 0, ... ..., (1пХ1 = 0, мы по индукции докажем, что йги, Фи, ..., йпи определяются равенством (12.47). Замечание 3. При проведении вычислений иногда требуется расшифровать равенство (12.47) и, учитывая, что в этом равенстве имеются совпадающие члены, выписать все различные члены этого равенства со стоящими перед ними коэффициентами. Для этой цели может быть использована фоцмула полинома Ньютона, имеющая вид (а1 + а2+ ...+ ат)п = у (еН + а2+...+ат)\аа,аа, ^ ^ {{2Ад) •<—I аг\ а21 ... ат1 т «1+012+ ... +ат=п (Суммирование в правой части этой формулы идет по всем целочисленным индексам аь а2, ..., ат, каждый из которых удовлетворяет неравенствам 0<:а;«:п при условии, что сумма всех этих индексов а1 + а2 + ... +ат равна п.) Формулу (12.49) нетрудно установить по индукции. В самом деле, при т = 2 и любом целом п эта формула заведомо справедлива, ибо она переходит в известную формулу бинома Ньютона. Предположим, что эта формула справедлива для некоторого номера т>2 и любого целого п, и проверим, что в таком случае она справедлива и для номера т+1 и любого целого п. Представив (а!+а2+ ... +ат + ато-н)" в виде (а, + а2+ ... +ат+1)" = [(й1 + а2+ - +ат)+ат+1]п, подсчитаем с помощью бинома Ньютона коэффициент при а?'а* ... а'%па'%!#1- В силу равенства а,1 + а2 + ... +а™+1=п, формулы бинома Ньютона и предположения о справедливости формулы (12.49) для номера т и любого целого п этот коэффициент равен * с«т+1 (сс1+-аа+ ••• +-«т)1 __ " а^ а2! ... ат! к п\ * Мы учитываем, что С„ = —— ——> и потому " к\ (л — к)\ сат+1 = Ап = («1+па+...+ ат+атч)1 <*,+«*+. • .+ат+1 а , (о! + ч, + ..: + от)!
§ 5. Производные и дифференциалы высших порядков 49? _ («1 + «2+ ... +ат + «щ-н)! («1 + «а+ ... +«т)1_ ат+11 («1 + «2 + • • • + ат)! ах! а21 ... ат! __ («1 + «8+ •••+«»! +Дт-и)! ах! а2! ... ат! ат+1! Полученное нами выражение для коэффициента при» а^'аъ'- • ■ас%гаат+1 в точности совпадает с тем выражением, которое получится из формулы (12.49), если в этой формуле заменить номер т на /п+1. Индукция завершена, и формула (12.49) доказана. Формула (12.49). дает нам право переписать выражение (12.47) для п-го дифференциала в следующем виде: «1+а2+...+ат=п т 3. Формула Тейлора с остаточным членом в форме Лагранжа ю* в интегральной форме. Договоримся обозначать к-й дифференциал функции т переменных и = }(х\, х% ..., хт) в точке М пространства' Ет символом а'ки\м. Докажем следующую важную теорему. Теорема 12.15. Пусть «>0 — целое число, функция п= = /(хь л'2 Хт) задана в некоторой г-окрестности* точки- М0(хи х2, ..., хт) и п+1 раз дифференцируема в указанной окрестности. Тогда полное приращение Аы=/(М)—/(Мо) этой функции: в точке М может быть представлено в следующей форме: Аи = а'и + —с12и Мо 2! + ... + — й"и + ач*и м. (п+1)1 (12.50) при этом N — некоторая точка указанной окрестности зависящая, вообще говоря, от М(х\, х2, ..., хт), а дифференциалы йхг переменных XI, входящие в выражения Лки\щ и йп+1и\м,. равны Дл:,= —XI—хр. Формула (12.50) называется формулой Тейлора для функции и = }(М) с центром разложения в точке- М0, а последний член формулы (12.50) называется остаточным членом, записанным в форме Лагранжа. Доказательство. Для сокращения записи проведем рассуждения для функции и=}(х, у) двух переменных х я у. Предварительно запишем в специальной форме формулу Тейлора для? п + 1 раз дифференцируемой в некоторой окрестности точки ^ функции и=Р{1) одной переменной ^. Напомним, что формула Тей- * Вместо е-окрестности точки Мо можно взять любую звездную окрестность этой точки (т. е. любое открытое множество, содержащее точку Мо> и обладающее следующим свойством: если точка М принадлежит этому множе~ ству, то и весь отрезок прямой МаМ ему принадлежит).
498 Гл. 12. Функции нескольких переменных лора с центром разложения в ^о для функции и=Р(1) одной переменной имеет следующий вид: р(1)=р (д+р' (д (*-д+-1- я* (д (;-д2 +... • • • + -V я») (д [1-ит + —3-— Я"+п & + е р-д) (/-д»+«, Ш (71+1)! 0<6<1. (12.51) Так как аргумент ^ является независимой переменной, то приращение А1 = 1—и представляет собой дифференциал сН независимой переменной I. Поэтому р(к) (д е -д*=я» (/0) л*=^ (д=^ I«. ш (12.52) я^'^ + е^-д) (*-д»+> ^^ик+^-ад. Если мы обозначим разность Р^)—Р(1:о) через Аи, то согласно (12.52) формулу Тейлора (12.51) можно записать в следующей специальной форме: Аи = с1и (о 2! + ....+ -1- йпи п\ 1 •<*<"+'>« | ,,+е «-«• (я+1)! (12.53) ^Рассмотрим теперь в е-окрестности точки М0(хо, г/о) произвольную точку М(х0+Ах, уо+Ау) и соединим точки М0 и М прямой лини- «ей. Очевидно, координаты х и у точек указанной прямой представляют собой следующие линейные функции новой переменной I: х=х0 + №х, у=уа+1Ау-, (12.54) шри этом координаты точек отрезка М0М соответствуют значениям переменной I из сегмента [0, 1]. Отметим, что значению ^=0 отвечает точка М0, а значению 1=\ — точка М. Так как по условию «функция «=/(*, у) двух переменных х и у га+1 раз дифференцируема в рассматриваемой окрестности точки М0, то из формул (12.54) вытекает, что на прямой МоМ эта функция является сложной функцией переменной I из сегмента [0, 1]. Обозначим эту •сложную функцию через Р(1) и запишем для нее формулу Тейлора с центром разложения в точке ^о=0 в специальной форме (12.53) при Аи=Р(1)-Р(0)=НМ)-!(Мо). 'Фигурирующие в формуле (12.53) дифференциалы различных порядков представляют собой дифференциалы сложной функции и = =НХ> г/). ГДе х и у являются линейными функциями (12.54). Согласно замечанию 2 предыдущего пункта при этих условиях дифференциалы любого порядка функции и=/(лг, у) могут быть записаны в форме (12.47). Поэтому
§ 5. Производные и дифференциалы высших порядков 499* А"и |,0=0 = [ Ах -^- + Ау-~\ и|м0<*„,^*"Iм„ (12.55> <Э* Ап+Щи+ъ(1-и)\Ах дх ■ Ау —— ) и | л<*.+ед*. г/о+еду) = Ап+1и | лг, причем в формулах (12.55) Ах и ф/ находятся из соотношений: (12.54) при А1=А1 = 1—0=1. Таким образом, в формулах (12.55) Ах=А1Ах=Ах к Ау = А1Ау = Ау. (12.56), Подставляя Аки\и и (Р+^и+щ-ы из (12.55) в формулу (12.53) и учитывая соотношения (12.56), мы получим формулу Тейлорач (12.50). Приведем развернутое выражение формулы Тейлора (12.50)? для функции и—{(х\, х% ..., хт): I \Хх, Х2, • • • > Хт) = / (Х\, Х2, . . • 1 Хт) + + X1 [<*-*?> т~+ (*.-^)т~ + • • • + (*«-*&> -г-1* х ЛшЛ к\ [ 5дг! дх2 охт\ Хт) ' X / \-^1» Х2у 1 (п+1)1 . . . + (Хт — (х1—х°1)-т-+(хг—х%)— ахх дхг Хт) ё дх„ п+\ + 6(*1 —X?), Х°2+Ъ{Х2 — Х2), /(*! + > Хт -\- 0 (Хт Хт))- (12.57> Следствие. Если функция и=/(хь х2, ..., хт) удовлетворяет тем же условиям, что и в теореме 12.15, и, сверх того, все- частные производные этой функции порядка п+\ непрерывны в- рассматриваемой г-окрестности точки М0, то остаточный член^ т. е. последний член в формулах (12.50) и (12.57), может быть- записан в виде 0 *• ;'=1 ' ■' п+1 X У /(х°1 + / (*! — х\), х\ + 1 (х2 — х°2) хт + { {хт—хт)) А1. Такую форму остаточного члена естественно назвать интегральной. Для получения формулы Тейлора с остаточным' членом в интегральной форме следует записать в интегральной форме остаточный член в формуле Тейлора для функции одной переменной РЦ), рассмотренной при доказательстве теоремы 12.15, т. е. воспользоваться результатами п. 4 § 4 гл. 9. В рас-
$00 Гл. 12. Функции нескольких переменных сматриваемом случае указанный остаточный член имеет вид 1 гя"+»(0(1—гучи. _1_ я! Это и приводит нас к написанному выше выражению остаточного члена для функции и=\(х.\, лг2, ..., хт). 4. Формула Тейлора с остаточным членом в форме Пеано. Теорема 12.15*. Пусть п>1 — целое число, функция и = ={(М) = {(хи х2 хт) задана и п—1 раз дифференцируема в «-окрестности точки Л1о(#1°, Х2°, ..., хт°) и п раз дифференцируема в самой точке М0 *. Тогда для любой точки М из указанной е-окрестности справедлива следующая формула: /(А1) = /(М„). _1_ 1! йи 1 Ш, + ■ 1 + — йпи м. + о(рп). + —(Ри\ м0 21 (12.58) «е которой через р обозначено расстояние р{М0, М), а символ >о{рп) обозначает бесконечно малую при р-*-0 (или при М-+Мо) функцию более высокого порядка малости, чем рп. Формула (12.58) называется формулой Тейлора (с центром в точке М0) с остаточным членом в форме Пеано. Замечание. В более подробной записи формула Тейлора ((12.58) имеет вид л * / ° ° ° \ I > хт) —[(XI, Х<1, . . . , Хт) -+- + й=1 Я-Г- + - + {Х„. 'Хщ) дх„ X х/(хУ, хЪ ... ,х«) + о(р"). (12.59) Заметим, что в правой части (12.59) стоит сумма многочлена «степени п от т переменных Хи х% ..., хт и остаточного члена о(р"). Обозначим через §п(М) разность между /(ЛГ) и указанным .многочленом, т. е. положим $п(М) = НМ)-!(М0)- -Е-И<* А=1 -*0 —- + дхх • + {хт хт) — дхт !(М0). (12.60) Теорема 12.15* будет доказана, если мы установим, что при выполнении условий этой теоремы §п(М)=о(рп). * При и=1 следует требовать, чтобы функция и=ЦМ) была только задана ш е-окрестности точки М0 и дифференцируема в самой точке М0.
§ 5. Производные и дифференциалы высших порядков 501 Доказательству теоремы 12.15* предпошлем две леммы. Лемма 1. Если функция ${М)=1{х\, х% ..., хт) п раз дифференцируема в точке М0(Х1°, х2° хт°), то как сама функция @п(М), определяемая равенством (12.60), так и все ее частные производные по любым переменным Х\, х2, ..., хт до порядка п включительно обращаются в нуль в точке М0. Доказательство. При п=1 функция (12.60) принимаетвид ё1(М) = 1(М)-}(Ма)-(Х1-хЬ -|- (ЛГ0)- ... -(хт-х°т)^-{М0), и равенства ^1(М0)=0, —^-(М0)=0 при всех 1=1, 2, ..., т про- дх; веряются элементарно. Для проведения индукции предположим, что лемма справедлива для некоторого номера л>1, и докажем, что в таком случае она справедлива и для номера п+1. Пусть функция 1(М) /г+1 раз дифференцируема в точке М0 и к\ I ох1 их,т\ (12.61) Равенство ёп+\(М) = 0 проверяется элементарно (достаточно учесть, что каждая круглая скобка (я,-—хр) в (12.61) обращается в нуль в точке Мо). Нам остается доказать, что для любого 1=1, 2, ..., т сама функция ^"+1 (М) и все частные производные этой функции до порядка п включительно обращаются в нуль в точке Мо, а для этого в силу сделанного нами предположения о справедливости леммы для номера п достаточно доказать, что функция ' (М) определяется равенством типа (12.60), а точнее, равенством ^(М) = -^(М)--^(М0)- дх-1 дх^ дх1 6=1 Так как все переменные #; (1=1, 2, ..., т) равноправны и входят в выражение для §п+\(.М) симметрично, то достаточно доказать равенство (12.62) для 1 = 1, т. е. доказать равенство
502 Гл. 12. Функции нескольких переменных дхх дхх дхг А=1 дхт ] дхг к-У-Щ0). (12.63) Из (12.61) очевидно, что для доказательства (12.63) достаточно убедиться, что для каждого номера к=\, 2, ..., я+1 при фиксированных Х2, Хз, ... , Хт а йхг {Х1~Х°} ~к +- {х*~х$ ~к + • • ■+{Хт~х^ {Х1~х°} 1х\~+(х'~*® ~к + • • •+{Хт~х^ д дх„ ахх (12.64) Так как при дифференцировании по х\ переменные х2, хз, , хт фиксированы, то величину 0 = (х2-х°) дх2 + ... + (Хт-Х0) дх„ при дифференцировании по х\ можно рассматривать как постоянную. К этому следует добавить, что поскольку символы——,——» используются для образования частных производных дх„ функции /в фиксированной точке М0, то при дифференцировании по х\ указанные символы нужно рассматривать как па- стоянные величины. В силу сказанного для доказательства равенства (12.64) достаточно убедиться в справедливости равенства йхх (*1-*!) дхх в к = и-д дхх (Х1~х°) дх. И Дифференцируя функцию (*! + *?) дхх (12.65) по х\ как сложную и учитывая отмеченную выше независимость от х\ символов В и , мы получим равенство (12.65). Индукция заверил^ шена. Лемма 1 доказана. Лемма 2. Пусть §{Щ=§{х\, х2, ..., хт)—произвольная функция, удовлетворяющая двум требованиям: 1) ёШ) п раз дифференцируема в точке М0{х\°, х2°, ..., хт°); 2) сама функция § (М) и все ее частные производные по любым- переменным х\, х2 хт до порядка п включительно обращаются
§ 5. Производные и дифференциалы высших порядков 50$ в нуль в указанной точке М0. Тогда для функции §(М) справедлива оценка 8{М)=о(р»), (12.66) в которой через р обозначено расстояние р(Л1, Мо) между точками М и М0. Доказательство. При п = 1 утверждение леммы вытекает из условия дифференцируемости * функции § (М) в точке Мо, ко- п торое имеет вид §(М)— 8{М0) = ^-^-(М0)(х<—х°) + о(р). 1=1 Учитывая, что §{М0) =0, —^-(ЛГ0) = 0 для всех 1=1, 2, ..., т мы и получим, что §(М)=о(р). Для проведения индукции предположим, что лемма 2 справедлива для некоторого номера п>1, и докажем, что в таком случае она справедлива и для номера п + 1. Пусть функция §(М) удовлетворяет двум требованиям леммы 2 для номера п+1. Тогда, очевидно, любая частная производная этой функции первого порядка —— (М), 1 = 1, 2, ..., т, будет дХ1 удовлетворять двум требованиям леммы 2 для номера п, а потому (в силу сделанного нами предположения о справедливости леммы 2 для номера п) будет справедлива оценка -^-(М) = о(р"). (12.66*) 0X1 Заметим теперь, что поскольку п>1, то п+1>2 и функция &(М), удовлетворяющая двум требованиям леммы 2 для номера п+1, во всяком случае, один раз дифференцируема в окрестности точки Мо. Поэтому для этой функции §(М) выполнены условия теоремы 12.15 для номера п = 0. Согласно указанной теореме для любой точки М из достаточно малой е-окрестности точки Мо на отрезке ** МоМ найдется точка N такая, что справедлива формула т 8(М) = 8(Л*о)'+ тг 5] (*<-*?) ~- (ЛО- (12-67) 1=1 Заметим теперь, что поскольку точка N лежит между точками М0 и М, а р — это расстояние между точками М0 и М, то р(Ы, М0)<:р, и потому из (12.66*) вытекает, что ^-(ло = 0(Р"). дх1 * См. соотношение (12.16) из п. 2 § 4 настоящей главы. ** Т. е. на множестве точек вида М0 + ((М—Л10), где I — любое число из сегмента 0</<1.
504 Гл. 12. Функции нескольких переменных Подставляя последнюю оценку в (12.67) и учитывая, что §{М0)== = 0, мы получим т *(л*)=о(р")2;|*/-*?1- 1=1 Так как \Х(—^|<|/ 2 (*'—*°)2==Р> то мы окончательно по- ' 1=1 лучим, что §(М)=о(рп+1). Индукция завершена. Лемма 2 доказана. Доказательство теоремы 12.15* легко провидится с помощью леммы 1 и 2. В самом деле, выше уже отмечалось, что для доказательства теоремы 12.15 достаточно установить, что при выполнении условий этой теоремы для функции (12.60) справедлива оценка §п(М)=о(рп). В силу леммы 1 сама функция (12.60) и все ее частные производные по любым переменным х\, х2, ..., хт до порядка п включительно обращаются в нуль в точке М0. Но тогда в силу леммы 2 для функции (12.60) справедлива оценка §п(М) =о(рп). Теорема 12.15* доказана. § 6. ЛОКАЛЬНЫЙ ЭКСТРЕМУМ ФУНКЦИИ т ПЕРЕМЕННЫХ 1. Понятие экстремума функции т переменных. Необходимые условия экстремума. Пусть функция т переменных и={(М) = = 1(хи хъ ..., хт) определена в некоторой окрестности точки Мй(хх°, *2°1 -. хт°) пространства Ет. Определение 1. Будем говорить, что функция и = }(М) имеет в точке М0 локальный максимум [локальный минимум], если найдется такая 8-окрёстность точки М0, в пределах которой значение ЦМо) является наибольшим [наименьшим] среди всех значений ДМ) этой функции. Определение 2. Будем говорить, что функция и={(М) имеет в точке М0 локальный экстремум, если она имеет в этой точке либо локальный максимум, либо локальный минимум. Установим необходимые условия локального экстремума функции ы=/(М), обладающей в данной точке М0 частными,производными первого порядка цо всем переменным. Докажем следующее Утверждение. Если функция и = {(М)={(Хи х2, ..., хту обладает в точке М0(д;10, х2°, ..., хт°) частными производными первого порядка по всем переменным х\, х2, ...., хт и имеет в этой
§ 6. Локальный экстремум 505 точке локальный экстремум, то все частные производные первого порядка обращаются в точке Мо в нуль, т. е. ^-(М0) = 0, _^-(М0) = 0,...,-^-(Лу = 0. (12.68) дхг дхг дхт Доказательство. Установим справедливость первого равенства (12.68). Фиксируем у функции и=!(хи х2 хт) аргументы х2, хг, ..., хт, положив их равными соответствующим координатам точки М0, т. е. положив х2 = х2°, Хз = х30, ..., хт=хт°. При этом мы получим функцию и=1(хи х2°, ..., хтп) одной переменной XI. Производная этой функции одной переменной в точке л:1 = лг1° да ,,. > совпадает с частной производной (М0). дхх Так как функция т переменных «=/(М) имеет локальный экстремум в точке Мо, то указанная функция одной переменной и=1(хи х2°, ..., хт°) имеет локальный экстремум в точке Х1 = Х\°, и поэтому (в силу результатов п. 2 § 1 гл. 7) производная этой функции одной переменной в точке х\ = Х1°, совпадающая с част- ди , .. ч нои производной (М0), равна нулю. дхг Первое равенство (12.68) доказано. Остальные равенства (12.68) доказываются аналогично. Подчеркнем, что равенства (12.68) (т .е. обращение в нуль в данной точке М0 всех частных производных первого порядка) являются лишь необходимыми и не являются достаточными условиями локального экстремума функции и=ДМ) в точке Мо. Например, у функции двух переменных и — ху обе частные производные —— и обращаются в нуль в точке М0(0, 0), но никакого экстремума.в этой точке М0(0, 0) указанная функция не имеет, ибо эта функция и=ху равна нулю в самой точке Мо(0, 0), -а в как угодно малой б-окрестности этой точки принимает как положительные, так и отрицательные значения. Точки, в которых обращаются в нуль все частные производные первого порядка функции и = /(М), называются стационарными точками этой функции. В каждой стационарной точке у функции и = 1(М) возможен локальный экстремум, однако наличие этого экстремума можно установить лишь с помощью достаточных условий локального экстремума, выяснению которых посвящен следующий пункт. Из доказанного выше утверждения вытекает и другая форма необходимых условий локального экстремума: если функция и = = 1(М) дифференцируема в-точке М0 и имеет в этой точке локальный экстремум, то дифференциал йи\м° этой функции в точке М0 равен нулю тождественно относительно дифференциалов независимых переменных йх\, йх2, ..., йхт.
506 Гл. 12. Функции нескольких переменных В самом деле, поскольку <1и\м. = -г- М) **1 + -Г" (Л*о) с1х2+...+-^- (М0) йхт, дхг дх2 дхт то из равенств (12.68) вытекает, что при любых йх\, ёх2, ..., йхт справедливо равенство ёи\м0=0. 2. Достаточные условия локального экстремума функции т переменных. При формулировке достаточных условий локального экстремума функции т переменных ы = /(Л1) важную роль будет играть второй дифференциал этой функции в обследуемой точке М0. В п. 2 § 5 настоящей главы мы убедились в том, что для случая, когда аргументы х\, х% хт два раза дифференцируемой функции «=/(*!, х2, ..., хт) являются либо независимыми переменными, либо линейными функциями некоторых независимых переменных, второй дифференциал этой функдии в данной точке М0 представляет собой квадратичную форму относительно дифференциалов аргументов йх\, йх2, ..., йхт следующего вида: т т <*2"1^ = Е Ц а^4хк, (12.69) 1=1 к=\ где ■а1к=аы = -^-(М0). (12.70) дх(дхк Для формулировки достаточных условий локального экстремума нам понадобятся некоторые сведения из теории квадратичных форм, которые мы для удобства читателя приводим ниже *. Квадратичная форма относительно переменных Н\, Л2 Нт т т Ф {к1ъ Л2, ... , йт) = ^] ^ ааНсНк (12.71) называется положительно определенной [отрицательно определенной], если для любых значений Н\, /г2, ••• ..., Нт, одновременно не равных нулю, эта форма принимает строго положительные [строго отрицательные] значения. Квадратичная форма (12.71) называется зн акоопределен- н о й, если она является либо положительно определенной, либо отрицательно определенной. Квадратичная форма (12.71) называется знакопеременной, если она принимает как строго положительные, так и строго отрицательные значения. * Все приводимые здесь определения и утверждения можно найти, например, в книге В. А. Ильина и Э. Г. Позняка «Линейная алгебра», (М., Наука, 1974).
§ 6. Локальный экстремум 507 Квадратичная форма (12.71) называется к в а з и з н а к о о п р е- деленной, если она принимает либо только неотрицательные, либо только неположительные значения, но при этом обращается в нуль для некоторых значений к\, /г2, ..., Нт, одновременно не равных нулю. Сформулируем так называемый критерий Сильвестра знакоопределенности квадратичной формы *. Назовем матрицей квадратичной формы (12.71) следующую матрицу: <алл а Л = апа. и "12 22 а гт (12.72) \атлап а„ лт1ит2 Если все элементы матрицы Л удовлетворяют условию а,-* = = аы (1=1, 2, ..., т; к—\, 2, ..., т), то указанная матрица называется симметричной. Назовем главными минорами симметричной матрицы (12.72) следующие определители: •*11> 4 = а11а] 21а22 11"12 а„а. 2Ха22а23 а31й32а33 А — апа1г.. й21а22'- а, Критерий Сильвестра формулируется в виде следующих двух утверждений. Г. Для того чтобы квадратичная форма (12.71) с симметричной матрицей (12.72) являлась положительно определенной, необходимо и достаточно, чтобы все главные миноры матрицы (12.72) были положительны, т. е. чтобы были справедливы неравенства А{>0, Л2>0, ..., Ат>0. 2°. Для того чтобы квадратичная форма (12.71) с симметричной матрицей (12.72) являлась отрицательно определенной, необходимо и достаточно, чтобы знаки главных миноров матрицы (12.72) чередовались, причем знак А\ был отрицателен, т. е. чтобы были справедливы неравенства Л,<0, Л2>0, Л3<0, Л4>0, .... Теперь мы подготовлены для того, чтобы сформулировать и доказать теорему, устанавливающую достаточные условия локального экстремума. Теорема 12.16. Пусть функция пг переменных и = ЦМ) = =!(хи х% ..., хт) один раз дифференцируема в некоторой окрестности точки Мо(лг1°, Х2°, ..., хт°) и два раза дифференцируема в самой точке М0. Пусть, кроме того, точка М0 является стационар- * Дж. Сильвестр — английский математик (1814—1897).
508 Гл. 12. Функции нескольких переменных ной точкой функции и=$(М), т. е. йи\м0=$- Тогда если второй дифференциал (12.69), (12.70) представляет собой положительно определенную [отрицательно определенную] квадратичную форму от переменных йхи йх2, ..., йхт, то функция и=[(М) имеет в точке М0 локальный минимум [локальный максимум]. Если же второй дифференциал (12.69), (12.70) представляет собой знакопеременную квадратичную форму, то функция и=?{М) не имеет локального экстремума в точке М0. Доказательство. Докажем сначала первую часть теоремы, предполагая ради определенности, что второй дифференциал (12.69), (12.70) представляет собой положительно определенную квадратичную форму от переменных йх\, д,х% ..., йхт. Докажем, что в этом случае функция и = {(М) имеет в точке М0 локальный минимум. Разложим функцию и—}(М) в окрестности точки Мо по формуле Тейлора с остаточным членом в форме Пеано, беря в этой формуле л = 2 *. Мы получим при этом, что ПМ)-Г(М0) = 4и\м.+ -уЛ*Ы.+ о(р2), (12.73) причем в равенстве (12.73) дифференциалы 6.x I переменных лг,-, входящие в выражение для йи\м„ и 62и\м0' равны соответствующим приращениям я,-—хр эти переменных, а величина р равна р = У^х^ + (Лс2)2 + ... + (6хт)2 = = У(Х1-хО^+(х2-х1Г+ ... + (хт~х°тГ. (12.74) По условию теоремы точка Мо является стационарной. Поэтому на основании результатов предыдущего пункта й!и|м„=0. Учитывая это равенство и полагая в выражениях (12.69), (12.70) для второго дифференциала йх1 = Х1—хр, мы придадим формуле Тейлора (12.73) следующий вид: т т /(уИ)-/(М0)=-А-^ 2!а«(*<-■*?) (**-*$ +° (Р2)- (12-75) 1=1 А=1 Достаточно доказать, что для всех достаточно малых р правая часть (12.75) положительна. (Это и будет означать, что в достаточной малой окрестности точки М0 разность ДМ)—!{М0) положительна, т. е. функция и=1{М) имеет в точке М0 локальный минимум.) * Для функции и=1(М) выполнены при л=2 все условия теоремы 12.15* (см. п. 4 § 5 настоящей главы).
§ 6. Локальный экстремум 509* Положим 1ц = > где 1=1, 2, .... Тогда из выражениям Р (12.74) для р вытекают следующие соотношения: |й,|<1, Н12 + Н22+... +кт*=\. (12.76)* С помощью введенных обозначений равенство (12.75) может быть- переписано в виде т т ПМ)-Г(М0)=^-^ ^а1ккА + о(р2). (12.75*> 1=1 к=\ Отношение о(р2)/р2 представляет собой бесконечно малую при р->0 (или при М-+М0) функцию, которую мы обозначим через а(р). Введение этой функции позволяет нам записать равенство о(р2) =р2а(р), с помощью которого мы придадим соотношению' (12.75*) вид т т /(М)-/(М0) = Р2^^]^й„/гЛ+«(р)]. (12.75**> 1=1 *=1 Теперь уже нетрудно доказать, что правая часть (12.75**) является положительной для всех достаточно малых р. Квадратич- т т ная форма Ф = Т] V а^^ь. представляет собой функцию, опре- 1=1 А=1 деленную и непрерывную на поверхности единичной сферы (12.76),. представляющей собой замкнутое и ограниченное множество. Па второй-теореме Веиерштрасса (см. теорему 12.7 из п. 3 § 3) эта функция достигает на указанном множестве своей точной нижней грани [х, причем из положительной определенности квадратичной формы (12.71) и из того, что Н\, Н2, ..., Нт, удовлетворяющие соотношению (12.76), не равны одновременно нулю, вытекает, что указанная точная нижняя грань \х, строго положительна. Так как бесконечно малая при р->0 функция а(р) при всех достаточно малых р удовлетворяет неравенству |а(р)|<ц, то веж правая часть (12.75**) является положительной при всех достаточно малых р, т. е. при всех М, достаточно близких к М0. Это и означает, что функция и=}(М) имеет в точке М0 локальный минимум. Совершенно аналогично доказывается, что в случае, когда второй дифференциал (12.69), (12.70) представляет собой отрицательно определенную квадратичную форму, функция и = $(М) имеет в точке М0 локальный максимум. Докажем теперь вторую часть теоремы, т. е. докажем, что в; случае, когда второй дифференциал (12.69), (12.70) представляет"
.'510 Гл. 12. Функции нескольких переменных особой знакопеременную квадратичную форму, функция и = }(М) не имеет локального экстремума в точке М0. Прежде всего установим следующее свойство знакопеременной квадратичной формы (12.71): Если квадратичная форма Ф(АЬ А2, ..., Ат) знакопеременна, :то найдутся две совокупности переменных (А/, А/, ..., Нт') и (А/', Н2", ..., пт") такие, что (А/)2 + (А2')2 + ... + (А„/)2 = 1, (пП2+ (И2")2+ ... + (Ат")2= 1, (12.77) причем Ф(й,' Н2', ..., Нт')>0, Ф(АД А2", ..., йт")<0. (12.78) В самом'деле, в силу определения знакопеременной квадратичной формы найдутся две совокупности аргументов 1\, 12, ... ..., 1т и 1\'\ 12"у ..., 1т", состоящие из чисел, одновременно не равных нулю, и такие, что Ф(*1', (2,..., и)>0, Ф(*,", *2", ■•., Л»")<0. (12.79) Положив &=., , А1= „ „ ^ (12.80) V(*,)2 + С2)2 + • • • + (<т)2 У (<1? + № + • ■ ■ + (<т )2 :и учитывая, что из определения (12.71) квадратичной формы сразу же вытекает, что Ф(Н.[,н'2,...,н'т) = — ; —<ыи и Л Ф (А", п"2, ... , Н"т) = ^ — Ф (/[, й, ..., С), С/+ С2)2+••• + (',„)* мы получим (в силу (12.79)) неравенства (12.78), причем из соотношений (12.80) сразу же вытекают равенства (12.77). Зафиксируем две совокупности переменных А/, А/, ..., пт' и •АД п2", ..., Нт", удовлетворяющие соотношениям (12.77) и (12.78), и докажем, что для любого р>0 найдутся две точки М'(х\, х2, ... ..., хт') и М"{х\", х2", ..., хт") пространства Ет такие, что ф{М', М0) =р(М", М0) =р, причем х'хо , "_хо — = А{, — 1- = П1 для всех 1 = 1, 2, ..., т. Р Р (12.81) В самом деле, положив для любого р>0 и для каждого номера I
§ 6. Локальный экстремум 5111 мы удовлетворим соотношениям (12.81), причем в силу равенств; (12.77) будут справедливы равенства рУ(к[)*+(к'2у+... + (Ьт)2 = р, Р (М", мй) = У{х\-х^ + (Х;-х1Г " Г0Л2 _ ^ т т/ = р Уф\У + (Л2)2+... + {С? = р. Теперь уже нетрудно убедиться в том, что для случая, когда второй дифференциал (12.69), (12.70) представляет собой знакопеременную квадратичную форму, функция и = }(М) не имеет экстремума в точке М0. Записывая для функции и = ЦМ) разложение в окрестности: точки М0 по формуле Тейлора с остаточным членом в форме Пеано и беря это разложение в указанных выше точках М' и М", мы получим вместо (12.75) следующие два разложения: ТП ТП !(м')-[(М0)=±-% 2*«(*;-*Ж--*2)+0(ря). (12-82> 1=1 к=1 т т /(ЛГ)-/(М0) = -^ ^а1к{х]-х^{хк-х$ + о{р% (12.83> 1=1 к=\ справедливые для всех достаточно малых р>0. Подставляя в эти разложения значения (х/—л:;0) и (*,"—хру из равенств (12.81) и учитывая, что о(р2) =р2а(р), где а(р)->0 при р->-0, мы придадим разложениям (12.82) и (12.83) следующий вид: /(М')-/(М0) = Р2 у5] 5]«.Л^+а(р) 1=1 *=1 1 / (ЛГ) -/ (М0) = Р2 [^- 2 X а"^Н'к + а (р) 1=1 А=1 Последние два соотношения можно также переписать в виде !(М')-1(М0) = р2\±-Ф(к[,Н'2,,..,Н'т) + а(р), (12.82*) /(М")-/(М0) = р2 [-^-Ф(АиА;,....,Л;) + о(р)|. (12.83*>
©12 Гл. 12. Функции нескольких переменных Учитывая соотношения (12.78) и тот факт, что величины •Ф (V, Ы Лт') >0 и Ф (ЛГ, Ы\ ..., кт") <0 не зависят от р, и .вспоминая, что р=р(М', М0)=р(М", М0), мы получим из соотношений (12.82*) и (12.83*), что для достаточно малого р>0 спра- шедливы неравенства ДМ')>ДМ0) и 1{М")<}(М0), которые и доказывают отсутствие экстремума в точке Мц. Теорема 12.16 полностью доказана. Замечание. Если второй дифференциал два раза дифференцируемой в данной стационарной точке М0 функции и=}(М) представляет собой в этой точке квазизнакоопределенную квадратич- шую форму, то нельзя сказать ничего определенного о наличии или •отсутствии в этой точке локального экстремума. Так, например, у каждой из двух функций щ—х3+у3 и Нг= =х*+у4 второй дифференциал в стационарной точке М0(0, 0) тождественно равен нулю (т. е. представляет собой квазизнакоопределенную квадратичную форму), но только одна вторая из указанных двух функций имеет в этой точке локальный экстремум. Для решения вопроса о локальном экстремуме для случая, котла второй дифференциал представляет собой квазизнакоопределенную квадратичную форму, следует привлечь дифференциалы более -высоких порядков, но это выходит за рамки нашего курса. Пример. Найти точки локального экстремума функции трех переменных и=%х2+у2+г2+2у+2г, (12.84) где Я — вещественное число, отличное от нуля. Так как —— = 2Хх, = 2у + 2, —— = 2г + 2, то единствен- дх ду дг . яой стационарной точкой является точка Мо(0, —1, I—1). Далее очевидно, что второй дифференциал в этой точке имеет «вид й*и \м0 = 2Х (йх)*+ 2 {йу)2 + 2 (&)■. При %>0 второй дифференциал в точке Мо представляет собой ■положительно определенную квадратичную форму*, и потому «функция (12.84) имеет в точке М0(0, —1, —1) локальный минимум. При Х<0 указанный второй дифференциал представляет собой знакопеременную квадратичную форму**, и потому функция (12.84) не имеет локального экстремума в точке М0 . 3. Случай функции двух переменных. На практике часто встречается задача об экстремуме функции двух переменных и=}(х,у). * Ибо этот второй дифференциал принимает строго положительные значенная при их, йу и Лг, одновременно не равных нулю. ** Ибо при Я<0 этот второй дифференциал положителен при йх=Ч, йу=\, «йг=1 и отрицателен при- йх=\, <*</=0, Лг=0.
§ 6. Локальный экстремум 513 В этом пункте мы приведем результаты, относящиеся к этому случаю. _, д2и 32ц д2и Пусть частные производные , , в некоторой точ- дхг дхду ду2 ке М0(х0, уо) обозначены символами а и-, «12, а21 соответственно. Справедливо следующее Утверждение. Пусть функция двух переменных и=}(х, у) один раз дифференцируема в окрестности точки Мо и два раза дифференцируема в самой точке М0, и пусть М0 является стационарной точкой. Тогда если в точке Мо выполнено условие а\\йп—0122>О, то функция и=}(х, у) имеет в точке Мо локальный экстремум (максимум при ац<0 и минимум при ац>0). Если же в точке М0 ацйгг—Д122<0, то функция и=}(х, у) не имеет в этой точке локального экстремума *. Доказательство. Справедливость первой части утверждения непосредственно вытекает из теоремы 12.16 и критерия Сильвестра знакоопределенности квадратичной формы, ибо А1 = ап, А2 = апа22—а122. Докажем вторую часть утверждения. Итак, пусть в точке М0 справедливо неравенство ацйгг—амг<0. Докажем, что в этом случае второй дифференциал й2и в точке М0 представляет собой знакопеременную форму. Рассмотрим сначала случай ацфО. Используя введенные выше обозначения р = У(х-х0У + (у-у0)\ Нг = -±—*Ч Ня Р Р получим следующее выражение для второго дифференциала: 2 <Ри|м. = Р2 У\ о.-йМа = Р2(ОцЙ1 + 2а12/11Л2 + а22Н\) = 1",А=1 ап = -2- [КД + апН2У + (апам—а12) Н2]. «11 Легко, проверить, что при п\ — \, /гг = 0 и при Н1= . Л2 = — " дифференциал сРи\м„- имеет разные знаки, т. е. ^«11 +«12 является знакопеременной формой, и поэтому согласно теореме 12.16 функция не имеет в точке М0 локального экстремума. * Случай аиаы—а212=0 требует дополнительного исследования. ** При этом р может быть как угодно малой величиной. Условие Н[2+Н22=1 выполнено. 17 Зак. 72
514 Гл. 12. Функции нескольких переменных Рассмотрим теперь случай ац = 0. Тогда из условия Сца2—«122< <0 вытекает, что а\2Ф0. Следовательно, так же как и выше, имеем. й2и\Мо = р%{2а12к1 + а22к2). (12.85) Пусть Н\фО и величина к2 столь мала (из условия кх2 + к22=1 следует, что такой выбор к\ и к2 возможен), что выражение {2а\2кх-\-а22к2) сохраняет знак величины 2аХ2к\. Тогда из формулы (12.85) вытекает, что <Ри\м0 имеет разные знаки при Й2>0 и к2<0, т. е. функция и={(х, у) не имеет локального экстремума в точке М0. Утверждение полностью доказано. Замечание. Требование йЦ{М0)>0 [соответственно <12}(М0)< <0] является необходимым условием локального минимума [максимума] в точке М0 дважды дифференцируемой в этой точке функции }(М). В самом деле, пусть ради определенности 1(М) имеет в точке М0 локальный минимум, но условие й?2/(УИ0)>0 не выполнено. Тогда найдутся к\, к2, ..., кт такие, что т т 1=1 к=\ Рассмотрим функций РЦ)=}(хр+1Ь,\, ..., хт° + 1кт), заведомо определенную при всех I, достаточно малых по модулю. Функция Р(1) обязана иметь локальный минимум в точке ^=0, чему противоречит условие Г"(0)=аЧ(М0)<0. ДОПОЛНЕНИЕ 1 Градиентный метод поиска экстремума сильно выпуклой функции В этом дополнении излагается теория широко применяемого на практике градиентного метода поиска экстремума сильно выпуклой функции. Идея этого метода чрезвычайно проста. Для приближенного отыскания точки минимума функции т переменных используется тот факт, что градиент этой функции имеет направление, совпадающее с направлением наибольшего возрастания этой функции. Значит, вектор —§гас1 / (лго) в каждой точке Хо= = (Х1°, х2°, ..., хт°) направлен в сторону наибольшего убывания функции 1{х). Это дает основание ожидать, что если, отправляясь от некоторого нулевого приближения хо=(х^, х2°, ..., х°т) мы построим к-е приближение Хк=(х\к, х2к, ..., хтк) по рекуррентной формуле Хк+\=хк~ а дгай Цхк),
Дополнение 1 515 то при достаточно малом положительном а последовательность точек {хк} сойдется к точке минимума функции $(х). Строгой реализации этой простой идеи и посвящено настоящее дополнение. 1. Выпуклые множества и выпуклые функции. Пусть х\ = = (х^, х2\ ..., Хщ1) и х2=(х12, х22, ..., хт2) — две точки /п-мер- ного евклидова пространства Ет, которые мы можем рассматривать как векторы в Ет с соответствующими координатами. Назовем отрезком или сегментом, соединяющим точки Х\ и х2, множество точек пространства Ет вида Х\ + Цх2—х\), где I — любое число из сегмента 0<1<1. Будем обозначать отрезок, соединяющий точки х\ и х2, символом #1*2. Определение 1. Множество С} точек пространства Ет называется выпуклым, если оно обладает следующим свойством: каковы бы ни были две точки х\ и х% принадлежащие множеству (2, отрезок х\ХЪ их соединяющий, также принадлежит этому множеству. Примером выпуклого множества в пространстве Ет может служить /п-мерный шар (безразлично, открытый или замкнутый) или полупространство дст>0 (т. е. множество всех точек (х\, х2, ..., хт) пространства Ет, т-я координата которых удовлетворяет условию л:т>0). Примером множества С}, не являющегося выпуклым, может служить дополнение т-мерного шара или т-мерный открытый шар, из которого удалена хотя бы одна точка. Пусть (2 — некоторое множество точек пространства Ет, а х — любая фиксированная точка этого пространства. Назовем расстоянием отточки х до множества <3 точную нижнюю грань расстояний от точки х до всевозможных точек этого множества. Будем обозначать расстояние от точки х до множества (2 символом р(л;, (2). Итак, по определению р(х, 0) = М р{х, у). Для любого множества (3 пространства Ет и любой точки х этого пространства существует расстояние р(*, (2) *. В частности, если точка х принадлежит множеству (2, то р(х, <3)=0. Однако у множества (2 не всегда существует точка у такая, что р(л!, у)=р(х, <2). Так, например, если множество (2 представляет открытый /п-мерный шар, а х — точка Ет, лежащая вне этого шара, то у такого множества С} не существует точки у такой, что р (х, у) = * Ибо множество р(х, у) для всевозможных у, принадлежащих (2, всегда ограничено снизу (например, числом нуль). 17*
516 Гл. 12. Функции нескольких переменных = р(*> Я) (ибо для всех точек у открытого шара справедливо неравенство р(х, у)>р(х, ^)). Если все же у множества С} существует точка у такая, что р(х> У) =р(х, С}), то эта точка у называется проекцией точки х на множество<2. Проекцию точки х на множество С} будем обозначать символом Р<)(х). Подчеркнем, что если точка х принадлежит множеству (? то Лз (*)=*• Итак, проекция Рц(х) точки х на множество <2 определяется соотношением р (х, Ря (х)) = р (х, О) = 1п1 р (х, у). Полезно отметить, что может существовать несколько проекций точки х на множество <3. Так, например, если <3—т-мерная сфера с центром в точке х, то любая точка (2 является проекцией точки х на множество <2. Справедлива, однако, следующая лемма: Лемма 1. Если множество С? пространства Ет является выпуклым и замкнутым, ах — любая точка Ет, то существует и притом единственная проекция точки х на множество (). Доказательство. Сначала докажем существование хотя бы одной проекции точки х на множество 0. Обозначим через р(х, ($) расстояние от точки х до множества (?. По определению р(*, 0) как точной нижней грани т! р(х, у) найдется последовательность {уп} точек множества <2 такая, что р(х, уп)-*~ По определению предела числовой последовательности для любого е>0 все элементы уп, начиная с некоторого номера, удовлетворяют соотношению р{х, Я)—г<р(х, уп)<р(х, С})+е. Отсюда следует, что последовательность {уп} точек пространства Ет во всяком случае является ограниченной и потому в силу теоремы Больцано — Вейерштрасса (см. п. 2 § 2 гл. 12) из этой последовательности можно выделить сходящуюся подпоследовательность уьп> где п=1, 2, 3, .... Обозначим через у предел подпоследовательности {«/*„}• В силу замкнутости множества (} точка у-принадлежит этому множеству. Остается доказать» что Р (х, У) = р (*, С) = Нт р (х, уьп). Для доказательства этого заметим, что в силу неравенств треугольника
Дополнение 1 517 Р (*. Ука) < Р (х, У) + р (У, Укп) И р (X, «/)< р (х, укп) + р (укп, у) справедливо соотношение IР (*. Укп)—р (х, у) | < р (у, укп). Из этого соотношения и их сходимости подпоследовательности {Укп) к у вытекает, что Пт р(х, укп) = р(х, у),т. е. р(х, <Э) =р{х, у). п-*а> Тем самым доказательство существования хотя бы одной проекции точки х на множество 0. завершено. Докажем теперь, что существует только одна проекция точки л: на множество С}. Предположим, что существуют две различные проекции у\ и уъ точки х на множество (?. Так как множество (2 является выпуклым, то весь отрезок уху2, соединяющий точки ух и уч, принадлежит множеству (2. В частности, множеству (3 принадлежит середина указанного отрезка. Убедимся в том, что расстояние р ух, -у 2 ) от точки х до указанной середины отрезка ухУч. строго меньше расстояния р(*. Ух)=р{х, щ). Исключим из рассмотрения тривиальный случай, когда Ух а ■ = х. В этом случае р (х, Уг Уг \ = О, в то время как р(х, Ух)=р(х, г/г)>0, ибо в противном случае обе точки ух и уч. совпадали бы с х и не могли бы быть различными. Итак, в тривиальном случае Ух г = х неравенство р (X, ^4^-) <Р(*.^1)=Р (*♦».) (12ЛЛ) очевидно. Докажем теперь неравенство (12.1.1) в случае, когда Ух + У* фХ. 2 Используя свойства скалярного произведения двух векторов пространства Ет (см., например, замечание 2 из п. 1 § 1 гл. 12), мы получим соотношение р2 (х> У* + У*\ = (\У1±У1_ _ х% Уг±Уш_ У 1-х . У 2-х Ух — х Уг—х 2^2' 2^2 = — [(у1—х,у1—х) + 2(у1—х,у2—х) + (у2—х,у2—х)]. (12.1.2) 4
518 Гл. 12. Функции нескольких переменных Убедимся теперь в справедливости строгого неравенства 1(01—*. 02—*)1 < У(Уг—х, 01—*) К(02—*, 02—*)- (12.1.3) В сноске на с. 485 доказано, что для любых векторов * а и Ь пространства Ет, не коллинеарных друг другу (т. е. таких, что аФХЬ ни для одного вещественного Я), справедливо строгое неравенство Коши — Буняковского \{а,Ь)\<Уг(а,аУ(Ь,Ь). Это означает, что для доказательства неравенства (12.1.3) нам достаточно убедиться в том, что векторы у\—х и г/5—х не кол- линеарны, т. е. убедиться в том, что ни для одного вещественного Я не может быть справедливо равенство у1~х=К(у2-х). (12.1.4) Если бы равенство (12.1.4) было справедливо для такого Я,, для которого | Я, |^=1, то было бы невозможно равенство р{Уи х)=р{у2, х). Справедливость равенства (12.1.4) для Я,= 1 противоречила бы тому, что точки г/1 и г/г являются различными. Наконец, справедливость равенства (12.1.4) для %= — 1 означала бы, что У1 2 = х, а этот случай мы исключили. Итак, равенство (12.1.4) несправедливо ни для одного вещественного Я, а потому доказательство неравенства (12.1.3) завершено. Сопоставляя равенство (12.1.2) с неравенством (12.1.3), получим, что X, 1^-)<-у[(Уг-х,У1-х) + + 2 У(01—X, уг—х) У(У2~Х, У 2-х) + (У2—х, 02—х)] -=■ = -~ [У(У1—х, уг—х) + У(у2—х, у2—х)]* = 4 = -^ [р (х, уг) + р(х, 02)]2 = р2 (х, г/х) = р2 (х, у2). Тем самым доказательство неравенства (12.1.1) завершено. Но это неравенство означает, что у множества (2 нашлась точ- ка ■, более близкая к х, чем точки ух и у2, а это противоречит тому, что каждая из точек у\ и у2 является проекцией точки х на множество <2, т. е. является точной нижней гранью расстояния р(х, у) для всевозможных у, принадлежащих (?. * Векторы в данном дополнении не будем выделять жирным шрифтом.
Дополнение 1 519 Полученное противоречие показывает, что наше предположение о том, что существуют две различные проекции ул и у2 точки х на множество <3, является ошибочным. Доказательство леммы 1 полностью завершено. Перейдем теперь к определению выпуклой функции. Определение 2. Функция ${х), заданная на выпуклом множестве (2 пространства Ет, называется выпуклой вниз или просто выпуклой на этом множестве, если для любых двух точек х\ и х2 множества <2 и для любого вещественного числа I из сегмента 0<^<1 справедливо неравенство ^[x1 + ^(x2-x^)]^(x^)+^[[(x2)—^(x^)]. (12.1.5) Определение 3. Функция !{х), заданная на выпуклом множестве С} пространства Ет, называется строго выпукло й на этом множестве, если для любых двух точек Х\ и х% множества С? и для любого вещественного числа I из интервала 0<^<1 справедливо строгое неравенство 1[х1 + Пх2-х1)]<1(х1)+Щ(х2)Ч(х1)1 (12.1.6) Ясно, что всякая строго выпуклая на множестве (3 функция [(х) является выпуклой на этом множестве. Легко установить достаточное условие выпуклости [соответственно строгой выпуклости] дважды дифференцируемой на выпуклом множестве '(? функции }(х). Лемма 2. Пусть функция [(х) задана и два раза дифференцируема на выпуклом множестве С}. Тогда, для того чтобы эта функция являлась выпуклой [строго выпуклой], на множестве С} достаточно, чтобы второй дифференциал а"2} этой функции во всех точках <2 являлся квазиположительно определенной [строго положительно определенной] квадратичной формой. Доказательство. Пусть х\ и х2 — любые две фиксированные точки множества <2. Рассмотрим на сегменте 0<^<1 следующую функцию одной независимой переменной I: ^(0 =Цх1 + Цх2-Х1)]-!(х1)-Щ(х2)-!(х1)]. (12.1.7) Напомним, что второй дифференциал йг\ функции ](х) = — \{х\, х2, ..., хт) независимых переменных (х\, х2, ..., хт) в данной точке х= (хи х2, ..., Хт) равен * т т */<*)=]Е Х^г(*)Дх'л**- (12Л-8) (=1 к=\ Дифференцируя функцию (12.1.7) два раза по I по правилу дифференцирования сложной функции, получим * См. п. 2 § 5 гл. 12.
520 Гл. 12. Функции нескольких переменных т т ^(0 = 2 ^^^[х1 + 1{х,-х1)){^-ххд{х1-х\)> (12.1.9) 1=1 6=1 где (ххх, х2\ ..., хт1) и (хг2, х22, .... хт2) — координаты точек хг я х2 соответственно. Сопоставляя соотношения (12.1.8) и (12.1.9), мы убедимся в справедливости равенства Р"{1)=&Кхх + 1{х2-х{)1 (12.1.10) в котором в выражении для й2} приращения Ах, взяты равными Дальнейшие рассуждения ради определенности проведем для случая, когда второй дифференциал д.2] во всех точках <2 является квазиположительно определенной квадратичной формой. В этом случае для всех Г из сегмента 0<:^<1 правая (а значит, и левая) часть (12.1.10) неотрицательна, т. е. для всех I из сегмента 0<*«:1 /г"(/)>0. (12.1.11) В силу определения 2 и соотношения (12.1.7) нам достаточно доказать, что для всех I из сегмента 0<^<1 справедливо неравенство РЦ)<0. (12.1.12) Для доказательства неравенства (12.1.12) используем соотношение (12.1.11) и легко проверяемые равенства /г(0)=0, 7(1)=0. (12.1.13) Предположим, что внутри сегмента 0<^<1 существует хотя бы одна точка I, в которой Р^)>0. Тогда функция Р(1) достигает своего максимального на сегменте 0<^<1 значения в некоторой внутренней точке /о этого сегмента, причем Р(1о)>0. В этой точке А) функция Р^) имеет локальный максимум, а потому Р'^о)=0. Но из неравенства (12.1.11) вытекает, что производная Р'(I) не убывает на всем сегменте 0«^<1, а потому и на сегменте /0<^<1- Отсюда и из условия Р'^0)=0 следует, что производная Р'(I) неотрицательна всюду на сегменте ^о<^<:1, а поэтому функция Р(Ц не убывает на этом сегменте. Это приводит нас к неравенству р(1)>р(и)>о, противоречащему второму соотношению (12.1.13). Полученное противоречие доказывает, что наше предположение о том, что на сегменте 0</<1 существует хотя бы одна точка /, в которой Р({)>0, является ошибочным, т. е. доказывает справедливость всюду на сегменте 0</<1 неравенства (12.1.12).
Дополнение 1 521 Тем самым первая часть леммы (о выпуклости /(*) при условии, что дР-\ является квазиположительно определенной квадратичной формой) доказана. Вторая часть леммы (о строгой выпуклости }(х) при условии, что а"1] является строго положительно определенной квадратичной формой) доказывается аналогично.. Исходя из неравенства (12.1.11), справедливого на этот раз со знаком >, и из равенств (12.1.13) и предположив, что внутри сегмента (Х^<1 существует хотя бы одна точка I, в которой /г(^)>0, мы придем к выводу, что Р (I) имеет внутри сегмента 0<^<1 точку локального максимума /о, причем /г(^0)>0. Но тогда, поскольку Р'Цо)=0, мы получим из (12.1.11), что Р'(()>0 всюду на полуинтервале /0<^<1, а это означает, что Р(1)>Р{(о)^0. Мы снова получаем противоречие со вторым соотношением (12.1.13), которое доказывает, что Р(1)<0 всюду на интервале 0</<1, т. е. доказывает строгую выпуклость {(х) на множестве Р. Лемма 2 полностью доказана. Доказанная лемма естественно наводит на мысль о рассмотрении следующего еще более узкого класса выпуклых на выпуклом множестве (? и два раза дифференцируемых на этом множестве функций. Определение 4. Два раза дифференцируемая на выпуклом множестве (2 функция {(х) называется сильно выпукло й на этом множестве, если существуют такие две положительные постоянные к\ и к2, что второй дифференциал а"2} этой функции, определяемый соотношением (12.1.8), во всех точках х множества <2 удовлетворяет неравенствам МД*)2«*2/<МД*)2- (12.1.14) (В этих неравенствах через Дл: обозначен вектор с координатами (Ддсь Ах2, ..., Ахт), а символ (Дл;)2 обозначает скалярный квадрат этого вектора, т. е. скалярное произведение (Ах, Ах).) Из левого неравенства (12.1.14) сразу же вытекает, что второй дифференциал сильно выпуклой функции представляет собой строго положительно определенную во всех точках множества (? функцию, а потому (в силу леммы 2) сильно выпуклая на множестве <2 функция заведомо является строго выпуклой на этом множестве. Вместе с тем класс сильно выпуклых функций достаточно широк и важен в прикладных задачах, и мы ограничимся этим классом при изложении теории градиентного метода поиска минимума. Начнем с выяснения вопроса о существовании и единственности минимума. 2. Существование минимума у сильно выпуклой функции и единственность минимума у строго выпуклой функции. Пусть функция }(х) определена на выпуклом множестве С?.
522 Гл. 12. Функции нескольких переменных Будем говорить, что эта функция имеет в точке хо множества (ЗлЪкальный минимум, если существует такая б-окрест- ность этой точки Са, что значение }(х0) не больше значений {(х) этой функции во всех точках пересечения б-окрестности Св и множества ф. При таком определении понятие локального минимума включает в себя и точки краевого минимума функции {(х) на границе множества <2. Таким образом, при данном нами определении можно подразделить точки минимума на точки внутреннего локального минимума (для случая, когда эти точки являются внутренними точками <2) и точки краевого локального минимума (для случая, когда эти точки являются граничными точками <3). Для изучения вопроса о существовании и единственности точки локального минимума нам понадобится следующая вспомогательная лемма. Лемма 3. Пусть на выпуклом множестве (2 задана дифференцируемая выпуклая функция }(х). Для того чтобы эта функция имела локальный минимум в точке х0 множества С}, необходимо и достаточно, чтобы для любого вектора Ах, для которого точка х+Ах принадлежит множеству С}, было справедливо неравенство* (дга<1/(ло), Дх)>0. (12.1.15) Доказательство. Необходимость. В силу утверждения, доказанного в п.. 8 § 4 гл. 12, левая часть (12.1.15) равна произведению производной функции }(х) в точке дг0по направлению вектора Ах на длину | Ах\ этого вектора: (ёгаа7(х0), Дх) = -2Ц*о) |Д*|, (12.1.16) де где е = Ах/\Ах\ — единичный вектор в направлении Ах. Так как хо является точкой локального минимума функции }(х), то производная д}/де(хо) по любому направлению е= = Ах/\Ах\ неотрицательна (точнее, равна нулю в случае, если Хо — точка внутреннего локального экстремума, и неотрицательна в случае, если хо — точка краевого локального экстремума). Итак, правая часть (12.1.16) (а потому и левая часть (12.1.15)) неотрицательна. Необходимость доказана. Достаточность. Пусть для любого вектора Ах, для которого точка х0+Ах принадлежит (3, справедливо неравенство (12.1.15). Докажем, что точка хо является точкой локального минимума функции Цх). * В неравенстве (12.1.15) берется скалярное произведение векторов егасЩхо) и Д#- Определение §гас!/(л:) см. в п. 8 § 4 гл. 12.
Дополнение 1 523 Так как функция }(х) по условию является выпуклой на множестве С, то для любых двух точек х\ и Хч этого множества и любого числа I из сегмента 0<^<1 справедливо неравенство (12.1.5). Полагая в этом неравенстве хх=Хъ, Х2=х0+Ах, мы можем переписать это неравенство в виде / (х0 + Ах) —/ (х0) > /(*° + ш) ~Пхо) . (12.1.17) Считая х0 и Ад; фиксированными, перейдем в неравенстве (12.1.17) к пределу при *-»-0 + 0. По определению производной по направлению (см. п. 8 § 4 гл. 12) предел при *-*0 + 0 правой части (12.1.17) в точности равен произведению, стоящему в правой части (12.1.16). Поэтому в силу соотношений (12.1.15) и (12.1.16) этот предел неотрицателен. Учитывая, что левая часть (12.1.17) не зависит от I, мы получим в пределе при *-»-0+0 из неравенства (12.1.17), что [(хо+Ах)^- /(х0)>0. Последнее неравенство, справедливое для любого вектора Ах, для которого точка х0 + Ах принадлежит (2, доказывает, что функция }(х) имеет в точке х0 локальный минимум. Достаточность доказана. Лемма 3 полностью доказана. Замечание 1. Из приведенного нами доказательства очевидно, что для случая, когда точка Хо является внутренней точкой множества С}, т. е. когда речь идет о внутреннем локальном минимуме, в формулировке леммы 3 знак > в неравенстве (12.1.15) можно заменить на знак =. Замечание 2. При доказательстве необходимости леммы 3 мы не использовали требования выпуклости функции Цх). Поэтому доказательство необходимости проходит без требования выпуклости функции !(х). Иными словами, справедливо следующее Утверждение. Если функция [(х) дифференцируема на выпуклом множестве (3 и имеет локальный минимум во внутренней [в граничной] точке х0 этого множества, то для любого вектора Ах для которого точка х0+Ах принадлежит С}, справедливо неравенство (Вга<1/(хо), Д*)=0 [(8гад/(х0), Дх)>0]. Перейдем к вопросу об единственности и о существовании точки локального минимума. Теорема (об единственности локального минимума у строго выпуклой функции). Если функция }(х) дифференцируема и строго выпукла на выпуклом множестве ($, то она может иметь локальный минимум только в одной точке этого множества.
524 Гл. 12. Функции нескольких переменных Доказательство.. Предположим, что функция }{х) имеет локальный минимум в двух различи ы-х точка #1 и х$ множества С?. Тогда условие выпуклости (12.1.5) для точек л;^ и Х2 можно записать в виде /(х2)_;(Х1) ^ Н*к + * (* ~*»)!-1Ы (12.1.18) (здесь / — любое число из интервала 0<^<1). Меняя в соотношении (12.1.8) точки х\ и х2 ролями, мы получим неравенство /(хх)-/(х2) > П*2 + *(ч ~*г)] ~!Ы . (12.1.19) В пределе при /-*0+0 правая часть (12.1.18) [соответственно правая часть (12.1.19)] дает производную функции }(х) по направлению вектора х2—х\ [соответственно вектора Х\—х2], взятую в точке х\ [соответственно в точке х2], умноженную на \х2—*1|. Так как обе точки х\ и х2 являются точками локального минимума, то обе указанные производные по направлению неотрицательны, т. е. пределы правых частей (12.1.18) и (12.1.19) при /->-0 + 0 оба неотрицательны. Таким образом, из неравенств (12.1.18) и (12.1.19) в пределе при ^->-0+0 мы получим Д*2)-/(*!)>(), К*1)-/(*2)>0. Сопоставление двух последних неравенств приводит к заключению о том, что 1{х1)=}(х2). Используя равенство }(х\) =/(лг2), мы получим из условия строгой выпуклости (12.1.6), что Ях, + *(*2-*1)]</(*1) (12.1.20) для всех ( из интервала 0</<1. Неравенство (12.1.20) противоречит тому, что функция /(х) имеет локальный минимум в точке х\ (в точке Х\ + Нх2—Х[), как угодно близкой пр'и малом I к точке хи функция 1(х) имеет значение, меньшее значения /(#0). Полученное противоречие доказывает, что наше предположение о том, что функция }(х) имеет локальный минимум в двух различных точках множества С}, является ошибочным. Теорема доказана. Существование локального минимума докажем при более сильных ограничениях, чем единственность. Теорема (о существовании локального минимума у сильно выпуклой функции). Если функция }(х) сильно выпукла на замкнутом выпуклом множестве <2, то
Дополнение 1 525 у этой функции существует на множестве С} точка х0 локального минимума *. Доказательство. Сначала отметим, что теорема заведомо справедлива для случая, когда выпуклое замкнутое множество С} является, кроме того, ограниченным. В этом случае по второй теореме Вейерштрасса (см. теорему 12.7) функция 1(х), будучи во всяком случае непрерывной на множестве (2, достигает в некоторой точке х0 этого множества своего минимального на ф значения. Указанная точка х0 и является точкой локального минимума. Остается доказать теорему в случае, когда выпуклое замкнутое множество С не является ограниченным. В этом случае мы фиксируем некоторую внутреннюю точку хх множества (2 и разложим функцию 1(х) по формуле Тейлора с центром в.точке хи взяв остаточный член /?г(*) в форме Лагранжа ** (см. п. 3 § 5 гл. 12). Указанное разложение будет иметь вид ((х) = Нх1) + аНх1) + -^^1[х1+Ь(х-х1)], (12.1.21) где 8 — число из интервала 0<8<1, так что точка Х1 + в{х—Х\) принадлежит отрезку, соединяющему точки Х\ и х2 ***. Если обозначить через Ах вектор х—Хи то для а"1(х\) будет справедливо равенство Щ(х\) = {%га.&1{хх), Ах). Из этого равенства вытекает, что М/(*1)|<|8га<1Ях,)||Дх|. (12.1.22) Далее, используя левое неравенство в определении сильной выпуклости (12.1.14), мы придем к неравенству <Р/[*1+в(*—*,)]>&! (А*)2- (12.1.23) Из соотношений (12.1.21) — (12.1.23) заключаем, что /(х)-/(хх) >-Щ{хд\+±-#Пч + Чх-хд\> > — |бга<1/(дса)| \Ах\+^-\Ах\\ * Так как сильно выпуклая на выпуклом множестве ф функция }(х) является строго выпуклой на этом множестве, то по предыдущей теореме точка хо будет единственной точкой локального минимума. ** Мы учитываем, что сильно выпуклая на множестве (2 функция {(х) два раза дифференцируема на этом множестве. *** Какова бы ни была точка х множества ф, отрезок, соединяющий точки XI и х,' принадлежит множеству С? в силу выпуклости этого множества. В сноске к теореме Тейлора 12.15 отмечалось, что в качестве окрестности центра разложения можно брать любую звездную окрестность этого центра, т. е. можно брать все множество ф.
525 Гл. 12. Функции нескольких переменных 1 ак что /(х)-/(хх)> |Дх| [^|Л*|- 1вг«1/(*!>! (12.1.24) Учитывая, что точка Х\ фиксирована и величина ^гасЩхО [ представляет собой некоторое фиксированное число, мы заведомо можем выбрать положительное число Я настолько большим, чтобы при |Дх|>.# выражение в квадратных скобках а (12.1.24) было положительным. Это означает, что при |Дх|># справедливо неравенство !(х)>1(х1), т. е. всюду вне замкнутого шара Сн радиуса Я с центром в точке хх значения ]{х) превосходят значение 1(х\), (в центре указанного шара). Обозначим через (?я пересечение множества (3 с указанным шаром Сц. Так как оба множества С и Сй являются выпуклыми и замкнутыми,- то и их пересечение <3к также является выпуклым и замкнутым. Так как, кроме того, множество <2д является: ограниченным, то по доказанному выше функция /(х) имеет на множестве (2я единственную точку хо локального минимума. Поскольку мы доказали, что во всех точках (2, лежащих за пределами <3Н, значения /(х) превосходят /(хО, то эти значения тем более превосходят /(хо), т. е. точка х0 является точкой локального минимума /(х) и на всем множестве С. Теорема полностью доказана. 3. Поиск минимума сильно выпуклой функции. Мы доказали-,, что сильно выпуклая функция /(х), заданная на замкнутом выпуклом множестве С}, имеет на этом множестве единственную» точку Хо локального минимума. Обратимся к построению и обоснованию алгоритма, с помощью которого отыскивается эта точка х0. Фиксируем произвольную точку х\ множества <Э и произвольное число а, удовлетворяющее неравенствам О <«<-!-, (12.1.25» где к2 — постоянная из неравенства (12.1.14), определяющего- сильную выпуклость функции /(х). Отправляясь от х\ как от первого приближения, составим' итерационную последовательность {х^} с помощью рекуррентного соотношения хк+1 = Р<1(хк—аёга<1{(хк)), А= 1,2,3,.... (12.1.26)- В настоящем пункте мы докажем следующее утверждение. Основная теорема. Пусть функция }(х) является сильно выпуклой на замкнутом множестве С1, и пусть Х\ — произвольная точка множества <2. Тогда итерационная последовательность {хи}, определяемая рекуррентным соотношением (12.1.26),.
Дополнение 1 527 при любом а, удовлетворяющем неравенствам (12.1.25), сходится к точке Хо локального минимума функции {(х). Подчеркнем, что эта теорема дает алгорит отыскания любого (внутреннего или краевого) локального минимума функции }(х), являющейся сильно выпуклой на произвольном (не обязательно ограниченном) замкнутом выпуклом множестве. Доказательству основной теоремы предпошлем четыре леммы. Лемма 4. Если <3 — выпуклое замкнутое множество Ет, х — произвольная фиксированная точка Ет, а у — произвольная точка множества (2, то (х—Рч (х), у~Ря (ж)) < 0. (12.1.27) Доказательство. Предположим, что неравенство (12.1.27) несправедливо. Тогда существует точка у множества <Э такая, что {х—Р9(х), у—Рд(х))>0. (12.1.28) Из (12.1.28) сразу же вытекает, что точка у не совпадает с Ра(х). В силу выпуклости множества (2 любая точка г = Рд(х) + + 1(у—Р<з(л:)) отрезка, соединяющего точки Рд(х) и у, принадлежит множеству С. Вычислим расстояние между любой такой точкой г и точкой х: рЦг, х) = {х~Ря{х)-1{у-Ра{х)), х-Р<3{х)-1{у-Р<2{х)))^ = рЦх, Р9(х))-2Цх-Р9(х), у-Р<г(х))+^{у, Р9(х)). (12.1.29) Так как х и у фиксированы, а I — любое число из сегмента 0</<1, то в силу неравенства (12.1.28) мы можем взять I удовлетворяющим неравенству 2(х-Рц(х),у-Ря(х)) и<г< рЧу, Рц(х)) При таком выборе I -21 (х-Р0 (х), у-Ра (х)) + /у (У, ^<? (*)) <0, и мы получим из (12.1.29), что РЦг,х)<р2(х,Р0(х)). Последнее неравенство противоречит тому, что точка Р<з (х) является проекцией точки х на множество С}: у множества 0 нашлась точка г, удаленная от х меньше, чем Р(){х) от х. Полученное противоречие завершает доказательство леммы. Лемма 5. Пусть / (х) дифференцируема и выпукла на замкнутом выпуклом множестве С}. Если при некотором положительном а проекция Рд(х0—а§гас1/(хо)) точки х0—стегай/(хо) на
528 Гл. 12. Функции нескольких переменных множество С? совпадает с точкой х0 этого множества, то функция {(х) имеет в точке х0 локальный минимум. Доказательст во. Используя лемму 4, запишем неравенство (12.1.27) для точек х=х0—а§гаа/(хо) и у=х0+Ах, где Ах — любой вектор, для которого точка у — Хо+Ах принадлежит Р. В результате получим (х0—а дгад / (х0) — Р<? (х0—а §гай / (х0)), Хо+Ах—Рц (х0—а дгаа! / (х0))) <0. Учитывая, что Р<з(хо—а%гай}(хо))=Хо, получим из последнего неравенства следующее соотношение: (§таА}(х0), Дл:)>0. Это соотношение, справедливое для любого вектора Ах, для которого точка х0 + Ах принадлежит С}, в силу леммы 3 устанавливает, что функция }(х) име'ет в точке хо локальный минимум. Лемма 5 доказана. Предположим, что функция }(х) является сильно выпуклой на ограниченном замкнутом выпуклом множестве <Э. Обозначим через т минимальное значение /(х) на множестве С}, а через ц число, строго большее тп, так что ^ >т = тт 1{х). х€<Э Фиксируем число V, строго большее ц, и обозначим через С—подмножество тех точек х множества (?, для которых р<Т(х)<\. (12.1.30) Множество <5 как подмножество ограниченного множества С само является ограниченным. Убедимся в том, что множество «3 является замкнутым. Пусть {хк} — произвольная сходящаяся последовательность точек множества 0. Требуется доказать, что предел хо* этой последовательности также принадлежит множеству 4- Так как каждая точка хк принадлежит множеству 0, то для каждого номера к [К1(хк)<х. (12.1.31) Сильно выпуклая функция }(х) во всяком случае непрерывна на <3, а поэтому из сходимости последовательности {хк} к х0 в силу определения непрерывности функции по Гейне вытекает сходимость последовательности }(хк) к числу /(х0). Так как все элементы сходящейся числовой последовательности {(хк) удовлетворяют неравенствам (12.1.31), то и предел }(хо) этой последовательности удовлетворяет неравенствам ^</(х0)<у * Так как исходное множество ф является замкнутым, то предел х0 во всяком случае принадлежит (2.
. Дополнение 1 529- (см. гл. 3, следствие 2 из теоремы 3.13), а это и означает, что точка х0 принадлежит множеству <5, Доказательство замкнутости множества <5 завершено. Итак, множество 0 всех точек х из множества С}, для которых справедливы неравенства (12.1.30), является замкнутым и ограниченным. Докажем теперь следующую лемму. Лемма 6. Пусть функция /(дс) сильно выпукла на выпуклом замкнутом множестве С}, х — любая точка С}, а — любое положительное число, символ Ах обозначает разность Ах=Ро(х~а%га<1}(х))—х. (12.1.32). Тогда справедливо неравенство (§гас!/(х),Дх)< -|Д*|. (12.1.33) а Если же множеств® <Э, кроме того, ограничено и точка х принадлежит подмножеству 0 тех точек (2, для которых справедливы неравенства (12.1.30) при ц,>пнп/(х), то найдется строго' положительное число у такое, что справедливо неравенство |Д*|>?. (12.1.34> Доказательство. Докажем сначала неравенство (12.1.33). Фиксируем произвольную точку х множества С и, привлекая лемму 4, запишем неравенство (12.1.27), взяв в нем вместо х точку х—а§га<1/(х), а вместо у точку х. При этом получим неравенство (х—а дгас! / (л:) —Р<э (х—а §гас! / (х)), х—Рсг (х—а дгад /(*)))<0. которое с учетом обозначения Ах = Ро(х—адгайДх))—х перепишется в виде (—а^гасЩл:)—Ах, —Ах)<:0. Из последнего неравенства и из свойств скалярного произведения вытекает, что о(8гас1Ддс), Ах) + |Лх2|«:0, а это и приводит к неравенству (12.1.33). Остается доказать, что при дополнительном предположении о том, что (2 ограничено и что х принадлежит подмножеству О, существует у>0 такое, что справедливо неравенство (12.1.34).. Рассмотрим неотрицательную функцию точки х вида \Ах\=\Рс}(х-~аётай!(х))—х\. (12.1.35) Убедимся в том, что эта функция является непрерывной на множестве (2 функцией точки х.
530 Гл. 12. Функции нескольких переменных Докажем сначала, что векторная функция Р(]{х) является непрерывной функцией точки х. Для этого достаточно доказать неравенство Р<2(х+Ах)— Рц{х)\<\Ах\, (12.1.36) справедливое для любых векторов х и Ад:. В силу леммы 4 справедливы неравенства (х—РС}{х),Рс!(х+Ах)—Рс2(х))<0, (X + Ах—Рд {X + АХ") , Рд{х) —РЯ (х + Ах) ) < 0. Используя эти неравенства и неравенство Коши — Буняков- ского получим цепочку соотношений \Ра(х+Ах)— Рд(х)\2=(Рд(х+Ах)— Ра(х), Р<г(х+Ьх)—Р(1(х)) = (Р<}(х+Ах)—х, Ря(х+Ах)—Рд(х)) + + (х—Рц (х), Р9(х+Ах) —Ра (*))<. <{Ра{х+Ах)— х, Ро(х+Ах)—Рс}(х))=Р(2{х+Ах)—х—Ах, Рд(х+АхУ—Ра{х)) + (Ах,Ря(х+Ах)—Ра(х))<с <(Дх, Р<г{х+Ьх)—Р<г(х))<\Ах\\Р<,(х+Ьх)—Р<г(х)\, из которой и вытекает неравенство (12.1.36). Итак, доказано, что Р<}(х) является непрерывной векторной функцией точки х. Из сильной выпуклости ](х) на С} вытекает, что функция а&гадДд:) также является непрерывной на (2 векторной функцией точки х. Но тогда из теоремы о непрерывности сложной функции и непрерывности разности непрерывных функций вытекает, что и функция Р(* (х—« §га(1 / (х))—х является непрерывной на множестве <2 векторной функцией точки х. Модуль указанной векторной функции, т. е. скалярная функция (12.1.35) тем более является непрерывной на множестве ф, а потому и на его подмножестве <5. Итак, функция (12.1.35) непрерывна и неотрицательна всюду на замкнутом ограниченном множестве <5. В таком случае, по второй теореме Вейерштрасса (см. теорему 12.7) эта функция достигает на множестве (5 своего неотрицательного минимального значения у. Указанное минимальное значение у заведомо строго положительно, ибо если бы у равнялась нулю, то на множестве <3 нашлась бы точка х0 такая, что Ро(х0—а ^гааДлго))— —#о=0, а это означало бы в силу леммы 5, что в этой точке Хо множества <5 функция /(х) имеет единственный на множестве (? локальный минимум (в то время как этот минимум по определению (3 лежит вне (3). Итак, ■у>0, и неравенство (12.1.34) доказано.
Дополнение 1 531' Лемма 6 полностью доказана. Лемма 7. Пусть функция /(х) сильно выпукла на выпуклом замкнутом множестве (), х — любая точка С}, а — любое число, удовлетворяющее неравенствам (12.1.25), Ах — разность вида (12.1.32). Тогда при переходе из точки х в точку х*=; = Р<г(ла—а§гас1/(х)) значение функции {(х) не возрастает, причем * /(х)-/(х*) > (4г—у)|Д*12- (12.1.37) Если же множество ($, кроме того, ограничено и точка х принадлежит подмножеству <5 тех точек (2, для которых справедливо неравенство (12.1.30) при |х>тш/(д;), то неравенство» Х€С1 (12.1.37) переходит в неравенство / (х) - / {х*) >(±--у) V2, (12-1.38У где у>0 — постоянная из леммы 6. Доказательство. Достаточно для любой точки х множества (2 установить неравенство (12.1.37), ибо из этого неравенства и из неравенства (12.1.34) сразу вытекает и неравенство (12.1.38) (для точек х, принадлежащих <5, при условии, чта (2 ограничено). Сначала докажем неравенство (12.1.37) для случая, когда, точка х является внутренней точкой множества С}. Имея в виду,. что точка х* = Рс}{х—а§гас1/(х)) принадлежит множеству (3, на! котором функция /(х) сильно выпукла, выразим значение {(х*)- по формуле Тейлора с центром в точке х, взяв остаточный член #г(х*) в форме Лагранжа. При этом получим /(**) = Цх) + (§гао7(х), Дх)> -±-йа/(х + ОДх), (12.1.39)- где Дх=х*—х=Р,э(х—а&гас1/(х))—х, 0<9<1. Используя неравенство (12.1.33) и правое неравенств»- (12.1.14), мы получим из формулы Тейлора (12.1.39) /(х*)-/(х)< 1-\Ах\*+-Ь-\Ах\\ а 2 так что для случая внутренней точки х неравенство (12.1.37)* доказано. 1 д2 ^ ,-. * Из (13.1.25) вытекает, что —— — ,> «•
532 Гл. 12. Функции нескольких переменных Пусть теперь х является граничной точкой множества (?. По определению граничной точки * найдется последовательность {хп} внутренних точек множества <2, сходящихся к х. Для каждой точки хп по формуле Тейлора с центром в этой точке мы получим Д**)=/(*»)+(дгай/(*„), (х*—*„)) + + ^- а2Цхп + вп(х*-хп)1 (12.1.40) где 0<6П<1. Учитывая, что правое неравенство (12.1.14) справедливо для й21 в любой точке множества С? и что ^гад/(х) является непрерывной векторной функцией точки х на множестве С}, мы получим, что в .пределе при п— + оо из соотношения (12.1.40) вытекает справедливость неравенства (12.1.37) для граничной точки х множества <3. Лемма 7 доказана. Перейдем теперь непосредственно к доказательству основной теоремы. Сначала докажем основную теорему при дополнительном предположении о том, что замкнутое выпуклое множество (2 является также ограниченным. Возьмем произвольную точку хх множества <2 и составим итерационную последовательность {хн} точек, определяемых рекуррентным соотношением (12.1.26), при условии, что число а удовлетворяет неравенствам (12.1.25). Из леммы 7 (а точнее, из неравенства (12.1.37)) сразу же вытекает, что Пч)-1(хк+1) > (-^ —1-) |х*-**+1|я>о. Таким образом, последовательность {{(хк)} является невозрас- тающей. Так как, кроме того, эта последовательность ограничена снизу (минимальным значением т функции /(х) на множестве (2), то она является сходящейся (см. теорему 3.15 из гл. 3). Обозначим предел последовательности {Цхн)} через и.. Ясно, что [1>т, где т — минимальное значение {(х) на множестве С}. Кроме того, поскольку все члены невозрастающей сходящейся последовательности не меньше ее предела (см. замечание 3 к теореме 3.15, гл. 3), то для всех номеров к справедливо неравенство /(**)> ц. (12.1.41) Докажем, что для предела \х справедливо равенство ц = щ = гшп/(л:). *€С2 * Так как множество С} выпукло, то оно не может иметь изолированных граничных точек.
Дополнение 1 533 Предположим, что это равенство несправедливо, т. е. предположим, что ц>т. Тогда если обозначить через V максимальное значение /(х) на множестве (3, а через (3 подмножество тех точек (3, для которых справедливы неравенства (12.1.30), то в силу леммы 7 найдется строго положительная постоянная у такая, что справедливо неравенство (12.1.38), которое приводит к следующему неравенству: /(**)-/(*/Н-1)> (-^—^)У*>°> (12.1.42) справедливому для любого номера.к. Суммируя неравенства (12.1.42), записанное для номеров к, равных 1, 2, ..., п—1, мы получим, что для любого номера п или, что то же самое, /(*„)</(*1) - ("-1) (-^—г) V2' (12Л'43> Неравенства (12.1.43), справедливые для любого номера п, противоречат неравенству (12.1.41), ибо величина, стоящая в правой части (12.1.43), при достаточно большом номере п становится меньше числа ^. Полученное противоречие доказывает ошибочность предположения ц>т, т. е. доказывает что ц = т. Итак, доказано, что последовательность Цхк) сходится к минимальному значению т функции /(х) на множестве С. Остается доказать, что сама итерационная последовательность {хь} сходится к той точке хо, в которой это минимальное значение достигается *. Фиксируем произвольное положительное число е и обозначим через Сг открытый т-мерный шар радиуса е с центром в точке Хо. Далее обозначим через <5Е ту часть множества (?, которая не содержит точек шара Се. Ясно, что 0.г — замкнутое ограниченное множество, так что функция /(х) достигает (в силу второй теоремы Вейерштрасса) своего минимального на этом множестве значения, которое мы обозначим через тг. Можно утверждать, что те>т, ибо в противном случае нарушалось бы условие существования у функции /(х) на множестве (2 единственной точки локального минимума. Далее, можно утверждать, что на множестве <58 имеется лишь конечное число точек последовательности {хь\ (ибо последовательность {/(х*)}, у которой имеется бесконечное чис- * Нами уже доказано, что минимальное значение функции {(х) на множестве (Э достигается в единственной точке этого множества.
534 Гл. 12. Функции нескольких переменных ло элементов, удовлетворяющих неравенству }{хк)>>тг>т, не может сходиться к числу /и). Значит, мы доказали, что для любого е>0 найдется номер- N. начиная с которого все элементы последовательности {хк}- лежат в шаре СЕ радиуса е с центром в точке хо. Это и означает, что последовательность {хк} сходится к точке х0. Тем самым для случая ограниченного замкнутого выпуклого множества (2 основная теорема доказана. Пусть теперь (2 — неограниченное замкнутое выпуклое множество. Снова фиксируем произвольную точку х1 этогс- множества и составим итерационную последовательность (12.1.26) при условии, что число а удовлетворяет неравенствам (12.1.25). При доказательстве теоремы о существовании локального- минимума у сильно выпуклой функции (см. п. 2) мы установили, что точка хо локального минимума сильно выпуклой, функции }(х) на неограниченном замкнутом выпуклом множестве <3 лежит в той части <ЭЯ множества С, которая содержится в шаре Ся с центром в точке х\, радиус Я которого выбран из условия Там же установлено, что подмножество (2# множества <2 является ограниченным выпуклым замкнутым множеством и что всюду вне <Эд значения }(х) превосходят {(хг). Так как в силу леммы 7 (а точнее, в силу неравенства' (12.1.37)) последовательность {}(хк)} является невозрастающей» а за пределами (2« все значения 1{х) .превосходят /(#0, то все точки итерационной последовательности {хь} лежат в <3я, а потому для любого номера к Ра (хк — а §гас1 / {хк)) = РЯн (хк — а §гад / (хк)). Значит, итерационную последовательность (12.1.26) можно- заменить на хи-1 = РаК (хк — а §га(1 / (хк)), после чего все дальнейшие рассуждения сведутся к ограниченному замкнутому выпуклому множеству (2Й, т. е. к уже рассмотренному выше случаю. Основная теорема полностью доказана. Замечание 1. Особенно просто выглядит последовательность (12.1.26) для случая, когда множество (2 совпадает ее* всем пространством Ет. В этом случае для любой точки х справедливо равенство Р<з(х) =х, и потому рекуррентная формула (12.1.26) принимает вид хк+1 = хк—а%г&&1(хк).
Дополнение 2 535 ДОПОЛНЕНИЕ 2 Метрические, нормированные пространства В этом дополнении будут изложены важные понятия и факты общей топологии, которые часто употребляются в различных разделах математики. Читатель без труда обнаружит, что эти понятия и факты являются естественным обобщением ряда определений и утверждений, содержащихся в предыдущих главах. Метрические пространства 1. Определение метрического пространства. Примеры. Выше мы уже подчеркивали, что фундаментальную роль в анализе играет понятие предела. В основе этого понятия лежит определение расстояния между числами, т. е. абсолютная величина разности этих чисел. Поэтому представляется естественным ввести понятие расстояния уже не между двумя числами, а между двумя произвольными элементами некоторого абстрактного множества X. Ясно, что при этом это расстояние должно обобщать свойства расстояния между числами числовой оси. В связи с вышесказанным дадим следующее определение. Определение 1. На множестве X определена структура метрического п р о с т р а н с т в а, если задана функция р(х, у) двух произвольных элементов этого множества х и у, удовлетворяющая аксиомам: 1) р(х, у)=0 тогда и только тогда, когда х = у\ 2) р(х, у)=р(у, х) (аксиома симметрии); 3) р(х> У)<р(у, •г)+р(.г> х) (неравенство треугольника). Функция р(х, у) называется метрикой или функцией расстояния, число р(х, у) называется расстоянием между точками х и у множества X. Таким образом, метрическое пространство образуют множество X и функция расстояния р. Поэтому обозначается метрическое пространство обычно так: (X, р) или просто X, если ясно, о какой метрике идет речь. Если в аксиоме 3) положить х=у, то, учитывая 1), получается, что 0<р(г/, г), т. е. функция расстояния — неотрицательная функция своих аргументов. Приведем примеры наиболее часто встречающихся метрических пространств. Примеры. 1) Множество вещественных чисел превращается в метрическое пространство, если для любых чисел х, у положить р(х, у) = = \х—у\. Это метрическое пространство обычно обозначает-
536 Гл. 12. Функции нескольких переменных 2) Координатное я-мерное пространство Х=Ап, точки которого (или элементы множества X) •— упорядоченные наборы п чисел, х=(х\ хп), превращается в метрическое пространст- п во, если положить р(х, у) = ^ \х1— у,|2)1/2 , где х- 1=1 = {х1„...,хп), у—{у\, ..., уп); обозначается оно* через Еп — = (Х, р). Аксиомы 1) и 2) определения метрического пространства, как легко видеть, выполняются. Справедливость аксиомы 3) вытекает из неравенства Коши — Буняковского для сумм (см. § 5 гл. 9): Р2 (*, у) = Е I х{ - У[ 12= ^ К*' - 2<) + (2« - Л)]1 = 1=1 1=1 = ^ (х, - г,.)2 + 2 ]Г (х< - г,) (2< - у,) + 2 (г, - ^)»< 1=1 1=1 1 = 1 < 2 (*1 -2,)2 +2^; |Х, - 2С | 12| - «/! | + ^ (^ -&)*< »=1 1=1 1=1 <^(Х!-21)2+2(^ [х!-2;|2)1/2(У;|2!-«/1-|2),/2+^(2!-^)2 = 1=1 1 = 1 ' 1=1 1=1 = р2 (х, г) 4- 2р (х, г) р (г, у) + р2 (г, г/) = [р (х, г) + р (г, г/)]2. Таким образом, р(х, г/)«:р(х, 2)+р(г, у), и неравенство треугольника в этом случае установлено. Заметим, что выше мы применили неравенство Коши —Буняковского к сумме п п V \хс — 2; | |г< — Ус | = V а(Ь{, где положено 1 = 1 1 = 1 Щ=\Х1—2,-|, Ь,= |2,—У;|, 1=1 Л. На множестве X, элементами которого являются упорядоченные наборы я чисел х=(хь ..., х„), можно вводить и другие функции расстояния, например положить, что: Ро (*. У) = , Р(Х] У) , » х,у(=Х, а) 1+р(*. г/) , где функция р(х, г/) введена выше, в примере 2); или положить Р1 (•*>*/) = тах |х,- — */,-|; б) 1* 1<Л * Этим же символом Еп мы обозначим и евклидово пространство, состоящее из элементов произвольной природы и имеющее размерность п.
Дополнение 2 537 'Р»(*»0) = 5] \Х1—Ус\\ В) 1=1 . (1, если хфу, . Рз(х,у) = \' У г) I 0, если л: = у; Р4(^.у) = (р(А:,у),еслир(х'у)<1* д) I 1, если р (х, у) > 1, где функция р(х, у) определяется, как указано выше. Естественно, что при этом одно и то же множество X превращается в разные метрические пространства (X, р,), где 1 = 0, 1, % 3, 4. 3) Пусть У — множество непрерывных функций, заданных на сегменте [а, Ь]. Введем метрику, полагая что р(х, у) = = тах \х(()— у(1)\. Получившееся пространство представляем «ь ет собой-метрическое пространство. Оно обозначается через С[а,Ь]={У,р). Точно так же множество 2. п раз непрерывно дифференцируемых функций на сегменте [а, Ь], л>1, становится метрическим пространством, если ввести метрику по правилу: Р (*> У) = тах тах Iх({) (0 — У{1) (01 > где л:(0)(0=#(0> #(0>(0=У(0- Это пространство обозначается обычно так: Сп[а, Ъ]=(2, р), л>1. Пространство С[а, Ь] иногда обозначается символом С0[а, Ь]. 4) Пусть V — множество всех ограниченных последовательностей х=(хи ..., хп, ...) действительных чисел. Положим р (х, у) — зир |Хс — ус |. Справедливость аксиом 1)—3) метри- ческого пространства очевидна. Это пространство обозначается через т= (V, р). Заметим, что каждое подмножество Х0 метрического пространства (X, р), в свою очередь, является метрическим пространством с той же самой функцией расстояния р. Действительно, если аксиомы, определяющие метрику р, выполнены для любых х, у, ге1, то они выполнены и для х, у, г, принадлежащих Х0. Таким образом, каждое подмножество Еп — метрическое прост- п ранство с функцией р(х,у) = (У\ \х( — У;|2)1/2 . Точно так же 1=1 любое подмножество С„[а, Ь] — метрическое пространство, п — = 0,1,2,....
538 Гл. 12. Функции нескольких переменных Пара (Х0, р) называется подпространством пространства {X, р). Заметим также, что если р(д:, у) — функция расстояния » некотором метрическом пространстве, то по формулам а) или л,) примера 2) мы можем получить новую функцию расстояния. 2. Открытые и замкнутые множества. Шаром О (а, г) & Метрическом пространстве X (замкнутым шаром К {а, г)) с Центром в точке а и радиусом г называется совокупность всех точек х^Х таких, что р(х, а)<г(р(х, а)<.г). Определение 2. Множество ЕсХ называется от кр ы- т ы м в пространстве Х= (X, р), если вместе с каждой своей точкой х оно содержит и некоторый шар 0(х, г). 0 также назовем открытым. Определение 3. Окрестностью точки хе! называется любое открытое множество, содержащее х. Окрестностью некоторого подмножества X (быть может, самого X) называется любое открытое множество, содержащее' данное подмножество *. Окрестность точки х будем обозначать через 2*. Определение 4. Пусть множество УаХ, тогда точка- хеА' называется предельной точкой множества У, если' каждая окрестность точки х содержит по крайней мере одну точку множества У, отличную от х. Точка уеУ называется изолированной точкой множества У, если существует окрестность точки у, в которой нет точек У, отличных от у. Определение 5. Точка у, принадлежащая множеству У — подмножеству X, — называется внутренней, если она содержится в У вместе с некоторой своей окрестностью. Точки, внутренние для дополнения У в X, называются внешними по» отношению к У. Если точка не является ни внутренней, ни внешней по отношению к У, то она называется граничной для У. Множество граничных точек для У обозначается через дУ. Определение 6. Множество в метрическом пространстве' называется замкнутым, если его дополнение открыто. Справедливо следующее утверждение. Лемма 1. Сумма любого числа открытых множеств, пересечение любого конечного числа открытых множеств есть мно- * Шар О (а, г) в метрическом пространстве, очевидно, является открытым, множеством, а поэтому его также можно считать окрестностью точки а. То, что- шар О (а, г)—открытое множество, следует из того, что этот шар содержит любую свою точку х вместе с некоторым шаром 0(х, е), где 0<г<г—р(о, х). Действительно, если у^О(х, е), то р(а, г/)<р(а, х)+р(х, у)<р(а, х)+г— —р(а, х)=г, т. е. у^О(а, г), поэтому любая точка у^О(х, е) принадлежит также шару О (а, г). Следовательно, шар 0(х, е,)сО(а, г), и поэтому исходный шар О (а, г) — открытое множество (см. также пример 3) в конце настоящего раздела).
Дополнение 2 539 жество открытое, 0 и все метрическое пространство X открыты. Пересечение любого числа замкнутых множеств замкнуто, сумма любого конечного числа замкнутых множеств замкнута, 0 и X замкнуты. Доказательство. Пусть {2а} — семейство открытых в X множеств. Если х<^\] 2а, то существует ао такое, что а хе2ао следовательно, существует число г>0 такое, что О (х, г)с2ао, т. е. О (х, г) а \] 2а. Следовательно, [} 2 а " ОТ- а а * крытое множество. п Далее, если 2ь ..., 2П открыты в X, то из того, что хе ("| 2(-, 1=1 следует, что для любого 1=1, ..., п хеИь т. е. для любого 1 = = 1, ..., п существует такое л>0, что 0(х, г,)сг2г. Взяв т— гшп г,-, получаем, что для любого 1=1, ..., п 0(х,г)^0(х,гс), 0(х,г)а [) 2„ 1=1 т. е. пересечение множеств 2,-, 1=1, ..., п — открытое множество. Второе утверждение непосредственно следует из первого, ес- .ли воспользоваться принципом двойственности для множеств. Например, пусть {Ра} — семейство замкнутых в X множеств. Для каждого а введем в рассмотрение открытое множество 2а = Ра'*. Тогда (П Ра)' = У Р'а = и 2а, т. е. (П Ра)' ~ открытое а а а а ;множество, следовательно, П ^а замкнуто. То, что 0 и X одно- а временно открыты и замкнуты, очевидно **. Определение 7. Замыканием У множества У называется пересечение всех замкнутых множеств, содержащих У. Очевидно, что У содержится в каждом замкнутом множестве, содержащем У. Следовательно, замыкание множества У есть наименьшее из всех замкнутых множеств, содержащих У. Справедлива следующая лемма. Лемма 2. Операция замыкания в метрическом пространстве удовлетворяет следующим свойствам: 3) У=>У, 2) Т=У, 3) У[}2 = У[}2, 4) 0 = 0, Х = Х. Доказательство. Свойство 1) очевидно: если хеУ, то х принадлежит любому замкнутому множеству, содержащему У, ■следовательно, х принадлежит и пересечению этих замкнутых множеств, т. е. хеУ. * Напомним, что А' обозначает дополнение множества А. ** Мы по определению полагаем 0 открытым. Так как X, очевидно, открыто, то 0=Х' будет являться по определению 6 и замкнутым множеством. Аналогично Х=0' замкнуто.
540 Гл. 12. Функции нескольких переменных Свойство 2) вытекает из того, что У, будучи пересечением замкнутых множеств, является в силу леммы 1 замкнутым множеством. Докажем свойство 3), так как Ус=У|_)2, то каждое замкнутое множество, содержащее У[}2, содержит и У, следовательно, пересечение этих замкнутых множеств также содержит У, т. е. УаУ[}2, но У принадлежит любому замкнутому множеству, содержащему У, следовательно, У"с=УЦ2._ Аналогично ЪсУ\\Ъ. Таким образом, УЦ2СГУЦ2; обратно, У[}2 в силу леммы 1 замкнуто, следовательно, У\}2^>У\}2. Утверждение 4) означает, что 0 и X — замкнутые множества. Лемма полностью доказана. Попутно мы показали, что если множество АаВ, то ЛсгЯ. Дадим следующее определение. Определение 8. Пространство (X, р) называется связ- н ы м, если его нельзя представить в виде суммы двух непустых открытых непересекающихся подмножеств. Очевидно, что пространство связно тогда и только тогда, когда его нельзя представить в виде суммы двух непустых замкнутых непересекающихся множеств. Множество У, принадлежащее метрическому пространству X, связно, если У связно как подпространство в X. 3. Прямое произведение метрических пространств. Если №, рО, (Х2, рг)—два метрических пространства, то можно определить прямое произведение этих метрических пространств. Пусть Х = Х\ХХ2— прямое произведение множеств Х1 и Х2у т. е. множество всевозможных пар (х\, х2), где Х\^ХХ, х2^Х2. Метрику на множестве X можно ввести, например, по следующему правилу: Р(Х, У)-;[Р12(*1, 01) + Р8а(*2, (/2)]1/2, где х=(х1, х2), у=(уи #0. х^Хи уг(=У{, 1=1, 2. Пара (X, р), Х = Х\ХХ2, р — функция расстояния, введенная выше, является метрическим пространством и, по определению, называется прямым произведением метрических пространств (Х\, р1) и (Х2, р2). Если задана счетная последовательность метрических пространств (Хи рО, (Х2, рг),-- и через X обозначено прямое про- со изведение множеств Хи 1=1, 2,..., Х= П^'> т- е- х состоит 1 = 1 из элементов х= (XI, х2,...), Хг<=Хи то можно дать, например, следующее определение. Определение 9. Прямым произведением метрических пространств (Хи рО, {Х2, р2),... называется пара {X, р), где
Дополнение 2 541 /1-»-°° "■■ 2* 1 +рь(л Ук) + Рк{Ч'Ук) 1=1 *=1 х, у е X, яА, г/А е ХА, * = (х1г х2, ...), г/ = уг, у2, ...), 6=1,2, .... со Обозначается оно так: (X, р) = [~] (■^•» Р«)- 1=1 4. Всюду плотные и совершенные множества. Определение 10. Пусть А и В— два множества в метрическом пространстве (X, р). Множество А называется плотным в В, если А^эВ. Множество А называется всюду плотным в пространстве X, если А = Х. Пространства, в которых имеются счетные всюду плотные множества, называются сепарабельными. Рассмотренные выше примеры метрических пространств Е1', Еп, Сп[а, Ь], л>-0, являются примерами сепарабельных метрических пространств. Так, в Еп счетным всюду плотным множеством является множество точек, у которых все координаты — рациональные числа. В пространствах Сп[а, Ь], п>0, такими множествами являются множества многочленов с рациональными коэффициентами. Однако пространство пг есть пример несепарабельного пространства *. Если рассмотреть множество Е0 последовательно* стей, состоящих только из нулей и единиц, то мощность такого множества есть континуум. Убедимся в этом. Рассмотрим какое-либо число хе е [0, 1]. Разобьем сегмент [0,, 1] пополам. Возьмем в качестве первого элемента последовательности число 0, если х принадлежит левой половине, т. е. сегменту [0, 1/2], и число 1 — в противном случае. Тот из двух рассматриваемых сегментов, которому принадлежит х, обозначим [а.\, Ь\\. В качестве второго элемента последовательности возьмем 0, если х принадлежит левой половине сегмента [й\, Ь\], и 1—в противном случае. Продолжая эти рассуждения далее, мы поставим в соответствие рассматриваемому числу х вполне определенную последовательность из нулей и единиц. Если хфу, то в результате описанного процесса эти точки на некотором этапе станут принадлежать разным отрезкам, а поэтому и последовательности, им отвечающие, будут разные. Следовательно, множество всевозможных последовательностей из нулей и единиц есть множе- * См. пример 4 из п. 1.
"542 Гл. 12. Функции нескольких переменных ство мощности, не меньшей, чем континуум. Для наших целейР этого и достаточно *. Взаимные расстояния в пространстве т между двумя различ-^ ными элементами р и а множества ^0 есть величина, равная) единице. Следовательно, приблизите, сколь угодно близко каж! дый из этих элементов элементами счетного множества нельзя,;, так как множество шаров радиуса 1/3 с центрами в точках множества Е0 имеет мощность не менее континуума и эти шары не пересекаются. Поскольку Е0с:т, где т=(У, р), то и все пространство т несепарабельно. Множество А называется нигде не плотным в метрическом пространстве X, если любое открытое множество этого пространства содержит другое открытое множество, целиком свободное от точек множества А. Например, в пространстве С [0, 1] множество А функций вида у = пх2 (п — целые числа) нигде не плотно. Другой пример нигде не плотного множества на сегменте [0, 1] (рассматриваемом как метрическое пространство) дает так называемое канторово совершенное множество. Множество А точек метрического пространства называется совершенным, если оно замкнуто и если каждая точка множества А является его предельной точкой. Канторово совершенное множество на сегменте /= [0, 1] строится следующим образом. Из сегмента [0, 1] удаляется интервал (1/3, 2/3) и оставшееся множество — объединение двух сегментов [0, 1/3), [2/3, 1]—обозначается через 1\. Из этих двух сегментов, в свою очередь, удаляются их трети — интервалы (1/9, 2/9), (7/9, 8/9). Объединение оставшихся сегментов обозначим через /г. Продолжим этот процесс неограниченно. Очевидно, /=)/1=э ... =э/„:з ... и /„ есть объединение 2п сегментов, длина каждого из которых 3_п. 00 Множество К = (") 1п и называется множеством л=1 Кантора. Покажем, что К совершенно. То, что оно замкнуто, следует из построения и леммы 1; остается показать, что К не содержит изолированных точек. Пусть х^К, и пусть 2* — произвольная окрестность точки х, т. е. открытое множество. Тогда по определению открытого множества найдется интервал ах (шар с центром в точке х), содержащий точку х и принадлежащий 2Х. Пусть Ап-—тот сегмент множества /„, который содержит точку х. Если п достаточно большое, то Апаах. Обозначим через ап тот конец сегмента Ап, который не совпадает * На самом деле множество всевозможных последовательностей из нулей и единиц есть множество мощности континуум.
Дополнение 2 543"- с х. Очевидно, это следует из построения множества К, ап<=К. Следовательно, произвольная окрестность точки х-—множество- 2Ж —содержит точку апфх : ап<=Ап<^охс^1,х, т. е. точка х — предельная для множества К, я К совершенно. Докажем теперь, что множество К нигде не плотно на сегменте [0, 1], рассматриваемом как метрическое пространство с обычным евклидовым расстоянием. Поскольку любое открытое множество на сегменте содержит внутри себя интервал, то достаточно показать, что любой интервал (шар) содержит внутри себя другой интервал, свободный от точек, принадлежащих К. Пусть о — произвольный интервал сегмента [0, 1]. Если он не- содержит точек К, то построение в этом случае закончено. Если же имеется точка х^К и хеа, то мы можем выбрать, столь большое пг, что хеЛтс/т и Лтсо, т — натуральное.. Найдем интервал длины 3~(т+1) с центром в середине Ат. Этот- интервал не содержит точек К и содержится в о. Таким образом, нигде не плотность множества К на сегменте [0, 1] доказана. 5. Сходимость. Непрерывные отображения. Определение 11. Последовательность {ап} точек метрического пространства называется сходящейся к т о ч к е а * этого пространства, если любая окрестность точки а содержит все элементы, этой последовательности, за исключением конечного их числа. Если последовательность {ап} сходится к а, то- пишут ап-^~а при п-*°о или Ит ап = а. Я-» 00 Непосредственно из данного определения следует, что ап->" ->а, если р(а„, а)->-0, п-^-оо. Лемма 3. Точка а метрического пространства X принад-- лежит замыканию А некоторого множества А тогда и только- тогда, когда существует последовательность {ап} точек множе-- ства А, сходящаяся к а. Доказательство. Пусть а^А, тогда а принадлежит' каждому замкнутому множеству, содержащему А. Возьмем в качестве окрестности точки а шар О (а, 1/п), п — натуральное. В этом шаре имеется по крайней мере одна точка ап^А. Если1' бы это было не так, то а^А и существовала бы окрестность точки а, свободная от точек множества А. Дополнение до этой.^ окрестности было бы замкнутым множеством, содержащим множество А, и точка а не принадлежала бы этому замкнутому множеству. Таким образом, получилось противоречие условию* а(=А, следовательно, мы построили последовательность точек ап—>-а при п-*-оо, ап^А. Заметим, что данная последовательность {ап\ может оказаться стационарной, т. е. такой, что все ап = а. Верно и обратное: если ап-^-а и ап^А, то а^А. Для этого заметим, что если любая окрестность точки а пе—
544 Гл. 12. Функции нескольких переменных ресекается с А, то оеЛ. Действительно, если аеЛ, то аеЛ. Если аеА, то, допустив, что аеЛ, и взяв дополнение множества А, получим окрестность точки а — множество (Л)', не пересекающееся с А, т. е. получим противоречие. Доказательство леммы теперь завершается так. Нам дано, что ап-^а и апеЛ. Следовательно, любая окрестность точкц а содержит точки ап множества А. По сказанному а^А~, что и требовалось. Одновременно нами доказано следующее утверждение. Утверждение. Точка а принадлежит замыканию мно* жества А в том и только том случае, если каждая окрестности 2а точки а пересекается с А. В гл. 4 было подробно изучено понятие непрерывности функции числового аргумента. Оказывается, что это понятие допускает естественное обобщение на случай, когда задана уже не обычная функция числового аргумента, а отображение одного метрического пространства в другое. Введем понятие непрерывного отображения. Определение 12. Отображение § одного метрического пространства (X, р) в другое (Х0, р0) называется непрерывным в точке х, если для каждой окрестности ~%8(Х) точки 8(х) найдется такая окрестность 2Ж точки х, что §(Ех)с:2>е(х). Если § непрерывно в каждой точке пространства X, то такое отображение называется непрерывным на X. Справедлива следующая лемма. Лемма 4. Отображение §: Х-*~Х0 одного метрического пространства X в другое Х0 непрерывно на X тогда и только тогда, когда прообраз любого открытого множества открыт. Доказательство. Необходимость. Пусть §: Х^Х0 — непрерывное отображение X в Х0 и 20— открытое множество в Х0. Если 8~1(Т,0)={х^Х :#(х)е2о} = 0, то открытость §_1(2о) очевидна, так как 0 открыто. Пусть 8~1{2О)Ф0 и *е2=4Г,(2о)- Так как лкеейг'СЕо), то #(#)е2о, следовательно, 2о можно рассматривать как окрестность точки §(х). Ввиду того, что ^ — непрерывное отображение на X (а значит, и в точке х), найдется окрестность 2Х точки х такая, что ^(2ж)с:2о, т. е. 2жс=^г1(2о). Итак, для любой точки яе^р'^о) найдется окрестность 2Ж такая, что 2жсг с^гЧЕо). Поскольку 2 = [} Их, то множество 2 открыто как объеди- нение открытых множеств 2Ж. Таким образом, прообраз любого открытого множества открыт. Достаточность. Пусть дано, что при отображении § :Х-+Х0 прообраз любого открытого множества открыт. Возьмем любую точку д;б! и произвольную окрестность 2в(Х) ее образа в ^о- Тогда 21 = ^-1(28(Ж)) по условию —открытое множество в X,
Дополнение 2 545 т. е. является окрестностью точки х, причем образ 2Ж при отображении § содержится в 2в(ж). Следовательно, отображение 8 по определению непрерывно в точке х. Поскольку эти рассуждения применимы, для любой точна х^Х, то отображение Я непрерывно на X и лемма доказана. Учитывая, что шар является открытым -множеством и всякое открытое множество содержит любую свой? точку вместе с некоторым шаром, можно определение 12 непрерывности отображения §: Х^>-Х0 в точке х^Х переформулировать следующим образом. Определение 13. Отображение 8 одного метрического пространства (X, р) в другое (Х0, р0) называется непрерывным в точке х, если для любого числа ё>0 существует такое число 6>0, что если точка у принадлежит открытому шару 0(х, б) с центром в точке х радиуса 6, то точка 8(У) принадлежит открытому шару 0(§(х), е) с центром в точке д(х) радиуса е, лежащему в пространстве (Х0, ро). Последнее определение можно переформулировать также следующим образом: отображение 8: А'->Х0 непрерывно в точке х, если Н*п8(У) = ё(х), У-+Х Из неравенства треугольника легко заключаем, что функция расстояния р(дс, у) непрерывна в точке х при фиксированном у. На самом деле она является непрерывной функцией и по двум переменным *. В случае, если метрическое пространство X есть числовая ось с обычным расстоянием между числами, т. е. пространство Е1, а отображение §—обычная скалярная функция на Ех, данное определение 13 непрерывности, очевидно, совпадает с определениями гл. 4. Введем понятие гомеоморфизма. Определение 14. Отображение §:Х-*-Х0 метрического пространства X в метрическое пространство Х0 называется гомеоморфизмом, если § отображает X на Х0 взаимно однозначно и 8 непрерывно вместе с обратным отображением 8~1- 6. Компактность. Покрытием множества А в метрическом пространстве называется любое семейство открытых множеств, объединение которых содержит А. Определение 15. Метрическое пространство X назы- I вается компактным или компактом, если любое его по- * Функция р(х, у) определена на произведении ХхХ и отображает ХхХ в Е1. Функция р(х, у) непрерывна на произведении метрических пространств ХхХ. Ее непрерывность следует из неравенства четырехугольника; |р(*, г)—р(у, и)К|р(*, у)+р{г, и)\, которое получается из двух неравенств: р(дс, г)<р(ж, у)+р(у, г)<р(х, у)+р(у, и)+р(и, г), Р(У, «)<Р(«/. *)+р(и, хХр(#, х)+р(х, г)+р(г, и). 18 Зак. 72
546 Гл. 12. Функции нескольких переменных крытие содержит конечное подпокрытие, т. е. из всякого покрытия пространства X открытыми множествами можно выделить конечную систему, содержащую все пространство (подпокрытие). Сегмент [а, Ь] числовой оси является компактом, что вытекает из того факта, что из всякого покрытия этого сегмента открытыми множествами можно • выделить конечное подпокрытие. М&жно показать, что метрическое пространство компактно тогда и только тогда, когда из всякой последовательности его точек можно выделить подпоследовательность, сходящуюся к некоторой точке из этого пространства. Определение 16. Система подмножеств {Аа} множества называется центрированной, если любое конечное подсемейство этой системы имеет непустое пересечение. Справедливы следующие леммы. Лемма 5. Для того чтобы метрическое пространство X было компактным, необходимо и достаточно, чтобы каждая центрированная система замкнутых его подмножеств имела непустое пересечение. Доказательство. Пусть X компактно, и пусть {Ра} — центрированная система замкнутых подмножеств. Множества Сп=^\/Га открыты, и никакая конечная система из этих множеств Оп, 1^п^Ы<оо не покрывает X. Значит, поскольку X компактно, {Со} не могут служить покрытием компактного пространства X. В противном случае мы могли бы выбрать конечное подпокрытие X из системы {Оа}. Но если {Оа} не покрывает X, то (\Ра не пусто, так как [}Ра = П(-Х\С№) = Х\ \]Са. а а а а Обратно, пусть любая центрированная система замкнутых подмножеств из X имеет непустое пересечение. Пусть {Оа} — открытое покрытие X. Выберем из этого покрытия конечное подпокрытие. Положим /га=Х\Оа и заметим, что так как {Оа} покрывает все X, то {]Ра = 0. Следовательно, {Ра} не яв- ляется центрированной, т. е. существуют такие Р\, Ръ,...,Рм, м М<00, ЧТО Р) Рй = 0, НО ТОГДа {0,}Мг=1 ={Я\^г}Мг=1 — КОНвЧ- 1=1 ное подпокрытие покрытия {Оа}, что и требовалось доказать. Лемма 6. Замкнутое подмножество компактного метрического пространства компактно *. Доказательство. Пусть Р — замкнутое подмножество компактного метрического пространства X и {Е0}—некоторая I система открытых множеств — покрытие Р. К системе {2«} при- * Т. е. из всякого покрытия этого подмножества открытыми в данном пра- странстве множествами можно выделить конечное подпокрытие.
Дополнение 2 547 соединим открытое множество С=^\/7, и полученное покрытие всего пространства обозначим через {Еа1} = {?!,а}{)6. Выберем в силу компактности X из системы {2а1} конечное покрытие всего пространства — систему {2{1}^=1. Выбрасывая, если это необходимо, из системы {Ег-1}Лгг=1 множество С, мы получим конечное покрытие множества Р, выбранное из системы {2в}- Лемма доказана. Лемма 7. Образ компактного пространства X при непрерывном отображении — компактное множество. Доказательство. Пусть § — непрерывное отображение X в Х0. Пусть {2а}—покрытие §(Х)аХ0 открытыми множествами, а Чга=^_1{2а}. Множества Ч?а открыты (см. лемму 4), и {Фа} — покрытие §(Х). Выберем из этого покрытия в силу компактности X конечное подпокрытие: ("Р,-} **.•=!; тогда {2<}м/=ь М<оо,— покрытие Х0, 2,= ^(Чгг), » = 1, -, М, что и требовалось доказать. Лемма 8. Компактное подмножество метрического пространства X замкнуто *. Доказательство. Пусть Р— компактное подмножество, и пусть аеХХ/7; для любого х^Р существуют окрестности 2а и 2Ж точек а я х соответственно такие, что 2ОП2Ж=0. В качестве таких окрестностей можно, например, взять шары О (а, г) и 0(х, г), г = —р(а,х). Множество 0= {] %х— покрытие 3 хбГ множества Р. В силу компактности Р выберем из этого покрытия конечное подпокрытие: {2^)^=1 ■ Рассмотрим соответствующие 2*/ окрестности 2аг', которые по построению не пересека* N ются с 2*-» и П 2а — 2 является окрестностью точки а. Очевидно, что 2 02^.= 0, 1=1,...,Ы, и поэтому 2(1^ = 0. Следовательно, 2сг.Х\.Р, т. е. множество Х\Р открыто, а Р замкнуто. Лемма 9. Пусть §: Х-+Е1, где Е — действительная числовая ось. Если § — непрерывное отображение, а X — компакт, то § ограничено и достигает своих точных верхней и нижней граней. Доказательство. Пусть §(Х)—непрерывный образ компакта (компактного пространства). По лемме 7 подмножество §(Х) метрического пространства Ех компактно, следовательно, ограниченно и замкнуто (см. гл. 4, § 7, п. 3). Осталось заметить, что непустое ограниченное замкнутое множество чис- * Заметим, что в отличие от множеств числовой оси (или Еп) в случае общего метрического пространства ограниченность и замкнутость множества еще недостаточна для его компактности (ср. с гл. 4, § 7, п. 3). 18*
5 48 Гл. 12. Функции нескольких переменных ловой оси содержит точные верхнюю и нижнюю грани *. Лемыщ доказана. 7. Базис пространства. Введем понятие базиса. Определение 17. Система открытых множеств {2а} лег. рического пространства X называется базисом этого пространства, если всякое непустое открытое множество пространства X может быть получено как объединение некоторых 2а из множеств системы. Справедлива следующая лемма. Лемма 10. Для того чтобы система {2а} открытых множеств была базисом пространства X, необходимо и достаточно, чтобы для всякого открытого множества О и всякой точки ае еО нашлось бы такое множество 2а„ из данной системы, что аеБа„сгС. Доказательство. Допустим, что система {2а} —базис пространства. Тогда любое открытое множество С есть сумма некоторых из множеств {2а}. Поэтому для всякой точки аеО существует такое множество 2ао, что аеИ^сй и 2„0 принадлежит данной системе {2а}. Обратно, пусть выполнены условия, сформулированные в лемме. Тогда всякое открытое множество С пред ставимо в виде О = {] 2Ко, т. е. система {2„0}— базис пространства. Лемма доказана. Определение 18. Метрическое пространство X называется пространством со счетным базисом, если в нем существует хотя бы один базис, состоящий не более чем из счетного числа множеств. Пространства со счетным базисом называются также пространствами со второй аксиомой счетности. Лемма 11. Метрическое пространство X является пространством со счетным базисом тогда, когда в нем имеется счетное, всюду плотное множество. Обратно, если в пространстве имеется счетный базис, то в нем есть и счетное всюду плотное множество. Доказательство. Пусть А = {ап}°°п=1—счетное, всюду плотное множество в X. Всевозможные шары 0(а„, 1/т), где п, пг — всевозможные натуральные числа, образуют базис пространства, причем счетный. Обратно, если в X имеется счетный базис {2„}о0и=1, то, выбрав по точке апб2я, мы получаем множество Л = {ап}°°п=ь которое всюду плотно. Действительно, если бы АФ-Х, то открытое множество 0 = Х\А было бы не пустым и не содержало бы ни одной точки из Л = {ап}°°п=1, что невозможно, так как С — * См. также гл. 4, § 7, п. 3.
Дополнение 2 549 открытое множество и оно есть объединение некоторых из множеств системы {2П}, а а„е2п- Примеры. 1) Легко построить метрическое пространство (X, р) и замкнутые шары К\(х\, гх) и К2{х2, г2) такие, что Я\сг <=:К2, П>''2. Действительно, пусть (X, р) — метрическое пространство, состоящее из всех точек {*, у} замкнутого круга на плоскости ху:Х^{х, у: л;2+г/2^9} с обычной евклидовой метрикой р. Шар К2 определим так: /С2=(Х, р). Пусть шар К1 = К2Г\{х, у: ■ (х—2)?+г/2<16}. Тогда /С,сЯ2, г, =4, г2 = 3, г,>г2. 2) Множество Л метрического пространства замкнуто тогда и только_тогда, когда оно совпадает со своим замыканием А, т. е. А = А. Действительно, если А=А, то, так как замыкание любого множества замкнуто (как пересечение замкнутых), А — замкнуто. Обратно, А принадлежит любому замкнутому множеству, содержащему А; одним из таких замкнутых множеств является в данном случае само Л,_т. е. АаА. С другой стороны, по определению замыкания Лс=Л, т. е. если Л замкнуто, то А=А. 3) Шар О(хо, г), как уже говорилось выше, в метрическом пространстве X — открытое множество. (Если х^.О(х, г), т. е. р(х, хо)<г, то шар 0(х, е) при 0<е<г — р{х0, х) будет принадлежать исходному множеству: 0(х, г)с^О(хо, г). Действительно, если уеО(х, е), т. е. р(х, у)<г, то р(*о, #)<р(*о, х)+р{х, у)<р(х0, х)+г — р(х0, х)=г.) Аналогично замкнутый шар — множество К (х, г) = {у : р (х, г/)^ 5^/"}—замкнутое множество в X. Это следует из того, что его дополнение есть множество открытое. 4) Замыкание А множества Л метрического пространства состоит из всех точек, которые являются либо предельными точками множества Л, либо элементами Л *. Действительно, всякое множество содержится в своем замыкании: АаА. Докажем, что замыкание Л содержит и предельные точки для Л. В самом деле, замыкание множества — множество замкнутое, а если множество замкнуто, то оно содержит все свои предельные точки: если- точка не принадлежит замкнутому множеству, то она принадлежит его дополнению, которое и является окрестностью этой точки, свободной от точек замкнутого множества, т. е. точка не является предельной для замкнутого I множества. Иными словами, А содержит все свои предельные * Это утверждение остается справедливым, а доказательство полностью сохраняется и для топологических пространств, которые будут рассмотрены в следующем разделе. Заметим также, что предельная точка множества А может оказаться элементом множества А.
550 Гл. 12. Функции нескольких переменных точки; так как Л<=Л, то А содержит и все предельные точки множества А. Таким образом, замыкание А содержит точки множества Ли точки, предельные для А. Обратно, пусть леей, покажем, что тогда либо л; — предельная для А, либо хбЛ. Действительно, если дсеЛ и х^А, то все доказано. Если же х&А, но х^А, то х—Предельная для А. В самом деле, допустим противное, тогда существует окрестность точки х — 2Ж, свободная от точек множества А. Ее дополнение — замкнутое множество, содержащее Л и не содержащее х, т. е. точка х^Л, что невозможно. 5) В метрическом пространстве (X, р) можно построить открытый шар 0(х, г)={у :р(х, у)<г) и замкнутый шар К(х, г)={у:р(х, у)^г) с общим центром и равными радиусами такие, что 0(х, г)ФК(х, г). Действительно, пусть X— множество, состоящее более чем из одной точки, и пусть , . (1, если хфу, 9{х,у) = \ \ О, если х — у, тогда К(х, 1)=А", 0(х, \)=х, б(х, \)=хфК{х, 1). Свойства метрических пространств В предыдущем разделе были изложены основные свойства метрических пространств, базирующиеся на понятии открытого и замкнутого множеств. Следует подчеркнуть, что фактически все утверждения предыдущего раздела используют только свойства открытых множеств — то, что сумма любого числа и пересечение конечного числа открытых множеств есть множество открытое, все пространство и пустое множество открыты, и не используют такие понятия, как шар, расстояние. Все это наводит на мысль, что можно строить пространства, в которых открытые (замкнутые) множества определяются аксиоматически с сохранением свойств, сформулированных в лемме 1. Тогда надобность в определениях 1 и 2 отпадает, а утверждение леммы 1 станет аксиомой. Именно так мы и поступим в следующем разделе, когда будем изучать топологические пространства. Ясно, что при этом будет достигнуто полное единообразие в изучении основных свойств метрических и топологических пространств. Такой подход к изучению свойств метрических пространств (формулировки и доказательства, использующие только свойства открытых (замкнутых) множеств) обладает, конечно, рядом преимуществ — например, допускает обобщения на классы более общих пространств. Вместе с тем, поскольку в структуру метрического пространства введена функция расстояния, эти пространства должны обладать и своими, присущими" только
Дополнение 2 551 им свойствами. Более того, чаще всего именно эти свойства и изучаются при рассмотрении метрических пространств. В настоящем разделе мы и изложим эти фундаментальные свойства метрических пространств. Все они используют понятие полноты пространства. Определение 1. Последовательность {хп} элементов метрического пространства (X, р) называется фундаментальной, если для любого числа е>0 существует такое натуральное число Ы, что для любых п, пг>Ы выполняется неравенство р(хп, хт)<е. Определение 2. Метрическое пространство (X, р) называется полным, если в нем всякая фундаментальная последовательность сходится к некоторому пределу, являющемуся элементом этого пространства. Заметим, что, как мы уже говорили, если последовательность {хп} сходится к элементу х, то р(х, хп)^-0 при я-»-оо *. Теорема (принцип вложенных шаров). Для того чтобы метрическое пространство было полным, необходимо и достаточно, чтобы в нем всякая последовательность замкнутых вложенных друг в друга шаров, радиусы которых стремятся к нулю, имела непустое пересечение. Доказательство. Необходимость. Пусть (X, р) — полное метрическое пространство, а К\{х\, г1)=э/С2(л:2, г2)=э...— вложенные друг в друга замкнутые шары. Последовательность их центров фундаментальна, так как р(хп, хт)<гп, т>п, а /"п-*-0, л->оо. Поскольку пространство X полное, то существует элемент х со пространства X такой, что х = Игл хп. Очевидно, что хе (~| Кп- Действительно, х — предельная точка для каждого Кп (см. определение 4 п. 1) ввиду того, что при т>я *те/(тс:/Сп, а так как Кп— замкнутое множество, то х^Кп (см. пример 4 с. 549). Достаточность. Пусть выполнены условия теоремы относительно шаров. Докажем, что пространство X полное. Мы должны показать, что если {хп} — фундаментальная последовательность, то она имеет предел д:еХ. Выберем точку ХП1 такую, что р{хп,хп,)< 1/2, п>пх. Примем *„, за центр замкнутого шара радиуса 1, который обозначим через К(хп^ 1)- Выберем, далее, точку х„г из последовательности {хп}, удовлетворяющую следующим условиям: р(хП1, #я2) < 1/2а для любого п>п2, п2>Щ. Примем точку хПг за центр шара К(хП2, 1/2) радиуса 1/2. Пусть хП1,хп„-..,х„к (щ<п2,... <пк) уже выбраны, * Очевидно, что любая сходящаяся последовательность является фундаментальной.
552 Гл. 12. Функции нескольких переменных тогда Хпк+1 выберем так, чтобы выполнялись условия: р(хп,хпк+1)< 1/2к+1 для любого п>пк+1, пк+1>пк. Как и выше, примем хп за центр замкнутого шара К(х„ , 1/2*) ра- диуса 1/2*4 и т. д. Мы получили-последовательность вложенных друг в друга замкнутых шаров, радиусы которых стремятся к нулю. По предположению существует точка х, общая для всех шаров. Ясно, что р(хпк,'Х)-*-0,пк-^оо, т. е. фундаментальная последовательность {хп} содержит последовательность {хпк}, сходящуюся к некоторой точке х пространства. Тогда и сама последовательность сходится к этому же пределу. Действительно, применяя свойство треугольника для функции расстояния (см. определение 1 п. 1), имеем Р (*„. х)< р {х„к, х) + р {хп, хПк)-+ О, пк, п -» оо. Таким образом, Ншд;п = хеХ. Теорема доказана. Замечание. В условиях теоремы все условия являются существенными: полнота пространства, замкнутость шаров, условие того, что они вложены, стремление их радиусов к нулю. Наименее очевидным является необходимость последнего условия. Вот пример полного метрического пространства и последовательности вложенных друг в друга замкнутых шаров, имеющих пустое пересечение. Пусть Х=(Ы, р), где N — множество натуральных чисел, а р {т, п) 11 —I , если пфт, т-\-п О, если п = т. Пусть К[п,1 + —)={т:р{т,п)<1+ 1/2л}, п = 1,2. Тогда очевидно, что К (п, 1 -\ ) замкнуты и вложены друг в друга, а пространство полно, поскольку каждая фундаментальная последовательность сходится в пространстве (она является, как говорят, «стационарной»). Однако пересечение указанных шаров, очевидно, пусто. Определение 3. Множество М, расположенное в метрическом пространстве X, называется множеством первой категории, если его можно представить в виде объединения счетного числа нигде не плотных в X множеств. Все остальные множества называются множествами второй категории. Теорема (теорема о категориях). Пусть (X, р) — непустое полное метрическое пространство, тогда X — множест'
Дополнение 2 553 во второй категории, т. е. X нельзя представить в виде объединения счетного числа нигде не плотных множеств. Доказательство. Предположим противное, что X = со = у Ап и каждое из множеств Ап, я=1, 2,..., нигде не ШГОТ- но в X. Пусть Ко — некоторый замкнутый шар радиуса единица. Поскольку множество А\ нигде не плотно, то существует замкнутый шар К\ радиуса меньше 1/2 такой, что К\<^Ко и К\[\А\ = 0. Поскольку множество А2 нигде не плотно, то точно так же существует замкнутый шар /С2 радиуса меньше 1/22* принадлежащий К\, для которого /С2(1Л2=0 и т. д. В результате мы получаем последовательность вложенных друг в друга замкнутых шаров {К.п}°°п=и радиусы которых стремятся к нулю. По предыдущей теореме существует х^.Кп_Для любого п, х^Х. Так как по построению Кп(]Ап = 0, то х^Ап для лю- бого п. Следовательно, л;е у Ап = Х.Это противоречит пред- п=1 со положению: X = у Ап. Теорема доказана. Определение 4. Отображение § метрического пространства X в это же пространство называется сжимающим, если существует такое число 0<а<1, что р(ё(х),8(у)Х<*р(х,у).* Теорема (принцип сжимающих отображений. Всякое сжимающее отображение полного метрического пространства (X, р) в это же пространство имеет и при том только одну неподвижную точку хе1, т. е. такую точку хеХ, что §(х) =х. Доказательство. Пусть хо — некоторая точка из X. Определим последовательность {*п}°°71=1 по правилу: Х1=8(х0), х2=8(х1),.... Последовательность {хп} фундаментальна в X. Действительно, если пг>п, то р(Хп, Хт).=р{8{Хп-1), 8(Хт-1))^ар(хп-1, *т-1)< <....апр(х0, )<а"{р(д;о> *1) + р(*ь х2) + + ...+р(^т-п-ь хт-п)}<апр(х0, Х1){1+а+ ... +а"-"-1}< <аир(*0) ДГ1) - (1 — а)-1, где а<1. * Отсюда следует, что сжимающее отображение § непрерывно, т. е. 1;т 8(У)=В(х).
554 Гл. 12. Функции нескольких переменных Таким образом, р(хп, хто)->-0, т,п-+оо. В силу полноты пространства X существует Пт хп. Пусть х=\\тхп. Тогда в силу непрерывности отображения 8 имеем §(х) = \\т§(хп) = Птхп+1=х. Итак, неподвижная точка существует. Докажем ее единственность. Если §(х)=х и 8(у)=У, то р(*, у)<ар(х, у), т. е. р(дг, у)=0 и х=у. Замечание. Если отображение 8 метрического пространства X в себя обладает лишь тем свойством, что р(ё(х), ё(у))<р(х, у) при хфу, то неподвижной точки может и не быть. Вот соответствующий пример: пусть Х= (Р, р), где Р= = [1, оо), а р — обычная евклидова метрика. Пусть §{х) = =х+—. Тогда р(ё(х),§(у))= х+- у -<\х — у\. х х у Однако неподвижной точки нет: § (х) = х-\ Ф х ни для X какого х^Х. О пред еление 5. Будем говорить, что два отображения § и §1 метрического пространства (X, р) в это же пространство коммутируют, если для любого х^Х справедливо равенство 8(81(х))=*81(8(х)). Теорема (обобщение принципа сжатых отображений). Пусть §\ и §2 — отображения полного метрического пространства (X, р) в это же пространство. Тогда, если отображение §1 сжимающее и отображения § и §1 коммутируют, то уравнение §(х)=х имеет решение д;еХ Доказательство. По предыдущей теореме существует и притом только одна точка х^Х такая, что ^1 (д:) =л:. Применим к обеим частям равенства отображение §. Воспользовавшись тем, что отображения коммутируют, получим 8{81{х))=В{*).. 8Л8{х))=8{х), 8\{у)=У, где у=§(х). Учитывая, что отображение #1 сжимающее и неподвижная точка у этого отображения одна, получим, что х= — У—8(х). Следовательно, и у отображения 8 существует неподвижная точка, а именно найденная выше точка х. Замечание. Степенью п отображения я называется отображение 8п< полученное в результате п последовательных применений отображения &: 8п(х)=8(8(...§(х)) ...), х<=Х. Из предыдущей теоремы в силу того, что отображения 8 и §п коммутируют, следует, что если отображение 8 таково, что не-
Дополнение 2 555 которая степень л его — сжимающее отображение, то уравнение §(х)=х имеет единственное решение*. Примеры. 1) Нахождение корней функции. Пусть <р(0>- а^^Ь — действительная функция, удовлетворяющая условию Липшица: 1<р('1)-<р('2)|<е|*,-*2|, о<е<1, и отображающая сегмент [а, Ь] в себя. Если ввести метрическое пространство (X, р), где Х= [а, Ь), а р — обычная евклидова метрика на сегменте, то отображение <рв! сжимающее, и потому числовая последовательность и, ^1=ф(^о), ^2=Ф>(^)> — сходится к единственному корню уравнения ((>(^)=^ для любого А)^ [а, Ь]. Отображение ф сжимающее, если, например, |ф'(/)|<6<1, *е=[а, Ь]. Пусть нам надо решить уравнение вида Р(1)=0, причем РЦ) действительная, определенная на [а, Ь], функция, Р(а)< <0, Р(Ь)>0, 0<9|<Р(/)<62 при *е=[а, Ь]. Тогда, если рассмотреть функцию ц)(^)=^— ЪР((), Х^Е* и найти корень уравнения ^)(^)=^, то мы решим исходную задачу. К этому последнему уравнению можно применить предыдущие рассуждения^ если, например |<р'(*) |<!в<1. Имеем 1—А92^ф'(0^==1—^1- Нетрудно подобрать действительное число Х>0, чтобы было- выполнено условие: 0^ф'(^)^9<1. Тогда, как нетрудно убедиться, функция ф(0 отображает сегмент [а, Ь] в себя. Действительно, так как ф'(0->0, то ф(0 не убывает, следовательно, ф(а)^ф(0^ф(^) ДЛЯ любого I из сегмента [а, Ь]. Но* ф(а)=а — КР(а)>а, у(Ь)=Ь — 'кР(Ь)<Ь, т. е. а<ф(0<Ь для: любого ?е [а, Ь]. 2) Нахождение решений систем уравнений вида у—Ах-\-Ь„. п Пусть г/; == 2^ а,цХ/ + Ь, 1= 1,..., п — отображение л-мерного про- странства в себя: набор (хи Х2,...,хп) переходит в набор (*/ь У2,—,Уп)^Х, т. е. отображение д(х)=Ах+Ь переводит набор» из я чисел в набор из л чисел. Здесь х, Ь, §(х)=у—векторы,, А — матрица, А = {ац}п{, ,=\. Если отображение §(х) будет в некотором метрическом пространстве и при некоторых условиях сжимающим, то векторное уравнение §{х)=х будет иметь по предыдущему одно и только* одно решение. Найдем такие условия на отображении § и введем метрику на множестве X, т. е. образуем соответствующие метрические пространства: * Единственность решения следует из того факта, что всякая точка, неподвижная относительно отображения §, будет неподвижной и относительно отображения §п.
556 Гл. 12. Функции нескольких переменных А) Пусть р1(х, у) = тах |х,— ус\ и х, у^Х. Тогда 1<1<П л Р1 (У', У") < тах V \ щ, | Р1 (х', х"), *', х", у', у"^Х, у' = Ах' + Ь, у" = Ах" + Ь, и условие того, что отображение ^ сжимающее, будет выполнено, если п ^ |а,7|<а< 1, » = 1, 2, ..., п. /=1 Б) Если ввести метрику на X по правилу п рЛх> у) = 2 I**—иI. 1 = 1 то, как нетрудно вычислить, условие того, что отображение сжимающее, будет иметь вид 1=1 В) Наконец, если метрика задана так: Р(х, У) = [% \х<-У1\^'\ 1 = 1 то отображение ё сжимающее, если ^ |а</|»<а<1. .',/=1 Выписанные условия достаточны, для того чтобы уравнение &(х)=л: имело и притом единственное решение или, что то же п самое, чтобы система Х[ — ^ ацХ/ + Ь1г 1=1, 2,...,п, имела и /=' притом одно решение. 3) Существование и единственность решения обыкновенного дифференциального уравнения первого порядка. Рассмотрим так называемую задачу Коши. Надлежит найти такую дифференцируемую функцию у(0, которая удовлетворяла бы уравнению у' = 1(1>У) и при ^ = ^о имела заданное значение у{1о)=Уо, где уо — некоторое число; при этом надлежит доказать, йто при определенных условиях такое решение уЦ) только одно.
Дополнение 2 557 Предположим, что функция 1(1, у) непрерывна на множестве: а^^Ь, —оо<г/<оо и удовлетворяет с константой К условию Липшица по у, т. е. Для всех точек ^е [а, Ь] на уо—кь У2)\<к\у]—у2\, и пусть ^о — внутренняя точка сегмента [а, Ь]. Легко убедиться, что решение задачи Коши эквивалентно решению интегрального уравнения у(0==Уо + \ НЬ У (!))$;• Значит, задано отобрано жение множества функций {у} по правилу: §(у) = Уо + + р(Б, у{1))й1. Введем пространство С[а, Ь]. Тогда отобрало жение § определено на этом пространстве и отображает его в себя, а задача о нахождении решения интегрального уравнения сводится к нахождению неподвижной точки отображения § — нахождению функции у такой, что §(у)=у. Для того чтобы такая точка существовала и была одна, достаточно, чтобы отображение § было сжимающее. Поскольку из условия Липшица следует, что \Н*. У1) -Ш, У2)\<К\У1-У»\<КР{УЬ У2), то < Р{В(У)> §(*))< тах [#р(у, г)<%<К(Ь—а)р'(у, г). *0 Здесь р — метрика в С [а, Ь]. Следовательно, отображение сжимающее, если сегмент [а, Ь] достаточно мал, так что К{Ъ — а)=6<1. При этих условиях мы получаем теорему существования и единственности решения задачи Коши на сегменте [а, Ь], содержащем точку 1о. 4) Оператор Вольтерра, свойства его п-й степени. Покажем, что некоторая степень отображения, задаваемого интеграль- | ным оператором Вольтерра, имеющим вид I $(/)=ь|/с(мжа^+Ф(о, а где X— некоторое число, К(1, |), <р(0—непрерывные функции своих аргументов, представляет собой сжимающее отображение в С [а, Ь], а</<Ь, а<^<&. Пусть М= тах |К(/, 1)1, Р(П, /,)= тах |/1(/)-/.(0|.
558 Гл. 12. Функции нескольких переменных Тогда а <ЩМ(Ь-а)Р(!1, /,). Отсюда 1гП(/1)-^(/2)1<1^Г^П-~^-р(/1. /■)• п\ Всегда можно выбрать такое п, что—| * -< 1, и, следо- л! вательно, при этом п отображение §п будет сжимающим. Согласно замечанию после предыдущей теоремы интегральное уравнение вида §(})=} имеет при любом % решение, и притом единственное. Топологические пространства В настоящем разделе будут рассмотрены основные свойства топологических пространств. Материал данного раздела вполне аналогичен изложенному в разделе о метрических пространствах, и поэтому мы повторим лишь основные определения, а доказательства некоторых теорем, поскольку они являются дословным повторением соответствующих доказательств в разделе о метрических пространствах, опустим. Подробнее мы остановимся лишь на специфических особенностях топологических пространств. 1. Определение топологического пространства. Хаусдорфово топологическое пространство. Примеры. Определение 1. Говорят, что на множестве X определена структура топологического пространства» если задана система {2} его подмножеств, обладающая свойствами: 1) само множество X и пустое множество 0 принадлежат {2}; 2) сумма любого числа множеств системы {2} и пересечение любого конечного числа множеств системы. {2} принадлежат {2}. Система {2}, удовлетворяющая условиям 1)—2), называется топологией на множестве X, а составляющие ее множества — открытыми в этой топологии *. Таким образом, пара, состоящая из множества X и топологии {2}, является топологическим пространством, которое иногда удобно обозначать через (X, 2). * Множество, являющееся дополнением к открытому, называется . з а м к н у - т ы м в топологическом пространстве.
Дополнение 2 559 Определение 1 выделяет весьма общий класс пространств. Обычно этот класс несколько сужают, добавляя к свойствам 1) и 2) так называемые аксиомы отделимости. Из этих аксиом мы рассмотрим наиболее часто используемые. ■ Аксиома Т2 (Хау сдор ф а): для любых различных точек х и у, принадлежащих множеству X, существуют такое множество 2Ж, содержащее точку х, и множество 1>у, содержащее точку у, такие что они оба принадлежат системе {2} и не пересекаются, т. е. 2жП2у=0. Топологические пространства, удовлетворяющие аксиоме Т2 (аксиоме Хаусдорфа), называются хаусдорфовыми. Аксиома Т\: для любых двух различных точек х и у, принадлежащих множеству X, существует множество Еж, принадлежащее системе {2}, содержащее точку х и не содержащее точку у, а также существует множество Ъу из системы {2}, содержащее точку у и не содержащее точку х. Топологические пространства, удовлетворяющие аксиоме Ти называются 7\-п р о с т р а н с т в а м и. Ясно, что если выполнена аксиома Т2, то аксиома Т\ выполнена, т. е. класс топологических пространств, удовлетворяющих аксиомам 1), 2), Т2, более узкий, чем класс топологических пространств, удовлетворяющих аксиомам 1), 2), Гь Примером пространства, удовлетворяющего аксиомам 1), 2), Т\ и не удовлетворяющего аксиомам 1), 2), Т2, является следующее топологическое пространство. Множество X состоит из точек отрезка [0, 1], а открытыми считаются следующие множества: X, 0, 2а;г = [0, 1]\{ап}, где {а„} — произвольное, не более чем счетное множество отрезка [0, 1]. Очевидно, что аксиомы 1), 2), Т{ выполнены. Однако аксиома Т2 не выполняется. Не всякое топологическое пространство удовлетворяет аксиоме Т\. Вот традиционный пример. Множество Х = {а, Ь} состоит из двух точек. Топологию зададим открытыми множествами, к которым отнесем все X, пустое множество 0 и точку Ь. Аксиомы 1) и 2) выполнены, а аксиома Т\ — нет. Приведем наиболее часто встречающиеся примеры топологических пространств. Примеры. 1) Рассмотрим произвольное метрическое пространство (X, р). Открытые множества в силу леммы 1 раздела о метрических пространствах удовлетворяют свойствам 1) и 2) определения 1 топологического пространства. Аксиома Т2 (Хаусдорфа) также выполняется в метрическом пространстве: если хФу, то р(*, у) =а>0 и шары О (х, -~Л, О (у, -|-]— открытые множества в (X, р), такие что О (х, -—) П О (у, —1 = 0.
560 Гл. 12. Функции нескольких переменных Таким образом, всякое метрическое пространство (X, р) яз- ляется и хаудорфовым топологическим пространством (А*, Б), где {2} — система открытых множеств в (X, р). 2) Рассмотрим множество X произвольной природы. Отнесем к системе {Б} только все множество X и пустое множество 0. Аксиомы 1), 2), очевидно, выполнены. Однако аксиомы 7\ и Гг не выполнены. Такая топология называется антидискретной. 3) Пусть X — произвольное множество. Отнесем к системе {Б} все подмножества множества X. Легко проверить, что {2} — хаусдорфова топология. Такая топология называется дискретной. Дадим следующее определение. Определение 2. Окрестностью точки х, принадлежащей топологическому пространству (X, Б), называется любое открытое множество, содержащее точку х. Окрестностью некоторого подмножества X (быть может, самого X) называется любое открытое множество, содержащее данное подмножество (или X). Окрестность точки х будем обозначать Бх. Предположим, что для каждой точки х, принадлежащей топологическому пространству _ (X, Б) среди всех окрестностей этой точки выделены некоторые, причем так, что какова бы ни была точка х и ее произвольная окрестность Б*, существует окрестность Б»1 точки х из выделенной системы, что х^2х1<^ с=Бх. Определение 3. Система выделенных окрестностей {Бх1} называется определяющей системой окрестностей данного топологического пространства*. Справедлива следующая лемма, которая дает удобный способ задания топологии. Лемма 1. Пусть X — произвольное множество. Для каждой точки х определим некоторые подмножества Бж, называемые «окрестностями» точки х и удовлетворяющие условиям: а) каждая точка имеет хотя бы одну свою «окрестность» и принадлежит любой своей «окрестности»; б) пересечение двух «окрестностей» точки содержит некоторую «окрестность» этой же точки; в) какова бы ни была «окрестность» Бж точки хеХ и точка г/еБж, существует «окрестность» Би точки у такая, что Еус=Бж; Тогда если отнести к системе {Б} всевозможные «окрестности» Бх точек х^Х, их всевозможные объединения и пустое множество, то будет задана топология на множестве X и (X, Б) — топологическое пространство, в котором система всех * Если х фиксировано, то система {Е*1} называется определяющей. системой окрестностей данной точки х.
Дополнение 2 561 «окрестностей» является определяющей системой. Обратно, всякое топологическое пространство может быть получено таким способом. Доказательство. Проверим выполнение аксиом 1)—2) топологического пространства. То, что все X принадлежит {2},. очевидно, 0 отнесено к {2} по условию. Аксиома 1) выполнена. Для проверки аксиомы 2) надо убедиться лишь в том, что. 21Г)22е{Е}, если 21^(2}, 22е{2}. Следовательно, надо установить, что 2]П22 может быть получено как объединение некоторых «окрестностей», т. е. надо убедиться, что для любой точки хе21П22 существует «окрестность» 2жс21П22. Но 21 и 22 принадлежат {2}, поэтому имеются «окрестности» 2а;1с:21 и 2*2сг с:22 — их пересечение содержит по условию б) некоторую^ «окрестность» 2,; точки х, которая содержится, очевидно, в, 2,П22. Обратно, если задано топологическое пространство {X, 2)„ то в качестве «окрестности» точки х, удовлетворяющей условиям а)—в), можно взять произвольное множество из системы, {2}, содержащее точку х. Используя эту лемму, приведем примеры еще двух хаусдор- фовых топологических пространств. Примеры. 1) В качестве X возьмем двумерную плоскость Е2. Окрестность любой точки хб! получим, если из любого открытого^ круга с центром в х удалим все отличные от самой точки х точки, лежащие на вертикальном диаметре этого круга. Полученное топологическое пространство является хаусдорфовым. 2) Рассмотрим в качестве X отрезок [0, 1], окрестности всех точек, кроме точки 0, определим обычным образом, а окрестностями точки 0 будем считать всевозможные полуинтервалы: [О, а), а>0, из которых выкинуты точки —, где п — натуральное число. Это, как легко видеть, пример хаусдорфова топологического пространства. Пусть (X, 2)—топологическое пространство, а У— подмножество X. Тогда на подмножестве X можно рассмотреть след. системы {2}, т. е. множества вида {2у} = {ГП2а}, 2ае{2}. Легко видеть, что тем самым на У задана топология, поэтому У само превращается в топологическое пространство и (У, 2у) называется подпространством пространства (X, 2). Топология, задаваемая системой {2у} = {УП2а}, 2ае{2} называется: индуцированной топологией. Так же, как и в случае метрических пространств, пространство (X, 2) называется связным, если его нельзя представить в виде суммы двух непустых открытых непересекающихся.
562 Гл. 12. Функции нескольких переменных ; подмножеств. Множество У в топологическом пространстве (X, X) связно, если У связно, как подпространство в (X, Е). 2. Замечание о топологических пространствах. После того как введены открытые множества для топологических пространств, можно ввести все понятия, введенные для метрических пространств. Так, дословно сохраняются определения предельной точки множества (см. определение 4 раздела о метрических пространствах), определение внутренней точки* (см. определение 5 раздела о метрических пространствах), определение замкнутого множества (см. определение 6 раздела о метрических пространствах), определение замыкания множества (см. определение 7 раздела о метрических пространствах), определение плотного и всюду плотного множества (см. определение 10 раздела о метрических пространствах), полностью сохраняется определение понятия нигде не плотного, совершенного множества, данные для метрических пространств. Точно так же, как и в случае метрических пространств, в случае топологических пространств определяется важное понятие непрерывного отображения (определение 12 раздела о метрических пространствах), понятие гомеоморфного отображения (определение 14 раздела о метрических пространствах), определение компактного топологического пространства, или компакта (см. определение 15 раздела о метрических пространствах). Так же, как и для метрических пространств, для топологических пространств вводится понятие центрированной системы (определение 16 раздела о метрических пространствах), определение базы топологии топологического пространства, топологического пространства со счетной базой. Топологические пространства со счетной базой называются топологическими пространствами со второй аксиомой счетности. Читатель без труда сформулирует эти определения для случая топологических пространств, для этого в соответствующих определениях раздела о метрических пространствах выражение «метрическое пространство» следует заменить на выражение «топологическое пространство». Согласно этим определениям в случае топологического пространства остаются справедливыми основные утверждения, доказанные для метрических пространств. Это вполне естественно, поскольку доказательства этих утверждений в основном используют понятие открытого и замкнутого множества и непосредственно не зависят от введенной там метрики. Так, лемма 1, утверждающая, что объединение произвольного числа открытых множеств и пересечения конечного их чис- * Совокупность всех внутренних точек множества У называется внутренно- о о «стью множества У и обозначается через У. Внутренность У, очевидно, есть объединение всех открытых множеств, принадлежащих У.
Дополнение 2 563- ла является множеством открытым, есть соответствующая аксиома топологического пространства; утверждение леммы 2, в. том числе и доказательства свойств операции замыкания, полностью сохраняется. На топологические пространства переносится также и понятие сходящейся последовательности (определение 11 раздела о метрических пространствах), а именно: последовательность- {ап} точек топологического пространства называется сходящейся к точке а этого пространства, если любая окрестность точки а содержит все точки последовательности {ап} за, исключением конечного числа. Если последовательность {ап} сходится к точке а, то пишут, что ап-+а при я-»-оо или Нтал=а. Однако в топологических пространствах это понятие не играет столь большой роли, как в метрических пространствах. В самом деле, лемма 3 утверждала, что в метрическом пространстве точка а принадлежит замыканию А некоторого множества А тогда и только тогда, когда существует последовательность {ап} точек множества А, сходящаяся к а. В топологическом пространстве этот факт может быть несправедлив. (Вспомним, что при доказательстве этого утверждения в метрических пространствах мы строили последовательность шаров- О (а, —), вложенных друг в друга для любого натурального п.) Можно выделить класс топологических пространств, обладающих аналогичным свойством. Назовем топологическое пространство пространством с: первой аксиомой счетности, если для любой его точки а существует счетная система ее окрестностей {2ап} такая,, что для любого открытого множества 20, содержащего точку а,, найдется окрестность 2^°, обладающая свойством: 22°с2а.. Такая система окрестностей называется счетной определяющей системой окрестностей точки а. В метрическом пространстве первая аксиома счетности, очевидно, выполнена. В топологическом пространстве (X, 2) с первой аксиомой счетности спр_аведливо утверждение: точка ае! принадлежит замыканию А некоторого множества А тогда и только тогда, когда существует последовательность {ап} точек множества А, сходящаяся к а. Доказательство этого утверждения аналогично доказательству соответствующего утверждения для случая метрических пространств. Последовательность шаров 01а, —1 следует заменить на последовательность окрестностей из систе-
564 Гл. 12. Функции нескольких переменных мы {Еап}, причем всегда можно считать, что Е0"+1сгЕа'г. В про- тивном случае Е0" надо заменить на П 2а. Утверждение на с. 544 полностью сохраняется. Сохраняется также и утверждение леммы 4 — критерий непрерывности отображения. На случай топологических пространств полностью переносится критерий компактности в терминах центрированной системы замкнутых подмножеств (лемма 5), утверждения лемм 6, 7, 8, 9 о свойствах компакта и непрерывных функций на нем. Заметим, что топологическое пространство может не быть пространством со счетной базой топологии даже тогда, когда оно является пространством с первой аксиомой счетности и в нем имеется счетное всюду плотное множество. Однако если в топологическом пространстве есть счетная база топологии, то топологическое пространство сепарабельно и удовлетворяет первой аксиоме счетности (ср. с леммой 11). Точно так же, как и в случае метрических пространств (см. определение 18), топологическое пространство называется пространством со второй аксиомой счетности, если в нем существует хотя бы одна база топологии, состоящая не более чем из счетного числа множеств. Линейные нормированные пространства, линейные операторы Понятие линейного пространства играет фундаментальную роль в анализе. Линейное пространство и линейные операторы в таких пространствах играют также важную роль во многих других разделах математики. 1. Определение линейного пространства. Примеры. Определение 1. Множество элементов Ь, содержащее хотя бы один элемент, называется линейным или векторным пространством, если выполнены следующие аксиомы. 1. Для любых двух элементов х и у множества Ь однозначно определен третий элемент г этого множества, называемый их суммой и обозначаемый символом х-\-у, причем справедливы следующие свойства: а) х-\-у=у+х {коммутативность); б) (*+«/).+2~*4-(у+2) (ассоциативность); в) существует такой элемент О, что х-{-0 = х для любого элемента *е1; элемент О называется нулевым или к у - ле м пространства Ь; г) для любого элемента х^Ь существует такой элемент х', что #+л;'=0; элемент х' называется противоположным к элементу х и обозначается обычно так: —х.
Дополнение 2 565 2. Для любого числа а и любого элемента х пространства Ь определен элемент у пространства Ь, называемый произведением а на х и обозначаемый символом ах, причем справедливы следующие свойства; а) а($х) = (а$)х {для любых чисел а и (5 и любого элемента х)\ б) (а-\-$)х=ах-\-$х (для любых чисел а и р и любого элемента х); в) а(х-\-у) = ах-}-ау (для любого числа а и любых элементов х и у); г) 1 • х = х для любого элемента х. Если в аксиоме 2 используются только действительные числа, пространство Ь называется действительным пространством. Если же рассмотрения ведутся с использованием комплексных чисел, то и пространство Ь называется комплексным. Элементы линейного пространства называют также векторами. Рассмотрим некоторые примеры линейных пространств. При изучении метрических пространств были рассмотрены следующие множества (см. раздел о метрических пространствах, примеры): множество вещественных чисел, координатное «-мерное пространство, множество непрерывных на сегменте функций и совокупность ограниченных последовательностей. Все эти множества представляют собой и примеры линейных пространств, если ввести операции сложения и умножения по следующим правилам. 1) В совокупности А1 вещественных чисел — обычные арифметические операции сложения и умножения. 2) В п-мерном координатном пространстве Ап — по формулам Х,+У=(Х1, Х2,...,ХП) + (У1, У2,.-,Уп) = (Х1+Уи Х2+У2,-,Хп+уп), ах=а(х1, Х2,...,хп) = {ахи ах2,..., ахп). 3) В пространстве непрерывных функций на отрезке — обычные операции сложения двух функций, т. е. }-\-8=!(х).-\-8(х), и умножение функции на число, т. е. а}=а?(х). В множестве ограниченных последовательностей введем операции сложения и умножения по формулам (х+у) = (XI, х2,...).+ (Уи У2, •••) = (Х1+Уи х2+у2, ■■■), ах=а(х\, Х2,...) = (алть алгг,...). Нетрудно проверить во всех перечисленных выше примерах выполнимость аксиом, определяющих линейное пространство. За этими линейными пространствами мы сохраним те же обозначения, что и в случае, когда рассматривались метрические пространства, т. е. соответственно в случае 1)—обозначение Е1, в
566 Гл. 12. Функции нескольких переменных случае 2)—Еп, в случае 3)—обозначение С [а, Ь] и в случае 4) — обозначение т. Определение 2. Линейные пространства Ь и Ь* называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие так, что если элемент х^Ь соответствует элементу х*^Ь*, а элемент у^.Ь соответствует элементу «/*е!*, то элемент х-\-у соответствует элементу х*-\-у*, а элемент ах соответствует элементу а** (а — любое число). Изоморфные пространства можно рассматривать как различные реализации одного и того же пространства, и такие пространства можно не различать. 2. Нормированные пространства. Банаховы пространства. Примеры. Определение 3. Функция /(*) =\\х\\, ставящая каждому элементу х линейного пространства Ь в соответствие вещественное число ||*||, называется нормой в линейном пространстве Ь, если она удовлетворяет следующим аксиомам: 1) Нх) = 11*11 = 0 тогда и только тогда, когда *=0; 2) 7(а*) = 1|а*|| = |а|||*|| = |а|/(*) для любого числа а; 3) /(*1.+*2) = 11*1+*21КИ*11|-Н1*2|1 для ЛЮбЫХ *1 « *2, «РИ~ надлежащих Ь. Определение 4. Линейное пространство Ь с введенной функцией I (*) = ||*|| называется линейным но р миро - ванным пространством. Чтобы подчеркнуть, что пространство Ь нормированное, обозначают его обычно буквой N. Значение нормы на элементе * пространства N называется нормой вектора х или длиной или модулем этого, вектора. Норма вектора всегда неотрицательна и равна нулю только для нулевого вектора. Действительно, полагая в аксиоме 3) х\ = —*2 с учетом 1) и 2), получаем, что 0=||0|| = ||*,-*1К1|*,|| + ||-*1|| = ||*1|Ц-|-1|||*1||=2||*1||; В любом нормированном пространстве может быть введена! естественная метрика по правилу р(*, г/) = 11* — у\\. Из аксиом,, задающих норму, вытекает, что функция р(*, у) действительно- задает расстояние в пространстве, т. е. удовлетворяет аксиомам расстояния. Кроме того, поскольку Л/" — линейное пространство, метрика р(*, у) инвариантна относительно сдвигов, т. е. Р (*!+*, *2+*) = Н(*1+*) — (*2+*) II = 11*1 — *2Н=Р(*Ь Х2), и положительно однородна, т. е.
Дополнение 2 567 р(ах, ау) = \\ах — ау\\**\\а(х — у)\\=*\а\\\х — у\\ = \а\р(х, у). С появлением естественной метрики в нормированном пространстве могут быть введены все те понятия, которые мы рассматривали в метрических пространствах, например полнота и т. п. Следующее определение выделяет из всех нормированных пространств важнейший класс пространств, называемых банаховыми *. Определение 5. Банаховым пространством называется полное линейное нормированное пространство. Приведем примеры банаховых пространств. Примеры. 1) Пространство Е*— действительная числовая ось с обычными арифметическими операциями, как мы знаем, является линейным пространством. Оно превращается в нормированное пространство, если норму числа х положить равной его абсолютной величине: ||л:|| = |#|. Из свойств абсолютной величины вытекает, что выполнены все свойства нормы. Это нормированное пространство Е1 является полным, т. е. банаховым. Его полнота, т. е. полнота Е1 как метрического пространства с обычным расстоянием между действительными числами (р(х, у) = \\х— у\\ = \х — у\), была установлена в гл. 3. 2) Линейное пространство Еп, рассмотренное нами выше, также является нормированным пространством, если норму вектора х= (х\, хч, ■-,хп) ввести по правилу нх||=(*?+4+...+^),"=(2«?)1/8- 1=1 Аксиомы 1) и 2) нормы, очевидно, выполнены, а неравенство треугольника превращается в неравенство 1=1 (=1 <(^1^|2)1/2+(Х1^12)1/2=1И1 + 11у11. 1=1 1=1 которое является частным случаем (при р = 2) неравенства Минковского для сумм (см. § 5 гл. 9). Это пространство Еп является полным, так как сходимость хъ. к х в Еп означает, что все координаты хн1 вектора хк сходятся к соответствующим координатам вектора х. Осталось применить утверждение приме- ра 1). * Стефан Банах — известный польский математик (1892—1945).
568 Гл. 12. Функции нескольких переменных 3) Пространство С [а, Ь] непрерывных функций с обычными операциями сложения функций и умножения функций на число, как мы уже говорили выше, является линейным пространством. Оно превращается в нормированное пространство, если положить ||/||= тах |/(л:)|,где /^—непрерывная на сегменте [аЬ] те [а, Ъ] функция. Используя свойства абсолютной величины и функции тах, легко убедиться, что все аксиомы нормы здесь выполнены *. 4) Пространство /«-ограниченных последовательностей также можно сделать нормированным, положив |И| = вир \хк\ для к х—(хи Х2, ■■■)■ Аксиомы нормы здесь также проверяются без труда. Можно убедиться также, что оно является полным нормированным пространством, т. е. банаховым пространством. 3. Операторы в линейных и нормированных пространствах. Пусть Ь\ и Е%— два линейных пространства и А— отображение пространства Ь\ в Е2, т. е. А : Е\-^-Е2. Определение 6. Отображение А:Е\-*-Еч одного линейного пространства Ех в другое Е2 называется линейным, отображением или линейным оператором, если: а) А (Х]-\-Х2) =Ах1-\-Ах2 для любых векторов Х\ и х2 пространства Ь\\ б) А{ах)=аАх для любого вектора х^Е\ и любого числа а. Отображение А : Е^ХЕ2Х ... ХЬп-^-Е прямого произведения линейных пространств Ь\, Ь2,...,Ьп** в линейное пространство Ь называется полилинейным, если линейно каждое отображение Аг: Ь{-+Ь, 1=\,2,...,п, получаемое из А (х, у,..., г) фиксированием всех переменных, кроме переменной, стоящей на 1-м месте. Здесь хе^ь ^е!2, ••• ...,2<=1П. Если задано линейное отображение А: Е\-+Е2 линейного пространства Ь\ в линейное пространство Ь% и пространство Е2 является действительной числовой осью (или комплексной плоскостью), то оператор А называют функционалом. Рассмотрим некоторые примеры. Примеры. 1) Пусть Ь — произвольное линейное простран- ство. Оператор Е ставит в соответствие каждому элементу хе= е/. тот же элемент х этого же пространства, т. е. Е: Ь-^Е и Ех=х для любого х^Ь. Такой оператор называется единичным или единицей. * Можно убедиться, что это пространство является и полным, т. е. банаховым. ** Линейные операции в ^ХЬгХ-ХЬп определены равенствам» [а'1, ..., Х„]+ [</!, ..., г/тг] = [*1+1/Ь -, Хп+Цп], <х[*1, -, Хп] = [(№, ..., О*,»!, где [XI, .... хп], [уи -, г/п]е14Х-..Х1п, хи Уг^Ьи 1=1, 2, .... п; а —число.
Дополнение 2 569 2) В трехмерном пространстве Е3 зададим оператор А как линейное преобразование, состоящее в проектировании каждого вектора на ось Ох (т. е. каждому вектору в соответствие ставится его координата на оси Ох). Оператор можно задать матрицей. Например, в базисе из единичных векторов ей е2, ез, направленных по осям координат Ох, Оу, Ог соответственно, указанный оператор А можно задать так: /1 0 0\/хЛ Ах = ( О О О II х2 , х — (х±, х%, х3) е Е3. \0 0 0/ \ха/ 3) В пространстве С[а, Ь] линейный оператор А задан по ь правилу: Л/= Г/ (х)с1х. Оператор А отображает С [а, Ь] в чис- а ловую ось и является функционалом. 4) Модуль непрерывности аЦ, б) (см. гл. 4) и дельта- функция 8(х—а), т. е. оператор 6(х—а), действующий по правилу б (л:—а) Ц(х)] =/(а), также являются функционалами на С [а, Ь]. 4. Пространство операторов. Пусть Ь\ и Ь2 — два линейных пространства. Рассмотрим совокупность {А} всех линейных операторов, отображающих Ь\ в Ь2. В множестве {А}, элементами которого являются линейные операторы, отображающие Ь\ в Ь2, можно ввести алгебраические операции. Пусть А\ и А2 — такие операторы. Определим сложение этих операторов посредством равенства (А1 + А2)х=А1х+А2х, хб/,1. Умножение линейного оператора на число определим формулой (аА)х-аАх. Очевидно, что при таких определениях все необходимые аксиомы, задающие линейное пространство, будут выполнены и рассматриваемое множество {А} линейных операторов будет линейным пространством. Нулем этого пространства будет нулевой оператор О, т. е. оператор, переводящий любой вектор х в нулевой вектор: Ох = 0. Пространство линейных операторов, которое мы ввели выше, обычно обозначается так: (/,!->- -+Ь2). Если пространства Ь\ и Ь2, кроме того, обладают некоторой топологией, например нормированы, то и пространство операторов (/-1—*-/-а) будет обладать определенной топологией. 5. Норма оператора. Пусть Ы\ и Ы2 — два линейных нормированных пространства и оператор А отображает N1 в Ы2.
570 Гл. 12. Функции нескольких переменных . ; , ' .—■ —— -~ Определение 7. Линейный оператор А:Кх*+Ы2, отобрщ жающий линейное нормированное пространство Ы\ в линейно^ нормированное пространство N2, называется ограничен* ным, если существует такая постоянная М, что ||А*||#2<; <М|иНлгг для всех хеЛ']. Индекс внизу символа нормы озна^ чает то пространство, в котором вычисляется норма вектора. Если это не будет вызывать недоразумений, эти индексы мы будем опускать. Справедливо следующее утверждение. Теорема. Для того чтобы линейный оператор А:Л^-^Л/г,. отображающий линейное нормированное пространство Ы\ в Ы2у был непрерывен, необходимо и достаточно, чтобы он был ограничен. (Заметим, что непрерывность оператора понимается как непрерывность соответствующего отображения.) Доказательство. Пусть А — непрерывный оператор. Если бы он был неограничен, то нашлась бы последовательность элементов {хп} такая, что 1И*«11>л||*п11. х 1 Пусть цп = —-—. Тогда Уп-ИЗ, так как ||оп|| = >-0при П\\Хп\\ •"•.»"■ "»Л" п V п-^оо. С другой стороны, я|1*л11 Заметим, что (в силу линейности оператора А) А-0=0; действительно, А-0=А(х—х)==Ах—Ах=0, Итак, Ауп не стремится к А-0=0, т. е. оператор А не является непрерывным в нулевой точке, что противоречит условию теоремы. Обратно, если А ограничен, то ЦЛ;с||<:М||*||. Пусть *„->*, т. е. \\хп—*||->0 при п-**оа. Тогда ||А*„—Ах\\ = \\А(хп—*)||« «МИ*,,—*||-*0 при п-*-оо. Следовательно, Ахп-+Ах и оператор А непрерывен в точке х. Определение 8. Пусть А — линейный ограниченный оператор. Наименьшая из постоянных М, удовлетворяющих условию \\Ах\\<М\\х\\, называется нормой оператора А и обозначается символом || А ||. Таким образом, согласно определению 8 норма оператора обладает следующими свойствами: а) для любого х^.Н\ справедливо неравенство 1И*||<||Л ||.||*||;
Дополнение 2 571 б) для любого числа е>0 найдется такой элемент хе, что 1И*,11>(||Л||-еНк11. Покажем, что ||Л|| = зир ||Лл:|| или, что то же самое, II Ах I ||Л||=8ир- -. Действительно, если ||х||«:1, то ЦЛд:||-<: 11*11*0 ||*|| «ИЛИ-11*11 <||Л||. Значит, и 81ф ||Ак||<||Л||. С другой стороны, для любого е>0 существует элемент хе такой, что ИЛлгЛ >(||Л ||-е) ||хе||. Пусть 6. = -^. Тогда №| = 1^1 > -^(11^1-6)11^11 = = 11Л||—е. Так как |е=1, то 5ир||Лх||>||Л^||>||Л||-е. 1МК1 Следовательно, зир ||Ах[|^||Л||, и потому ||Л||= вир ||Лх||. Замечание. Из проведенных рассуждений следует, что ||Л||=зир||Лх||. МЫ Выше (см. п. 4) нами было введено пространство (11-*-12) операторов, отображающих линейное пространство Ь\ в линейное пространство /^. Это пространство играет важную роль в различных разделах анализа, и мы сейчас продолжим его изучение. Предположим теперь, что указанные выше линейные пространства Ь\ и 1г являются нормированными. Переобозначим их через Ы\ и Л'» соответственно, а соответствующее линейное пространство, элементами которого являются линейные ограниченные операторы, через (Л^-»-^). В пространстве (Л^-^-Л^) можно ввести норму. Для этого норму элемента А пространства (#1-*-М2) введем по правилу: ||Л|| = зир ||Лд:||. Легко видеть, 11*11=1 что эта норма удовлетворяет аксиомам определения нормы. Таким образом, линейное пространство (М^Ыг), элементами которого являются линейные ограниченные операторы, есть линейное нормированное пространство. Возникает естественный вопрос: когда это пространство является полным, т. е. банаховым? Ответ на этот вопрос содержится в доказываемой ниже теореме. Теорема. Если линейное нормированное пространство Л!2 = В2 банахово, то пространство. (М1-*-В2) линейных ограниченных операторов также является банаховым.
572 Гл. 12. Функции нескольких переменных Доказательство. Пусть {Л„} — фундаментальная последовательность пространства операторов (Л^1->Л2), т. е. \\Ап—Лт||-»-0, когда п, /я->-оо. Для любого х получим, что \\Апх—Лтдг||<!'Ли—Лт|]||л:||->0 при п, т-+оо. Следовательно, если хеЛ'] фиксировано, то последовательность элементов {Апх} фундаментальна в В2, т. е. в силу полноты В2 эта последовательность сходится. Обозначим у = ]\тАпх. Мы получи- ли, таким образом, отображение Л^ в В2. Оператор, осуществляющий это отображение, обозначим через А. Из свойств предела следует, что он линеен. Докажем его ограниченность. Из того, что \\Ап—Лт||->0 при п, т-+оо, следует, что |||Л„||— —11Лт|||->0 при п, т-+оо, т. е. числовая последовательность {ЦЛП|1} фундаментальна в Е1, а следовательно, и ограничена. Существует такая постоянная Ж, что ||Л„||<М для любого натурального п. Отсюда получаем, что ||Л„х||<||Лп|Ц|х||<:ЛГ||д;|1, т. е. в силу того, что функция, определяющая норму (расстояние), непрерывна, имеем \\Ах\\ = \ш\\Апх\\<М\\х\\. Итак, оператор А — ограничен. Оператор А был нами определен как оператор, отображающий Л^ в В2 по указанному выпю правилу. Покажем, что А является пределом последовательности {Ап} в смысле сходимости по норме в пространстве (Л^-кВг)- Зададим произвольное е>0 и выберем п0 так, что ||ЛП+Рл;—Лп*||<е для и>га0 и любого х такого, что ||х||< <1. Пусть р-^-оо. Тогда \\Ах—Л„л:||<;е для «>п0 и всех х с нормой, не превосходящей единицы. Поэтому для п>«о получим ||ЛЛ—Л|| = вир ||(Л„—Л)х||<е. Следовательно, Л= ПтЛ„ ||Л1||<1 П->00 в смысле сходимости по норме в пространстве (Л^—кВг), т. е. это пространство банахово, что и требовалось доказать. 6. Понятие гильбертова * пространства. Определение 9. Гильбертовым пространством называется множество Н элементов [, §, к, ..., обладающее следующими свойствами: 1) Н представляет собой линейное пространство, т. е. в И определены действия сложения и умножения на действительные или комплексные числа (в зависимости от этого Н называется действительным или комплексным пространством) . 2) Н является метрическим пространством, причем метрика вводится с помощью скалярного произведения, т. е. числовой функции (I, §) от пары аргументов / и §, называемой их скалярным произведением и удовлетворяющей аксиомам: * Давид Гильберт — немецкий математик (1862—1943).
Дополнение 2 57* а) («/, ё) =а(/, &) для любого числа а; б) (/+*, А)=^, к)+ (8, к); в) (/,§) = (*/)*; г) (/, /) >0 при [ФО; (/, /) =0 при / = 0. Норма ||/|| элемента / определяется равенством ||/|| = = (/* /) 1/2> а расстояние между элементами I и § полагается равным р(1,§) = \\Г-ё\1 3) Н является полным пространством, как метрическое пространство с введенным выше расстоянием. {Конечномер- нов пространство всегда полно.) Возьмем произвольные элементы /, ^еЯ, пусть X — действительное число. Тогда 0<(8+Ч1. 8)В, ?+Ш, 8) 8) = (К /)+2Х| (/, §) 12+ + т([,8)\Ч§,8) и, следовательно, такой многочлен относительно X не может иметь различных действительных корней. Отсюда вытекает, что \и,8)\*-а,п\([,8)\2(8,8)<о- Таким образом (даже в случае (/, §)=0), 1а*)1а<(нн&*)или | а я) |<няшяи. Мы получили неравенство Коши — Буняковского. Знак равенства в нем, помимо тривиального случая / = 0 или § = 0, достигается только тогда, когда /=—Х(/, §)§ при некотором значении X, т. е. когда векторы / и § коллинеарны. Используя это неравенство, легко проверить, что норма элемента ||/|| и расстояние р(/, §) = \Ц—§11 удовлетворяют всем аксиомам, входящим в их определение. Вместе с метрикой в гильбертовом пространстве появляются понятия, связанные с предельным переходом в смысле введенного расстояния. Наличие скалярного произведения позволяет ввести в Н понятия угла между векторами (если Н вещественно). Угол (/, §) между векторами / и .§' определяется равенством сов (/Гг) = (/' в) . К й 11/11II г II Это понятие, в свою очередь, позволяет назвать два вектора ортогональными, если они образуют угол в 90°. Другими словами, векторы / и § называются ортогональными, если и,8)=о. * (@, /) означает комплексно сопряженное к числу (§, {).
574 Гл. 12. Функции нескольких переменных Если вектор / ортогонален векторам &\, ..., §п, то он °РТ°- ■ п тонален и их линейной комбинации V а,-^. 1 = 1 Если векторы §1, ..., §п, ••• ортогональны вектору / и §=\\тдп, то вектор §" ортогонален вектору /. п-юа Из сказанного следует, что совокупность всех векторов, ортогональных векторам /ь .... /п, где п фиксировано, образует замкнутое линейное многообразие, т. е. подпространство, называемое ортогональным дополнением к множеству Ни .,.. М- В гильбертовом пространстве Я можно ввести важное понятие сопряженного оператора. Определение 10. Оператор А* называется сопряженным к линейному ограниченному оператору А, если для любых элементов х, у^Н выполняется равенство (Ах, у) = = (х,А*у). Ограниченный линейный оператор А, действующий в гильбертовом пространстве Я, называется самосопряженным, если (Ах, у) = (х, Ау) для всех х и у из Я. Примеры. 1) В я-мерном пространстве Еп, элементами которого являются наборы чисел х= (х\, Х2, ..., хп), можно вве- п сти скалярное произведение по формуле (х, у) = Х\ х^у^. Учи- 1=1 тывая, что конечномерное пространство Еп полное, заключаем, что Еп является гильбертовым пространством. Аксиомы скалярного произведения здесь, очевидно, выполнены. 2) Операторы Е (единичный), О (нулевой) являются примерами самосопряженных операторов, действующих в гильбертовом пространстве. Для них всегда выполнены соотношения {Ех, у) = (х, у) = (х, Еу), (Ох,у) = (0,у)=0=(х,Оу). ДОПОЛНЕНИЕ 3 Дифференциальное исчисление в линейных нормированных пространствах В гл. 5, 6, 7 были изучены вопросы дифференциального исчисления функции одной переменной, а также были исследованы экстремальные свойства функции одной переменной. В предыдущих параграфах настоящей главы эти же вопросы изучались уже для функций многих переменных.
Дополнение 3 575» Подчеркнем, что всюду в гл. 5, 6, 7 под функцией мы понимали соответствие между точками множества {М} числовой? оси (или точками множества {М} т-мерного евклидова пространства) и подмножеством числовой оси. Другими словами,, такие функции отображают множество {М} числовой оси или- т-мерного евклидова пространства в подмножество числовой оси. Такие функции могут быть названы числовыми (скалярными) функциями, ибо множество значений таких функций есть числа (скаляры) вещественной оси. В дополнении 2 к этой главе мы вводили понятие функции,, отображающей одно абстрактное множество в другое (например, одно метрическое пространство в другое метрическое пространство, одно нормированное пространство в другое нормированное пространство и т. д.). Такие функции называются- операторами, отображениями, функциями множеств ю т. д. В частности, можно рассматривать функции, отображающие т-мерное евклидово пространство в л-мерное евклидово» пространство. Такие функции называются уже векторными функциями, поскольку значениями таких функций являются не числа, а векторы некоторого пространства. Например,,, если отображение происходит в л-мерное евклидово пространство, то значениями функции, осуществляющей это отображение, являются векторы л-мерного пространства. Примером функции, осуществляющей отображение одного метрического пространства X в то же пространство X может быть тождественное отображение Е, ставящее в соответствие каждой точке хеА' ту же точку х^Х. Отображение \\х\\, ставящее в соответствие точке х нормированного пространства ЛГ число \\х\\ — норму элемента х, есть пример функции, заданной на нормированном пространстве N. В этом параграфе будет построено дифференциальное исчисление функций, заданных на нормированном пространстве. В качестве элементарного следствия наших построений могут- быть получены факты, относящиеся к функциям, осуществляющим отображения т-мерного евклидова пространства в л-мерное евклидово пространство (при этом натуральное число п< может как совпадать, так и не совпадать с натуральным числом т). 1. Понятие дифференцируемости. Сильная и слабая диффе- ренцируемость в линейных нормированных пространствах. Пусть. Л^ и Лг2 — два нормированных пространства и Р — отображение (функция), действующее из Ы\ в Ы2 (Р:М1-*-Ы2) и определенное на некотором открытом множестве 2 пространства.! Ы\. Напомним, что поскольку N1 — нормированное пространство, то оно, в частности, является и метрическим пространством; следовательно, все понятия, введенные в метрических про-
376 Гл. 12. Функции нескольких переменных странствах, такие, как открытое, замкнутое, ограниченное множество, расстояние между точками и т. д. имеют смысл. Подчеркнем, что в этом дополнении будут использоваться многие понятия, введенные в дополнении 2. Введем понятие дифференцируемого отображения. Определение. Назовем отображение Р:Ы^-^-Ы2 дифференцируемым* в данной точке х, принадлежащей открытому множеству ЕсгЛ'ь если существует такой ограниченный линейный оператор 1,*е (А/^-^-Л^) **, что для любого е>0 существует 6>0 такое, что если Н^Ы\ и \\Н\\мг <б, то \\Р(х+к)-Р(х)-ЬхкЬ1 <.в\\к\\н, или, что то же самое, \\Р{х+к)-Р{х)-ЬМ\ы2 = о{к), где о(й)/||/1||-ИЭ при ||/1||,у1-»-0. Здесь х+йеЕсгЛ^. Индексы N2 или Ы\ у знака || • || нормы означают, что норма берется соответственно в пространстве Л/г или Л^. Для простоты записи договоримся в дальнейшем о том, что там, где не будет возникать недоразумений, эти индексы опускать. Выберем последовательность чисел ета->0. Согласно сформулированному определению ей отвечает последовательность чисел бге и для любой последовательности точек кп такой, что 1|й„||<бп, 11й„||-»-0, мы получим, что \\Р(х+кп)~-Р(х)\\^\\Р(х+кп)-Р{х)-1хкп\\ + \\Ьхкп\\< <е„||Л„||+||/.,||||йп11-»-0, когда п-*-оо (поскольку |Л„||-»-0, еп->-0, а ||1.*||<С в силу ограниченности линейного оператора Ьх). Следовательно, Пт Р (х + кп) — р (х) при ||й„||->0, т. е. если обозначить х+кп через хп, то Итхп = х, Пт Р (хп) = Р (х). Та- * Если, в частности, Р(х) есть скалярная функция, определенная на некотором интервале (а, Р) (Р(х) отображает подмножество числовой оси в подмножество числовой оси Р(х):(а, Р)-»^1), то в случае ее дифференцируемости в точке Хо из интервала (а, Р) можно записать: Р(х0+к)— Р(хо)— Ьк = о(Н), о(й)/Л->-0, если Л^О, тде к — некоторое число — приращение аргумента функции, Ь = Ь{хо) — линейный оператор, являющийся производной отображения Р(х) в точке хо, принадлежит в данном случае пространству операторов (Е*—>~Е1), т. е. является просто оператором умножения на число. С другой стороны, если рассматривать Р(х) как обычную числовую функцию, то число Ь есть, очевидно, производная функции Р(х) в точке хо, т. е. Е=Р'(х0). ** Через (Л^1->-Л?2) в дополнении 2 было обозначено пространство линейных ограниченных операторов, отображающих одно линейное нормированное пространство Л^ в другое линейное нормированное пространство #2.
Дополнение 3 577 ким образом, дифференцируемое в точке х отображение Р(х) непрерывно в этой точке. Выражение Ьхп при каждом п^Ых является элементом пространства Л/*2 и называется сильным дифференциалом (или дифференциалом Фреше) отображения Р в точке х (и иногда обозначается символом йР). Линейный оператор Ьх называется производной или сильной производной отображения Р в точке х. Будем обозначать эту производную символом Р'(х). Таким образом, мооюно записать, что сильный дифференциал отображения Р по определению равен ЬхК т. е. йР=Ьхк, а сильная производная Р'(х) равна Ьх, т. е. Р' (х) = Ьх. Если отображение Р дифференцируемо в точке х, то соответствующая производная определяется единственным образом. В самом деле, пусть Р(х+Н)— Р(х)— Гхк-=о(к)* и Р(х+к)—Р{х)—Ь2хк = о(к). Тогда Ь1хк—Ь2хк = о(к). Следовательно, для любого е>0 найдется такое 6>0, что из неравенства Ц/гУ<6 следует неравенство Шхк-Ь2М<г\\к\\. Разделим обе части этого неравенства на 11/гЦ^О. Тогда получим, что выполнено неравенство \г1— I2 к 1<-р I IIАII IIА || I справедливое в силу свойства нормы и линейности операторов и Ь1Х и Ь2Х. Полагая — е, где ||е|| = 1, мы получим, что IIА || \\ихе-12хе\\<.ъ для любого вектора е из единичной сферы (т. е. для любого вектора, с нормой, равной единице). В силу произвольности е отсюда следует совпадение операторов Ь1Х и Ь2Х всюду на единичной сфере. Поскольку операторы Ь1х и Ь2Х линейные, то они, очевидно, совпадают и всюду, т. е. * Написанное равенство следует понимать так: \\Р(х+к)—Р(х)—ЬхЩ=о(к). В равенстве Р(х+к)—Р(х)~^к=о(к), ~7^-^, если ||Л||-»-оо, т. е. норма IIА II величины о(к) является числовой величиной о(||Л||). 19х/2 Зак. 72
578 Гл. 12. Функции нескольких переменных Для того чтобы проиллюстрировать определение сильной дифференцируемости отображения одного нормированного пространства в другое на конкретном примере, рассмотрим случай отображения Р:Ет-*-Е\ т. е. отображения т-мерного евклидова пространства в числовую ось. В этом случае * отображение Р = Р(хи х2, ..., хт) есть обычная числовая функция от т переменных. Если обозначить приращения аргумента Х\ через Н\, аргумента х2 через к2, ..., аргумента хт через кт, то, как это следует из формулы (12.15), условие дифференцируемости функции т переменных Р{х\, х2, ..., хт) в точке л; = = (хи х2, ..., хт), принадлежащей некоторому открытому множеству ИаЕт, записывается- в виде Р{Х1 + Ни Х2+П2, ..., Хт + Пт)—Р{хи Х2, ..., Хт) = = Г(х + к)—Е(х)=А1к1+А2к2 + ... + Аткт + о(р), дР (х) где х+к — (х1 + к1, х2 + к2, ..., хт + кт), Д = дх. Л2 , . . ., Лот — — , р —(Я; + «2+ . ■ • + Пт) , ОХ% ОХт X — \Х^, Х2, • • •, Хт)ш Заметим, что справедливо равенство р=||л||, где \\к\\ берется в пространстве Ет, как в нормированном пространстве. Поэтому если функция т переменных дифференцируема, то она, очевидно, и сильно" дифференцируема, как отображение нормированного пространства Ет в нормированное пространство Е1, причем сильная производная Ьх определяется из уело- т вия Ьхк=\ кс, т. е. Ьхк равно скалярному произведению Лш1 дх1 г'~ / дР дР дР \ и /и и и \ вектора Рх—\ , , ..., на вектор п— {к\, к2, ..., «„■). \ дхх дхг дхт) Из курса линейной алгебры мы знаем, что всякий линейный функционал из пространства (Еп-^Е1) имеет вид скалярного произведения. Таким образом, в случае отображения т-мерного евклидова пространства в числовую ось понятие Сильной дифференцируемости функции Р(х\,-х2, ..., хт), очевидно, в силу единственности производной совпадает с понятием ее дифференцируемости. Установим теперь некоторые элементарные факты, непосредственно вытекающие из определения производной. * Выбрав базис в Ет, мы всегда, независимо от природы элементов хеГ™, можем считать, что х является упорядоченной совокупностью т чисел.
Дополнение 3 579 Свойство 1. Если Р(х) =/г=сопз1 (оператор Р от х не зависит — является постоянным), то Р'=0, где О — нулевой оператор. Доказательство этого свойства очевидно. Свойство 2. Производная непрерывного (т. е. ограниченного) линейного отображения А есть само это отображение: А'(х)=А. Действительно, А(х+к)—А(х)=А(х)+А(к)—А{х)=А{к). Поэтому А'(х)=А. Свойство 3 (производная сложной функции). Пусть N1, Ы2, N3 — три нормированных пространства, ЪХа — окрестность точки хо^Л/'ь Р — отображение этой окрестности в N2, Уо=Р(хо), 2Уо — окрестность точки г/о^Л/г и О — отображение этой окрестности в Л'3. Тогда если отображение Р дифференцируемо в точке хо, а О дифференцируемо в точке уб, то отображение Н—СР (которое определено в некоторой окрестности точки Хо и отображает ее в Л'з) дифференцируемо в точке Хо и Н'(х0) = 0'(у0)-Р'{хо). В самом деле, согласно условиям дифференцируемости отображений Р и О Р(хо+1)=Р(хо)+Р'(х0)1+о1(1) и 0(уо-кч) = С(уо) + 0'(уо)у) + о2(ц), II <>1 (1)11 где -V , —величина, стремящаяся к нулю при стремлении II* II Н°2(Т))11 к нулю |||||; —-5-р— величина, стремящаяся к нулю при N11 стремлении к нулю \\ц\\. Операторы Р'(х0) и С (г/о) — постоянные операторы, ограниченные по норме. Поэтому о(Р'(*о)|) = о(|) и С(Уо)о(|) = =о(|). В самом деле, Ио^яоШН^еИ^'^оШ, если \\Р'(хо)1\\<8, т. е. \\о(Г'{х0)Ъ)\\<е\\Г(х0)1\\<св\\Р'(х0)\\Ю\ = = 6111511, где 81 = е||Р(хо)||, ||.Р(хо)11 — норма ограниченного оператора.Р'(хо) *■ Таким образом, для всякого б]>0 существует б1>0 (а именно 81 = Ы\\Р/(х0)\\, \\Р'(х0) \\фО) такое, что \\о{Р'(х0)Ъ)\\<е1№\, если ||511<6, = 6/||Р(л;о)||, т. е. если 11^'(ло)1111|11<6 (поскольку, если выполнено это неравенство, то тем бол^е ||/;/(*оШ1«11/7/(хо) Щ11<6. * Мы воспользовались оценкой ||Лх1К1|Л||||д;[|, справедливой для любого ограниченного оператора (см. дополнение 2). 191/2*
580 Гл. 12. Функции нескольких переменных Следовательно, о{Р'(х0)1)=о(1)*. Соотношение С(Уо)о(1) = =о(5) доказывается еще проще. Учитывая доказанные соотношения, получим Н{х0+1)=ОР(хо+1)=0[Р(х0)+Р/(хо)1 + о1(1)} = = 0[уо+Р/(хс)1+о1(1)]=0(уо+т)), где г) = Р'(хо)1+01(Ъ). Далее, 0(Уо+г\) = 0(уо) + 0'(у0)у] + о2(ц) = = 0(уо) + 0'(уо)1Р'(хо)1 + о1(1)]+о2(Р'(х0)1+о^)) = = 0(уо) + С'(уо)Р/(х0)1+С'(уо)о1(1)+о2(Р'(х0)Ъ)+о1№ = = С(у0) + 0'(уо)Р'(хо)1+о3(1). Следовательно, Н(хо+1)-С(уо)=Н(х0+1)-0(Р(хо))=Н(хо+Ъ)— Я(*о) = = С'(Уо)Р'(х0)1+Ог(1), и формула для производной сложной функции полностью доказана. Если Р, С, Н — числовые функции, то это формула превращается в известное нам правило дифференцирования сложной функции. Для отображений Р, С, Н это правило называется еще правилом вычисления производной композиции отображений. Свойство 4. Пусть Р и О — два непрерывных отображения, действующих из А^ в К2. Если Р и О дифференцируемы в точке Хо, то и отображения Р+0 и аР, где а — число, тоже дифференцируемы в этой точке, причем {Р+0)'(х0)=Р'(хо) + С'(ха), (аР)'(х0) = аР'(х0)**. В самом деле, из определения суммы операторов и произведения оператора на число *** получаем, что (Р+С){х0+п)=Р(Хо+п) + 0{хо+п) = =Р(х0) + а{х0)+Р'(х0)Н + О'(х0)Н+о1(Н); (аР) (х0+11)=аР(хо)+аР'(хо)п+02{Н). Из этих равенств и получаем требуемые соотношения. Рассмотрим теперь еще одно понятие, связанное с диффе- ренцируемостыо отображения. * Если Р'(хо)=0, то ||-Р'(;со)[|=0 и соотношение о(/7'(х<>)|) =о(|) очевидно. ** Символам^ (Р+О)'(х0) и (аР)'(хо) обозначены значения операторов (Р+0)' и (аР)' в точке хо. *** Для нелинейных операторов эти определения такие же, как и в случае линейных операторов (см. дополнение 1).
Дополнение 3 581 Определение. Слабым дифференциалом (или дифференциалом Гато) отображения Т7:Л^-^Л/г называется предел ,. Р (х 4- (Н) — Р (х) й ■-. / , , , \ 1пп—*—^—- *-*- — — Р (х + Щ /=0 где сходимость понимается по норме в пространстве Ы2. Слабый дифференциал называется еще первой вариацией отображения Р в точке х и обозначается символом БР(х, к). Слабый дифференциал БР(х, К) может и не быть линеен по к. Если же оператор йР(х, к) оказывается линейным, т. е. если йР(х, п)=Рс'(х)к, где Рс(х) — ограниченный линейный оператор, то этот оператор называется слабой производной (или производной Гато). 2. Формула Лагранжа конечных приращений. При изучении дифференцируемых числовых функций важную роль играла формула Лагранжа конечных приращений. Выведем такую формулу в случае дифференцируемого отображения Р:Ы1-+Ы2. Пусть 2 — открытое множество в Ы\, содержащее точку Хо, и пусть множество точек хо+1(х—Хо)* целиком содержится в 2, 0</<1. Теорема. Пусть /7:А/'1-^^У2 ■— отображение, определенное на открытом множестве Бс:А/\, непрерывное на [х0, х] и имеющее сильную производную Р' в каждой точке интервала (хо, х). Тогда \\Р(Х)-Р(Х0)\\< 511Р ||Г(9|Н|ДХН = ?€(*<>.*) = зир Ц/^Хо + бЛ^П-ЦДхН, &х = х—х0. е<е<1 Доказательство. Рассмотрим сначала непрерывное отображение /(^), заданное на сегменте [0, 1] и отображающее его в пространство Л/*2, /: [0, 1]~*-ЛГ2 и непрерывную функцию §((), заданную на сегменте [0, 1], принимающую числовые значения. Покажем, что если /(/) и ^(г) сильно дифференцируемы на интервале (О, 1) (/(<) как отображение одного нормированного пространства, а именно интервала (0, 1), в другое нормированное пространство Л^, а §({) дифференцируе- * Множество точек вида Xо+^(x—Хо), где 0^<[1, называется отрезком или сегментом и обозначается символом [хо, х] в М. При 1=0 получаем точку хо, а при ^=1 — точку х; если 0</<1, то множество точек х0+1(х—хау называется интервалом (х0, х). 19 Зак. 72
582 Гл. 12. Функции нескольких переменных ма как числовая функция, определенная на интервале (О, I)), и если 11/(011<г'(0. о<*<1, то \\!(1)-!(0)\\<8(1)-е(0)- (*> Из этой формулы утверждение теоремы уже будет следовать легко. Докажем эту формулу. При каждом фиксированном е>0 обозначим через Аг множество точек сегмента [О, I], в которых выполнено неравенство 11/(0-/(0) 11<г(0-*(0) + в*+е. (**) Покажем, что при любом е>0 число 1 принадлежит множеству АЕ. Тогда при 1=\ и е-^0 получим доказываемую формулу. В силу непрерывности отображения /(/) и функции §(1) множество Ае замкнуто на сегменте [0, 1]. Действительно, если ^пеД, и ^г,-*^о, то в неравенстве !1/(^)-/(0)||<§(^)-^(0) + е^ + Е. пользуясь непрерывностью функции нормы (или, что то же самое, непрерывностью функции расстояния): |1л'Ц = р(д;, 0), непрерывностью отображения }{1) и непрерывностью функции §({), можно перейти к пределу при 1п~^1о и заключить, что. ||/(/о)-/(0)||<г(<о)-г(0)+в/0+в, 'т. е. 1о^Аг, а следовательно, множество Ае замкнуто. Множество Аг. непусто, лоскольку (**), очевидно, выполнено при достаточно малых I (левая часть неравенства (**) при малых I в силу непрерывности /(/) мала, а правая имеет положительный член е в качестве слагаемого, который не зависит от I). Пусть а = зирЛе. Поскольку множество Ле<=[0, I] замкнуто», то аеЛг. Покажем, что а не может быть меньше числа 1. Допустим противное, что а<1, т. е. 0<а<1. В силу дифференцируемое™ /(/) и §({) в точке а для достаточно малых положительных чисел к будем иметь ||/(а + А)-/(а)|Г=||/'(а)Л + о(Л)||<||/'(а)А|Ц-Цо(А)1[< (в данном случае \\к\\—\к\=к, поскольку к — положительное число, а норма элемента к сегмента [0, 1] совпадает с модулем числа к). Далее, 8(а+к)—е(а) = \ё(а + Н)—8(а)\, к>0,
Дополнение 3 583 поскольку функция §(/) на интервале (0, 1) не убывает. Это следует из того, что ^'(/)>0, 0<^<1, что, в свою очередь, следует из неравенства 0<Ц/'(/) п<^'(0. 0<?<1. Заметим теперь, что \ё(а + к)-ё(а)\^\ё'(а)к + о(Н)\^ 7?\ё'(а)к\-\о(к)\^8'(а)к—^-к для достаточно малых к. Поэтому \\1(а + к)-!(а)\\<\1Г(а)\\к + ^-к<§'(а)к + -1-к< <.§(а + к)—§(а)+ек. Поскольку ||/ (а) -ДО) || <^ (а) -§ (0) + еа+е, то ||/(а + А)-/(0)|| = ||/(а+А)-/(а)-+/(а)-/(0)Ц< <||/(а+Л)-/(а)|| + ||/(а)-/(0)||< <§{а+к)--8(а)+ек+§(а)—8(0)+еа + г = =§{а+к)—8(0)+е{а+к) + г. Мы видим, что аЧ-/и=Л8, а это противоречит выбору числа а, т. е. число а не может быть меньшим единицы. Следовательно, а—1, и 1еЛв. Формула (*) доказана. Завершим теперь доказательство теоремы. Положим !{()=Р(хо+1Ах), г(*)=Л*||Дх||*, 0<*<1, где М= Йф ||/'(6)||. 16(0,1) Отображение /(/) и функция §{1) удовлетворяют, очевидно, всем условиям вспомогательного утверждения, установленного нами выше. Поэтому, подставляя эти выражения для /(^) и §({) в формулу (*), получаем формулу Лагранжа. Теорема доказана. Следствие. Если Ле(Лг1-*-А^) — линейное непрерывное отображение нормированного пространства Ы\ в нормированное пространство Л"?, не зависящее от х, а Р(х) — отображение открытого множества Бс#| в Ы2, удовлетворяющее условиям теоремы, то \\Р(х)-Р(х0)-ААх\\< зир \\Р' Ц)-А\\ \\Ах\\. Ъ€(х0,х) Действительно, применив теорему к отображению Р{х)— А Ах, Ах=х—х0, 19*
584 Гл. 12. Функции нескольких переменных- получим \\Р{х)~-АЬх-Р(х0)\\< вир \\Р'(1)-А(х-х0)'\х^\\Ах\\ = = вир \\Р'(®-А\\\\Ах\\, что и требовалось доказать. Можно показать, что теорема и следствие из нее верны, если всюду вместо сильной производной Р' (х) рассматривать слабую производную Рс' (х). 3. Связь между слабой и сильной дифференцируемостью. Сильная и слабая дифференцируемость представляет собой различные понятия даже в случае т-мерного евклидова пространства при т>2. Действительно, рассмотрим, например, функцию двух переменных /(*)=/(*!. Ч)- Х^Х% если х? + л;| > О, { + 4 ' 2 О, если хх = 0 и х2 = 0, л= (х\, х2) — точка плоскости. Легко проверить, что эта функция непрерывна всюду на плоскости, включая точку (0, 0). В точке (0, 0) имеем .. /(0 + Й) —/(0) .. ^Фг .. тгНг <-о ( и*о Рк\ + Щ ^о к\ + Рк\ где /г= (Ни п2) — точка плоскости, представляющая собой некоторое приращение аргумента х функции }(х) в точке (0, 0). Таким образом, мы видим, что в точке (0, 0) слабый дифференциал }(х) существует и равен нулю. С другой стороны, в-начальной точке имеем /^.(0, 0) = —\'х (0> 0)= 0"» это непосредственно вытекает из самого определения частных производных и из того, что {{хи 0)=0, /(0, д;г)=0. Поэтому, записывая приращение функции в точке (0, 0) в виде ДДЙ1, кг) = ПК, А,)-/(0, 0) = Юа1 + Мй2 + о(Л)1 охх дх2 где к=(пи Н2) — приращение аргумента, "1^О!_>-0 при 1\Ы\ = (/г12+Й22)1/2-^-0, получим, что
Дополнение 3 585 Выбирая Н.2 — Н.12, имеем о (А) |Л =Л2 = Л1/2, что приводит к противоречию. Действительно, величина |&1|/2, поделенная на норму к, при /12=/и2 стремится" к 1/2 при ||/1||->0, а величина о(к), поделенная на \\Щ, при любых /ц и Н2 стремится к нулю при ||А||-*-0, что следует из определения о (к). Следовательно, функция }{х) не дифференцируема в точке (0, 0) в сильном смысле. Однако если отображение Р имеет сильную производную, то оно имеет и слабую производную, причем сильная и слабая производные совпадают. Действительно, для сильно дифференцируемого отображения имеем Р{х + 1к) — Р (х) = Р' (х) (Щ + о (Щ = 1Р' (х) к + о Щ, Р(х + (Н)—Р<х) ,. [с,м, ,'о(й) Нт = Р'{х)к, что и требовалось. Выясним условия, при которых из слабой дифференцируемое™ отображения Р следует его сильная дифференцируе- мость. Докажем следующую теорему. Теорема. Если слабая производная Рс'{х) отображения Р:Ы1-+Ы2 существует в некоторой окрестности 2*0 точки Хо и представляет собой в этой окрестности функцию от х, непрерывную в точке х0*, то в точке х0 сильная производная Р'{хо) существует и совпадает со слабой. Доказательство. По условию отображение Р имеет слабую производную /У(*о) в точке х0. Выбрав к так, что ^ц + Ае 2*0, рассмотрим выражение г(х0, к)=Р(хо+к)—Р(х0)~Р/(хо) к. Элемент г(х0, к) принадлежит пространству Л/т2. Пусть ср — произвольный линейный ограниченный функционал на пространстве Ы2. Позже мы укажем некоторые условия на его выбор. Тогда из формулы для г(Хо, к) получим Ф(г(х0, к)) = у(Р(х0+к)-Р(хо))-<?(Рс'(хо)к). Рассмотрим функцию /(7) =(р(Р(хо+Иг)— Р(х0)) числового аргумента I, 0<^<1. Эта функция дифференцируема по I и для нее * Рс' (х) отображает множество 2,, пространства #4 в некоторое множество пространства операторов (Л^-э-ЛГг), т. е. Рс'(х) — операторная функция. Понятие непрерывной функции было нами определено даже для отображений одного метрического пространства в другое (см. дополнение 2).
586 Гл. 12. Функции нескольких переменных (Здесь мы воспользовались непрерывностью функционала ф, поменяв местами символы Нт и <р, а также слабой дифферён- цируемостью Р{х) в окрестности 2*0.) Применив к функции /(/) формулу конечных приращений на сегменте {0, 1], получим /(1)=/(0)+Г(6), 0<8<1, или у(Р(х0+к) — Р{х0))=у{Рс'(хо-\-Вк)к), О<0<1. Таким образом, Ц)(Г(Х0, к))=Ц)(Р{Хо+11)—Р(Хо))—^{Рс,(Хо)к) = = (р{Рс' (хо+вк) к) — Ф (Р/ (хо) к) = = Ф {Рс (хо+ВН) к—Р/ (х0) к). Отметим теперь следующий факт: запись ^>(х), где хеЛ/ — некоторому нормированному пространству, а \р — линейный непрерывный функционал на Ы, можно рассматривать с двух точек зрения. Во-первых, можно фиксировать функционал гр и менять аргумент хеЛ/. В этом случае, например, как мы отмечали в дополнении 2, ||1|з[| = 8ир |я|)(х)| • Во-вторых, можно 11*11=1 фиксировать элемент хеЛ/, а менять функционалы г|). Линейные непрерывные функционалы ар отображают пространство N в пространство Р действительных (или комплексных) чисел и принадлежат тоже нормированному (даже банаховому в силу полноты Р, см. дополнение 2) пространству (Ы-+-Р). В этом случае, например, .||х|| = вир |а|з(х)|, где верхняя грань уже бе- 11*11=1 . ■ • рется по всем функционалам 1ре(Л/—>-Р); ||1|)|| = 1, т. е. по функционалам, имеющим нормы, равные единице. Поэтому, по определению верхней грани, существует такой функционал яр, 11^11 = 1, что при фиксированном х<=Л/" |ч|>(л:)|> — ||х||. Воспользуемся этим фактом и выберем функционал ф, ||ф|| = 1, таким, что 1фИ*0, й))|>-у|И*„ й)||, где к, а следовательно, г(хо, к) фиксированы. Отсюда и из равенства для ф(г(х0, к)) получаем, что \\г(х0, Н)\\<2\\у(Гс'{х0+вк)Н—Рс'(хо, к)\\< <с2\\Гс'(х0 + М)к—Рс'(х0)к\\\\<р\\<. <.2\\Рс{х0+Щ— Рс'{х0)\\\\к\\. '
Дополнение 3 587 Но по условию Рс'{х) есть непрерывная в точке Хо функция от х; поэтому Мт\\Р'с(хо + %к)-Р'с(х0)\\ = 0, Л-.-0 так что II {х0, к)\\ есть величина выше первого порядка малости относительно ||А||, т. е. Рс'(Хо)к, как это следует из формулы г(х0, к)=Р(хо+к)—Р(х0)—Рс'{хо)п есть главная, линейная по к, часть разности Р(хо+к)—Р(х0). Тем самым доказано существование сильной производной Р'{х0) и ее совпадение со слабой производной Р/ (*о) • 4. Дифференцируемость функционалов. В предыдущих пунктах нами было введено понятие дифференцируемого отображения Р:Ыг-^Ы2, отображающего нормированное пространство Ы\ в нормированное пространство Ы2. Мы уже отмечали, что производная Р'(х) такого отображения представляет собой при каждом х линейный оператор, действующий из N1 в ЛГ2, т. е. элемент пространства операторов (Л^-^Л/г). В частности, если Ы2—Р, где Р — числовая прямая или комплексная плоскость, то отображение Р принимает числовые значения на Ы\ и называется функционалом. При этом производная функционала Р в точке Хо есть линейный функционал, зависящий от х0. Для примера найдем главную линейную часть приращения функционала Р(х) = ||л'||2, заданного в действительном гильбертовом пространстве Н. Имеем Г(х+Ь)—Р{х)=]\х + к\\*-\\х\\*= (х+к, х + к) — (х, *)> = (х,.х)+2(х, к) — (х, х) + {к, к)=2(х, к) + (к, к). Можно убедиться, что Р'(х)=2х. (Для этого следует заметить, что всякий функционал в Н имеет вид скалярного произведения.) 5. Интеграл от абстрактных функций. В этом пункте будет изложен материал, являющийся, с одной стороны, .дополнением к изложенному в гл. 9 материалу об определенном интеграле, а с другой стороны, являющийся необходимым в теории дифференцирования в банаховых пространствах. Предположим, что отображение Р действует из банахова пространства В\ в другое банахово пространство В2, причем пространство В: есть числовая ось ЕК Таким образом, Р:Е1^- -+В2. Отображение Р, сопоставляющее числу х элемент банахова пространства В2, назовем абстрактной функцией на числовой оси. Производная Р'{х) абстрактной функции при условии, что она существует, представляет собой при каждом х элемент пространства В2 — касательный вектор к кривой Р(х). Для абстрактной функции, представляющей собой функцию числового аргумента х, очевидно, слабая дифферен-
588 Гл. 12. Функции нескольких переменных цируемость совпадает с сильной. В этом случае, используя соотношение \\Р{х+И1}—Р{х)—Рс'(х)Ы\\=о(\(\), ЬфО, *-*0, вытекающее из слабой дифференцируемости, и полагая в нем Ш=Н\, получим, что цР(х + Н1)-Р(х)-Р'с(х)Н1\\ = о(^-^=о(\Н1\), где число ку-^О, т. е. Р(х) сильно дифференцируемо и сильная производная совпадает со слабой. Построим интеграл от абстрактной функции Р(х), определенной на сегменте [а, Ь]. Пусть {хк} — разбиение сегмента [а, Ь]. Введем интегральную сумму п о=^ Р{Ък)Ьхк, Ьб[хи, хк\. Пусть й= тах АхА— диаметр разбиения. Абстрактную функцию Р(х) назовем интегрируемой на сегменте [а, Ь], если для этой функции на указанном сегменте существует предел I ее интегральных сумм при стремлении диаметра й разбиений {хк} к нулю, причем этот предел берется по норме пространства В2. Таким образом, абстрактна» функция Р(х) интегрируема, если Предел I называется интегралом от абстрактной функции по сегменту [а, Ь] и обозначается символом ь 1= [р{х)йх. а Очевидно, что / является элементом В2, поскольку <т являете» элементом В2 и пространство В2 полное, т. е. и предел а при й-й) принадлежит В2. Следует отметить, что построение теории интеграла от абстрактной функции мало чем отличается от построения теории» интеграла от числовой функции. Подчеркнем, что интеграл от абстрактной функции не является уже числом, как обычный интеграл, поэтому, например, всюду в доказательствах модуль интеграла от числовой функции надо заменять на норму инте- | грала от абстрактной функции и т. п.
Дополнение 3 589и Отметим следующие простые свойства интеграла от абстрактных функций. Их доказательства аналогичны доказательствам, приведенным в гл. 9 при построении интеграла Римана» 1. Интеграл от абстрактной непрерывной функции Р(х) существует, т. е. такая функция интегрируема. 2. Если С — линейное отображение пространства В2 в банахово пространство В3 (предполагается, что С также и непрерывно), то » ь [СР{х)йх = С ^Р(х)йх. а а 3. Справедливо неравенство ь ь \[р{х)йх\<[\\Р{х)\\йх, а а где справа стоит обычный интеграл Римана от числовой функции. 4. Если Р(х) имеет вид 1(х)у0, где }(х) — числовая функция, а г/о — фиксированный элемент из В2, то ь ь ^Р(х)йх = у0^!(х)(1х, а а где справа также стоит интеграл Римана от функции {(х) пв" сегменту [а, Ь]. 6. Формула Ньютона — Лейбница для абстрактных функций» В проведенных выше рассмотрениях через (N1-^2) мы обозначали пространство всех линейных ограниченных (непрерывных) отображений из линейного нормированного пространства #1 в линейное нормированное пространство Я2. Топологию* в- пространстве (N[-+N2) задает, например, норма в этом пространстве. Заметим, что для задания топологии (системы> окрестностей каждой точки) в линейном пространстве (Л/\->- -*-М2) достаточно задать систему окрестностей начала координат, в силу линейности пространства тем самым будут заданы? окрестности каждой точки. Рассмотрим теперь линейное пространство (Л/^-^-А/г) 1 всех: непрерывных ограниченных, быть может, нелинейных, отобрав I жений пространства Ы\ в М2. * Напомним, что для задания топологии на некотором множестве необходимо указать систему множеств, удовлетворяющих аксиомам 1, 2 (см. дополнен ние 2, раздел топологических пространств). Множества, удовлетворяющие этим* аксиомам, называются открытыми. Открытые множества метрического или нор^ мированного пространства удовлетворяют упомянутым аксиомам.
590 Гл. 12. Функции нескольких переменных Нелинейное отображение Р:МХ-^Ы2 называется ограниченным, если для всякого ограниченного множества ЛсгМ, соответствующее множество Р(А) ограничено в Ы2 (множество в нормированном пространстве ограничено, если его можно поместить внутрь некоторого шара с центром в начале координат). Нелинейное непрерывное отображение не обязано быть ограниченным. Очевидно, что пространство (Л^!-»-^) является подпространством (Л^-»-]^)!. В линейном пространстве (А^-кЛ/г)] зададим систему окрестностей нуля (для любого натурального п и произвольного е>0): 2„,Е = {/:•: зир 1^(х)||<е} |М<" и тем самым зададим топологию в пространстве (Ы\^>-Ы2)1. Читателю предлагается проверить, что данной системой окрестностей в пространстве (Л/^-^Л^Ь задана топология. На подпространстве (^1^-^2)01(^1^-^2)1 эта топология совпадает с обычной топологией, задаваемой операторной нормой. Рассмотрим сегмент [х0, х0+Ах] в Л/ь Пусть задано непрерывное отображение Р(х) этого сегмента в пространство (А^-^Л/гЬ, т. е. каждой точке х^[хо, Хо+Лх] сопоставлено некоторое отображение /■'(л:)е(Л^->-Л/2)1, непрерывно зависящее от точки д;еЛг|. Определим интеграл от Р(х) по сегменту [х0, х0+ + Ах], по определению полагая х0+Ах 1 Г Р{х)йх= {р{х0 + 1Ах){Ах)й1. х0 0 Здесь оператор Р(х0+1Ах) применяется к элементу ЛяеЛ^. При каждом ?(=[0, 1] величина Р(х0+1Ах] (Ах) представляет собой элемент пространства Ы2 — образ элемента Лл; при отображении Р(х0~(Ах). Согласно построениям п. 5 интеграл, стоящий в правой части формулы, существует и является элементом пространства Ы2. Используя эти замечания, докажем формулу Ньютона — Лейбница для интеграла от абстрактной функции. Рассмотрим отображение /*", которое действует из Ы\ в Ы2 и имеет на сегменте [х0, Яо + Ах] сильную производную Р'(х), непрерывную по х. Напомним, что отображение Р(х):Ы1-*~Ы2 непрерывно в точке *еЛ/ь если для любого шара с центром в точке Р{х), лежащего в Ы2, найдется такой шар с центром в точке х, лежащий в Ыи образ которого при отображении Р(х) целиком со- \. держится в указанном шаре с центром в точке Р(х).
Дополнение 3 591 Отображение Р(х) непрерывно на сегменте [х0, Хо+Ах] (т. е. на множестве точек вида {x0+^Аx}, где 0<^<1), если оно непрерывно в любой внутренней точке сегмента (т. е. когда точка отвечает параметру / такому, что 0</<1) и, кроме того, непрерывно в точке Хо справа и в точке х0+Ах слева*. Поскольку отображение Р'(х) непрерывно на сегменте *о+Дх [хо, Хо+Ал:], то существует интеграл 1 Р' (х)йх. Докажем, что имеет место равенство х0+Ах Г Р'{х)йх = Р{х0 + Ах) — Р{х0), Хо которое и называется форму л о й Ньютона — Лейбница для абстрактных функций. По определению интеграла можем записать Г Р'(х)с1х=^Р'(х0 + {Ах)(Ах)(И = Хо О = Пт V Р' (х0 + 4 Ах) Ах (4+1-4) = Пт V Р' (хк) (Ахк), где хк = хо+{кАхк, АХк—^к+1—^г)Ах, й — диаметр разбиения сегмента [0, 1]. С другой стороны, легко заметить, что . п—1 Р(х0 + Ах)-Р(х0) = ^ [Р(х0 + и+1Ах)~Р{х0 + ^Ах)] = я—1 ■%[Р(хы)-РШ к=0 Рассмотрим разность Р(Хк+\)—Р(хк)—Р'(хк)Ахк и применим к ней формулу из следствия к теореме п. 2 Лагранжа. При А = = Р/(хк) получим \\Р(хк+1)-Р(хк)-Р'(хк)Ахк\\< < $ир \\Р'(хк+вкАхк)~Р'(хк)\\\\Ахк\\. о<ей<1 * Говорят, что точка х<=[хо, х0+кх] стремится к точке х0 справа, если хе ^{хо+(Ах} и ^->-0+0. Аналогично определяется стремление х к точке Хо+Ах слева. Отображение Р(х), определенное на сегменте [х0, Хо+Ах], непрерывно в точке хо справа, если предельное значение Р(х) при стремлении х к точке ха справа равно Р(хо). Аналогично определяется непрерывность Р(х) в точке -Ко + Дх слева.
592 Гл. 12. Функции нескольких переменных Просуммируем эти неравенства по всем к от 0 до п—1 и вместо ||Дх*Ц поставим ИДяЩ^-н—**|. Получим |2 [Р(хш)-Р(хк)-Р'{хк) АхЦ< <||Дх||Ё Ых-1к) зир ЦР'(хк + ЪкАхк)-Р'(хк)\\. Так как производная Р'{х) непрерывна на сегменте [х0, х0+ + Ах], то она является и равномерно непрерывной* на этом сегменте. Поэтому правая часть неравенства, написанного выше, стремится к нулю при неограниченном измельчении разбиения сегмента [хо, Хо+Ах], откуда и вытекает, что Р (х0 + Ах)-Р (х0) = %,[Р (*М-0 ~Р (**)] = *=0 = 2 [Р (хк+1)-Р (хк) -Р' (хк) Ахк] + %Р' (хк) Ахк -+ 4=0 к=0 *о+ДХ I р' (х) ах, если е?-Ю. Формула Ньютона — Лейбница доказана. 7. Производные второго порядка. Рассмотрим дифференцируемое отображение .Р: Л/\-*-А/2. Мы уже отмечали, что производная Р'(х) этого отображения при каждом фиксированном хе^1 есть элемент пространства (Л^-^Л^) — пространства линейных ограниченных операторов на Ы\, действующих в Л^. Допустим, что отображение Р'{х), в свою очередь, дифференцируемо. Производная отображения Р'{х) называется второй производной отображения Р и обозначается символом Р". При каждом фиксированном х отображение Р"(х) является» очевидно, элементом пространства (^1->(Лг1->-Л^2)) — пространства линейных ограниченных операторов, действующих из Элементы этого пространства допускают и другую интерпретацию в виде так называемых билинейных отображений. * Абстрактная функция Р(х):Ы1-+Ыг называется равномерно непрерывной на множестве {х}=Мс:Ми если для всякого е>0 найдется такое б>0, что \\Р(х^—,Р(л:2)||<е для любых *1 и хг из множества М, если только 1*1—Хг11<б. Доказательство того факта, что непрерывная абстрактная функция на компакте в N1 является равномерно непрерывной, аналогично доказательству этого факта для числовых функций на компакте (см. гл. 4, § 6, п. 3, теорему 4.16).
Дополнение 3 593 Определение. Отображение В: (М1-*-Ы2), отображающее нормированное пространство Ы\ в нормированное пространство Л/*2, называется билинейным, если каждой упорядоченной паре элементов (хи г/О *> из Ых поставлен в соответствие элемент В(х\, г/0 из Л/2 так, что выполнены следующие свойства: 1. Для любых Х[, у\, х2, г/2 из Л/\ и любых чисел а и р имеют место равенства В(аХ1 + $х2, у1)=аВ{хи у1)+^В{х2, г/0, В{хи ау1 + Ру2)=аВ{хи у1)+^В(хи г/г). 2. Существует такое положительное число М, что \\В(х, у)\\<М\\х\\Ы при всех х, у, из Ы\. Первое из этих условий означает, что билинейное отображение В линейно по каждому из двух своих аргументов. Второе условие означает ограниченность билинейного отображения В. Так же, как и в случае линейного отображения (см,, дополнение 1), показывается, что ограниченное билинейное отображение является непрерывным уже по совокупности своих аргументов. Определение. Наименьшая из постоянных М, удовлетворяющих условию \\В(х, у)\\<.М\\х\\\\у\\, называется нормой билинейного от об р аоюения В и обозначается символом |(51|. Точно так же, как и над линейными операциями (операторами) (см. дополнение 1), над билинейными операциями можно определить операцию сложения двух билинейных отображений, по определению положив (В\ + В2) (х, у)=В\(х, у) + + В2(х, у), а также операцию умножения отображения В на число а: (аВ) (х, у)=аВ(х, у). Поскольку для билинейной операции В определена и его норма, то билинейные отображения пространства Ы{ в пространство Ы2 сами образуют линейное пространство. Обозначим его (Л/У-^Л^) (здесь индекс 2 над символом М\ означает, что из пространства Л^ берется два элемента (х, у), которые переводятся отображением В в один элемент пространства Л"2). Так же, как и в случае линейных отображений, показывается (см. дополнение 1), что если пространство Ы2 банахово (полное), то и пространство (Ы^^-Ыг) будет банаховым. * Пара элементов л: и у называется упорядоченной, если указано, кассой из ее элементов является первым. Если элемент х является первым элементом пары, а элемент у — вторым, то упорядоченную пару записывают так: <*, </)■
594 Гл. 12. Функции нескольких переменных Докажем следующее Утверждение. Между элементами пространства (Л/-!—>■ (Л^1—*-Л^2)) " пространства (Л^2-»-^) можно установить взаимно однозначное соответствие, сохраняющее линейные опе-. рации (т. е. если элементу А^^(N^-^(N^->'N<2)), отвечает элемент В1^(Ы12-+Ы2), а элементу Л2е(]\г1->(Л/,1-*-Л/2)) отвечает элемент В2е(Л/12->-#2), то элементу аА\ + ^А2 отвечает элемент\ аВ\ + $В2, где а и р — любые числа). Действительно, каждому элементу Ле(^1-»-(^1->-^2)). поставим в соответствие элемент В из (Л^2-*-^) по правилу В(х,у) = (Ах)у. Это соответствие, очевидно, линейно. Покажем, что это соответствие сохраняет и нормы элементов *, т. е. покажем, что ||ЛЦ = ||Б||. Отсюда, в частности и будет следовать взаимная однозначность соответствия. Действительно, если бы два различных элемента при изометричном соответствии переходили бы в один элемент, то их разность соответствовала бы нулевому элементу. Норма этой разности равнялась бы норме нулевого элемента, т. е. нулю. Таким образом, элементы совпадали бы, что противоречит их выбору. Итак, докажем, что если элементу Ле(Л^—^(Л/^-^Л^)) отвечает элемент Ве(^1г->ЛГ2), то ||Л|| = ||5||, причем нормы элементов берутся в соответствующих пространствах. Пусть г=В{х, у) = (Ах)у. Тогда 11г||<||Лх||№1|<||Л|| 11x11 \\у\\, откуда ЦЯ||«11Л||. С другой стороны, если задано билинейное отображение В, то при фиксированном хеА/\ отображение у^>~(Ах)у = В(х, у) является линейным отображением пространства Л^ в Ы2. Таким образом, каждому х^Ы\ ставится в соответствие элемент Ах пространства (Л/\-к/У2). Очевидно, что Ах линейно зависит от х, т. е. билинейное отображение В определяет некоторый элемент Л пространства (Л^->-(./У1->-Л?2)). При этом отображение В восстанавливается по Л при помощи формулы В(х, у) = {Ах)у. Далее, ||Лх|| =зир \\(Ах) у\\ = зир \\В(х, у)\\<\\В\\ \\х\\. М1<1 1М<1 * Соответствие между двумя упорядоченными пространствами, сохраняющее нормы отвечающих друг другу элементов, называется изометричным. Подг черкнем, что нормы берутся в соответствующих пространствах.
Дополнение 3 595» Таким образом, ИЛИ < ||Я||. Следовательно, из соотношений ||В||<:||Л|| и 1И||<||В|| получаем, что 1ИЦ = |!5||. Нами, таким образом, доказано, что соответствие между пространствами (N1-*- (Ы: ->Л'2)) и (Л^-э-Л/г) линейно и изомет- рично. При этом образ пространства (Ы1-+{Ы1->~Ы2)) при таком соответствии есть все пространство (Л^2->А/2) ■ Утверждение доказано. Из доказанного утверждения следует, что если берется какой-нибудь элемент пространства (М-М^-^Уг)), то всегда; можно указать его образ в пространстве (Л/^-э-Уг) • Более того, норма элемента в исходном пространстве и норма его образа совпадают. Сохраняются также линейные операции при построенном соответствии в пространствах (Л^->- ->(Л^1->7У2)) и (Л^2-*-Л/г). Такие пространства можно не различать; называются они изоморфными. Эти пространства отличаются только тем, что их элементы имеют различную природу, а все остальные свойства пространств (#г-»-(#1-->~ -*-Л^2)) и (Л^!2—*-Л/^2) одинаковы. В частности, мы выяснили, что вторая производная Р"{х) отображения /7:Л^1->Л?2 является элементом пространства {Ы\-+(К\-+И2)). В соответствии с только что сказанным мы: можем считать Р"(х) элементом пространства (Аг12-*-Л^2)- 8. Отображение т-мерного евклидова пространства в п-мер- ное. Важным частным случаем введенных выше отображений является случай отображения Р(х) т-мерного евклидова пространства в л-мерное. Напомним, что в евклидовом пространстве Ых = Ет норма элемента « = (Ни Н2, ..., Нт) записывается^ в виде т 1|Л||** = Ё#],УЯ. 1 = 1 а в пространстве /У2 = .Е" норма элемента* Р(х)~ = (р1(х), Р2(х) Рп(х)) записывается в виде 1 = 1 * Мы, естественно, подразумеваем, что в пространствах Еш и Еп выбраныч базисы, поэтому отображение Р(х) :Ет^>-Еп можно рассматривать в координатной форме. Конкретная реализация элементов пространств Ет, Еп может быть» любой.
596 Гл. 12. Функции нескольких переменных где х — фиксированная точка из Ет; Р\{х), р2(х), ..., Рп(х) — координаты вектора Р(х). В случае отображения Р(х) = {Р\(х), р2(х), ..., Рп(х)), х= = (х\, х2, ..., хт) т-мерного евклидова пространства Ет в л-мерное евклидово пространство Еп естественно считать это отображение или, что то же, эту вектор-функцию Р(х) * дифференцируемой в точке х^Ет, если каждая компонента р1(хи х2, ..., хт), Р2(Хи х2, ..., хт), ..., Рп(хи х2, ..., хт) дифференцируема в точке х как функция т переменных х\, х2, ..., хт. Отображение Р(х) можно рассматривать и с общей точки зрения (а не как векторную функцию), т. е. как отображение одного нормированного пространства Ы^Е™ в другое нормированное пространство Ы2=Е". Определение дифференцируемого отображения Р{х):Му-> -+N2 в точке х в том случае будет таким же, как и в случае общих нормированных пространств, только нормы, фигурирующие в этом определении, будут определяться формулами для норм в евклидовом пространстве. А именно мы назовем отображение Р(х):Ег"-*~Еп, определенное на некотором открытом подмножестве 1,с:Ет, дифференцируемым в точке хе2, если существует такой ограниченный линейный оператор Ьх^(Ет-+Еп), что для любого е>0 можно найти 6>0, при котором из неравенства \\п\\Ет < 6 следует неравенство \\Р(х + Н)-Р (х)-ЬхН\\Еп < в||А||в«. То же самое сокращенно можно записать так: Р (х+Н) — Р (х) — ЬХН=о (к), где величина ||о(А) ||/||/1||-*~0 при ||л||->0. Аналогично общему случаю вводится и производная Р'(х) отображения Р{х). Из курса линейной алгебры известно, что всякое линейное отображение т-мерного евклидова пространства в л-мерное (линейный оператор) можно задать некоторой матрицей порядка (пгХп). Поскольку производная Р'(х) отображения Р{х), действующего из Е,п в Еп, есть оператор из пространства Ет в пространство Еп (элемент пространства (Ет-+Еп)), то Р'{х) есть зависящая от х матрица порядка (тХп). ■ Найдем вид матрицы. Если в Ет и Еп выбраны базисы, а именно базис еи е2, ..., ..., ет в Ет и базис /ь /2, ..., /„ в Еп, то всякий вектор х^Е™ запишется в виде х=Х1е1 + х2е2+... + хтет, пде хи х2, ..., хт — координаты вектора х в базисе еи е2, ..., ет. Всякий вектор 1/еЕ» можно записать в виде У=Уф+у2!2 + ... +У4п, где «а, У% —, Уп — координаты вектора у в базисе ^, /2, •••. /«• * Мы учитываем, что при каждом х из Ет значение Р(х) представляет со- *бой вектор (7ч (х), Рг(х), ..., Рп(х)) из пространства Еп.
Дополнение 3 597 Отображение у~Р(х) пространства Ет в пространство Еп (хе.Ет, у^Еп) можно записать в виде У1 = РЛхи х2, ..., хт), У2 = Р2(Х\, Х2, —, Хт), Уп = Рп{Х\, Х2, ..., Хт). Здесь Рх{хих2, ...,хт), Р2(хи х2, ..., хт), ..., Рп(хи х% ..., хт) — координаты вектора у = Р(х) при фиксированном х= = (Х\, Х2, ..., Хт) ■ Далее, отображение Р'(х), как мы уже говорили, является линейным оператором — элементом пространства (Ет-*~Еп). Покажем, что если р(х) дифференцируема, как вектор-функция, то ( ду1 дух дух 1 Р'(х) = дхг дуг дхх дуп дх2 ду2 . дх2 дУп дхт дуг дхт дуп (***) [ дхх дхг дхт , В самом деле, в этом случае Р(х) = (Рх(х), Р2(х), ..., ..., Рт(х)), Р(х+Н) = (Р1(х+Н), Р2(х+Н), ..., Рт(х+Н)), х = ~(хи х2, ..., хт), х + п=(Х1 + Н1, х2+Н2 хт + Нт), и если записать вектор-функцию покомпонентно в виде столбца и воспользоваться тем, что каждая компонента является дифференцируемой функцией т переменных, то Р(х+Н)—Р(х) = ,Рг(хх + Нх, х2 + Н2,...,хт + Нт)~Р1 (*!, х2,..., хт) \ = (р2(х1 + /г1, х2+Н2, ■..,хт + Нт)~Рг{х1, х2,... ,хт) \рп(х1 + н1> х2 + Н2, ■■■,хт + Нт)~Рп{х1, х2 ,хп)> ( т 1=1 т Ъ 1=1 д-^1 (х1> *2> • • • > *т) дхе- А; + о (А) дРг{хихг,...,хт) ^ + о(Л) дх/\ ^ = 1 дРп{х1, х2, ... , хт) дх/ А,. + о(А)
598 Гл. 12. Функции нескольких переменных Г дРг дРг дР± ^ Г , 1 "1 ~^— ••• 1 Л1 дхх дР2 дхг дРп дх2 дР2 дх2 дРп дхт дР2 дхт дРп К дхх дх2 + дхт ) ( т) к о (Л) о (К) о(А) Здесь величины о(Н)1\\Н\\ *, принимающие вещественные'значения, стремятся к нулю, если \\Н\\ = (к21 + к22 + ... + к2т)^2^0. Эта матричная запись допускает, как это легко видеть, такое, более простое представление Р[х+к) — Р{х) = Ьхк + о(к), где ( дРх дРх дРг ) Р'{х)^Ех = дхг дР2 дхх дРп дх2 дР2 дх2 дРп дхт дР2 дхт дРп дХ} дх2 дх„ л= < и "> к , о-(А) = 'о(п)' о {К) о (к) 1 ; причем величины о(/г)/||/1||->-0, если \\к\\ = (к21 + к22+ — + + к2т)1/2-+0. Поскольку координаты вектора о(к)/\\к\\ стремятся к нулю, если |[/м|->0, то и норма вектора о(к)/\\к\\ в пространстве Еп (т. е. корень квадратный из суммы квадратов его компонент) также стремится к нулю, если ||Л||-»-0. Поэтому можно заключить, что производная Р (х) дифференцируемого отображения Р{х):Ет^-Еп в точке х находится, по формуле (***). Матрица, задаваемая формулой (***) называется якобие.вой матрицей отображения Р:Ет-*-Еп, а в случае п — т ее определитель — якобианом этого отображения в данной точке х. 9. Производные и дифференциалы высших порядков. Аналогично тому, как это было сделано в п. 7 для второй производной отображения Р (х) одного нормированного пространства Л/] в другое нормированное пространство Ы2, можно ввести понятие третьей, четвертой и вообще я-й производной отображения Р (х), определив п-ю производную как производную от производной (п—\)-го порядка. При этом, очевидно, п-я производная представляет собой элемент пространства -(Л^~>- -*-(Л^->-...— (Л^-э-Л/'г))), Л*1 встречается п раз. Повторяя рассуждения, проведенные для второй производной, можно каждому элементу этого пространства поставить в соответствие эле- * В случае дифференцируемой функции пг переменных величину о (к) мы обозначали о(р) =о(||Л||), где р=||ЛЦ.
Дополнение 3 599 мент пространства (ЛГ1П->Л^2) полилинейных (а именно «-линейных) отображений М\^-Ы2. При этом под полилинейным отображением (п-линейным) отображением одного нормированного пространства в другое понимается такое соответствие у=А(х\, Х2, .... хп) между упорядоченными системами (х\, Х2, ..., хп) элементов из Л^ * и элементами пространства N2, которое линейно по каждому из хи 1=1, 2, ..., при фиксированных остальных элементах и удовлетворяет при некотором М>0 условию . \\А(ХиХ2, ...,. Хп)\\<МЫ\\Х21..\\Хп\1 Таким образом, п-ю производную Р<-пЦх) отображения Р можно считать элементом пространства (Ы1п-^-Ы2). Рассмотрим теперь дифференциалы высших порядков. Напомним, что мы определили сильный дифференциал йР отображения Р как результат применения к элементу /геЛ^ линейного оператора Р'(х), т. е. в виде йР = Р'(х)Н. Дифференциал второго порядка определяется как величина й2Р=Р"(х) (к, к), где Р"{х)(к, к) является квадратичным выражением**, отвечающим отображению Р"(х)^. еЕ(Л/!2+Л'2). Аналогично дифференциалом п-го порядка называется выражение (1пР = р(п)(х) (п, п, ..., к), т. е. дифференциалом п-го порядка называется элемент пространства N2, который получается в результате применения оператора Р^пЦх) к элементу (к, к, ..., к) пространства М1хМ1Х...хМ1=Ы1п. п раз 10. Формула Тейлора для отображений одного нормированного пространства в другое. Согласно рассмотрениям п. 1 сильная дифференцируемость отображения Р(х) означает, что разность Р(х+к)—Р(х) может быть представлена в виде линейного члена по к и слагаемого, имеющего порядок выше первого относительно \\к\\. Этот факт обобщает, как мы знаем, соответствующее разложение для дифференцируемой функции Р(х) —Р(х1, дг2, ..., хт) т переменных. Для функции Р(х\, х2, ..., хт) справедлива, как было показано в этой главе, формула Тейлора с остаточным членом в форме Пеано. Поэтому, естественно, возникает вопрос о получении формулы Тейлора с остаточным членом в форме, аналогичной форме Пеано, и для отображений нормированных пространств. Справедлива следующая теорема. Теорема. Пусть Р — отображение нормированного про- * Элемент (х\, хг, ..., х„) принадлежит пространству N^п~N^X■..XN^ (ср. дополнение 2). ** Выражение В(х, х) называется квадратичным, если получено из -билинейного отображения В(х,у) при совпадающих аргументах, т. е. при х=у.
600 Гл. 12. Функции нескольких переменных странства Л^ в нормированное пространство Л^2, определенное на некотором открытом мнооюестве 2сЛ/1 и такое, что Яп>(х) существует и представляет собой равномерно непрерывную- функцию* от х в 2. Тогда имеет место равенство Р(х+п)-Р(х)=Р'(х)к+Ч2Р"(х)(К й) + ... ... + №>(*) (к, к, ...,к)+г(х,к), где \\г(*, й)||=о(|№)**. Доказательство. Проведем доказательство этой теоремы по индукции. При л=1 равенство означает просто диф- ференцируемость отображения Р(х), и тем самым это равенство по условию теоремы выполнено. Рассмотрим теперь произвольное фиксированное целое число л>2 и предположим, что равенство, получающееся из (4) заменой п на п—1, справедливо для всех отображений, удовлетворяющих условиям теоремы, в которых я заменено на п—1. Докажем равенство (****). Рассмотрим отображение Р'(х) и применим к нему формулу Тейлора (****), в которой л заменено на п— 1, а вместо приращения к рассмотрено приращение Й, где / — число, принадлежащее сегменту [0, 1]. Очевидно, что Р' (х + 1к) = Р' (х) + ^Р" (х) Л + Д- Р'" (х) (к, к) + ... ' • • + {г!1\у. *** М (ЬЛ,...,к) + Ф.Щ***, 'где \\п{х, й)[1=о(^-1||й||п-1), а форма (к, к,...,к) имеет п— 1 аргумент©в. Проинтегрируем обе части формулы Тейлора для р'(х+к)**** по сегменту [х, х+к] и воспользуемся формулой * Отображение Р'.Ы^Ы^ (или абстрактная функция Р(х)) называется равномерно непрерывной функцией на множестве МсЛ^, если для любого числа е>0 найдется такое число б>0, что \\Р(Х1)—Р{х2)\\<е для всех точек хи *2 из множества М одновременно, если только 11*1—л2||<в (см. также примечание п. 6). ** Это равенство означает, что для любого числа е>0 найдется такое чис- \\г(х,Н)\\' ло б>0, что \\г(х, А)||<е||А||в, если ||А]|<6, т. е. — ^0, если п->-0. *** Мы пользуемся тем, что формы (А, А) (А, А, ..., к) линейны по каждому из своих аргументов. Поэтому (<А, 1к)—Р(к, А), Цк,(к й) = С-1 (А, А, ... , к). п—\ "гРл **** Т. е. формулу I2 Р' (х + /А) = Р' (х) + 1Р" (х) к +-— Р'" (х) (А, А) 4- + ••■+ (г1<Я11), Р(п)(х)(к,к, ... ,к) + г1(х, к). п—1
Дополнение 3 601 Ньютона — Лейбница для абстрактных функций (см. формулу п. 6). Получим 1 Р (х + к)—Р (х) = (У (х + Щ к&1 = ' / 0 1 = Пр' (х) + (Г (х)к + -^-Р'"{х)(к, к)+ ... + о + —±— е~1 р{п) (х) {к, н к)\ш+к„, (я —1)! Г где 1 ь Здесь мы воспользовались тем, что по определению интеграла от х+Н абстрактных функций справедливо равенство С Р' (х + к) йк = X 1 , — ^Р'(х+1к)М1, а также формулой для отображения Р'\х+1к). Таким образом *, р (Х + Н)-Р (х) = Р' (хук + ± Р" (х) (к, к)■+ ... + + ±-Р^{х){к,к к) + Кп, где для Кп в силу свойств 3 интеграла (см. п. 5) справедлива оценка ПЯЛ <\$гг(х, ЩШ\< |\\гг(х, 1к)\\ \\к\\(И =о(||Л||«). о о Следовательно, формула Тейлора для отображения .Р(х) одного нормированного пространства Ы1 в другое нормированное пространство #2 установлена. Теорема доказана. * Ниже мы пользуемся тем, что выражение Р"(х)я, примененное к я, есть квадратичное выражение Р"(х)(к, А), Р"(х)<=(К1г-*-Ыг), и действует на пару векторов (я, я), переводя их в элемент пространства Ы%; аналогично Р -(*)(я, к, ... , к) примененное к я, есть уже я-линейное отображение вида рЫ(х)(к,к к). п 20 Зак. 72
602 Гл. 12. Функции нескольких переменных Исследование на экстремум функционалов в нормированных пространствах В главе, посвященной дифференциальному исчислению функции одной переменной, и в § 6 гл. 12 мы уже занимались задачей об отыскании экстремумов функции одной или нескольких переменных. Однако ряд задач, имеющих важное практическое применение, приводит к отысканию экстремумов функционалов, определенных на нормированном пространстве. Так, например, еще в 1696 г. Иоганн Бернулли опубликовал письмо, в котором предлагал вниманию математиков задачу о линий наиболее О быстрого ската — брахистохроне. В этой задаче требуется найти линию, соединяющую две точки А^ и Л 2, не лежащие на одной вертикальной прямой, и обладающую тем свойством, что материальная точка скатится по этой линии из точки А± в точку Л$ в кратчайшее время. Эта задача приводит к исследованию на экстремум функционала Р(х), определенного на нормированном пространстве С\[а, Ь] непрерывно дифференцируемых функций (см. дополнение 1) вида ь Р{х) = [ф(х{1),х'\1))й1, а где х{1) — элемент пространства С\[а, Ь]. Оказалось, что линией наиболее быстрого ската является циклоида (см. § 7 гл. 5) / = Л(т—51ПТ), х=А{\—созт). Основным принципом в механике является принцип стационарного действия Остроградского—Гамильтона, утверждающий, ч-то среди возможных, т. е. совместимых со связями, движений системы материальных точек в действительности осуществляется движение, которое можно определить, исследовав на экстремум функционал * а где Т — кинетическая, а V —• потенциальная энергия системы. Изучение таких задач, в которых надо исследовать на экстремум определенный функционал, составляет содержание так называемого вариационного исчисления. В настоящем пункте мы коснемся лишь некоторых основных фактов этой дисциплины. 1. Необходимое условие экстремума. Пусть Р{х)—некоторый действительный функционал, определенный на банаховом пространстве В, т. е. Р(х) — отображение полного нормированного пространства В в действительную числовую ось.
Дополнение 3 603 I Определение. Функционал Р(х) достигает в точке Хо локального минимума (максимума), если для всех х, находящихся в достаточно малой окрестности точки Хо (т. е. для всех х, для которых норма разности х—х0 достаточно мала), выполнено неравенство Р(х)—Р (х0) >-0 (<0). Локальный минимум и локальный максимум объединяются общим наименованием «локальный экстремум». Для функций т переменных мы установили в § б следующее необходимое условие экстремума: если функция {(х^ х2,...,хт) дифференцируема в точке Хо= (хи х%,..., хт) и имеет в этой точке экстремум, то в этой точке либо ^=0, либо, что то же, _^_=-^- = ...=-^- =0. дхг дхг дхт Для функционалов на произвольном нормированном пространстве справедлива аналогичная теорема. Теорема. Для того чтобы дифференцируемый на нормированном пространстве функционал Р достигал в точке Хо экстремума, необходимо, чтобы его дифференциал в этой точке равнялся нулю тождественно относительно Н: а'Р = Р'(хо)п=0, т. е. необходимо, чтобы Р'(хо) =0. Доказательство. Поскольку функционал Р дифференцируем, то по определению дифференцируемости Р(хо + Н)—Г(хо)=Р'(Хо)Н+о(Н). Если Р'(хо)пФО для некоторого элемента Н, то для всех достаточно малых- действительных чисел Я, знак всего выражения Р'(хо) (КН) -\-о(\кН) совпадает со знаком его главного члена, Р'{х0)(Хк), так как если & мало, то величина \\Хк\\ также мала и о (АЛ) есть величина более высокого порядка малости по сравнению с Р'(х0)(&к). Функционал Р'(Х(,) линейный, поэтому Р'{ха) (АЛ) —кР'(хо)Ъ. Следовательно, если Р'(х0)кф0, то приращение Р{х0+Щ— Р(х0) =Р'(х0) (АЛ)+о(ЯЛ) (при данном к, для которого Р'(х0)к^=0) может принимать при сколь угодно малых по норме элементах АЛ как положительные, так и отрицательные значения, т. е. экстремума в точке Хо быть не может. Теорема доказана. Пример. Рассмотрим функционал ь Р{х) = \Щ,х{1),х'{1))й1, а "| заданный на пространстве С\[а, Ь] непрерывно дифференцируе- 20*
604 Гл. 12. Функции нескольких переменных мых на отрезке [а, Ь] функций. Здесь х' (() =——, /(^, х(1)% х'{1)) — дважды дифференцируемая функция своих аргументов на множестве а<^<Ь, —оо<д;< + оо, —оо<л/<оо. Этот функционал играет важную роль в вопросах вариационного исчисления. Согласно предыдущей теореме, для того чтобы найти те точ^ ки, в которых возможен экстремум, т. е. найти стационарные точки, необходимр найти сильный дифференциал этого функционала и приравнять его нулю. По формуле Тейлора с остаточным членом в форме Пеано для функции /(7, х, х') получим, что ь Р{х+к) —Р{х) = [\Щ,х + к, х' + Н')— Д(/, х, х')]сИ = а Ь =\ [!х (*, х, х') н (о + /; (*, х, хг) к' (о + о (Р)];л, а где р=[А2+А'2]*. Напомним, что норма элемента к в пространстве С^[а, Ь] определяется по правилу ||Л||С1[0,ь] = тах{тах |й(*)|, тах 1А'(01}- Поэтому ь 11 о (р) Л | < (Ъ-а) - о(||А||с1[вл) =о(||А||С1[в.ч). а Итак, необходимое условие экстремума для данного функционала имеет вид (к(1) — произвольное приращение аргумента ь йР - Г [1'х (*, х, х') к ({) + /V (/, х, х') к' ({)] (И = 0. а На самом деле, можно убедиться, что это условие эквивалентно следующим: 0.1 Это так называемая краевая задача для функции х(() определяет некоторую кривую х(1), на которой возможно достижение функционалом экстремума. Указанная краевая задача состоит из дифференциального уравнения для функции х(1) (уравнения,, содержащего функцию х(1) и ее производные) вида/^(*, х(()> х' ({)) /*'('. х(1), х' (^)) = 0, которое называется урав-
Дополнение 3 605 ь нением Эйлера для функционала Р = Г/1 (?, х,х')Микраевых а условий вида }'х>{1, х (/), х' (0)|<=о = 0, /у (*, х (0.. *'(0) 1-<=ь = °- 2. Достаточные условия экстремума. Напомним, что для функции /п переменных /(*!, х2,..., хт) справедливы следующие утверждения. Если функция {{хи Хг,...,хт) имеет в точке (хи Х2,...,Хщ) локальный минимум (максимум), то в этой точке й2/>б(<0). Если в точке (х\, х%,..., хт) выполнены условия: /71 1) й/ = 0и 2) й*1= V _^_Лс^>0 №<0), 1.6=1 когда не все ^ = 0, то в этой точке /(х) имеет локальный минимум (максимум). Посмотрим, в какой мере эти факты переносятся на функционалы, определенные на банаховом пространстве. Теорема. Пусть Р(х) — функционал, принимающий действительные значения и заданный в банаховом пространстве В. Пусть Р(х) имеет в некоторой окрестности точки х0 непрерывную вторую производную. Если этот функционал Р(х) достигает в точке х0 Локального минимума (максимума), то &Р(;Хо)>0 (42Р(х0)<0). Доказательство. Заметим прежде всего, что й2Р(ха) — = Р (хо){Н, к). Поэтому неравенство й2Р(Хй)>>0 означает, что Р'(хо)\к, /г)»0 для всех ЛеЛ. По формуле Тейлора получаем Р(х0 + п)~Р{х0) =Р' {х0)Н + ±Р"(х0) (к, к) + о (Р||2). Допустим для определенности, что в точке х0 функционал Р(х) имеет локальный .минимум. Тогда Р'(хо) = 0 и, следовательно, Р (х0 + к)-Р (х0) = ±- Р" (х0) (к, к) + о (||Л||а). Если при каком-либо к выполнено противоположное неравенство Р"{х0)\к, к)<0, то, поскольку Р"(х0)(Хк, Щ=к2Р"(х0) (к, к) при любых действительных Я, существуют сколь угодно малые по норме элементы §=Хк*, для которых Р"(хо)(ё, §)<0- Но при достаточно малых ||^|| знак выражения Р(х0+§)—Р(х0)~ * Действительно, 11^11= |Х|||й||, и при малых по модулю числах X и фиксированном элементе к норма элемента ц мала.
606 Гл. 12. Функции нескольких переменных =—-Р"(х0)(&, §) + о(\\д\\г) определяется знаком главного члена — Р"(х0) (§, §), и мы получаем, что Р (*„ + д) -Р(х0) = ±-Г (х0) (в, 8) + о(\\8\П < О, т. е. минимума в точке х0 нет. Аналогичные рассуждения проводятся и для того случая, когда в точке х0 функционал имеет локальный максимум. Теоре- ма-доказана. Как видим, эта теорема есть прямое обобщение соответствующего утверждения о необходимом условии экстремума для случая функции т- переменных. Однако если речь идет о достаточных условиях экстремума функционалов, то полная аналогия со случаем функции т переменных исчезает. Условие й2/>0 положительной определенности второго дифференциала, достаточное для минимума в стационарной точке в случае функции ((хи х%,..., хт) т переменных, не является- достаточным для минимума в стационарной точке функционалов, определенных на произвольных банаховых пространствах.! Для примера рассмотрим пространство /2 всевозможных последовательностей (х%, дг2,...) действительных чисел Хи Хг, ■■'■; 00 Л таких, что V* |%А|2 = Пт V |х&|2< оо. Сумма двух последо- вательностей х=(х1, Хг,...) и у=(уи г/г,—) определяется так: х+у= (х1-\-уь Х2+У2,—); произведение последовательности х— = (хи Хг,...) на число А, определяется по правилу: Хх= (Ххи %Х2,...). Из элементарного неравенства |хь±г/й|2<2|х&|2+ + 2|г/ь|2 следует, что элемент х-\-у принадлежит нашему прост- ранст'ву, если х и у ему принадлежат, поскольку V \хк + ук\г ^ 00 со < 2 V |*а12 + 2Т] \уь\2<.°°- Таким образом, введенное прост- ранство линейно. Если ввести в этом линейном пространстве норму, положив по определению, что 1И1"=2 1**12. то введенное нами пространство /г становится нормированным. Аксиомы нормы проверяются здесь без труда. В частности, ак-
Дополнение 3 607 сиома треугольника следует из того, что при каждом натуральном л справедливо неравенство (2 |х*±лг),/я<(2 1**1г)1/2+(х; ы2)1 I аЛ 1/2 \Ук к^1 ' *=1 ' Ь=1 (см. дополнение 2). Переходя здесь к пределу при п-^оо, получаем неравенство треугольника. Рассмотрим в данном нормированном пространстве /2 функционал оо 9 °° А=1 6=1 Вычислим первый и второй дифференциалы этого функционала в точке 0. Имеем СО 00 00 о (Хк + Ьь)2 Р(х + п)-Р(х) = %Щ^-%(Хк + пку-% к3 к=\ А=1 Л=1 -Е^2Е(^-2Ф+ к-1 *=1 где многоточием обозначены члены, не являющиеся линейными по п= (ки кг,...). Таким образом, в точке х=0 первый дифференциал равен нулю. Вычисляя, аналогично находим, что вто- °° к2 рой дифференциал в точке 0 й2Р ="2 V ~- > 0 положительно 4=1 определен. Тем не менее в точке 0 минимума нет. Действительно, Р(0)=0, Р(0,...,0±,0,...)=-±—~<0, и поэтому Р(0, 0 О, —, 0, . ;. ] — ^(0, 0, ...). < 0. Поскольку элемент х = (0, 0, . .. ,0, —, 0, ...) может быть по норме /2 сделан сколь угодно малым (||х||2=—), где к — произвольно боль- кг шое натуральное число), то в любой сколь угодно малой окрестности точки 0 существуют точки х, в которых Р(х)<Р(0). Следовательно, в точке 0 минимума нет. Введем следующее определение. Определение. Квадратичный функционал В(х, х) назы- вается сильно положительным, если существует такое
608 Гл. 12. Функции нескольких переменных положительное число у, что В(х, х)>>у\\х\\2 для всех х. Если В(х, л;)>0 для всех ненулевых х, то функционал называется положительно определенным. Очевидно, что сильно положительный квадратичный функционал В(х, х) является положительно определенным. Обратное, вообще говоря, неверно. Теорема. Если дважды дифференцируемый функционал Р(х), определенный в банаховом пространстве В, удовлетворяет в точке Хо^В условиям: а,Р(х0)=0 и йгР{х0) — сильно положительный квадратичный функционал, то Р(х) имеет в точке Хо локальный минимум. Доказательство. Пусть Р"(хо)(п, Н) >у||/г||2. Выберем е>0 настолько малым, чтобы при ||Л[|<8 величина о(||/г||2) в равенстве Р (х0 + п)—Р(х0) = — Р" (х0) (п> Щ + о (||А||а) удовлетворяла условию ||о(||/г||2)|| < ^-||й||а. Тогда 4 Р(х0 + Н)-Р(х0) = -1-Р''(х0)(п,п) + о(\\п\\2)>^-№\2>0 2 4 при ||Л||<8. Следовательно, в точке х0 имеется локальный минимум функционала Р(х). Теорема доказана. Эта теорема вместе с приведенным выше примером функционала в /2 показывает, в частности, что сильная положительность есть более сильное условие, чем положительная определенность квадратичного функционала. Заметим, что в конечномерном, пространстве сильная положительность квадратичной формы эквивалентна ее положительной определенности. Заканчивая дополнение 3, подчеркнем, что предыдущая теорема устанавливает достаточное условие минимума, которое является весьма общим и вместе с тем трудно проверяемым в ряде задач. Поэтому в вариационном исчислении, исходя из конкретного вида функционала, устанавливают другие более тонкие достаточные условия экстремумов функционала. На этом вопросе в данном курсе мы останавливаться не будем.
Глава 13 НЕЯВНЫЕ ФУНКЦИИ Во многих вопросах естествознания приходится сталкиваться с такой ситуацией, когда переменная и, являющаяся по смыслу функцией аргументов Х\, х2,..., задается посредством функционального уравнения Р(и, Хи х2,...) =0. В этом случае говорят, что и как функция аргументов Хи х2,... задана н е я в но. Естественно, возникает вопрос о том, при каких условиях функциональное уравнение Р(и, хи х2, ...)=0 однозначно разрешимо относительно и, т. е. однозначно определяет явную функцию и = ф.(д;1, х2,...), и более тонкий вопрос о том, при каких условиях эта явная функция непрерывна и дифференцируема. Указанные вопросы не являются простыми. В качестве примера обратимся к функциональному уравнению Р(и, Х\, х2) = = и2 + х12 + х22—1=0, определяющему в пространстве переменных (и, х\, х2) сферу 5 радиуса 1 с центром в начале координат Рис. 13.1 (рис. 13.1). Очевидно, указанное функциональное уравнение определяет в круге Х\2 + х22<с < 1 бесконечно много явных функций. Таковыми являются функ-. VI—х\ — х\, функция « = — VI ция и = функция, равная 2 2 х\ —х2и любая ГП Х\ —х2 для одних точек круга Х\2+х22< 1 ■«?■ и равная — у 1 —Х\—х2 для других точек этого круга. При каких же условиях существует единственная явная функция, удовлетворяющая уравнению Р(и, хи х2) = и2+х12-^-х22--1=0? Фиксируем на сфере 5 произвольную точку М0(и, х±, х2), не лежащую в плоскости Оххх2, т. е. такую, что «^=0. Очевидно, что часть сферы 5, лежащая в достаточно малой окрестности точки М0, однозначно проектируется на плоскость Ох1х2 (см. рис. 13.1). Аналитически это означает, что если рассматривать функцию Р(и, хи х2) = и2+х?-\-х22— 1 только в указанной достаточ-
610 Гл. 13. Неявные функции но малой окрестности точки Мо, то уравнение Р{и, хи Хг)=и2-{- +х^+Хг2—1=0 однозначно разрешимо относительно и и опреде» V*- 2 2 1 —Х\ —х2 при й>0 и соответственно и = — V 1 —Х\ —х2 при и<0. Если же на сфере 5 взять точку М^О, Х\, Хг), лежащую в плос- кости 0*1X2 (см. рис. 13.1), то очевидно, что часть сферы 5, лежащая в любой окрестности Ми неоднозначно проектируется на плоскость Ох&г. Аналитически это означает, что если рассматривать функцию Р(и, Хи Хг) = и2+Х\2-\-Хг2—1 в любой окрестности точки М\, то уравнение Р(и, Хи Хг) = и2-{-Х\г+Хг2—1=0 не является однозначно разрешимым относительно и. Обратим внимание на дР то, что частная производная = 2« функции Р(и, Х\, Хг)=«2+ ди +Х12+х%2—1 не обращается в нуль в точке М0 и обращается в нуль в точке Ми Ниже мы установим, что для однозначной разрешимости в окрестности точки М0 общего функционального уравнения Р(и, Хи Хг, ...)=0 относительно и принципиальную роль играет необращение в нуль в точке уИ0 частной производной -—. Попут- ди но мы установим условия, при которых явная функция, представляющая собой единственное решение этого уравнения является непрерывной и дифференцируемой. Полученные нами результаты будут перенесены на случай неявных функций, определяемых системой функциональных уравнений, а также на случай абстрактных функций, осуществляющих отображения произвольных банаховых пространств. § 1. СУЩЕСТВОВАНИЕ И ДИФФЕРЕНЦИРУЕМОСТЬ НЕЯВНО ЗАДАННОЙ ФУНКЦИИ 1. Теорема о существовании и дифференцируемости неявной функции. В дальнейшем мы договоримся обозначать пространство переменных {и, х±, Хг,...) символом 7?, а пространство переменных (хи хг,...) символом Я'. Для сокращения записи и для удобства геометрической иллюстрации будем рассматривать две переменные х1 и Хг- Теорема 13.1. Пусть функция Р(щ х\, Хг) дифференцируема в некоторой окрестности точки М0(й, хи х2) пространства Я, причем частная производная дР/ди непрерывна в точке М0. Тогда если в точке М0 функция Р обращается в нуль, а частная производная дР/ди не обращается в нуль, то для любого достаточно малого положительного числа е найдется такая окрестность точки о о М0'(хи Хг) пространства Я', что в пределах этой окрестности существует единственная функция и = у(хи х%), которая удовлетво-
§ 1. Существование и дифференцируем ость 611 ряет условию \и—й\ <еи является решением уравнения Р(и, хи х2)=0, (13.1) в окрестности точки причем эта функция ы = ф(х1, х%) непрерывна и дифференцируема в указанной окрестности точки М0'. Замечание 1. В условиях теоремы 13.1 можно опустить требование непрерывности частной производной дР/ди в точке М0, но тогда придется дополнительно потребовать, чтобы эта производная не обращалась в нуль не только в самой точке М0, но и в некоторой ее окрестности и сохраняла определенный знак в этой окрестности. Доказательство теоремы. 13.1. 1. Прежде всего докажем, что для достаточно малого е>0. М0'(Х[, х2) существует единственная функция и = ц>(хих2), удовлетворяющая условию \и—ы|<е и являющаяся решением уравнения (13.1). . Чтобы сделать доказательство более наглядным, будем сопровождать его геометрической иллюстрацией. Из аналитической геометрии известно, что уравнение (13.1) определяет в пространстве К некоторую поверхность 5 (рис. 13.2), причем в силу условия Р(М0)=0 точка М0 лежит на эгой поверхности. С геометрической точки зрения однозначная разрешимость уравнения (13.1) относительно, и означает, что часть поверхности 5, лежащая в непосредственной близости к точке М0, может быть однозначно спроектирована . на плоскость ОХ\Х2. Ради определенности будем считать, что частная производная дР*ди положительна в точке М0. Тогда из непрерывности указанной производной в М0 и из теоремы об устойчивости знака непрерывной функции вытекает, что найдется такая окрестность точки М0 всюду в пределах которой др/ди положительна. Эту окрестность мы можем взять в виде шара и достаточно малого радиуса с центром в точке М0. Фиксируем далее положительное число в- настолько малым, чтобы каждая из точек М{ (й—е, х°, х2) и Рис. 13.2
612 Гл. 13. Неявные функции М2(й-\-е, хи х2) лежала внутри шара & (для этого достаточно взять е меньшим радиуса шара й). Подчеркнем, что при этом снизу е ограничено^лишь нулем, и мы можем брать его как угодно малым — это будет использовано нами ниже. Рассмотрим функцию Р(и, хи х2) одной переменной и на сегменте й—е<ы<й+е. С геометрической точки зрения это означает, что мы рассматриваем функцию трех переменных Р(и, хи х2) вдоль дР ° ° отрезка МхМ2 (см. рис. 13.2). Так как производная —— {и, хг,х2) о о положительна на сегменте й—е<ы<й+Е, то функция Р(и, Хи х%) возрастает на этом сегменте. Но тогда, поскольку эта функция равна нулю в середине указанного сегмента (т. е. при ы = й), то Р(и, Хи х2) имеет отрицательное значение на левом конце и положительное значение на правом конце указанного сегмента, т. е. Р(М1)<0, Р(М2)>0. Далее рассмотрим функции Р(й—г, хи х2) и Р(й-\-г, Хи х2) двух переменных х1 и х2, т. е., выражаясь геометрическим языком, рассмотрим функцию Р(и, хи х2) на двух плоскостях, параллельных координатной плоскости Ох\х2, первая из которых проходит через точку Ми а вторая — через точку М2. Поскольку Р(М1)<0, Р(М2)>0 и функция Р(и, Хи х2) непрерывна всюду в шаре О,, то по теореме об устойчивости знака непрерывной функции на указанных плоскостях найдутся такие окрестности точек М1 и М2, в пределах которых функция Р сохраняет те же знаки, что и в точках М1 и М2. Эти окрестности мы можем взять в виде открытых квадратов с центрами в точках М1 и М2 и с достаточно малой стороной 26 (на рис. 13.2 указанные квадраты заштрихованы). Аналитически тот факт, что функция Р(и, хи х2) сохраняет постоянный знак на указанных квадратах, выражается неравенствами Р(и — ъ, хх, х2) < О о Р(и + г,хг,х2) >0 , при \х1 — х11< б, \хг — х2|<6. (13.2) Выборы стороны указанных квадратов мы подчиним и еще одному условию: возьмем б столь малым, чтобы оба указанных квадрата лежали внутри шара й (это заведомо можно сделать, ибо центры квадратов М1 и М2 являются внутренними точками шара О). При таком выборе б любая точка пространства (и, хи х2), координаты которой удовлетворяют неравенствам 1*1—*1|<6, |*2—°х2\<$, \и—ы|<6, (13.3) будет лежать внутри шара О,. С геометрической точки зрения неравенства (13.3) определяют открытый прямоугольный параллелепипед с центром в точке М0 и со сторонами, параллельными осям координат и, х\, х2 и соответственно равными 2е, 26 и 26.
§ 1. Существование и дифференцируемость 613 Этот параллелепипед мы будем обозначать символом П. Так как 'параллелепипед П лежит внутри шара &, то всюду в параллелепипеде П* производная дР/ди положительна. Кроме того, в силу (13.2) функция Р(и, хи х2) отрицательна на нижнем основании и положительна на верхнем основании П. Докажем теперь, что уравнение (13.1) однозначно разрешимо относительно и, если функцию Р(и, Хи х2) рассматривать лишь для значений и, хи х2, лежащих внутри параллелепипеда П. Пусть М'(хи х2) — любая точка пространства Я', координаты которой удовлетворяют неравенствам \х1—°х1\<8, |х2— х2|<8. (13.4) Иначе говоря, пусть М' (хь х2) — любая точка плоскости ОХ1Х2, лежащая внутри квадрата с центром в точке Ма'{Хи х2) и со сторонами, равными 26. Требуется доказать, что для координат Х\, Хг точки М' найдется, и притом единственное, число и из интервала й—е<и<й-{-е такое, что Р(и, Х\, х2)=0. (С геометрической точки зрения это означает, что любая прямая, параллельная оси и и пересекающая параллелепипед П, пересекает поверхность 5 внутри параллелепипеда П в одной и только в одной точке.) Зафиксировав значения хх и х2, удовлетворяющие неравенствам (13.4), рассмотрим функцию Р(и, хи х2) аргумента и на сегменте и—е<ы<й-1-е, т. е. рассмотрим функцию Р(и, Хи х2) на отрезке М^М2, где М\ и М2' — точки пересечения прямой, проходящей через точку М'(хь х2) и параллельной оси Ои, с основаниями дР параллелепипеда П (см. рис. 13.2). Так как производная ди {и, хх> х2) положительна на сегменте и—е<и<й+г, то функция Р(и, Хи х2) возрастает на этом сегменте (или, что то же самое, возрастает на отрезке М^Мг). Но тогда из условий /г(М/)<0, Р(М2)>0 вытекает, что внутри сегмента и—е<ы<й+е найдется одно-единственное значение и такое, что Р(и, хь х2)=0 (или, выражаясь геометрически, внутри отрезка М1'М2 найдется единственная точка М, лежащая на 5). Пусть теперь функция ы = ф(хь х2) символизирует то правило, посредством которого каждой точке М'(хи х2) из окрестности (13.4) «ставится в соответствие единственное число и из интервала й—е< <и<й+е, для которого Р(и, Хи х2) =0. Мы доказали, что в окрестности (13.4) существует единственная функция и=<р(хи х2), удовлетворяющая условию \и—ы|<е и являющаяся решением уравнения (13.1). 2. Докажем теперь, что функция м=ф(х1; х2) непрерывна в любой точке М'(хь х2) окрестности (13.4). Так как для любой точки * Включая открытые квадраты, лежащие в его основаниях.
614 Гл. 13. Неявные функции М'{х\, х2) из окрестности (13.4) выполнены те же условия *, что » для точки Мо'(хи х2), то достаточно доказать непрерывность функции и=ц>(хи х2) лишь в точке М0'(хи х2). Требуется доказать, что для любого достаточно малого положительного е существует положительное число б такое, что для любых х1 и х2, удовлетво- о о ряющих неравенствам )лг±—Х1|<б, \х2—х2\<Ь, справедливо неравенство \и—«|<8, где и=<р(*1, х2), й=ц>(хи х2). Если взять в качестве е то число, которое выбрано выше при рассмотрении п. I, то существование е обеспечивается неравенствами (13.3). Остается заметить, что в рассуждениях п. 1 положительное число е может быть взято как угодно малым (это отмечалось в п. 1). Тем самым непрерывность функции и=ц>(хи х2) установлена. Запишем условие непрерывности функции и=<р(хи х2) в точке Мо'(хь Хг) в разностной форме. Обозначая через Дм полное приращение функции и=у(хи х2) в точке М</(Хи х2), соответствующее приращениям аргументов Ах^ и Ах2, мы получим, что Аи->0 при 1 3. Остается доказать дифференцируемость функции "ы=<р(*1( х2^ в любой точке М'(хи х2) окрестности (13.4). В силу замечания, сделанного в п. 2, достаточно доказать дифференцируемость функции и = у(хи х2) в самой точке М0' (хи х2). Чтобы это сделать, вычислим полное приращение Аи функции ы=ф(хь х2) в точке Мо {х\, х2), соответствующее приращениям аргументов Ахг и Ах2* Поскольку Р(й, Хи х2)=§ и Р{й-\-Аи, Х\+Ахи х2+Ах2)=0, то полное приращение АР функции Р(и, хи х2) в точке М0(й, Хи х2)> соответствующее приращениям аргументов Аи, А*! и Ах2, равно нулю. Но в силу условия дифференцируемое™ функции Р(и, Хи х2) в точке М0(й, Х\, х2) это полное приращение имеет вид 4Р - {-^+») *• + (^'+«) **+ (-^ + >)'4*°- <13-5> Здесь все частные производные дР/ди, дР)дх1 и дР/дх2 берутся о о в точке Мо(й, Хи х2); ' Аи -+• О, о,р и у-^0 при | А^-^0, Ах, ->• 0. * Именно, любой точке М'(хи х^) из окрестности (13.4) соответствует точка М(и, хи хг) пространства Я такая, что функция Р(и, хи х%) обращается в нуль в точке М, дифференцируема в некоторой окрестности точки М и имеет в этой окрестности отличную от нуля частную производную дР/ди.
§ 1. Существование и дифференцируемость 615 Из соотношения (13.5), учитывая, что АР = 0, получаем -^ + у) А" + (|^ +а) А^+ (^- + р) Д*2 = 0. (13.6) Согласно разностной форме условия непрерывности функции л = ф(х1, хг) в точке Мо'(#ь Хг) можно утверждать, что Ди->0 при Лл'1->0, Длг2->0. Таким образом, можно утверждать, что А.хх ->■ 0, а, 6 и у->-0 лишь при условии] Дх2->-0. По условию теоремы частная производная дР/ди отлична от нуля в точке М0. Поскольку у->-0 при {д*1^' т0 пРи достат04- но малых Ах! и Ах2 выражение (дР/ди+у) не обращается в нуль. В таком случае формулу (13.6) можно поделить на (дР/ди+у), в результате чего мы получим Аи = (- ^^ + аУд%+ (- ^/^ + Р\ д* (13,7) \ дР/ди + у ) \ дР/ди + у ] По теореме о пределе частного двух функций можем утверждать, что дР1дх1 + а _ дР/дх! , дР\дхг + Р _ _ дР/дх2 дР/ди-\-у дР/ди ' дР/ди + у дР/ди (13.8) где >х и ^0 при {А^-0. Сопоставляя формулы (13.7) и (13.8), окончательно получим 4" = (-^) 4*-+ (—^-) д*> + "4* + ^- <1М> Формула (13.9) доказывает дифференцируемость функции и — о о = ф(х1, хг) в точке М0'(х1, Хг). Тем самым теорема 13.1 полностью доказана. ^ Замечание 2. Приведенное доказательство без всяких затруднений переносится на случай неявной функции, зависящей не от двух, а от любого конечного числа аргументов Х\, Хг,..., хп*. Случай двух аргументов х± и х2 имеет лишь то преимущество, что допускает наглядную геометрическую иллюстрацию в пространстве (и,хих2). 2. Вычисление частных производных неявно заданной функции. Остановимся на вычислении частных производных функции, неявно заданной посредством уравнения (13.1). Пусть выполнены условия теоремы 13.1. Тогда для полного приращения функции и = И, в частности, от одного аргумента.
616 Гл. 13. Неявные функции = ф(*ь Хг) справедливо представление (13.9). Это представление и теорема 13.9 позволяют утверждать, что частные производные функции и=ч(хи хг) определяются формулами ди _ дР/дхг ди __ дР/дх2 (13 10> 0x1 дР/ди ' дхг ~ дР1ди Аналогичные формулы справедливы и для случая, когда неявно заданная функция зависит не от двух, а от любого конечного числа аргументов хи х2,.... хп. В этом случае _ди_==_ дР1дхк {к=12 ш). (1з.11> дхк дР1ди ч Если мы хотим обеспечить существование у неявно заданной функции ы = ф(х1, Хг) частных производных второго порядка, то, естественно, приходится усилить требования, наложенные на функцию- Р(и, х\, Хг) в теореме 13.1, именно приходится дополнительно требовать, чтобы функция Р(и, х±, х2) была два раза дифференцируема в рассматриваемой точке. В этих предположениях остановимся на вычислении частных производных второго порядка. Введем полезное в дальнейшем понятие полной частной производной функции. Предположим, что нам дана дифференцируемая функция трех аргументов Ф(и, хи х2), причем один из этих аргументов и сам является дифференцируемой функцией двух других аргументов Ху и> хг. Тогда функцию Ф(и, хи х2) можно рассматривать как сложную» функцию двух аргументов Х\, Хг. Частные производные этой сложной функции по ху и Хг будем называть полными частными-, производными функции Ф{и, х\, х2) по Х\ и х2 и обозначать символами БФ/Оху и Г)Ф/Ох2. По правилу дифференцирования сложной функции мы получим следующие формулы для указанных полных частных производных: РФ1 -^ дФ ди дФ РФ _ ^Ф_ _ди_ дФ Рхх ди дху дхх ' Рхг ди, дх2 дхг Переходим к вычислению частных производных второго порядка неявно заданной функции. Ради определенности вычислим производную д2и/дх2дх1. Дифференцируя первую из формул (13.10) по х2 и принимая во внимание, что каждая из частных производных дР/дху и дР/ди зависит от трех аргументов и, хи х2, первый из которых сам является функцией х1 и х2, будем иметь дР Р[дР1дХ1) дР Р[дР1ди] ди' Рх2 дхх Рх2 дхгдхг Рх2 (дР/ди)2 ~ !"32и Р дР1дхг дР/ди
§ 1. Существование и дифференцируемость 617 дР ( д2Р ди д2Р \ дР ( д2Р ди . д2Р ди \ дхгди дх2 дхгдх2 ] дкх \ ди2 дс. дидх2 _ ди Вставляя в полученную формулу выражение ди/дх2, определяемое второй из формул (13.10), окончательно будем иметь д2Р дР дР д2Р ( дР у д2Р дР дР д2Р дР ■ дР д2и дхгди ддса ди дх^дх?, \ ди ) ди2 дхх дх^ дх2ди дх\ ди дх2дхл 7~дР ди (13.12) Совершенно аналогично вычисляются частные производные дги\дх? и дги\дхгг- Аналогичным методом могут быть вычислены и частные производные третьего и последующих порядков. Пример. Вычислить частную производную д2и/дх2дх1 функции, неявно заданной уравнением и2+х^ + хгь—1 = 0. Используя равенства (13.10), получим, что ди дхх Далее получим, что д2и _ 0(ди/дх1) _ дх2,дхг ^ Лег д ди 2*1 ди и ' дх2 ( 2хЦ ди \ и ) дхг 2х\ и %х1 ди и2 дхг 4*4 и3 3. Особые точки поверхности и плоской кривой. Рассмотрим некоторую поверхность 5 [плоскую кривую Ь\, определяемую в заданной декартовой прямоугольной системе координат уравнением Р(х, у, г)=0 [Р(х, г/)=0]. Относительно функции Р(х, у, г) [Р(х, у)] предположим, что она имеет непрерывные частные производные первого порядка по всем аргументам всюду в некоторой окрестности любой точки поверхности 5 [кривой Ь]. Будем называть данную точку поверхности 5 [кривой Ь] особой, если в этой точке обращаются в нуль все частные производные первого порядка функции Р(х, у, г) [Р(х, у)]. В окрестности особой точки нельзя применить к уравнению Р(х, у, г)=0 [Р(х, у)=0] теорему 13.1, т. е. нельзя утверждать, что это уравнение разрешимо хотя бы относительно, одной из переменных х, у, г [х, у]. Таким образом, участок поверхности 5 [кривой Ь], прилегающей к особой точке, может не допускать однозначного проектирования ни на одну из координатных плоскостей [ни на одну из осей координат]. Структура поверхности 5 [кривой Ь] в окрестности особой точки
-618 Гл. 13. Неявные функции может быть сложной и требует дополнительного исследования. Точки поверхности 5 [кривой Ь], не являющиеся особыми, принято называть обыкновенными. В окрестности обыкновенной точки действует теорема 13.1, так что прилегающий к обыкновен- яюй точке участок поверхности 5 [кривой Ь] допускает однозначное проектирование хотя бы на одну из координатных плоскостей [хотя бы на одну из осей координат], что существенно облегчает - исследование этого участка. Примеры. 1) Найти особые точки кругового конуса х2+ дР дР + 1/2—22=0. Поскольку Р(х, у, г)=хг-\-уг—г2, то =2х, = дх ду дР ~2у, = —2г. Единственной особой точкой является начало дг координат. Хорошо известно, что в окрестности этой точки поверх- шость конуса не может быть однозначно спроектирована ни на «одну из координатных плоскостей (рис. 13.3). Рис. 13.3 Рис. 13.4 2) Найдем особые точки плоской кривой х2—уг+л;3 = 0. Так как *дР1дх = 2х+Зх2=х{2 + Зх), дР\ду=—2у, то обе частные производ- шые дР/дх и дР/ду обращаются в нуль в двух точках (0,0) и (—2/3, 0). Из этих двух точек только первая принадлежит рассматриваемой кривой, т. е. является особой. Построив кривую Х2—у2_|_хз=о в окрестности точки (0, 0), мы убедимся в том, что эта точка является точкой самопересечения графика (рис. 13.4). Ясно, 'что в окрестности этой точки кривую нельзя однозначно спроектировать ни на ось Ох, ни на ось Оу. 4. Условия, обеспечивающие существование для функции у={(х) обратной функции. Применим теорему 13.1 для выяснения условий, при выполнении которых функция у = 1(х) имеет в некоторой окрестности точки х0 обратную функцию х = }~Цу), опреде-
§ 2. Функции, определяемые системой функциональных уравнений 61&' ленную в некоторой окрестности точки у0, где уо = [(х0). Будем рассматривать функцию «/ = /(*) как функцию, определяемую* функциональным уравнением вида Р(х, у)=Цх)—г/ = 0. Тогда вопрос о существовании обратной функции совпадает с вопросом о разрешимости относительно х указанного функционального уравнения. Как следствие теоремы 13.1 и- замечания 1 перед доказательством этой теоремы, мы получим следующее Утвер-ждение. Если функция у—}{х) имеет отличную от нуля и сохраняющую определенный знак производную в некоторой окрестности точки х0, то для этой функции в окрестности х0 существует обратная функция х = {~1(у), определенная и дифференцируемая в некоторой окрестности точки у0, где уо = {{х0). Производная указанной обратной функции в точке у0 в силу второй из формул (13.10) равна [/'(*о).1_1. § 2. НЕЯВНЫЕ ФУНКЦИИ, ОПРЕДЕЛЯЕМЫЕ СИСТЕМОЙ ФУНКЦИОНАЛЬНЫХ УРАВНЕНИЙ 1. Теорема о разрешимости системы функциональных уравнений. В предыдущем параграфе мы рассматривали вопрос о существовании и дифференцируемое™ неявной функции, определяемой посредством одного функционального уравнения. В этом параграфе мы рассмотрим аналогичный вопрос для совокупности пг- (пг — любое натуральное число) неявных функций, определяемых посредством системы функциональных уравнений. Итак, предположим, что пг функций Щ. — Ф1 (%\у %2' • • • I %п)' ^2 == Фг \-^1> %2> •- • 1 %п)' (13.13) Мт — Фт (-"-II Х2' • • ■ > -""л) ищутся как решение системы пг функциональных уравнений Г 1 1^1? ^2> • • • > "т> %1> %2> • • • > %п) == *м * 2 (Ц1> ^2> • • • > У/п' ^1> ^2> ■ • • > Хп) = V, * т 1^1 > ^2> • • • > ^т> ^1> %2> • • • > %п) — "• (13.14) Изучим вопрос о разрешимости системы функциональных уравнений (13.14) относительно щ, и^,...,ит. Под термином «решение- системы (13.14)» мы в дальнейшем будем понимать совокупность т функций (13.13) таких, что при подстановке этих функцию в систему (13-.14) все уравнения этой системы обращаются в тождества. Это решение мы будем называть непрерывным и дифференцируемым в некоторрй области Ь изменения переменных хи х2,...,хп, если каждая из функций (13.13) непрерывна и
«20 Гл. 13. Неявные функции дифференцируема в области И. Договоримся обозначать символом Я пространство т-\-п переменных щ, иг, ,.., ит, Хи Х2,..., хп, а символом %' пространство п переменных Ху, х%,..., х„. Рассмотрим т функций Ри Р2,..,., Рт, стоящих в левых частях системы (13.14), и составим из частных производных этих функ- дий следующий определитель: дРх дРг дРх Л = дРг дРг 9% ди2 дит дРг дРт дР„ дРп ди„ (13.15) Будем называть определитель вида (13.15) определителем Я к о б и * (или кратко якобианом) функций Ру, Рг,..., Рт. по переменным ии щ,..., ит и кратко обозначать символом ЩР1г Р2, ...,Рт) Г>(%, и2, ... , игт) Имеет место следующее замечательное утверждение. Теорема 13.2 (обобщение теоремы 13.1). ^функций Ч \^1» ^2> * * ' ' ^т> ^1> -^2> • • • ' -^п/' Пусть пг (13.16) ^т\%| ^2> • • • » и:Л, Х^, Х^, • • • 1 Xп) дифференцируемы в некоторой окрестности точки Мо(йу, йг,..., йт, хи Хг, -.., хп) пространства /?, причем частные производные этих функций по переменным щ, иг,,.., ит непрерывны в точке М0. Тогда если в точке М0 все функции (13.16) обращаются в нуль, а яко- ,Рт) биан отличен от нуля в М0, то для достаточно Э(их, иг, .".. , ит) малых положительных чисел ей ег, —, ет найдется такая окрестность точки Мо {х\,..., хп) пространства Я', что в пределах этой окрестности существуют единственные пг функций (13.13), которые удовлетворяют условиям \щ—щ | <еь |ц2—йг\<гг,..., \итйт—|<е-п и являются решением системы уравнений (13.14), причем это решение непрерывно и дифференцируемо в указанной окрестности точки Мо'. * Карл Густав Яков Якоби — немецкий математик (1804—1851).
§ 2. Функции, определяемые системой функциональных уравнений 621 Замечание. При т—\ теорема 13.2 переходит в доказанную выше * теорему 13.1, ибо в этом случае якобиан (13.15) обращается в частную производную дР^дщ. Доказательство теоремы 13.2 проведем методом математической индукции. При т=\ теорема уже доказана. Поэтому достаточно, предположив теорему 13.2 справедливой для системы т—1 функциональных уравнений, доказать справедливость этой теоремы и для системы т функциональных уравнений. Поскольку, по предположению, якобиан д = Р(Р1,Р%, ... ,Рт) 0(«1,«2 ит) ! дР1 \ дих 1 дРт-1 5% дРт дих дРг дит-]. дРщ-1 дит-\ дРт дит.х дРг дит дРт-х дит дРт дит (13.17) отличен от нуля в точке Мо, то хотя бы один из миноров (т—\)-го порядка ** этого якобиана отличен от нуля в точке М0. Не ограничивая общности, будем считать, что в точке М0 отличен от нуля обведенный пунктиром минор, стоящий в левом верхнем углу. Тогда в силу предположения индукции первые т—1 уравнений системы (13.14) разрешимы относительно и1( и%, ..., ит-и Точнее, для достаточно малых положительных чисел еь ег,..., еуц_1 найдется о о такая окрестность точки М0" (йт, Хи ..., хп) пространства Я" переменных (ит, Хи ..., хп), что в пределах этой окрестности определены т—1 функций и1 = Ф1(ит,х1, ... ,хп), Ит-1 = Фт_1 («т, Х1г . . . , Хп), (13.18) которые удовлетворяют условиям \и1—й±| <81, ..., \ит^—йт_1| <гт-1 ■и являются при наличии этих условий единственным и дифференцируемым решением системы первых т—1 уравнений (13.14). Подставим найденные функции (13.18) в левую часть последнего из уравнений (13.14). При этом левая часть последнего из уравнений (13.14) превращается в функцию, зависящую только от ^7П! Х±, ..., Хп- Рт{ии...,ит-и От, Хи-,хп) =-Р™[Ф1(«т, хи ...,х„), ..., Фт_1(ыт, Хи ... .-., хп), ит, Хи ...,хп] =^(ит, хи ..., хп) (13.19) * При этом следует учесть замечание 2 к теореме 13.1. ** Напомним, что минором (т—1)-го порядка данного определителя т-го шорядка называется определитель (т—1)-го порядка, полученный из данного •определителя т-го порядка вычеркиванием одной строки и одного столбца.
622 Гл. 13. Неявные функции (эту функцию мы обозначили символом я|з). Таким образом, последнее из уравнений системы (13.14) приводит нас к уравнению ■ф(ит, XI, ..., хп) =0. (13.20). В силу равенства (13.19) $>(ит, х\, ..., хп) можно рассматривать как сложную функцию своих аргументов. Тогда, применяя теорему о дифференцируемости сложной функции, мы можем утверждать, что функция \р(ит, *ь •••. хп) дифференцируема в некоторой окрестности точки М0"(йт, хи...,хп) пространства Я". Равенство (13.19) и последнее из уравнений (13.14) позволяют утверждать, что о о "Ф("т, х\,..., хп) =0. Поэтому, для того чтобы доказать, что к уравнению (13.20) применима теорема 13.1 и это, уравнение разрешимо относительно ит, достаточно установить, что частная производная дт\>/дит непрерывна и отлична от нуля в точке М0". Для того чтобы сделать это, вычислим указанную частную производную. Подставим в первые т—1 уравнений системы (13.14) функции (13.18), являющиеся решением этих уравнений, и продифференцируем полученные при этом тождества по ит-. Получим дРг дФ,, дих дип + + дРг дФ„ дР- ди„ ди„ + -Р- = о, ди. (13.211) дР, <ЭФ, дщ ди„ т-\ + дРп ди„ 9Ф>"-1 _|_ дРт~1 ■ ди„. ди„ 0. (13.21"1-1) Далее продифференцируем по ит равенство (13.19). Получим дРт дФг дих ди„ + + дР„ дип дФщ-1 , дРт ди„ 1^% д$ дит (13.21«) Умножим теперь равенства (13.211) —(13.21т) на соответствующие алгебраические дополнения Аи Аг, ...,Ат элементов последнего столбца якобиана (13.17) и после этого сложим эти равенства. Получим т—1 дФк 2 ди„ д^ + д^ Ах дР! дит + А дик ■' ~ * дщ дР2 ди„ + +%. +- Ат + Д 'дР* Л дик в/?" \ - А - + д$ ди„ ди„ Так как сумма произведений элементов данного столбца определителя на соответствующие алгебраические дополнения элементов этого (другого) столбца равна определителю (нулю), то каждая квадратная скобка равна нулю, а круглая скобка равна якобиану (13.17).
§ 2. Функции, определяемые системой функциональных уравнений 623 Таким образом, мы получим, что Д = Дт-^. (13.22) дит Здесь символом А обозначен якобиан (13.17), а Дт — алгебраическое дополнение последнего элемента последнего столбца, которое совпадает с минором, обведенным пунктиром и, по предположению, отличным от нуЛя в точке М0. Поделив равенство (13.22) на Ат, окончательно найдем дит Ат Формула (13.23), справедливая в точке М0", доказывает непрерывность частной производной д-ф/дит в точке М0" (ибо А и А™ состоят из частных производных функций (13.16) по «ь ич,...,ит, непрерывных в точке М0). Кроме того, из формулы (13.23) вытекает, что д^/дит в точке Мо" отлична от нуля (ибо якобиан.А отличен от нуля в точке М0). Тем самым мы доказали, что к уравнению (13.20) можно применить теорему 13.1. Согласно этой теореме для достаточно малого положительного о о о числа гт найдется такая окрестность точки Мо'(хи Х2,...,хп) пространства Я', что всюду в пределах этой окрестности определена функция «т = фт(*1, Х2, ..., Хп), (13.24) которая удовлетворяет условию \ит—ыт|<ет и является при наличии этого условия единственным, непрерывным и дифференцируемым решением уравнения (13.20). Имея в виду, что функции {13.18) являются решениями первых т—1 уравнений (13.14) при любых ит> XI,..., хп из окрестности точки М0", и вставляя найденную функцию (13.24) в (13Л8), мы получим функции, зависящие только от переменных хи..., хп' «1 = Ф1[фт(ЛЦ, ..., Хп), Хи ...,*„] =ф1(*1, ..., *„), Чгп-1 — Фт-1![фт(#1, —,Хп), Хи ..., Хп] =фт-1(#Ь ••-, Хп) ■ (Эти функции мы обозначили символами фЬ ..., фт_1.) Теорема о дифференцируемости сложной функции дает право утверждать, что каждая из функций ф1,..., (рт^ дифференцируема в окрестности точки М0'(хи ..., хп). Таким образом, мы доказали, что т функций Ы1 ^ Ф1 \Х1> Х2> • • ■ > хп)> | 1 • • • (13.25) ит = Фт \Х1> Х2, . . . , Хп) ) удовлетворяют в окрестности точки М0' условиям | и^—й-11 <81,...
624 Гл. 13. Неявные функции ..., \ит—йт\<ет и представляют собой при наличии этих условий непрерывное и дифференцируемое в некоторой окрестности точк» М0'(х^ хп) решение системы (13.14). Остается доказать, что функции (13.25) представляют собой единственное решение системы (13.14), удовлетворяющее условиям |«1—«11 <е±,..., \ит—йт\<ът (при достаточно малых положительных ей ..., гт). Предположим что кроме функций (13.25) существуют еще т. функций и.1 — Фх (х1? х%, ... , хп), Чт ~ Фт \х11 х2> • • • » хп)> (13.25> также являющихся решением системы (13.14) и удовлетворяющих условиям |Й1—Й1[ <еь ..., \йт—йт\<гт- Тогда в силу предположения индукции первые т—\ функций. (13.25) представляют собой при заданном ит = йт единственное и, дифференцируемое решение системы первых т—1 уравнений. (13.14). Но при заданном ит единственное решение системы первых т—1 уравнений (13.14) дается равенствами (13.18). Таким образом, справедливы соотношения «1 = ®1 ("т. *!>••■> Хп), Чт—1 ='Фт—1 (Ит, %,..., Хл), (13.18'> в которых Фь ..., Фт_1 — те же функции, что и (13.18). В таком случае последнее уравнение (13.14) и соотношение (13.19) позволяют нам утверждать, что йт является единственным решением уравнения (13.20), т. е. йт — ит. При наличии равенства йт = ит из соотношений (13.18') и (13.18) сразу же вытекает, что*Й1 = Иь ..., йт_1 = ит_1. Теорема 13.2 полностью доказана. 2. Вычисление частных производных функций, неявно определяемых посредством системы функциональных уравнений. В этом пункте мы предположим, что выполнены условия теоремы 13.2, и займемся вычислением частных производных функций (13.25). Подставим функции (13.25) в систему уравнений (13.14), решением которой эти функции являются, и продифференцируем получившиеся тождества по х\ (1= 1, 2,..., п). Получим дРг дих дих дх1 дРт д% диг дх1 + + дР1 дит др! _ д + дит дх, дРт дит дит дх1 + дх. дРт дх, = 0. (13.26)
§ 2. Функции, определяемые системой функциональных уравнений 625 Равенства (13.26) представляют собой линейную систему уравне- «ий относительно т неизвестных —— , ... , ——. Определитель дх1 дх1 этой системы якобиан (13.17) отличен от нуля в окрестности точки М0. Значит, система (13.26) имеет" единственное решение, определяемое формулами Крамера: Р(Р1,Р2, ... ,Рт) дик __ __ Р(Ц!, .... ик.1г XI, %+!, ... , ит) дх[ Р(^1,/?а, ... , Рт) #(«1. «2 В/п) Выражения для частных производных второго и последующих порядков * можно получить посредством дифференцирования этих ■формул. 3. Взаимно однозначное отображение двух множеств т-мерно- го пространства. Рассмотрим в некоторой окрестности точки Мо{хи ...,хт) функции и1 = Ф1(х1, ... ,хт), | (13.27) ит = <рт (хх, ... , хт). } Рассматриваемые т функций осуществляют отображение указанной окрестности точки М0 на некоторое множество {Ы} т-мерного пространства переменных ии и2,..., ит. Это отображение называется взаимно однозначным, если каждой точке из указанной окрестности точки Мо соответствует только одна точка множества {Щ, так что при этом каждая точка множества {Л^} соответствует только одной точке указанной окрестности точки М0. Из теоремы 13.2 непосредственно вытекает следующее Утверждение^ Если функции (13.27) дифференцируемы в окрестности точки М0, причем все частные производные первого ■ порядка непрерывны в самой точке М0, а якобиан —ф1' '" ' ^ Р(*1 Хт) отличен от нуля в этой точке, то функции (13.27) осуществляют взаимно однозначное отображение некоторой окрестности точки М0{Хи ..., хт) на некоторую окрестность точки Л/о(йь ..., йт), где 1ц = цц{х1,...,хт) (1 = 1, 2,..., т). В самом деле, соотношения (13.27) можно рассматривать как систему функциональных уравнений относительно Х\, хг,..., хт, для которой выполнены условия теоремы 13.2. Но тогда эта система всюду в некоторой окрестности точки М)(й4 йт) имеет единственное решение: * Существование этих частных производных обеспечивается дополнительными ограничениями на функции (13.16).
626 Гл. 13. Неявные функции (13.27') хт = $т \и1' • • • » ит)- ) Очевидно, что функции (13.27') осуществляют обратное отображение. Заметим, что в условиях сформулированного утверждения как функции (13.27), осуществляющие прямое отображение, так я функции (13.27'), осуществляющие обратное отображение, являются непрерывными. Взаимно однозначное отображение, обладающее таким свойством, называется гомеоморфизмом. Более того, в условиях сформулированного утверждения как функции (13.27), осуществляющие прямое отображение, так и функции (13.27'), осуществляющие обратное отображение, являются дифференцируемыми. Взаимно однозначное отображение, обладающее таким свойством, принято называть диффеоморфизмом. § 3. ЗАВИСИМОСТЬ ФУНКЦИИ 1. Понятие зависимости функций. Достаточное условие независимости. Пусть т функций от одних и тех же п переменных и1 = Ф1(х1, х2 хД, ) . . . : (13.28) ит — Ч>т(х1* Х2' •••• Хп) > определены и дифференцируемы в некоторой открытой я-мерной области * Б. Будем говорить, что одна из этих функций, например ик, зависит в области .й от о с т а л ь н ы х ф у н к ц и й, если сразу для всех точек (х\, х2,..., хп) области Б ик = Ф(ии ...,ик-и ик+и...,ит), (13.29) где Ф — некоторая функция, определенная и дифференцируемая в соответствующей области изменения своих аргументов. Функции «1, и%...,ит будем называть зависимыми в области Д если одна из этих функций (все равно какая) зависит в области О от остальных. Если же не существует дифференцируемой функции Ф такой, что сразу для всех точек области В справедливо тождество вида (13.29) хотя бы для одного к (к—1, ..., т.), то мы будем называть функции щ, и2, ..., «„ независимыми в области Э. * В частности, в качестве области й можно взять некоторую окрестность фиксированной точки М0 я-мерного пространства.
§ 3. Зависимость функций 627 Примеры. 1) Легко убедиться в том, что три функции четырех переменных и2. = х1+Х2+Хз + Х1к, и3 = 2х1х2 + 2*1X3+2x1X4+2*2*3+2*3*4 зависимы в любой области /) четырехмерного пространства, ибо для всех точек (х\, х2, х3, х4) этой области Ы1 = Ы22—Ыз- 2) Покажем теперь, что две функции двух переменных щ = х+у и и2=х—у независимы в любой области Б плоскости х, у, содержащей начало координат. Ясно, что функция щ сохраняет постоянное значение нуль на прямой* х+у = 0, проходящей через начало координат (рис. 13.5). Но на этой прямой функция и2 имеет переменное значение и2 = = 2х. Поэтому на том участке этой прямой, который лежит внутри Д и2 заведомо не зависит от «ь Совершенно аналогично доказывается, что на лежащем внутри области Б участке прямой *—» = 0, «2 = 0, ыг-=2х и, значит, щ не зависит от Ыг- За м е ч а н и е. В курсе линейной алгебры вводится понятие линейной зависимости функций: т функций щ, и2, ..., ит называются линейно зависимыми в области Д если для всех точек области /) одна из этих функций выражается в виде линейной функции от остальных. Ясно, что линейная зависимость функций является частным случаем зависимости этих функций, ибо если функции щ, и2, ..., ит линейно зависимы в области Д то они зависимы в этой области, но существуют функции, зависимые в области Д но не являющиеся в й линейно зависимыми (например, функции, выписанные в примере 1). Теорема 13.3 (достаточное условие независимости функций). Пусть пг функций от п>т переменных 1 /° / \п \ / % ^^\&у=0 Рис. 13.5 а1=ф1(х1, ., *т+1> • • ■ 1 Хп)> = фт(.*1' • • • » хт> *т+1> • • •> %п) определены и дифференцируемы в окрестности точки Мо(х1,... ...°хт, Хт+и ...,хп). Тогда если якобиан из этих функций по каким- либо ш переменным отличен от нуля в точке М0, то эти функции независимы в некоторой окрестности точки М0.
628 Гл. 13. Неявные функции Доказательство. Не ограничивая общности, будем считать, что в точке Мо отличен от нуля якобиан 0(Хг, Хг, ... , Хт) Докажем теорему от противного. Предположим, что функции и1г «2,..., ит зависимы в некоторой окрестности точки М0, т. е. одна из этих функций, например ии, для всех точек этой окрестности выражается в виде ыь = Ф(ы1,..., Ий-1, ии+и ..., ит), где Ф — некоторая дифференцируемая функция. Пользуясь правилом дифференцирования сложной функции, вычислим' производную функции и к по любой из переменных л:; (/=1, 2,..., т). Будем иметь диь __ дФ 3% , дФ дик-1 , дх1 дщ дх1 ^ик—1 дх[ + ^Ф_^±1_+ +^Ф_^ (/ = 1,2, ...,«). (13.31) очк I, 0X1 оит дх[ Формулы (13.31), если их взять для любого значения 1=1, 2, ...,т в точке Мо, говорят о том, что к-я строка якобиана (13.30) представляет собой линейную комбинацию остальных строк с коэффи- дФ дФ дФ циентами, соответственно равными , , ..., -д » дыг дщ, ои-ь-! дФ дФ ~г , ... , ~ Но в этом случае якобиан (13.30) равен оик-{-1 оит нулю в точке М0, что противоречит условию теоремы. Пример. Уже рассмотренные выше две^функции и1=х-\-у и иг = х—у независимы в окрестности любой точки М(х, у), ибо яко- биаН Р (»*■"») й(х, у) 1 1 1 —1 = —2^0 всюду. 2. Функциональные матрицы и их приложения. Снова рассмотрим т функций от п переменных (13.28): ы1=Ф1(х1, х2, ... , хп),~- ит — (Рт(Х1' Х2' ••• » хп)т (13.28) На этот раз предположим, что функции (13.28) определены и дифференцируемы в некоторой окрестности точки Мо(Хи...,хп), причем все частные производные первого порядка этих функций непрерывны в самой точке Мо. Составим из частных производных функций (13.28) следующую функциональную матрицу:
§ 3. Зависимость функций 629 Эф! Эф! Эф! дхг Эф2 дх1 д<9т дх% Эф2 дх2 дфт дхп Эфг дхп 5фт (13.32) дхг дх2 дхп содержащую т строк и п столбцов. Имеет место следующее утверждение. Теорема 13.4. Пусть у функциональной матрицы (13.32): 1) некоторый минор г-го порядка* отличен от нуля в точке М0(хи Х2,...,хп); 2) все миноры (г+1)-го порядка равны нулю в некоторой окрестности точки Мо**. Тогда г функций, представлен- ных в указанном миноре г-го порядка, независимы в окрестности- точки Мо, а каждая из остальных функций зависит в этой окрестности от указанных г функций. Доказательство. Не ограничивая общности, будем считать, что в точке М0 отличен от нуля минор, стоящий в левом верхнем углу матрицы (13.32), т. е. отличен от нуля определитель. дф! дхх дфг Э*! дф! дхг дфг дхг (13.33) Тогда независимость в окрестности точки М0 функций щ, иг,..., иг~ сразу вытекает из теоремы 13.3. Остается доказать, что любая из функций «г+ь..., «т *** зависит в окрестности М0 от щ, и2,..., ит. Докажем, например, что иг+1 зависит в окрестности точки М0 от щ, и2,..., иг. Сосредоточим свое внимание на первых г функциях: (13.28). Если обозначить через й\,...,йг числа вида й1 = ф1(хь Хг,... о о о о т ..., хп),..-, Кг=фг(*1, Хг,...,хп), то всюду в некоторой окрестности точки уУ0 (щ, ...,йг, Х\,..., хп) (п + г) -мерного пространства переменных («1,..., иг, Хи ..., хп) первые г функций (13.28) представляют собой единственное и дифференцируемое решение следующей системы уравнений****: * Напомним, что минором г-го порядка данной матрицы называется определитель, составленный из элементов, стоящих на пересечении каких-либо г столбцов и т строк матрицы. ** В случае, если л=т1п(т, п), требование 2) следует опустить. *** Конечно, при этом предполагается, что т>г. **** В самом деле, в указанной точке Ы0 все функции' Ри .... Рг обращаютсж- 0(^1? ... , Рг) в нуль, а якобиан —; С = (—1) =5^0, так что выполнены условия теоремы 13.2. Г» (И!, и г)
*630 Гл. 13. Неявные функции Л(«1, .... "г, *ь ...,хи)=ф1(*ь ...,*п)—«1 = 0, (13.34) РГ(Щ, ..., щ, х\, ..., лгп)=фг(хь ..., *„)—«г=0.| С другой стороны, поскольку якобиан —5—1 — > СОВПаДаЮ- щий с минором (13.33), отличен от нуля в точке Ы0, то систему (13.34) можно в окрестности этой точки однозначно разрешить относительно Х1,...,хг. Иными словами, всюду в достаточно малой окрестности точки Л^0 система (13.34) имеет единственное и дифференцируемое решение Х1 = $1 ("1> • • • > иг' Хг+1> • ■ ■ > Хг)> Хг=Ыи1> ••• . "г> Хг+1> ••• ' Хп)- (13.35) Подчеркнем, что равенства (13.35) и первые г равенств (13.28) полностью эквивалентны в окрестности точки Ый. В частности, если подставить Хи х%,...,хг, определяемые уравнениями (13.35), в первые г равенств (13.28), то указанные равенства обратятся в тож- . дества относительно хт+и...,хп, «ь ..., ит. Дифференцируя эти тождества по переменной х\ (1—г+1,..., п) и замечая, что щ,...,иг не зависят от хт+и ..., хп будем иметь ^Ф1 3% | , дф! »|у , Эф! _п , (13 361) дхх дх1 дхг дх1 дх1 г-=о, дфг д^ иду дфг 5фг _0 дх1 дх[ дхг дх{ дх1 (13.36г) ".Заметим, что равенства (13.361) — 13.36г) справедливы для всех значений переменных х\,...,хт, хг+\,...,хп из некоторой окрестности точки М0. Для того, чтобы убедиться в том, что функция иг+\ зависит в некоторой окрестности точки 'М0 от щ,...,иг, подставим значения „Х\,..., хг, определяемые уравнениями (13.35), в (г+1)-е равенство (13.28). При этом ш+\ превращается в функцию аргументов щ,.., .,.., Иг, Хг+\,..., Хп, Ибо Цг+1 = фг+1(*1,..., хг, Хг+\, ..., Хп) = фг+1 [^1 («1, - ..., иг, Хг+и ...,хп),...,Уг(и1, ...,иг, хг+г, ...,хп), хг+и ..., хп] =Ф(«ь - ' ...,иг, Хг+\,...,хп) (эту функцию мы обозначили символом Ф). Остается доказать, что для всех значений переменных х\,...,хг, -.хг+и ..., хп, лежащих в достаточно малой окрестности точки М0, •'функция Ф не зависит от хг+ь..., хп. Для этого достаточно доказать, что для всех Х\,...,хп из достаточно малой окрестности точ- (ки М0 справедливы равенства -^=0 (/=г+1, -.., п). (13.37) дх1
§ 3. Зависимость функций 63 к Продифференцируем функцию Ф по переменной л:/ (1 = г+1,...п) как сложную функцию. При этом получим дЬ+1 ^ + ... д%+1 д^г дфг+1 __ ЭФ дх1 (13.3бг+*> дхх дх1 дхг дх1 дх[ Рассмотрим теперь следующий минор (г+1)-го порядка матрицы:* (13.32): дф1 Эфх Эфх д= дхг ЭФг дхг <Ч+1 дхг Эфг дхг дф, дх1 Эфг дх1 +1 дЧг+\ дхг дхг дх1 (13.38)* По условию теоремы этот минор равен нулю всюду в окрестности: точки М0. Умножим равенства (13.361) — (13.36г+1) на соответствующие алгебраические дополнения А: Аг, Аг+1 элементов последнего столбца минора (13.38) и после этого сложим все эти равенства. В силу теоремы о том, что сумма произведений элементов данного столбца на соответствующие алгебраические дополнения элементов этого (другого) столбца равна определителю- (нулю), получим * д = _^ф_д (13.39) 0X1 В равенстве (13.39) символ Д обозначает минор (13.38), равный нулю всюду в окрестности точки Мо, а алгебраическое дополнение Лг+1 совпадает с минором (13.33), отличным от нуля в точке- Мо, а значит;, и в некоторой окрестности этой точки**. Из равенства (13.39) заключаем, что всюду в некоторой окрестности точки М0 справедливы равенства (13.37). Теорема доказана. Пример. Вернемся к исследованию зависимости функций Щ = х}2+х22+хъ2+х42, и2=х\ + х2+х%+х$, иъ = 2х\Х2 + 2х\ХЪ + 2x1*4 + 2х2х3 + 2хъх±. * При этом мы повторяем рассуждения, подробно описанные при доказательстве теоремы 13.2. ** Поскольку все частные производные, входящие в минор (13.33), непрерывны в точке ЛГо, то и сам минор (13.33) непрерывен в точке Мо. Но тогда по» теореме об устойчивости знака непрерывной функции этот минор отличен отг нуля не только в самой точке Мо, но и в некоторой ее окрестности.-
«32 Гл. 13. Неявные функции Функциональная матрица (13.32) имеет вид 2,Х-± А%% "%з бХ^ 1 1 . 1 1 2 (х2 + х3 + х4) 2(хх + х3 + х^ 2(х1 + х2 + хА) 2(х1 + х2 + х3) Легко убедиться в том, что все определители третьего порядка тождественно равны нулю, причем в любой точке пространства (Х\, #2, Хг, х$), у которой не все четыре координаты Х\, х% Хг и Х4 совпадают, хотя бы один из определителей второго порядка ^А^ /Хм 1 1 » ^л* ^-^я 1 1 » ^Лт1 &%а 1 1 отличен от нуля. Значит, в окрестности любой указанной точки П\ и Мг независимы, а и% зависит дт щ и и2. § 4. УСЛОВНЫЙ ЭКСТРЕМУМ 1. Понятие условного экстремума. В § 6 гл. 12 мы занимались отысканием локальных экстремумов функции, аргументы которой не связаны никакими дополнительными условиями. Вместе с тем в математике и в ее приложениях часто встречается задача об отыскании экстремумов функции, аргументы которой удовлетворяют дополнительным условиям связи. Экстремумы такого рода мы будем называть условными, чтобы отличить их от (безусловных) экстремумов, изученных в § 6 гл. 12. Приведем пример задачи об отыскании условного экстремума. Пусть требуется найти экстремумы функции и = х2 + у2 при условии, что аргументы этой функции удовлетворяют условию связи х+у—1=0. Таким образом, экстремумы функции и=х2 + у2 ищутся не на всей плоскости Оху, а лишь на прямой х+у—1=0. Для решения поставленной задачи подставим в выражение •функции и=х2+у2 значение у, определяемое из условия связи х+у—1=0. Таким путем мы сведем поставленную задачу к задаче об отыскании безусловного экстремума функции и = 2х2—2д:+1. Последний экстремум находится без труда: поскольку и' — = 4(д:—1/2), ы<2>=4, то функция и=2х>—2х+\. имеет минимум <л=1/2 при #=1/2. Таким образом, функция и=х2+у2 с условием .связи х+у—-1=0 имеет условный минимум ы=1/2 в точке (1/2, 1/2). Отметим, что безусловный минимум функции и=х2 + у2 дос- Рис. 13.6
§ 3. Зависимость функций 633 тигается в точке (0,0) и равен и = 0. Впрочем, даже из наглядных соображений (рис. 13.6) очевидно, что минимум функции и = х2+у2 (графиком которой служит параболоид вращения) на всей плоскости Оху не совпадает с ее минимумом на прямой х+у—1 = 0. Переходим к общей постановке задачи об отыскании условного экстремума. Пусть требуется найти экстремум функции т + п переменных и=1(хи:.,хп, «/ь..., ут) (13.40) при наличии т условий связи *1 \Х1' • • • > Хп' У1> • • • » Ут) = "» Г 2 \х1> • • • > Хп> #1> • • • > Ут) — "| *•*•■ » в • * »♦••• Рт {Х1г ■■■ ,Хп, уг, . . . , ут) = 0. (13.41) Прежде всего уточним само понятие условного экстремума функции (13.40) при наличии связей (13.41). Будем говорить, что функция (13.40) при наличии связей (13.41) имеет условный максимум (минимум) в точке М0(хи...,хп, уи — Ут), координаты которой удовлетворяют условиям связи (13.41), если найдется такая окрестность точки Мо, в пределах которой значение функции (13.40) в точке М0 является наибольшим (наименьшим) среди ее значений во всех точках, координаты которых удовлетворяют условиям связи (13.41). Для нахождения условного экстремума функции (13.40) при наличии связей (13.41) предположим, что функции, стоящие в левых частях равенств (13.41), дифференцируемы в некоторой окрестности рассматриваемой точки М0, причем в самой точке М0 частные производные указанных функций по уи...-, ут непрерывны, а якобиан °{р1' •"• ' Рт) (13.42) 0(У1> ■■■ > Ут) отличен от нуля. В таком случае в силу теоремы 13.2 для достаточно малых положительных чисел в\, ег, ..., гт найдется такая окрестность точ- о о ки М'0{х\,...,Хп) пространства переменных (х\,...,хп), что всюду в пределах этой окрестности определены т функций Ух = Фх (%. • • • . х„), уг ~ Фг (х1> • • • > хп)> Ут — Фт!-"-!» •••> хп)> (13.43) удовлетворяющих условиям \у\—у\ | <еь ..., \ут—ут\<ет и являющихся при наличии этих условий единственным и дифференци- 21 Зак. 72
634 Гл. 13. Неявные функции руемым решением системы уравнений (13.41). Подставляя найденные функции (13.43) в (13.40), мы сведем вопрос о существовании условного экстремума в точке М0 у функции (13.40) при наличии связей (13.41) к вопросу о существовании безусловного экстремума в точке М'0 у сложной функции аргументов х\, х2,.... • ••> Хп- и = 1[хи ...,хп, у1(хи...,х„),...,ут(хи ..., хп)] = (13.44) = Ф(*ь...,л;„). Вопрос о существовании безусловного экстремума функции (13.44) может быть решен методами, указанными в § 6 гл. 12*. Изложенная нами общая схема сведения условного экстремума к безусловному была реализована в'рассмбтреннбм выше частном примере. Постараемся теперь, не прибегая к решению системы (13.41), установить по крайней мере необходимые условия существования условного экстремума в точке М0. Итак, пусть функция (13.40) дифференцируема в точке Мо и имеет в этой точке условный экстремум при наличии связей (13.41) или, что то же самое, функция (13.44) имеет в точке Мо' безусловный экстремум. Согласно установленному в § 6 гл. 12 необходимым условием безусловного экстремума функции и = Ф(х\, ...,хп) в точке М0' является равенство нулю в этой точке дифференциала этой функции йиг=^.йхх+ ... + —йхп, (13.45) дхг дхп тождественное относительно йхх йхп. В силу инвариантности формы первого дифференциала и равенства (13.44) формулу (13.45) можно переписать в виде йи = -У-Лх1+... + -У-йхп+-$-йу1+ ... + ^-йут = 0. (13.46) дхг дхп дух оут (В этой формуле все частные производные берутся в точке М0.) Подчеркнем, однако, что в равенстве (13.46) йуи...,ёут представляют собой дифференциалы функций (13.43), так что равенство (13.46) не является тождеством относительно йу\,..., йут. Предположим, что в уравнения связи (13.41) мы подставили функции (13.43), являющиеся решением системы (13.41). При этом уравнения (13.41) обратятся в тождества, и мы получим, дифференцируя эти тождества, * При этом, конечно, придется подчинить функцию (13.40) некоторым условиям.
§ 3. Зависимость функций 635 ■ (1х1+... + ^с1хп + ^-(1у1+... + -^-с1ут = 0, 3*1 дхп дух ду„ дРт ^. , , дРт .,.. , дРт„.. , , дР„ йх1+.. .+^(1хп + ^йух + . . ,+^±Л1йут = 0. д*1 дхп " дй %, (13.47) Так как якобиан (13.42), по предположению, отличен от нуля в точке М0, то из линейной системы (13.47) йуи ...,йут могут быть выражены как линейные функции йхх,..., кхп. Если найти эти выражения и подставить их в (13.46), то, собирая в полученном равенстве члены, содержащие йх1г...,с1хп, мы будем иметь А10х1 + ... + Аайхп = ^, (13.48) где через А\,...,Ап обозначены некоторые рациональные функции частных производных /, Р\,...,Рт в точке Мо- Так как в равенстве (13.48) фигурируют лишь дифференциалы независимых переменных, то из этого равенства заключаем, что Л1 = 0,..., Л„ = 0. Присоединяя к указанным равенствам т условий связи (13.41), мы получим необходимые условия существования условного экстремума функции (13.40) при наличии связей (13.41) в виде Л, = 0,...,Л„ = 0, Р1 = 0,...,Рп = 0. (13.49) Равенства (13.49) представляют собой систему т + п уравнений для определения т+п координат точки возможного экстремума. . 2. Метод неопределенных множителей Лагранжа. При изложенном выше методе отыскания точек возможного условного экстремума мы нарушили симметрию в отношении переменных Х1,...,х„, Уи—,Ут. Часть из этих переменных Х\, ..., хп мы рассматривали как независимые, остальные — как функции этих переменных. В ряде случаев это приводит к усложнению выкладок. Лагранжем предложен метод, симметризирующий роль переменных. Изложению этого метода и посвящен настоящий пункт. Умножим равенства (13.47) соответственно на произвольные (и пока еще неопределенные) постоянные множители Х\,...,%т- Полученные после умножения равенства сложим почленно с равенством (13.46). В результате получим следующее равенство: ^йх1+...Л.ЖйХа + -^йу1+...+.Я-йуа = Ь (13.50) 5*1 дхп п дух ' Ьут где символом -§(х\,..., хп, у\,...,ут) обозначена следующая функция: У=[ + к1р1 + ... + ктРт. (13.51) Эту функцию мы в дальнейшем будем называть функцией Лагранжа. Считая, что для функций (13.41) выполнены усло- 21*
636 Гл. 13. Неявные функции вия, сформулированные в предыдущем пункте, и что функция (13.40) дифференцируема, выберем множители ки...,Хт так, чтобы выполнялись равенства Л = 0, ... ,-^- = 0. (13.52) дух дут Это заведомо можно сделать, ибо равенства (13.52) приводят к линейной системе "1 г Лх —— + . . . + Кт —— = О, дуг ду1 дуг д! +^^- + ..- + ^^=0, дух дут дуп определитель которой (якобиан (13.42)) отличен от нуля. В силу равенства (13.52) равенство (13.50) принимает вид -^-Лс1+... + -^Лс„ = 0. (13.53) дхг дхп Поскольку при сделанных выше предположениях переменные Х\,...,хп являются независимыми, то из равенства (13.53) заключаем, что Л = 0, ... ,-^- = 0. (13.54) дхх дхп Присоединяя к уравнениям (13.52) и (13.54) условия связи (13.41), мы получим систему п+2т уравнений Л = 0, ...,-^- = 0,-^ = 0,...,-^-=0, (13.55) дхх дхп дух ду,„ Р1 = 0,...,.Рт = 0 для определения п + т координат точек возможного условного экстремума и т множителей К\,...,Хт- Практически при реализации этого метода поступают следующим образом. Составляют функцию Лагранжа (13.51) и для этой функции находят точки возможного безусловного экстремума. Для исключения множителей 'К\,...,%т привлекают условия связи (13.41). Такой путь отыскания точек возможного условного экстремума является законным, ибо он приводит нас как раз к системе п+2т уравнений (13.55). Пример применения метода множителей Лагранжа будет рассмотрен в п. 4. 3. Достаточные условия. В этом пункте мы рассмотрим один из путей дополнительного исследования точек возможного условного экстремума. Предположим, что в точке М0 выполнены необходимые условия экстремума (13.55). Кроме того, дополнительно потребуем двукратной дифференцируемости функций (13.40) и
§ 3. Зависимость функций 637 (13.41) в окрестности точки М0 и непрерывности всех частных производных второго порядка в самой точке М0. Из конструкции функции Лагранжа (13.51) очевидно, что при наличии связей (13.41) экстремумы функций (13.40) и Лагранжа совпадают *. Но тогда из результатов § 6 гл. 12 вытекает, что для получения достаточного условия экстремума в точке М0 у функции (13.40) при наличии связей (13.41) следует присоединить к условиям (13.55) требование знакоопределенности в этой точке еР-ф. При этом в соответствии с результатами § 6 гл. 12 мы можем констатировать наличие в точке М0 минимума, если при наличии связей (13.41) а,2^/Мо>0, и максимума, если а"2\р/М0<0. Сделаем еще несколько замечаний практического характера. Прежде всего отметим, что второй дифференциал а*2\р можно в данной точке Мй возможного экстремума вычислять так, как если бы все переменные Хи ..., хп, уи ..., Ут были независимыми. В самом деле, в общем случае второй дифференциал й2^) функции ф не обладает свойством инвариантности формы и должен был бы с учетом зависимости г/ь ...,ут от Хи ..., хп определяться равенством йх1—+ ... +<1хп-—+с1у1—-+ ...+с1уп—\ г|> + 0*1 дхп дух дут) дУ1 дУт Но в точке возможного экстремума справедливы равенства эд> о ^ о дуг дут так что бйр определяется той же формулой й2у= (йх1-—+ ...+йхп—- + йу1-—+ ■ \ дхг дхп ду1 д \2 ■■+^Ут , 'Ф. дУт 1 (13.56) что и в случае, когда все переменные Х\,..., хп, уи ..., ут независимы. Далее, заметим, что поскольку нам требуется установить знакоопределенность а"Ц> лишь при наличии связей (13.41), то при проведении вычислений следует в формулу (13.56) для еР\|з подставить вместо йуи ••■, с!ут их значения, определяемые из системы (13.47). После этого следует изучить вопрос о знакоопределенности а,2$ в данной точке М0. 4. Пример. Найдем экстремальные значения функции переменных и = Х12-]гХ22+ ... +хгт (13.57) * Это вытекает из того, что при наличии связей (13.41) разность {(М) — —}{М0) совпадает с разностью Ц>(М)—\р(М0).
638 Гл. 13. Неявные функции при наличии связи *1+*2 + ... + л:т+1=0. (13.58) Составим функцию Лагранжа гр=д:12+ ... +х*т+\{х1+ ... +хт+1) (13.59) и для нее изучим вопрос о точках безусловного экстремума. Так как для любого номера г, равного 1, 2,..., т, справедливо соотношение —— = 2х{ + л, то единственной стационарной точкой дхс является точка М0 с координатами •М-Ь-т -т)- Для определения Я используем условие связи (13.58), из которого получим, что (-А)т+1.0. Таким образом, Я = 2/т и единственная стационарная точка имеет координаты М0(—\/т,—1/т,...,—11т). Поскольку второй дифференциал функции Лагранжа (13.59), равный й^ = 2[{йх^+ ... +(йхт)*\, всегда положительно определен, то функция (13.57) при наличии связи (13.58) имеет в точке М0(— 1/т, —\/т,...,—1/т) условный минимум. Подставляя координаты точки М0 в (13.57), мы получим, что минимальное значение функции (13.57) при наличии связи (13.58) 1 раВНО Итш= т ДОПОЛНЕНИЕ Отображения банаховых пространств. Аналог теоремы о неявной функции 1. Теорема о существовании и дифференцируемости неявной функции. В § 1 гл. 13 мы установили теорему 13.1 существования и дифференцируемости неявной функции, зависящей от числовых аргументов х, у, причем эта функция и = ц>(х,у) находилась как решение уравнения Р(и, х, у)=0 в окрестности некоторой точки М0(й, х, у).
Дополнение 639 Ниже мы убедимся, что указанная теорема 13.1 без больших изменений переносится с числовых функций на отображения произвольных банаховых пространств. Предпошлем формулировке и доказательству этой теоремы некоторые обозначения. Символом В мы обозначим некоторое банахово (т. е. полное нормированное) пространство. Символом N будем обозначать нормированное пространство, через ХхУ обозначим прямое произведение множеств X и У, т. е. множество всевозможных упорядоченных пар (х, у), для которых хе1, г/еУ. Всюду ниже под производной некоторого отображения мы понимаем сильную производную, введенную в дополнении 3 к гл. 12. Докажем теорему об отображениях нормированных пространств, обобщающую теорему 13.1 о неявной функции. Теорема. Пусть Ыи И2 и В — линейные нормированные пространства, причем В — банахово пространство, 2 — окрестг ность точки (хо, г/о), принадлежащей произведению пространств Их и В, а Р(х, у) — отображение окрестности 2 в пространство Иг, обладающее следующими свойствами: а) Р{х, у) непрерывно в точке (хо, г/о), х, хй^.Ы\, у, !/0еВ; б) Р(х0, г/о)=0; в) частная производная Ру'(х, у), т. е. производная по аргументу у при фиксированном элементе х *, существует в 2 и непрерывна в точке (лго, г/о), а оператор Ру'(х0, г/о) имеет ограниченный обратный оператор** >[РУ'(х0, г/о)]-1; г) частная производная Рх'(х, у) существует в каждой точке окрестности 2 и непрерывна в самой точке (х0, г/о). При этих условиях в некоторой окрестности 20 точки х0 пространства Л/*! определено отображение у = ц>(х): 2о->-В такое, что: а°. Р(х, ф(х))=0 в 2о и у(х)=у(х) непрерывно в точке Хй\ б°. г/0 = ф(д:о); в°. если у\(х) — какое-либо отображение, определенное в некоторой окрестности 24 точки хо, обладающее свойствами а° и б°, то <Р1(л;)=ф(лО в некоторой окрестности 2с21П20 точких0; * См. по этому поводу также п. 2. ** Пусть А — оператор, действующий из 8 в IV, БА — область определения (т. е. множество, на котором определено отображение А), а Я а — образ множества Оа, т. е. множество элементов вида Ах, хе/Зд. Оператор А называется обратимым, если для любого г^Ял уравнение Ах=г имеет единственное решение. Если А обратим, то каждому ге^А можно поставить в соответствие единственный элемент хеВд, являющийся решением уравнения Ах = г. Оператор, осуществляющий это соответствие, называется обратным к А и обозначается символом Л-1.
640 Гл. 13. Неявные функции г°. отображение у — (р(х) дифференцируемо в точке х0 и г/' = ср'(*о) = —{Ру'{х0, уо)]-1Рх'(хо, г/о). Доказательство. Без ограничения общности можно считать, что х0 = 0, г/о = 0 (в противном случае можно сделать замену Х1 = х—Хо, г/1 = /у—г/о, и утверждение сведется к указанному случаю х0 = 0, г/о = 0). Согласно условию теоремы окрестность 2 точки (0,0) принадлежит произведению Л^ХВ пространств Л^ и В. Очевидно, что окрестность 2 содержит такую окрестность точки (0,0), которая является прямым произведением окрестности ||л:||<б точки ОеЛ/^ и окрестности ||г/||<е точки ОеВ. Итак, можно считать, что х0 = 0, г/о = 0 и 2 = {(х, у)е=М1хВ:\\х\\<8, \\у\\<г}. Рассмотрим при фиксированном х отображение Аху=у-[Ру'(0,0)]-1Р(х, у) окрестности точки ОеВ в пространство В. Подчеркнем, что в силу условий теоремы отображение Р(х, у) определено при ||х||<6, ||г/||<е и его значения лежат в пространстве Ы2. Отображение Ру {х, у) определено и непрерывно в точке (0,0). По условию в) отображение Ру'(0,0) : В-к/У2, имеет обратное [^/(0, О)]-1 : Ыг-^-В. Таким образом, последовательное применение отображений Р(х, у) и [Ру'(0,0)]~1, т. е. отображение [Ру'(0, 0)]~лР(х, у) определено и его значения лежат в В. Заметим, что точка у = ц>{х) является неподвижной точкой отображения Ах (см. дополнение 2 к гл. 12) тогда и только тогда, когда Р(х, ф(х))=0. Таким образом, отыскание и исследование функции у = ц>(х) сводится к отысканию и исследованию неподвижных точек отображения Ах. Для того чтобы отыскать неподвижные точки отображения Ах, применим принцип сжимающих отображений. Заметим для этого, что при любом фиксированном элементе хеЛ^, таком, что Цд:||<б, отображение Аху дифференцируемо по у в области ||г/||<е, г/еВ, что следует из свойства производной сложной функции (см. дополнение 3 к гл. 12, п. 1, свойство 3), причем {Аху)у'= {Еу)/-[Ру'(0, 0)]-1/у(*> УЬ здесь Е — единичный оператор. Поскольку, согласно свойству 2 (дополнение 3 к гл. 12), производная ограниченного линейного оператора есть сам этот оператор, т. е. (Еу)'-Е, то мы полу-, чим, что (Аху)у' = Еу-[Ру'(0, 0)]-ЛР/(х, у) = =[[Ру'(0,0)]-1[Ру'(0,0)-Ру'(х,у)].
Дополнение 641 Отображение Ру'{х, у) по условию а) теоремы непрерывно в точке (0,0), поэтому всегда можно найти такую окрестность Ы1<Р<8, ||«/||<Р<г точки (0, 0)еЕ#1ХВ,-в которой* \\Ру'(0,0)-Ру'(х,у)\\<(2\[[Ру'(0,0)]-Ч)-1. Следовательно, при ||л;||<р, ||г/||<Р получим, что ЦАху)у'\\<\\[Ру'М}-Ч \\Ру'{0,0)-Ру'(х, у)\\<2-К Всюду ниже будем считать, что 1М|<р, ||г/||<Р, и поэтому \\(Аху)у'\\<2-К По формуле конечных приращений для отображений при любом фиксированном х, ||х||<р, и любых у1 и у2 таких, что \\ух\\< <Р, НЫ1<Р> получим (см. дополнение 3 к гл. 12, п. 2) 11401-40211 < 8иР 11401+ 9 (02-01)111101-02Н< 4" Н01-021Г- о<е<1 2 Здесь мы воспользовались тем, что ||</1 + 6(г/2—У1)Н<Р при 11011КР, !Ы1<Р и при любом 0<9<1 \\У1 + в{Угг-У1) Н<1101(1-6) 11 + 118^11= (1-в)||г/1||+0Ы<р. Таким образом, Ах — семейство сжимающих отображений окрестности ||г/||<р точки ОеВ в пространстве В, причем коэффициент сжатия 1/2 не зависит от параметра х^Ыи ||х||<р. Для того чтобы применить принцип сжимающих отображений к отображению Ах, следует указать то полное метрическое или нормированное пространство, которое при этом отображении переходит в себя. Укажем это пространство. Зафиксируем произвольное число 61 такое, что 0<81<р. Покажем, что существует такое число 61(81), 0<б1(е1)<р, что при любом хеЛ^, и ||*||<б1(81) (эту окрестность в пространстве Кх обозначим через Ео) отображение Ах преобразует замкнутый шар /((0,61) с центром в точке 0 и радиуса 61 в пространстве В в себя. Действительно, в силу того, что отображение Р(х, у) непрерывно в точке (0,0), и того, что Р(0, 0)=0, для указанного еГ найдется такое положительное число 61(81), что при ||л:||< <6,(е0<р П40|| = \\[Р'У ФМ-'Р (*, 0)\\<\\{[Р'у (0,0)]-Ч| \\Р (х, 0)||< ±- 8Х. * Напомним, что по условию в) теоремы оператор [Ру'(0, О)]-1 непрерывен, а следовательно, ограничен по норме; норма этого оператора отлична от нуля, так как область его значений, совпадая с областью определения оператора Гу'(0, 0), не является лишь нулевым элементом. ** Здесь мы обозначили (Ах(-))у' через Ах'{-).
642 Гл. 13. Неявные функции Далее, если ||#||<81(е1), [|г/||<еь то в силу того, что отображение Ах сжимающее, и полученной оценки для ||ЛХ0|| имеем \\АхУ\\=\\лху-ахо + 4с0ц<||4^-4.0Ц+1|4,0||< \\\у\\+ + _е1<вг Следовательно, Ах преобразует замкнутый шар /С(0, е\) пространства В в себя. Элемент х при этом фиксирован и ||#||< <б!(81). Замкнутый шар К(0, е^ является метрическим пространством, причем (в силу замкнутости) полным. В самом деле, В — полное метрическое пространство. Всякая фундаментальная последовательность точек уп^К(0, е\)с:В сходится к точке г/о^В, которая в силу замкнутости /С(0, 81) принадлежит /С(0, 81). Поэтому /((0, 81) — полное метрическое пространство и Ах — сжимающее отображение, определенное на нем. Согласно принципу неподвижной точки (см. дополнение 2 к гл. 12) получаем, что при каждом хе!0 найдется единственная точка г/ = ф (л:) в шаре /С(0, еО, неподвижная относительно отображения Ах. Для этой точки справедливо соотношение Лжф(*)=<р(х)=|Ф(л:)-[/У(0,0)]-^(х, <р(*)), или Р(х,ч(х))=е0, если Следовательно, функция у = у(х) удовлетворяет уравнению Р{х, ф(х)) =0. Эта функция непрерывна в нуле, так как по любому положительному 81 <р, мы можем найти такое 61(81), что при |[лс||<б1(Е1) отображение Ах переводит шар К(0, еО в себя, т. е. единственная неподвижная точка у = ц>(х) этого отображения при лге20 принадлежит шару К(0, е\), т. е. удовлетворяет условию ||ф(х)||«:е1. Утверждение а° полностью доказано. Далее, поскольку 4,0 = 0—[/У(0, 0)]-^(0, 0)=0, то в силу единственности неподвижной точки имеем при х = 0 г/о = ф(0)=0. Тем самым установлено утверждение 6°. Далее, если ф1(х) — отображение, удовлетворяющее условиям а° и б° в некоторой окрестности 24 точки ОеЛ/'ь то найдется такое 62(е1), что Цф1(х)Ц<:е1 при |Ы|<82(е1). При ||х]|< <ппп (61(81), 62(81)) одновременно будут выполнены соотношения ||ф(*)||<81 и Цф1(л;)||<е1. В силу того, что Р(х, ф](д;))=0, будет справедливо равенство
Дополнение 643 Л*ф1 (*) = Ф1 (*) — [Ру' (О, 0) ] -+Р (X, ф, (X) ) = ф1 (X) при любом х таком, что ||*||<тш(б1 (еО, 62(61)). Следовательно, ф1(х) — также неподвижная точка отображения Ах, принадлежащая шару К{0, г\). Однако неподвижная точка может быть только одна, поэтому ф1(х)=ф(х) в окрестности 2 = {*: ||*||<тш (61(81), 82Ы)}с:21П2о. Тем самым доказано утверждение в0. Осталось установить утверждение г° о дифференцируемости неявной функции. Обозначим через Ь линейный ограниченный оператор, действующий из А^ в В по правилу 1=ч/(0) = -[*У(0,0)]-^/(0,0). Проверим, что этот оператор Ь является производной отображения у = ф(*) в точке 0. Напомним, что для этого необходимо существование для каждого б>0 такого 8>0, что для любого х, удовлетворяющего условию |[*||<6, выполнено неравенство ||ф(*)-Ф(0)-1*||<е||*||. Учитывая, что ф(0)=0, и используя выражение для Ь запишем соотношение ф(х)=ф(0)-1х = ф(х) + [^/(0,0)]-^ж,(0,0)х = = [;у(о,о)]^[/у(о,о)х+/у(о,о)Ф(х)]. Поскольку * Р(х, ф(х)) =Р{0, 0) =0, то с помощью формулы конечных приращений для отображений получим, обозначая буквой у функцию ф(*): \\у-Ьх\\<\\[Р'у(0,0)]-т\Р(х,у)-Р(0, 0) - ^(0,0)*- -^(0,0)|/|К||[^(0)0)]-Ч|[ зир \\Р'х (6*. е^) _/?;(о,о)|||[*ц + + вир Ц^(вх,в^)-^(0,0)|||Ы|]<Т1(|И| + |М|), 0<в. б!<1 * " где величина ц может быть сделана сколь угодно малой (в силу непрерывности в точке (0, 0) производных Рх' и Ру')., если величина б достаточно мала. Таким образом, ||г/—Ь*||<т)( 11*11 + + 1Ы1)<Т1 (11*11 + 11^*11 + \\у—Ьх\\). Отсюда при достаточно малом ■п получаем** \\у—Ь*Ц<^(1—т))_1(1 + ||ЬЦ) ||*11. Достаточно выбрать ц так, чтобы было выполнено неравенство т](1-т1)-Ч1 + Ш1)<е. * Все рассмотрения ведутся в окрестности 2о точки 0, в котерой существует единственная неявная функция у = ц>(х). ** Ниже мы используем неравенство И^КИ^-И 11*11-
644 Гл. 13. Неявные функции Дифференцируемость отображения у = у(х) в точке 0 доказа* на, и утверждение г° установлено. Таким образом, теорема полностью доказана *. 2. Случай конечномерных пространств. Рассмотрим важный частный случай, когда нормированное пространство Ы\ совпадает с пространством Ет, а пространства В п Ы2 совпадают с Еп **. В качестве следствия теоремы получим теорему о неявной функции для этого частного случая. Выберем в пространствах Ет и Еп базисы и запишем отображение Р(х, у) в координатной форме: р1 = Р{(хи ..., хт, г/ь ..., уп), Рп = Рп(хи ..., хт, ух уп), где (Х[, ..., хт)=х — точка пространства Ет, (у и ..., уп)=у— точка пространства Еп, причем точка (Ри ..., Рп) принадлежит также Еп. Подчеркнем, что отображение Р(х, у) определено на прямом произведении пространств А^ХЙ или в данном частном случае на прямом произведении ЕтХЕп. Если фиксировать переменную у, положив ее равной у0, то мы получим функцию, определенную*** на некотором множестве Ет —сечении ЕтхЕп. Отображение Р(х, у0) представляет собой частичное отображение по переменной х (по отношению к исходному отображению Г(*,У))- Если в некоторой точке х0 е Е™ это частичное отображение Р(х, у о) дифференцируемо, то его производная в этой точке ха называется частной производной исходного отображения Р(х, у) в точке (хо, уо) (или частным производным отображением) по переменной х. Обозначается эта частная производная символом Рх(х0, уо) или — Уо' (иногда Бх Р(х0< г/о))- дх Ясно, что наши рассмотрения пригодны и в общем случае нормированных пространств Ы\, В, а не только в случае конечно- I мерных пространств Ет и Еп. * Можно показать, что если в окрестности 2 точки (хо, (/о) существуют и непрерывны частные производные отображения Р : Р'х и Р'у то и в некоторой окрестности точки ха функция у(х) непрерывно дифференцируема и ее производное отображение вычисляется по формуле у'(х)=-[Р'у(х, у(х))]~'[Р'х(х, у(х))}. ** Мы не предполагаем какой-либо конкретной реализации элементов конечномерных пространств Ет, Еп, т. е. элементы этих пространств не обязательно упорядоченные совокупности чисел (ср. п. 1 § 1 гл. 13). *** Все рассмотрения проводятся аналогично, если отображение Р(х, у) определено не на всем произведении ЕтХЕп, а лишь на некотором, например открытом, множестве 2, принадлежащем ЕтХЕп.
Дополнение 645 Замечание. Нетрудно, так же как и в случае функций многих переменных, доказать, что если отображение Р(х, у): М1хВ^-Ы2 дифференцируемо в точке (хо, *д>), то в этой точке у него есть все частные производные отображения и справедливо соотношение йр (х0, у0) = —(х<" Уо' с1х+.—(х°' Уо) йу. Здесь дх ду а,Р(х0, уо) — дифференциал Фреше от функции Р(х, у) в точке (хо, Уо)', — °'Уо и — — частные производные отображе- дх ду ния Р(х, у) в точке (х0, у0), а (их, йу) — элемент касательного пространства К(Хо,уа) N1X В*. Вернемся снова к изучению отображения Р(х, у): ЕтхЕп^ -+Еп. Согласно рассмотрениям п. 8 дополнения 3 к гл. 12 частные производные отображения Рх': Л^-^А^., Ру' :В-+-Ы'2 или, что то же самое, Рх': Ет-+Еп, Ру': Еп-^Еп задаются матрицами дРг _д/ч I Лг. дг^- 1 I д/л г)/ К = дРг дх, дРп д?1 дхт дР,г дхх дхт / \ дух дуп Непрерывность отображений /V и Ру' (операторов в конечномерных пространствах, задаваемых матрицами), как известно из курса линейной алгебры, равносильна непрерывности всех элементов соответствующей матрицы. Обратимость линейного отображения Ру'{х0, у0) :Еп-+Еп равносильна невырожденности матрицы, задающей это преобразование. Теперь мы подготовлены к тому, чтобы сформулировать теорему в случае отображения Р(х, у) :ЕтХЕп^Еп. Теорема. Пусть Ет и Еп — два конечномерных пространства размерностей шип соответственно, 2 — окрестность точки о о о о (хо, Уо), х0= (л:ь ..., Хт), г/о= (У\, —, Уп), лежащей в произведении пространств Ет и Еп, и Р(х, у) — отображение 11аЕтХЕп в пространство Еп, обладающее свойствами: а) Р(х, у) непрерывно в точке (х0, г/о); хей™, у, Уо^Еп (т. е. в точке (х0, г/о) непрерывны все координаты Т7,, 1=1, ...,«); * Если х — фиксированная точка, то КхМ можно отождествить с пространством N. Пусть Р(х) — дифференцируемое отображение нормированного пространства N1 в нормированное пространство N2, а Ьх11 — дифференциал Фреше (см. дополнение 3 к гл. 12), тогда можно сказать, что Ьх — линейное отображение касательного пространства КxN^ к Л в точке х в касательное пространство КхМ2 к Ы2 в точке Р(х). Часто элементы пространства Кх^1 обозначают через их, элементы пространства КхМ2 — через йР, поэтому д.Р---кхЛх. Касательным пространством к N 'в точке х называют пару КХМ= (х, Л'). Понятие касательного пространства формализует такие понятия, как «вектор, приложенный в точке», «вектор с началом в точке» и т. д. В рассматриваемом случае касательное пространство ]^,х у^Ы^ХВ есть произведение касательных пространств /С*Д2 X/(<УУ2.
646 Гл. 13. Неявные функции б) Р(х0, г/о)=0 (т. е. р1(хи ..., хт, уи ..., г/п)=0, ..., Рп{х\, ■■■■, Хт, г/ь ..., у°п)=0), где ■ Х0= (Х\, ..., Хт), Уо=(У1, - , Уп)\ в) частная производная ■ дР1(х, у) дРг(х, г/)> С> 1 \ « дУ1 "' дУп дРп{х, у) дРп(х, у) дух " ' дуп существует в каждой точке окрестности 2 и непрерывна в точке {хо, г/о) (т. е. в точке (х0, г/0) непрерывны, все элементы указанной матрицы), отображение дРЛх0, уд) дР^Хр, у0) с I \ ■ ду1 " дуп дРп(х0, Уо) дрп(х0, г/о) ду1 ' " дуп не вырождено (т. е, определитель указанной матрицы Якоби отличен от нуля); г) частная производная дРг(х, у) дР^х, у)> дхг дхп К(Х'У) = . дРп(х, у) дРп(х, у) дхх дх„ существует в каждой точке окрестности 2 и непрерывна в точке (*о> г/о) (т. е. в точке (х0, г/0) непрерывны все элементы указанной матрицы). При этих условиях в некоторой окрестности Ъо точки Хо^.Ет определено отображение у = у(х) (т. е. определены функции #й = фА:(*Ь ■•• , Хт), Й=1, ... , п) ТйКОв, ЧТО'. а°. Р(х, ф(л:))=0 СР<(*ь -, хт, Уи - , У«)=0, г'=1, ..., п и г/=ф(л:) непрерывно в точке Хо (т. е. координаты (р\(х), ..., фга(л:) отображения у(х), х=(хи..., хт) непрерывны в точке х0); б°. г/0=ф(л:о) ( т. е. ук = ((к(хи ..., хт), к=\, ..., я); в°. если у\{х) — другое отображение, определенное в некоторой окрестности 2] точки хо, обладающее свойствами а° и 6°, то ф!(л:)==ф(л:) в некоторой окрестности Иа1,1[\11о точки х0; г°. отображение у = <р(х) дифференцируемо в точке Хо и У = ф' {х») = — [Р'г (х„, г/о)]-1 Р'х (х0, у0) =
Дополнение 647 9^1 (*о. г/о) дух дРп{х0, У о) дРг(х0, у0) \- дУп \ дРп{х0, г/о) 1 1 / дР^Хр, г/0) | Эдгх 1 дРп(хр, у0) дРЛх0, у0) дхт дРп{х0, г/о) дР дхт дух дуп / \ дхг дх„ Замечание. В случае, если Еп одномерно, т. е. Еп совпадает с Е\ мы получим всего одно скалярное уравнение Р(хи ..., хт, у)=0, где *=(%!, ..., хт) — точка из Ет, у^Е1 — числовой аргумент. В этом случае отображение Ру' состоит только из одного элемента , и поэтому (Р')~1 = 1 / ——. По- ду у I ду дР с, I дР дР \ скольку в этом случае = гх = I ——, .... —— , то соглас- ОХ \ 0X1 ®Хт I но утверждению г° теоремы получаем, что \ дх^ дхт) \ ду ) \ дхх' или, приравнивая координаты, получаем ду _ дР/дхг . _ . дх[ дР/ду . Если и пространство Ет одномерно, т. е. Ет = Е\ то точка х — число и в этом случае —^- = / . Эти формулы были дх дх I ду нами установлены в § 1 и 2. 3. Особые точки поверхности в пространстве п измерений. Обратное отображение. В п. 3 § 1 настоящей главы мы рассматривали понятия особой и обыкновенной точек поверхности в трехмерном пространстве Е3. Рассмотрим теперь обобщения этих понятий на случай пространства любого конечного числа измерений. Пусть у=Цх) — отображение окрестности точки хо пространства Ет в пространство Еп, дифференцируемое в точке х0. Если в пространствах Ет и Еп выбрать базисы, то отображение У = !{х) может быть записано в координатной форме [х= = (*ь х2, ..., хт)]: У\ = 1\{Х\, — . Хт), Уп—1п(Х1, ... , Хщ) • Рангом отображения у=[(х) в точке х0= {хи —, хт) называется число, равное рангу матрицы
648 Гл. 13. Неявные функции Обычно ранг отображения /(х) в точке Хо обозначается символом гап§/(л:о). Ясно, что гапд/(х0) <гшп (т, п). Определение. Точка х0 пространства Ет называется особой (критической, сингулярной) точкой отображения }(х) некоторой окрестности этой точки в пространство Еп, если ранг этого отображения в точке х0 меньше наименьшего из чисел тип, т. е. если гап§/(д:о) <гшп"(т, п). Если в точке х0 выполнено соотношение гап§ / (х0) = тт (т, п)г то точка х0 называется обыкновенной или неособой для отображения у= }(х): Пусть х0^Ет и х0= (хи ..., Хт). Рассмотрим соотношение Р{х\, ..., хт), где Р — числовая непрерывно дифференцируемая функция, Р:Ет-+Еп. Предположим, что точка х0= (х\, ..., хт) не является особой для функции Р. Поскольку в этом случае матрица, определяющая ранг отображения, состоит из одной строки ( дР(х0) дР(х0) \ { дх1 ' дхт )' то сформулированное выше условие того, что точка Хо не является особой для отображения Р(х) (т. е. условие тап§Р = = тт(/л, 1) = 1), означает, что хотя бы одна из частных производных Р в этой точке отлична от нуля. Пусть ради определенности —^-^-ФО. Поскольку Р(хо)=0, то по теореме о не- охт явном отображении переменную хт в окрестности точки Хо = = (Х\, ..., х-т) можно выразить в виде функциональной зависимости Хт = \\Х\, ... , Хт—\)- Таким образом, в окрестности неособой точки мы разрешили функциональную систему уравнений, состоящую из одного уравнения, зависящего от т переменных. Пусть теперь в некоторой окрестности точки х0= {х\, ...,хп+т) пространства Еп+т задано обращающееся в нуль в этой точке отображение Р: Еп+т-+Ет, т>\, указанной окрестности в пространство Ет, непрерывное в этой окрестности и обладающее в ней частными производными первого порядка по всем переменным, непрерывным в самой точке хо- Тогда если точка х0 не является особой, то тап§Р(х0) =т, т. е. найдется хотя бы один минор порядка т, отличный от нуля. Пусть это будет, например^ минор 0(Р\, ..., Рт)/0(хи ..., хт). Тогда по теореме о неявной функции уравнение Р{х) = О, т. е. система
Дополнение 649 ?1 (*1» • • • » Хп+т) = 0. (*> г т (*1> • • • > Хп+т) == « , разрешима в указанной окрестности точки хо относительно переменных х\, ..., хт, т. е. существуют единственные функции Х\=Ц>\{хт+\ Хт+п), Хт — фт (^т+1| ••■ » Хт+п), являющиеся решением системы функциональных уравнений (*);, эти функции будут непрерывны в некоторой окрестности точки Хо'=(хт+и ..., Хт+п) и дифференцируемы в этой точке. (Если предположить, что частные производные непрерывны и в некоторой окрестности точки х0, то и функции <рь •••. фт будут дифференцируемы в некоторой окрестности точки (хт+и .... ... , Хт+п)', СМ. СНОСКУ П. 2.) Подчеркнем, что условие неравенства нулю якобиана ЩРк .--.Рт) означает при принятых нами определениях, что отображение Р{х', ха') :Ет-*Ет (хо' — фиксированная точка) имеет ранг в точке (хи...,Хт)=х', равный т; гап§Р(х/,х0') = тт(т,т) = тТ т. е. означает, что точка х' является неособой для отображения Р(х', х0') :Ет-+Ет; выше х0'=(хт+и ..., хт+п), х'={хи ..., хт). В качестве еще одного следствия теоремы о неявном отображении является следующая теорема об обратном отображении (об обратной функции) (см. также п. 4 § 1 настоящей главы). Теорема. Пусть Р: '^-+N — отображение открытой окрестности 2 точки хо банахова пространства В в нормированное пространство N. Пусть отображение у = Р(х) дифференцируемо в 2, Р' (х) непрерывно в точке Хо и оператор Р' (х0) — обратимый. Тогда найдутся окрестность 1,1 точки х0, Ъ\с^В, и окрестность 12 точки Уо = Р(х0), 2гс:Л^ такие, что отображение Т: Е^Е? взаимно однозначно отображает 2] на 22, а обратное отображение Р~и. Ег->-21 непрерывно в Ег и дифференцируемо в точке х^ причем (Р-1У(Уо)=[Р'(хо)]~1. Для доказательства этой теоремы достаточно применить теорему о неявной функции (о неявном отображении) к отображению О (у, х)=Р(х)—у, определенному на множестве Л^ХЕ, 2с:В, и принимающему значения в пространстве N.
650 Гл. 13. Неявные функции Действительно, в этом случае для О (у, х) выполнены все условия теоремы п. 1: О(у0, х0)=0, С {у, х) непрерывно в точке (Уо, Хо), Ох'(у, х)=Р'(х), Су (у, х) =—Е, Е — единичный оператор, поэтому Су' и Ох' определены в Мх2 и непрерывны в точке (уо, Хо); наконец, Сх'(Уо, хо)=Р'(х0) — обратимый оператор. Поэтому, применяя теорему о неявном отображении к отображению О (у, х), мы можем утверждать, что в некоторой окрестности 2г точки г/о^М существует функция х=Р~1(у), которая непрерывна в этой окрестности 2г; справедливо соотношение Хо=Р~1(уо); функция х(у) =Р~г(у) дифференцируема в точке у о, причем х'(Уо)=-[Ох'(Уо, Хо)]-'Оу'{у0, х0)=[Р'(х0)]-1Е = [Р'(х0)]-К Отображение х = Р~1{у) осуществляет взаимно однозначное отображение окрестности 22 на Е[ и является обратным по отношению к отображению у = Р(х). Если предположить, что отображение у = Р(х) непрерывно дифференцируемо в некоторой окрестности точки Хо, то отображение х=Р~1{у) будет диффеоморфизмом, т. е. будет взаимно однозначным и дифференцируемым отображением 22 на 2ь Геометрически это утверждение можно истолковать так: множество О (у, х)=Р{х)—у = 0, заданное как график отображения у = Р(х), в некоторой окрестности (г/о, Хо) точки из пространства ЫхВ можно изобразить как график отображения х=Р~1(у), заданного в некоторой окрестности точки у0^.Ы. В случае, если пространства В и N совпадают с пространством Ет, т. е. В — М=Ет, теорема об обратном отображении утверждает, что если задано отображение у — Р(х), или в координатной форме У1 = р1(хи ..., хт), Ут — Гт\Х\, ... , Хт) , причем функции Т7,-, 1=1, ..., т дифференцируемы в окрестности точки х0= (х\ Хщ) и их частные производные непрерывны в ■Уо — Р(хо); якобиан *' —— в точке х0 отличен от нуля, Щъ хт) то существуют окрестности 1ч<^Ет, 22сг^т точек х0^1ч и г/о^2г соответственно, которые взаимно однозначно соответствуют друг другу при помощи отображения у = Р(х): 21->-22, причем существует гомеоморфное отображение * х=Р~1(у) : 22->-21 окрестности 22 на окрестность 2ь обратное по отношению к Р, дифференцируемое в точке у0= (уи ..., ут) и * Взаимно однозначное непрерывное отображение, обратное к которому также непрерывно, называется гомеоморфным отображением или гомеоморфизмом.
Дополнение 651 / 9Рг дРг ' . [ дхх дхт [Р-1(Уо)]' = [Р'(Ч)]-1-\ ■■■ ■ ■ -т \ дРт ^ _ дРт \ дхх дхт (Если предположить, что отображение у=Р(х) непрерывно дифференцируемо в некоторой окрестности точки Хо, то отображение х = Р~1(у) будет диффеоморфизмом.) Замечание. Условие обратимости отображения Р'(хо) фигурирующее в теореме об обратном отображении (или в случае отображения пространства Ет в Ет неравенство нулю якобиана Ъ(Ри..;Рт)1(Е>{х\ хт)) является лишь достаточным условием для существования обратного отображения х=Р~1(у). Обратное отображение может существовать и в случае, когда это условие не выполнено. Например, если у = Р(х) =х3: Е1-+Ех, то в точке нуль якобиан равен нулю, но обратная функция х = -]/ у существует. Однако, если в точке х0 якобиан равен нулю, то обратная функция, если она и существует, не может быть дифференцируемой в соответствующей точке у0, где г/0 = = Р(Ха). 4. Условный экстремум в случае отображений нормированных пространств. Точно так же, как и для числовой функции нескольких переменных, нетрудно получить решение задачи об условном экстремуме и в случае отображений нормированных пространств. Для этого мы воспользуемся необходимым условием экстремума для функционалов *(см. дополнение 3 к гл. 12). Утверждение. Пусть Р(х, у) —■ вещественный функционал, определенный в некоторой окрестности Е точки (хо, г/о) произведения В1ХВ2 двух банаховых пространств В\ и В2 и дифференцируемый в этой точке (хо^ г/о). Пусть С(х, у) — отображение окрестности 2 в нормированное пространство Ы, непрерывно дифференцируемое в окрестности 2, причем О(хо, у0)=0. Если отображение Оу'(х0, г/о) — обратимый оператор, то для того, чтобы функционал Р(х, у), рассматриваемый на подмножестве 2, определяемом условием С (х, у) = 0, имел в точке (хо, г/о) локальный экстремум, необходимо, чтобы существовал такой функционал А, отображающий нормированное пространство N в вещественную ось, что Р'(х0,уо)-~АО'(хо,у0)=0*. * Т. е. в точке (*о, г/о) выполнены три соотношения: Рх(хц, уо)—АСх'(хо, г/о) =0, Ру'(Хе, уе)—АСу'(Хо, Уо)=0, О(х,,у,)=0.
•652 Гл. 13. Неявные функции Последнее условие можно трактовать как необходимое условие экстремума, функционала Лагранжа ~Ч* = Р(х, у)^- —АС{х, у)=0. Роль множителя Лагранжа X здесь играет функ, ционал Л. Доказательство. Рассмотрим соотношение 0{х, у) = = 0 в окрестности 2 точки (х0, уо)^В\ХВ2. По теореме о неявном отображении уравнение С(х, у)=0 можно разрешить относительно аргумента у и тем самым множество точек (х, у), удовлетворяющих условию 0(х, у)=0, в окрестности 2 точки (х0, у0) можно представить в виде элементов множества (х, у(х)), где у(х) — непрерывно дифференцируемая в некоторой окрестности точки х0 функция и у{х0) =уо. Таким образом, задача об условном экстремуме для функционала Р(х, у) при условии С(х, </)=0 свелась к задаче нахождения локального экстремума для функционала Ф (х) = = Р(х, у(х)). Воспользуемся необходимым условием экстремума для дифференцируемого функционала Ф (х). Согласно результатам дополнения 3 к гл. 12 получим, что Ф'(хо)=0. Однако Ф'(х0)=Рх'(хо, у{х0))+Ру'(хо, у{х0))у'{хо). Поэтому условие Ф'(х0)=0 равносильно выполнению равенства Рх'{х0, у{х0))+Ру'(х0, у(х0))у'(х0)=0. Учитывая, что у{х0)=у0, у'(х0) =— [С/(х0, у0) ]-1 С/ (х0, у о) и что линейный функционал А=Ру'(х0, уо)[Су'{х0, у о)]'1 действует из пространства N в числовую ось Е1 (действительно, [Оу'(х0, у0)]-1ЩА'^-В2), Ру'(х0, у0)<=(В2^Е1)), имеем во-первых, что Рх'{хо, Уо)—АОх'{хо, (/о)=0, а во-вторых, из равенства А=Ру'(х0, уо)[6у'{х0, уй)]-х получим, что Ру'{х0, уо)—АОу'(х0, уо) =0. Равенства Р/(хо, уо)—АСх'{хо, г/о) =0, Ру'(хо, Уо)—АСу'(хо, Уо)=0, О(х0, Уо) = 0, очевидно, и завершают доказательство. Если рассматривается частный случай отображения Р{х, у) окрестности 2 точки (х0, у о) произведения двух конечномерных пространств ЕтХЕп в пространство Е1 при условии, что 0(х,у) =0, х0, х<^Ет, уо, у^Еп, 0(х,у) : 2-^", то в координатной форме необходимое условие экстремума, очевидно, имеет вид
Дополнение 653 О ОО О П О ОО О дР,{Х!, ... , Х„, уг; ... , уп) _ УГ\^ дОр{х1, ... , Хт, уг, ..., Уп) _ д дхк Лл р дхь р=1 О ОО О ГС о ОО О дР(х1, ... , хт, у±, ... , уп) ЧГ1 ^ дОр{хх, ..., хт, у1г ... , уп) __ ^ дй 2и '" ду; Р=1 О О О О 0р (л^, ... , хт, у1г ... , уп) = О, где к=\, 2 т, I, р = \, 2 п, С=(Си ..., Оп), (>ч, - , Ю — о о о о набор вещественных чисел, х0=(*ь •■•. хт), уо = {у\, ..., уп)\ см. также формулу (13.55). В частности, если отображение 6(х, у) переводит окрестность 2 в вещественную ось, т. е. функция С(х, у) веществен- нозначная (С: 2-+Е1), мы получаем уже найденное нами ранее необходимое условие экстремума функции Р (х, у) при условии, что функция 0{х, у)=0. Заметим, что в этом случае очевидно, что вектор (А-ь ..., %п) заменяется одним вещественным числом Я — множителем Лагранжа.
ОГЛАВЛЕНИЕ Предисловие титульного редактора .... 5 Предисловие ко второму изданию 6 Предисловие к первому изданию 6 Глава 1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОГО АНАЛИЗА 10 Глава 2. ВЕЩЕСТВЕННЫЕ ЧИСЛА 29 § 1. Множество чисел, представимых бесконечными десятичными дробями, и его упорядочение 29 1. Свойства рациональных чисел (29). 2. Недостаточность рациональных чисел для измерения отрезков числовой оси (31). 3. Упорядочение множества бесконечных десятичных дробей (34) § 2. Ограниченные сверху (или снизу) множества чисел, представимых бесконечными десятичными дробями .... 40 1. Основные понятия (40). 2. Существование точных граней (41). § 3. Приближение чисел, представимых бесконечными десятичными дробями, рациональными числами 44 § 4. Операции сложения и умножения. Описание множества вещественных чисел 46 1. Определение операций сложения и умножения. Описание понятия вещественных чисел (46). 2. Существование и единственность суммы и произведения вещественных чисел (47). § 5. Свойства вещественных чисел 50 1. Свойства вещественных чисел (50). 2. Некоторые часто употребляемые соотношения (52). 3. Некоторые конкретные множества вещественных чисел (52). § 6. Дополнительные вопросы теории вещественных чисел . .54 1. Полнота множества вещественных чисел (54). 2. Аксиоматическое введение множества вещественных чисел (57). § 7. Элементы теории множеств . 59 1. Понятие множества (59). 2. Операции над множествами (60). 3. Счетные и несчетные множества. Несчетность сегмента [0, 1]. Мощность множества (61). 4. Свойства операции над множествами. Отображение множеств (65). Г л а в а 3. ТЕОРИЯ ПРЕДЕЛОВ ". . 68 § 1. Последовательность и ее предел 68. 1. Понятие последовательности. Арифметические операции над последовательностями (68). 2. Ограниченные, неограниченные, бесконечно малые и бесконечно большие последовательности (69). 3. Основные свойства бесконечно малых последовательностей (73). 4. Сходящиеся последовательности 654
Оглавление 655 и их свойства (75). § 2. Монотонные последовательности 83 1. Понятие монотонной последовательности (83). 2. Теорема о сходимости монотонной ограниченной последовательности (84). 3. Число е (86). 4. Примеры сходящихся монотонных последовательностей (88). § 3. Произвольные последовательности 92 1. Предельные точки, верхний и нижний пределы последовательности (92). 2. Расширение понятий предельной точки и верхнего и нижнего пределов (99). 3. Критерий Коши сходимости последовательности (102). § 4, Предел (или предельное значение) функции 105 1. Понятия переменной величины и функции (105). 2. Предел функции по Гейне и по Коши (109). 3. Критерий Коши существования предела функции (115). 4. Арифметические операции над функциями, имеющими предел (118). 5. Бесконечно малые и бесконечно большие функции (119). § 5. Общее определение предела функции по базе .... 122 Глава 4. НЕПРЕРЫВНОСТЬ ФУНКЦИИ 127 § 1. Понятие непрерывности функции 127 1. Определение непрерывности функции (127). 2. Арифметические операции над непрерывными функциями (131). 3. Сложная функция и ее непрерывность (132). § 2. Свойства монотонных функций 132 1. Монотонные функции (132). 2. Понятие обратной функции (133). § 3. Простейшие элементарные функции 138 1. Показательная функция (138). 2. Логарифмическая функция (145). 3. Степенная функция (146). 4. Тригонометрические функции (147). 5. Обратные тригонометрические функции (154). 6. Гиперболические функции (156). § 4. Два замечательных предела 158 1. Первый замечательный предел (158). 2. Второй замечательный предел (159). § 5. Точки разрыва функции и их классификация . . . . 162 1. Классификация точек разрыва функции (162). 2. О точках разрыва монотонной функции (166). § 6. Локальные и глобальные свойства непрерывных функций . 167 1. Локальные свойства непрерывных функций (167). 2. Глобальные свойства непрерывных функций (170). 3. Понятие равномерной непрерывности функции (176). 4. Понятие модуля непрерывности функции (181). § 7. Понятие компактности множества 184 1. Открытые и замкнутые множества (184). 2. О покрытиях множества системой открытых множеств (184). 3. Понятие компактности множества (186). Г л а в а 5. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 189 § 1. Понятие производной 189 1. Приращение функции. Разностная форма условия непрерывности (189). 2. Определение производной (190). 3. Геометрический смысл производной (192). § 2. Понятие дифференцируемости функции 193 1. Определение дифференцируемости функции (193). 2. Диф- ференцируемость и непрерывность (195). 3. Понятие дифференциала функции (196).
656 Оглавление § 3. Дифференцирование сложной функции и обратной функции 197 1. Дифференцирование сложной функции (197). 2. Дифференцирование обратной функции (199). 3. Инвариантность формы первого дифференциала (200). 4. Применение дифференциала для установления приближенных формул (201). § 4. Дифференцирование суммы, разности, произведения и частного функций 202 § 5. Производные простейших элементарных функций . . . 205> 1. Производные тригонометрических функций (205). 2. Производная логарифмической функции (207). 3. Производные показательной и обратных тригонометрических функций (208). 4. Производная степенной функции (210). 5. Таблица производных простейших элементарных функций (210). 6. Таблица дифференциалов простейших элементарных функций (212). 7. Логарифмическая производная. Производная степенно-показательной функции (212). § 6. Производные и дифференциалы высших порядков . . . 213> 1. Понятие производной я-го порядка (213). 2. я-е производные некоторых функций (214). 3. Формула Лейбница для л-й производной произведения двух функций (216). 4. Дифференциалы высших порядков (218). § 7. Дифференцирование функции, заданной параметрически . 220» § 8. Производная векторной функции 222 Глава 6. ОСНОВНЫЕ ТЕОРЕМЫ О ДИФФЕРЕНЦИРУЕМЫХ ФУНКЦИЯХ 224 § 1. Возрастание (убывание) функции в точке. Локальный экстремум 224 § 2. Теорема о нуле производной 226 § 3. Формула конечных приращений (формула Лагранжа) . . 227 § 4. Некоторые следствия из формулы Лагранжа .... 229» 1. Постоянство функции, имеющей на интервале равную нулю производную (229). 2. Условия монотонности функции на интервале (230). 3. Отсутствие разрывов первого рода и устранимых разрывов у производной (231). 4. Вывод некоторых неравенств (233). § 5. Обобщенная формула конечных приращений (формула Ко- ши) . . 234 § 6. Раскрытие неопределенностей (правило Лопиталя) . . . 235 о 1. Раскрытие неопределенности вида — (235). Раскрытие 00 неопределенности вида — (240). 3. Раскрытие неопределен- 00 ностей других видов (243). !§ 7. Формула Тейлора « 245 § 8. Различные формы остаточного члена. Формула Маклорена 248 1. Остаточный член в форме Лагранжа, Коши и Пеано (248). 2. Другая запись формулы Тейлора (250). 3. Формула Маклорена (251). § 9. Оценка остаточного члена. Разложение некоторых элементарных функций . . . . . 251 1. Оценка остаточного члена для произвольной : функции (251). 2. Разложение по формуле Маклорена некоторых элементарных функций (252). 1§ 10. Примеры приложений формулы Маклорена 256. 1. Вычисление числа е на ЭВМ (256). 2. Доказательство иррациональности числа е (257). 3. Вычисление значений тригонометрических функций (258). 4. Асимптотическая оценка элементарных функций и вычисление пределов (259).
Оглавление 657 Глава 7. ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ И ОТЫСКАНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИИ 262 § 1. Отыскание стационарных точек 262 1. Признаки монотонности функции (262). 2. Отыскание стационарных точек (262). 3. Первое достаточное условие экстремума (264). 4. Второе достаточное условие экстремума '(265). 5. Третье достаточное условие экстремума (267). 6. Экстремум функции, недифференцируемой в данной точке (268). 7. Общая схема отыскания экстремумов (270). § 2. Выпуклость графика функции 271 § 3. Точки перегиба 273 1. Определение точки перегиба. Необходимое условие перегиба (273). 2. Первое достаточное условие перегиба (276). 3. Некоторые обобщения первого достаточного условия перегиба (276). 4. Второе достаточное условие перегиба (277). 5. Третье достаточное условие перегиба (278). § 4. Асимптоты графика функции 279 § 5. Построение графика функции 281 § 6. Глобальные максимум и минимум функции на сегменте. Краевой экстремум 284 1. Отыскание максимального и минимального значений функции, определенной на сегменте (284). 2. Краевой экстремум (286). 3. Теорема Дарбу (287). Дополнение. Алгоритм отыскания экстремальных значений функции, использующий только значения этой функции . . . 288 Глава 8. ПЕРВООБРАЗНАЯ ФУНКЦИЯ И НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ 291 § 1. Понятие первообразной функции и неопределенного интеграла 291 1. Понятие первообразной функции (291). 2. Неопределенный интеграл (292). • 3.'Основные свойства неопределенного интеграла (293). 4. Таблица основных неопределенных интегралов (294). § 2. Основные методы интегрирования 297 1. Интегрирование замены переменной (подстановкой) (297). 2. Интегрирование по частям (300). § 3. Классы функций, интегрируемых в элементарных функциях . 303 1. Краткие сведения о комплексных числах (304). 2. Краткие сведения о корнях алгебраических многочленов (307). 3. Разложение алгебраического многочлена с вещественными коэффициентами на произведение неприводимых множителей (311). 4. Разложение правильной рациональной дроби на сумму простейших дробей (312). 5. Интегрируемость рациональной дроби в элементарных функциях (318). 6. Интегрируемость в элементарных функциях некоторых тригонометрических и иррациональных выражений (321). § 4. Эллиптические интегралы , 327 Глава 9. ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ РИМАНА 330 § 1. Определение интеграла. Интегрируемость . . . . . 330 § 2. Верхние и нижние суммы и их свойства . . . . . 334 1. Определение верхней и нижней сумм (334). 2. Основные свойства верхних и нижних сумм (335). § 3. Теоремы о необходимых и достаточных условиях интегрируемости функций. Классы интегрируемых функций . . . 339 1. Необходимые и достаточные условия интегрируемости (339). 2. Классы интегрируемых функций (341).
658 Оглавление '§ 4. Свойства определенного интеграла. Оценки интегралов. Теоремы о среднем значении . 347 1. Свойства интеграла (347). 2. Оценки интегралов (350). § 5. Первообразная непрерывной функции. Правила интегрирования функций 357 1. Первообразная (357). 2. Основная формула интегрального исчисления (359). 3. Важные правила, позволяющие вычислять определенные интегралы (360). 4. Остаточный член формулы Тейлора в интегральной форме (362). § 6. Неравенство для сумм и интегралов 365 1. Неравенство Юнга (365). 2. Неравенство Гёльдера для сумм (366). 3. Неравенство Минковского для сумм (367). 4. Неравенство Гёльдера для интегралов (367). 5. Неравенство Минковского для интегралов (368). § 7. Дополнительные сведения об определенном интеграле Римана 369 1. Предел интегральных сумм по базису фильтра (369). 2. Критерий интегрируемости Лебега (370). Дополнение 1. Несобственные интегралы 370 § 1. Несобственные интегралы первого рода 371 1. Понятие несобственного интеграла первого рода (371). 2. Критерий Коши сходимости несобственного интеграла пер- . вого рода. Достаточные признаки сходимости (373). 3. Абсолютная и условная сходимость несобственных интегралов (375). 4. Замена переменных под знаком несобственного интеграла и формула интегрирования по частям (378). § 2. Несобственные интегралы второго рода 379 1§ 3. Главное значение несобственного интеграла . . ... 382 Дополнение 2. Интеграл Стилтьеса 384 1. Определение интеграла Стилтьеса и условия его существования (384). 2. Свойства интеграла Стилтьеса (389). Глава 10. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА 391 § 1. Длина дуги кривой 391 1. Понятие простой кривой (391). 2. Понятие параметризуемой кривой (392). 3. Длина дуги кривой. Понятие спрямляемой кривой (394). 4. Критерий спрямляемости кривой. Вычисление длины дуги кривой (397). 5. Дифференциал дуги (402). 6. Примеры (403). !§ 2. Площадь плоской фигуры 405 1. Понятие границы множества и плоской фигуры (405). 2. Площадь плоской фигуры (406). 3. Площадь криволинейной трапеции и криволинейного сектора (414). 4. Примеры вычисления площадей (416). § 3. Объем тела в пространстве 418 1. Объем тела (418). 2. Некоторые классы кубируемых тел (419). 3. Примеры (421). Глава 11. ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛЕНИЯ КОРНЕЙ УРАВНЕНИИ И ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ ... 422 § 1. Приближенные методы вычисления корней уравнений . . 422 1. Метод «вилки» (422). 2. Метод итераций (423). 3. Методы хорд и касательных (426). § 2. Приближенные методы вычисления определенных интегралов 431 1. Вводные замечания (431). 2. Метод прямоугольников (434). 3. Метод трапеций (436). 4. Метод парабол (438).
Оглавление 659 Глава 12. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ .... 442 § 1. Понятие функции т переменных 442 1. Понятие т-мерного координатного и т-мерного евклидова пространств (442). 2. Множества точек т-мерного евклидова пространства (445). 3. Понятие функции т переменных (449). § 2. Предел функции т переменных 451 1. Последовательности точек пространства Ет (451). 2. Свойство ограниченной последовательности точек Ет (454). 3. Предел функции т переменных (455). 4. Бесконечно малые функции т переменных (458). 5. Повторные пределы (459). § 3. Непрерывность функции т переменных 460 1. Понятие непрерывности функции т переменных (460). 2. Непрерывность функции т переменных по одной переменной (462). 3. Основные свойства непрерывных функций нескольких переменных (465). § 4. Производные и дифференциалы функции нескольких переменных 469 1. Частные производные функции нескольких переменных (469). 2. Дифференцируемость функции нескольких переменных (470). 3. Геометрический смысл условия дифференцируемое™ функции двух переменных (473). 4. Достаточные условия дифференцируемости (474). 5. Дифференциал функции нескольких переменных (476). 6. Дифференцирование сложной функции (476). 7. Инвариантность формы первого дифференциала (480). 8. Производная по направлению. Градиент (481). ■§ 5. Частные производные и дифференциалы высших порядков .. 485 1. Частные производные высших порядков (485). 2. Дифференциалы высших порядков (490). 3. Формула Тейлора с остаточным членом в форме' Лагранжа и в интегральной форме (497). 4. Формула Тейлора с остаточным членом в форме Пеано (500). ^ 6. Локальный экстремум функции т переменных .... 504 1. Понятие экстремума функции т переменных. Необходимые условия экстремума (504). 2. Достаточные условия локального экстремума функции т переменных (506). 3. Случай функции двух переменных (512). Дополнение 1. Градиентный метод поиска экстремума сильно выпуклой функции 514 1. Выпуклые множества и выпуклые функции (515). 2. Существование минимума у сильно выпуклой функции и единственность минимума у строго выпуклой функции (521). 3. Поиск минимума сильно выпуклой функции (526). Дополнение 2. Метрические, нормированные пространства . . 535 Метрические щюстранства. 1. Определение метрического пространства. Примеры (535). 2. Открытые и замкнутые множества (538). 3. Прямое произведение метрических пространств (540). 4. Всюду плотные и совершенные множества (541). 5. Сходимость. Непрерывные отображения (543). 6. Компактность (545). 7. Базис пространства (548). Свойства метрических пространств 550 Топологические пространства 558 1. Определение топологического пространства. Хаусдорфово топологическое пространство. Примеры (558). 2. Замечание о топологических пространствах (562). Линейные нормированные пространства, линейные операторы 564 1. Определение линейного пространства. Примеры (564). 2. Нормированные пространства. Банаховы пространства.
660 Оглавление Примеры (566). 3. Операторы в линейных и нормированных пространствах (568). 4. Пространство операторов (569). 5. Норма оператора (569). 6. Понятие гильбертова пространства (572). Дополнение 3. Дифференциальное исчисление в линейных нормированных пространствах ..." 574 1. Понятие дифференцируемое™. Сильная и слабая дифферен- цируемость в линейных нормированных пространствах (575). 2. Формула Лагранжа конечных приращений (581). 3. Связь между слабой и сильной дифференцируемостью (584). 4. Дифференцируемость функционалов (587). 5. Интеграл от абстрактных функций (587). 6. Формула Ньютона—Лейбница для абстрактных функций (589). 7. Производные второго порядка (592). 8. Отображение т-мерного евклидова пространства в /г-мерное (595). 9. Производные и дифференциалы высших порядков (598). 10. Формула Тейлора для отображения одного нормированного пространства в другое (599). Исследование на экстремум функционалов в нормированных пространствах . 602 1. Необходимое условие экстремума (602). 2. Достаточные условия экстремума (605). Глава 13. НЕЯВНЫЕ ФУНКЦИИ 609 § 1. Существование и дифференцируемость неявно заданной функции 610 1. Теорема о существовании и дифференцируемости неявной функции (610). 2. Вычисление частных производных неявно заданной функции (615). 3. Особые точки поверхности и плоской кривой (617). 4. Условия, обеспечивающие существование для функции у=}{х) обратной функции (618). § 2. Неявные функции, определяемые системой функциональных уравнений 619 1. Теорема о разрешимости системы функциональных уравнений (619). 2. Вычисление частных производных функций, неявно определяемых посредством системы функциональных уравнений (624). 3. Взаимно однозначное отображение двух множеств т-мерного пространства (625). § 3. Зависимость функций 626 1. Понятие зависимости функций. Достаточное условие независимости (626). 2. Функциональные матрицы и их приложения (628). § 4. Условный экстремум . 632 1. Понятие условного экстремума (632). 2. Метод неопределенных множителей Лагранжа (635). 3. Достаточные . условия (636). 4. Пример (637). Дополнение 1. Отображения банаховых пространств. Аналог теоремы о неявной функции 638 1. Теорема о существовании и дифференцируемости неявной функции (638). 2. Случай конечномерных пространств (644). 3. Особые точки поверхности в пространстве п измерений. Обратное отображение (647). 4. Условный экстремум в случае отображений нормированных пространств (651). Оглавление 654