Текст
                    .я.
ч
м
Г	Г ТЕ


А. Я. ХИНЧИН ВОСЕМЬ ЛЕКЦИИ ПО МАТЕМАТИЧЕСКОМУ АНАЛИЗУ ИЗДАНИЕ ТРЕТЬЕ огиз ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 19 4 8 ЛЕНИНГРАД
'I 11-5-4 i Редактор В. А. Калакуцкий. Техн. редактор Р. А. Негримовскпя. Подписано к печати 10/V111 1948г. 16,25 печ. л. 14,95 уч.-изд. л. 36780 тип. зн. в печ. л. А-07455. Цена 9 р. Пер. 1 р. Лак. NS 7901. Отпечатано в типографии. Н-19 с матриц 1-й. Образцовой тип. треста „Поли- графкнига" Огиза при Совете Министров CCCIJ. Москва. Валовая. 28.
Пров. 19 г. 5 ч I г СОДЕРЖАНИЕ Предисловие к третьему изданию 4 Предисловие к первому изданию 5 Лекция I. Континуум 9 Лекция II. Пределы 33 Лекция III. Функции 59 Лекция IV. Ряды .... 87 Лекция V. Производная 120 Лекция VI. Интеграл 156 Лекция VII. Разложение функций в ряды 198 Лекция VIII. Дифференциальные уравнения .... 231 ЁЙБЛИОТЕ р III10TJ). СТП'! Г"' Академии Наук ССЧ 9
ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ Третье издание отличается от первого лишь немногими изменениями. Самое существенное из них состоит в том, что я вычеркнул «принцип индукции» из числа основных лемм, вследствие чего все опиравшиеся на этот принцип доказа- доказательства пришлось заменить другими. Я надеюсь, что для большинства читателей я этим облегчил усвоение книги, так как мне представляется, что этот принцип и опирающиеся на него рассуждения предъявляли читателю в отношении логиче- логической культуры требования несколько более высокие, чем это вообще принято в настоящей книге. Из других изменений заслуживают быть отмеченными только новая трактовка формулы Тейлора и параграфа о функ- функциях с ограниченным изменением.
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Курс высшей математики в том или ином объёме читается в значительном большинстве высших учебных заведений. С основами математического анализа знакомятся студенты всех технических и большей части военных, агрономических и экономических вузов, не говоря уже о специальных фа- факультетах университетов и педагогических институтов. Все эти многочисленные, читаемые в разных учебных заведениях курсы весьма различны как по своему объёму, так и по той принципиальной, идейной и логической базе, на которой они строятся. В последнем отношении, в сущности, только уни- университетские курсы поднимаются до более или менее солид- солидного научного уровня; все остальные вынуждены довольство- довольствоваться упрощённым, далеко отстающим от современных научных воззрений идейно-логическим фундаментом, а иногда и весьма ограниченной программой. Между тем, мы часто встречаемся с таким положением, когда инженер, учитель, экономист, в свое время изучавший высшую математику по такому упрощённому курсу, начинает ощущать потребность в расширении и, главное, более прочном обосновании своих математических знаний. Возникает ли эта потребность вследствие тех или других конкретных исследований такого специалиста в его собственной научной области, или она встаёт как неизбежный плод общего расширения его научного и жизненного горизонта, — независимо от этого она, конечно, должна быть удовлетворена. Казалось бы, это сделать просто: взять какой-нибудь полный курс математического анализа, вроде Немыцкого !) или Фихтенгольца2), и штудировать !) Немыцкий и др., Курс математического анализа, т. I—II, Гостехиздат, 1944. 2) Фихтенгольц, Курс дифференциального и интеграль- интегрального исчисления, т. I, Гостехиздат, 1947.
Ь ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ его систематически, опираясь на уже имеющиеся менез солид- солидные и глубокие познания. Однако, опыт показывает, что этот представляющийся столь естественным путь почти никогда не приводит к цели и, за редкими исключениями, ведёт к разоча- разочарованию, а подчас и парализует дальнейшие попытки в на- намеченном направлении. Дело в том, что, с одной стороны, наш учащийся, как правило, располагает для той цели, кото- которую он себг поставил, лишь весьма ограниченным количеством времени и систематически проработать большой курс в не- нескольких томах уже по этой причине, лишён возможности. С другой же стороны, и это, пожалуй, всего важнее, — не имея ещё твёрдой научной базы и нз будучи математиком по специальности, он сам, без руководства, не может выде- выделить в изучаемом принципиальных моментов, вынужден уде- уделять поэтому полную долю внимания не имеющим сущест- существенного значения мелочам и кончает тем, что теряется в этих мелочах, переставая, так сказать, видеть лес за де- деревьями. А между тем, для того чтобы дать потребностям и за- запросам такого учащегося полное удовлетворение, нужно весьма немногое. Несколько лет назад я имел случай прочитать специальный, посвященный этой цели курс, состоявший всего из 12 двухчасовых лекций, слушателям курсов по повышению математической квалификации инженеров при Московском государственном университете. Должен признаться, что вна- вначале мне эта задача казалась почти безнадёжной; между тем, я имею основания полагать, что курс мой удовлетворил за- запросы слушателей, несмотря на свою краткость. Секрет этого успеха заключался в том, что мне удалось найти правильный ключ к решению стоявшей передо мной педагогической задачи: я с самого начала отказался от мысли излагать хотя бы одну главу своего предмета в полной подробности; вместо этого я ограничивался возможно выпуклым, конкретным и впечатляю- впечатляющим развитием принципиальных моментов, я говорил больше о целях и тенденциях, о проблемах и методах, о связях основных понятий и идей анализа между собой и с приложе- приложениями, чем об отдельных теоремах и их доказательствах. Я не боялся в целом ряде случаев для ознакомления с не имзю- щими принципиального значения деталями доказательств (а иногда и с целыми цепями теорем и доказательств) отсы-
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ 7 лать моих слушателей к учебнику. Но зато для освещения какого-либо понятия, метода или идеи, имеющих ведущее, принципиальное значение, я уже позволял себе не жалеть времени, стараясь всеми средствами, путём самых разнородных описаний, наглядных образов и т. п. возможно ярче и эффек- эффективнее внедрить эти основоположные моменты в сознание моих слушателей. Я с основанием рассчитывал на то, что после такой подготовки каждый из них, ощутив желание или потребность в более . глубоком изучении той или другой главы анализа, сможет уже самостоятельно, без посторон- посторонней помощи, во-первых, найти нужный ему материал и, во- вторых, подойти к его изучению, так сказать, по-хозяйски, умея отделить главное от второстепенного и малосущест- малосущественного. Все многократные беседы мои с отдельными слушателями, с группами слушателей и со всей аудиторией в целом неиз- неизменно убеждали меня, что избранный мною путь был единст- единственно правильным. Пользуюсь случаем отметить, что очень большая аудитория, наводнившая все читавшиеся на этих курсах лекции и в своём большинстве не отсеявшаяся до самого их окончания, наилучшим образом свидетельствует о том, как широко распространена среди наших инженеров потребность в повышении уровня их математических знаний. Предлагаемая книга ставит себе ту же цель, что и мой только что упомянутый лекционный курс, и стремится осу- осуществить её теми же самыми средствами. Читатель, следова- следовательно, с самого начала должен быть предупреждён, что здесь он не найдёт сколько-нибудь полного изложения уни- университетского курса анализа или хотя бы отдельных избран- избранных глав этого курса. Автор ставит своей задачей только дать общий, но зато возможно доступный и запоминающийся очерк основных идей, понятий и методов математического анализа — такой очерк, который легко бы читался и усваи- усваивался всяким, кто знаком хотя бы с самым упрощённым изложением этого предмета, и который, после такого усвое- усвоения, уже позволил бы читателю сознательно и самостоятельно изучить во всех деталях любой отдел и любую главу этого предмета. Я беру на себя, однако, смелость думать, что чтение этой книги сможет принести существенную пользу и многим
8 ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ студентам математических факультетов наших университетов. Дело в том, что ни учебник, ни лектор, будучи естественно стеснены рамками времени и программы, не могут уделить достаточно внимания дискуссии принципиальных вопросов и в основном должны ограничивать себя изложением всех дета- деталей конкретного материала. А между тем, всякий знает, как полезно иногда оторваться от деревьев и поглядеть на лес; я хочу надеяться, что предлагаемая книга поможет в этом кое-кому из будущих математиков, впервые приступающих к изучению математического анализа.
ЛЕКЦИЯ I КОНТИНУУМ Почему математический анализ должен начинаться с изучения континуума? — Почему континуум не может быть изучен без по- построения полной теории вещественных чисел? — Построение ирра- иррациональных чисел. — Теория континуума. — Основные леммы. Почему математический анализ должен начинаться с изучения континуума? «Переменная величина у называется функцией переменной величины х, если каждому значению ве- величины х соответствует единственное определённое значение величины _у». Эту фразу можно уподобить воротам, открываю- открывающим вход в область высшей математики; с помощью этой фразы мы определяем важнейшее, основоположное понятие математи- математического анализа — понятие функциональной зависимости, в котором, как в зародыше, уже заложена вся идея овладения явлениями природы и процессами техники с помощью матема- математического аппарата. Вот почему мы должны со всей беспощад- беспощадностью требовать от этого определения полной, безукоризнен- безукоризненной ясности; ни одно слово в нём не должно вызывать и тени сомнения; малейшая двусмысленность здесь грозит сделать всё величественное здание, которое строит наука на базе этого основного понятия, несовершенным, требующим капитальной перестройки. А между тем, та краткая формулировка, с которой мы на- начали, при ближайшем рассмотрении оказывается во многих пунк- пунктах недоговорённой и допускающей различные толкования. Мы здесь остановимся только на одном таком неотчётливом пункте, ибо как раз попытка выяснить его содержание до конца и приведёт нас вплотную к предмету нашей сегодняшней лекции. Наше определение содержит слова «каждому значению ве- величины х»; для того чтобы у нас не оставалось никакой неяс-
10 ЛЕКЦИЯ ПЕРВАЯ ности, мы должны, следовательно, неукоснительно трзбовать, чтобы нам был разъяснён смысл термина «значение переменной величины»; но этого мало; в нашем определзнии говорится о «каждом значении»; отсюда следует, что для полного понима- понимания этого определения недостаточно иметь представление о некоторых отдельных значениях величины х; мы должны, сверх того, совершенно отчётливо представлять себе всю совокуп- совокупность, весь «запас» этих значений, любому из которых дол- должно соответствовать определённое значение величины у. Мы должны знать то, что в анализе называют «областью опреде- определения» данной функции. Что представляют собой отдельные значения переменной величины? Мы знаем, что это — числа. Если так, то совокуп- совокупность всех этих значений есть некоторая совокупность чисел — некоторое, как говорят, числовое множество. Какое же это множество, какие числа оно содержит? Мы с самого начала исключим из рассмотрения область мнимых чисел, предполагая, что все значения величин х и у— числа вещественные. Но все. ли вещественные числа могут быть значениями величины х; а если нет, то какие могут и какие нет? Обо всём этом в нашем определении ничего не сказано, и это вполне понятно, потому что на этот вопрос нельзя одина- одинаковым образом отвгтить для всех функций (а в сущности даже и для одной функции в разных задачах). Область определения функции зависит как от природы этой функции, так и от тех специальных задач, для решения которых нам эта функция нужна в данном исследовании; ведь очень легко понять, что одну и ту же функцию в разных задачах приходится исследо- исследовать при различных значениях независимой переменной. Всему этому мы знаем много примеров. Так, функцию y=ix\ (по крайней мере в пределах элементарной математики) имеет смысл рассматривать лишь для целых положительных х\ функцию y^lgx — только для х^>0, и т. д. Можно легко придумать и такие примеры, где естественной областью определения функ- функции будет служить числовое множество гораздо болеа слож- сложного строения. Однако, если мы спросим себя, каково же множество зна- значений величины х, с которым фактически чаще всего прихо- приходится иметь дело как в самом математическом анализе, так и в его приложениях, то мы должны будем сказать, что в пода-
континуум 11 вляющем большинстве случаев такой областью определения функции служит «отрезок» (закрытый или открытый), т. е. со- совокупность всех вещественных чисел, заключённых между двумя данными числами (включая или исключая последние). Иногда этот отрезок заменяется полупрямой (например, х ^> 0), — это значит, что множество значений величины х есть совокуп- совокупность всех вещественных чисел, которые больше (или меньше) некоторого числа (иногда требование ^> или <^ заменяется требованием :з= или eg); наконец, бывают случаи, когда отре- отрезок обращается в полную прямую, т. е. когда значениями ве- величины х могут быть все вещественные числа. В этом случае говорят, что областью определения функции служит вся вещест- вещественная ось или «числовая прямая». Так или иначе, мы видим, что для функций математического анализа той областью, тем полем, на котором они развивают и развёртывают свои индивидуальные черты, той средой, где они вырастают в мощные математические орудия естествозна- естествознания и техники, является совокупность всех вещественных чи- чисел. Эту совокупность в математике называют континуумом (точнее — линейным континуумом). И совзршенно так же, как мы должны тщательно исследовать почву, прежде чем дать ей выращивать нужные нам растения, мы в высшей математике, желая быть рачительными и научно, а не наудачу действую- действующими хозяевами, прежде чем строить на базе понятия функ- функциональной зависимости всё здание этой науки, должны тща- тщательнейшим образом изучить ту среду, в которой живёт и развивается это понятие. Вот почему во всех серьёзных, науч- научно построенных курсах математического анализа континуум является первым предметом изучения; и только после того, как его сущность и природа в достаточной степени усвоены, мо- можно перейти к основательному изучению понятия функциональ- функциональной зависимости. А строение континуума оказывается не та- таким простым, как можно было бы предполагать на первый взгляд; мир вещественных чисел развёртывает себя перед нашими гла- глазами, как сложная, богатая разнообразнейшими деталями кон- конструкция, всестороннее изучение которой наука не может счи- считать законченным и до настоящего времени. Почему континуум не может быть изучен без построе- построения полной теории вещественных чисел? Итак, что же та- такое континуум? Какие существуют вещественные числа? Ко-
12 ЛЕКЦИЯ ПЕРВАЯ гда и почему мы можем быть уверены, что действительно охватили совокупность всех вещественных чисел? В элементах алгебры мы овладеваем множеством всех ра- рациональных чисел, т. е. всех целых чисел и дробей, как по- положительных, так и отрицательных. Но очень скоро мы начи- начинаем замечать, что этих чисел нам нехватает. Что это зна- значит? Почему бы не ограничиться одними рациональными чис- числами? Мы не можем согласиться на это потому, что среди рациональных чисел нет, например, числа у2, т. е. нет чи- числа, квадрат которого равнялся бы числу 2. А почему такое число необходимо иметь? Потому хотя бы, что диагональ ква- квадрата, сторона которого равна 1, имеет как раз длину у2 ; следовательно, если бы мы пожертвовали существованием та- такого числа, то нам пришлось бы мириться с тем, что длины отрезков, которые с такой простотой возникают в геометрии, могут не выражаться никакими числами. Ясно, что на такой базе измерительная геометрия развиваться не может. Значит, ]^2 должен найти себе место среди вещественных чисел; но среди рациональных чисел его нет; поэтому мы называем это число иррациональным. Однако этот ]/ 2 отнюдь не удовлетворяется тем, что мы признали его существующим; он немедленно начинает требовать, во-первых, чтобы среди рациональных чи- чисел ему отвели совершенно определённое место, т. е. точно ука- указали, какие рациональные числа меньше его и какие больше (так, ]/*2^>1—диагональ квадрата больше его стороны); во-вторых, он требует, чтобы мы научились производить над ним действия, как над рациональными числами и совместно с ними (так, сумма стороны и диагонали квадрата равна 1 -(-]/~2, что побуждает нас приписать смысл и этому числу, т. е. при- присоединить и его к совокупности вещественных чисел). Все эти требования нового числа вполне основательны и законны, и если мы в данный момент ничего на них не ответим, то это только потому, что мы сейчас же введём в наш мир ещё много других новых чисел; все они без исключения будут предъ- предъявлять к нам те же самые претензии, и нам проще будет потом удовлетворить все эти претензии одновременно, чем за- заниматься в деталях каждым числом в отдельности. За числом |/2 в наш мир естественно и неизбежно входят все (положительные и отрицательные) квадратные корни из ра-
континуум 13 циональных чисел, затем кубические корни и вообще все чи- числа вида Л, (м где г—любое положительное рациональное число, а п — лю- любое целое число ^2. Но этим, как известно, дело не огра- ограничивается; столь же конкретные запросы, как вышеприведён- , ное соображение о диагонали квадрата, в целом ряде случаев заставляют нас вводить в качестве новых чисел корни тех или других алгебраических уравнений; это случается всякий раз, ко- когда данное уравнение не имеет корней среди уже введённых нами чисел, между тем, как мы не можем отказать этим кор- корням в существовании, не лишая этим числовой характеристики какой-нибудь вполне конкретно определяемой величины. Пойдём в этом направлении до конца. Назовём алгебраи- алгебраическим числом всякий корень (вещественный) уравнения вида Р(х) = 0, где Р(х)— любой многочлен с целыми коэффициен- коэффициентами, и введём в наш мир все вещественные алгебраические числа; в частности, мы тем самым вводим и все числа видаA), j_ ибо число г " определяется как корень уравнения qx • — р = О, v где—=г есть представление рационального числа г в виде простой дроби; в качестве ещё более частного случая всякое рациональное число г=?- также принадлежит множеству алге- алгебраических чисел, будучи корнем уравнения qx — р = 0. Очень легко, как говорят, «упорядочить» весь этот мир алгебраических чисел, т. е. указать правило, позволяющее для любых двух алгебраических чисел определять, какое из них больше и какое меньше; несколько труднее, хотя тоже не очень сложно, определить правила всех обычных алгебраиче- алгебраических действий над этими числами и показать, что результатами этих действий всегда являются снова алгебраические числа, так что — это очень важный момент!—алгебраические опера- операции над алгебраическими числами всегда приводят к алгебраи- алгебраическим же числам и, значит, никогда не могут потребовать введения каких-либо новых чисел. Может быть, мы могли бы теперь остановиться, считать построение мира вещественных чисел законченным и приняв,
14 ЛЕКЦИЯ ПЕРВАЯ следовательно, за континуум совокупность всех алгебраичес- алгебраических чисел? Хорошо известно, что мы этого сделать не можем, и изве- известно, почему именно не можем. Если для многих апгебраиче- ских теорий построенными нами до сих пор числами можно удовлетвориться, то как раз для анализа такое ограничение является совершенно невозможным. Дело в том, что математи- математический анализ к элементарным операциям алгебры уже на пер- первых своих шагах присоединяет основную и важнейшую анали- аналитическую операцию — предельный переход. Бывает очень много случаев, когда вполне конкретные соображения заставляют нас признать существование предела у той или другой последова- последовательности чисел; мало того, предел этот встаёт перед нами как число, которое имеет конкретное и реальное значение и над которым нам в дальнейшем желательно производить алге- алгебраические и аналитические операции. Если бы дело обстояло так, что для всякой последовательности алгебраических чисел, которой мы считаем нужным приписать определённый предел, такой предел существовал действительно в той же области алгебраических чисел, то можно было бы смело допустить, что эта область и является континуумом, что ни в каких иных вещественных числах, кроме алгебраических, математический анализ не нуждается. Но дело обстоит не так. Если мы возьмём круг радиуса 1 и будем вписывать в него правильные многоугольники, неогра- неограниченно увеличивая число их сторон, то периметры всех та- таких многоугольников выразятся алгебраическими числами. Пре- Предел этой числовой последовательности мы называем длиной окружности. Признать этот предел несуществующим означало бы запретить в геометрии говорить о длине окружности; вы легко можете представить себе, к какому крушению привёл бы такой запрет не только геометрию, но и все другие точные науки, пользующиеся образом круга. И между тем, можно доказать, что среди алгебраических чисел такого предела нет. Где же выход из этого положения? Выход ясен. Мы вынуждены признать, что для целей математи- математического анализа одних только "алгебраических чисел недоста- недостаточно, что необходимо присоединить к ним ещё новые веще- вещественные числа; все такие неалгебраические вещественные числа называют обычно «трансцендентными»; построенное нами
континуум 15 выше число (длину окружности радиуса 1) обозначают через 2п; значит, тс есть число трансцендентное. Другим важным примером трансцендентного числа в анализе является извест- известное число е = 2,718. .., которое, как вы знаете, также поро- порождается простым предельным переходом, исходя от рациональ- рациональных чисел. Трансцендентность чисел с и п была доказана довольно поздно, во второй половине прошлого столетия. Однако необходимость введения трансцендентных чисел была показана несколько ранее, в середине прошлого столетия, на других, более простых, хотя и менее важных, примерах (фран- (французским математиком Лиувиллем). Итак, наш континуум всё ещё не достроен. Как же нам следует поступить далее? Можем ли мы остановиться здесь и сказать, например, так: «континуум есть множество всех алге- алгебраических чисел, к которым по мере надобности мы присоеди- присоединяем (в качестве трансцендентных) числа, получающиеся (по- (подобно е и тс) из алгебраических путём предельного перехода, но сами не являющиеся алгебраическими»? Мы ставим этот вопрос потому, что ведь именно на такой базе (правда, обычно не высказываемой явно) строятся в большинстве случаев «упро- «упрощённые» курсы математического анализа, избегающие изло- изложения полной теории иррациональных чисел. Нет, конечно, так сказать нельзя, нельзя и остановиться там, где мы сейчас находимся, и на это имеется целый ряд весьма простых и убедительных причин. Прежде всего, кон- континуум, будучи совокупностью всех вещественных чисел, дол- должен определяться как некое твёрдое множество (по образцу^ например, вышеустановленного определения совокупности всех алгебраических чисел), без оставления возможности впослед- впоследствии добавлять к нему всё новые и новые числа. Далее, слова «по мере надобности» в нашем провизорном определении явно лишены точного содержания; если мы имеем последователь- последовательность алгебраических чисел, не имеющую алгебраического предела, то в вопросе о том, приписать ли ей трансцендентный предел или признать её вовсе не имеющей предела, мы с фор- формальной точки зрения в данный момент вправе поступать вся- всякий раз по нашему произволу, и выбрать то или другое ре- решение нас заставляют не формальные, а конкретно-реальные соображения, которые, сколь бы вески они ни были, не могут найти себе места в математическом определении. Формально
16 ЛЕКЦИЯ ПЕРВАЯ мы можем отказать числу тг в существовании; в данном случае это крайне невыгодно, но в других случаях подобный отказ может и не приводить ни к каким неудобствам; но ясно, что критерий, который хотел бы заставить нас вводить трансцен- трансцендентное число «всякий раз, когда без этого неудобно обхо- обходиться», не есть и при любой перефразировке не можег стать математическим критерием. Наконец, ниоткуда не следует, что введёнными таким путём числами мы смогли бы удовлетвориться; ведь новые числа нам пришлось бы складывать, перемножать, подвергать предельным переходам (с числами, не допускающими этих операций, математическому анализу нечего делать); от- откуда мы можем иметь уверенность, что результаты всех опе- операций будут вещественными числами нашего континуума? А если нет, то их снова придётся добавить, и следовательно, «аш континуум не мог включать всех вещественных чисел. Мы видим, таким образом, что на позиции, занимаемой .нами в данный момент, удержаться нельзя; нельзя, построив в виде примера одно или два трансцендентных числа, сказать «и так далее» и на этом успокоиться, ибо, как мы только ¦что убедились, никакого континуума мы таким образом не определим. Мы видим, таким образом, что для полноценного обоснова- обоснования математического анализа мы никак не можем обойтись без построения общей теории вещественных чисел, т. е. такой теории, которая не ограничивалась бы примерами конструкции новых чисел, а содержала в себе общие принципы такой кон- конструкции, исчерпывающим образом характеризующие собой всю совокупность вещественных чисел. Построение иррациональных чисел. В науке существует несколько различных теорий континуума. Однако все эти тео- теории— и об этом важно всегда помнить — совершенно одина- одинаково в идейном отношении подходят к своей задаче. По сравнению с этим их принципиальным единством то, что их между собою различает, может быть оцениваемо так же, как детали конструкции оцениваются в сравнении с архитектур- архитектурным планом здания. Все эти теории имеют своей целью, принимая в качестве первоначальной данности множество рациональных чисел, по- получить из него сразу всю совокупность всех вещественных чи- .сел с помощью единого конструктивного принципа. Форма
континуум 17 этого принципа различна в различных теориях; однако сход- сходство между этими теориями ещё далеко не заканчивается на указанном нами пункте. Дело в том, что выбор конструк- конструктивного принципа, ведущего к построению новых, иррациональ- иррациональных чисел, во всех теориях, несмотря на существенные фор- формальные отличия, основан на одной и той же идее. Эта идея состоит в том, что главная, доминирующая роль при конструк- конструкции новых чисел придаётся основной аналитической операции предельного перехода, все же другие .встречающиеся способы порождения сводятся к ней, рассматриваются как её частные случаи. Вы знаете, что действительно, например, квадратные корни из целых чисел являются пределами надлежаще выбран- выбранных последовательностей рациональных чисел («приближённых корней»); так же обстоит дело и в других случаях. Ввиду сказанного, для более конкретного ознакомления с построением теории континуума нет необходимости рассма- тривать в деталях все эти различные способы обоснования, а вполне достаточно взять в качестве образца какой-нибудь один из них; всё принципиально важное, что мы при этом увидим, будет в равной мере относиться и к другим теориям. Мы выбираем в дальнейшем теорию Дедекинда не потому, что она имеет какие-либо существенные преимущества перед другими, а лишь по той чисто внешней причине, что имен- но она принята в подавляющем большинстве наиболее рас- пространённых руководств; таким образом, для читателя не представит затруднения отыскать такое пособие, где он сможет ознакомиться с деталями, пропущенными в нашем изложении. 1. Прежде чем приступить к введению иррациональных чисел, мы должны несколько более внимательно вглядеться в множество рациональных чисел, которое мы обозначим через R. Сначала обратим внимание на одно очень элементарное свойство этого множества: между любыми двумя рациональ- рациональными числами г, и г2 всегда найдется третье; проще всего мы в этом убеждаемся, замечая, что полусумма Гх . г~ есть всегда рациональное число, лежащее между гг и /; как след- следствие этого факта мы повторным его применением сейчас же устанавливаем, что между г, и г2 всегда заключено бесконеч- бесконечное множество рациональных чисел. 2 А. Я. Хинчин. Восемь лекций
18 ЛЕКЦИЯ ПЕРВАЯ 2. Теперь постараемся внимательно всмотреться в ту кар- картину, которая порождается при попытках найти или опреде- определить у2 (мы будем иметь в виду положительное значение радикала). Прежде всего мы ищем среди рациональных чисел (никаких других для нас пока не существует!) такое число, квадрат которого равен числу 2, и легко обнаруживаем, что та- такого (рационального) числа не существует (мы не будем при- приводить здесь известного из курса средней школы арифмети- арифметического доказательства «того факта). Это значит, что, какое бы рациональное число г мы ни выбрали, мы будем иметь либо г'1 <^ 2, либо г2 ^> 2. Рассмотрим сперва одни только по- положительные рациональные числа. Они естественно разбиваются по только что рассмотренному признаку на два класса: класс А тех положительных рациональных чисел г,, для которых i\<C 2, и класс В тех положительных рациональных чисел л2, для которых а|^>2. Так как гг и г2 положительны, то из r'j <^ 2 <^ г| сле- следует rj<V2> т. е. каждое число класса А меньше каждого числа класса В. Очевидно теперь, что в этом последнем заключении ничего не изменится, если мы присоединим к классу А нуль и все отрицательные (рациональные) числа; но тогда мы бу- будем иметь уже разбиение всего множества R на два класса А и В, причём каждое число класса А меньше каждого числа класса В. Условимся называть сечением (точнее — сечением множества R) всякое разбиение множества R на два непустых1) класса, для которого имеет место это условие; мы пришли, таким образом, к некоторому определённому сечению множества R. Сечения множества R мы можем строить самыми различ- различными способами, в том числе и совершенно элементарными. Так, относя к классу А все рациональные числа г, «S 5, а к классу В — все рациональные числа r2]>5, мы, очевидно, также получим некоторое определённое сечение множества R. Если обычным образом изображать числа точками на прямой линии, то всякое сечение, очевидно, изобразится некоторым разбиением (рациональных) точек прямой на два множества, из которых первое (А) целиком расположено влево от вто- второго (В). На первый взгляд может показаться, что все сечения мно- множества R являют нам совершенно одинаковую картину, что !) Т. е. содержащих каждый хотя бы одно число.
континуум 19 два различных сечения отличаются друг от друга только тем местом, где они произведены, и что поэтому одно из них может быть переведено в другое простым сдвигом. Чрезвы- Чрезвычайно важно, что такое представление ошибочно, что в са- самой структуре сечений возможно глубокое (и для нашей цели фундаментальное) различие. В самом деле, в нашем последнем примере существует число (т. е. рациональное число, никаких других у нас по- покуда нет!), обладающее тем замечательным свойством, что все числа, меньшие его, принадлежат классу А, а все числа, большие его, — классу В; в нашем примере этим числом яв- является, очевидно, число 5. Число, обладающее этим свойством, мы будем называть рубежом данного сечения; таким образом, в нашем последнем примере произведённое сечение имеет рубеж. Напротив, в нашем первом примере (связанном с у 2) такого рубежа нет. Докажем это. Пусть рубежом служит (рациональное) число г; как для всякого (рационального) числа, мы должны иметь либо л2 <^ 2, либо Л2^>2; пусть для определённости г2<^2; по свойству рубежа для. каждого г' ^> г мы должны иметь г'2 ^> 2. Но если г<^1, то, полагая л'=:1, мы уже приходим к противоречию; если же г ^ 1, то г2 ^ г; поэтому, полагая 2 — а*= с (^> 0 ) и г' = г-|——, мы имеем: что опять-таки приводит к противоречию, ибо г' ^> г. Итак, все сечения множества R распадаются на два типа: имеющие рубеж и не имеющие рубежа; при этом надо иметь в виду, что: a) двух рубежей сечение иметь не может, ибо если г и г'—такие рубежи и если r<^r', то в силу пункта 1 сущест- существует такое число г", что г <^ г" <^ г'; но тогда по свойству рубе- рубежей из г"~^>г следует г"^Вг), а из г"<^г' следует r"?A что создаёт противоречие; b) рубеж, если он существует, очевидно, есть либо наи- наибольшее число класса А, либо наименьшее число класса В; 1) Запись а?М означает: а есть элемент множества М. 2*
20 ЛЕКЦИЯ ПЕРВАЯ если рубежа нет, то нет ни наибольшего числа в классе А, ни наименьшего числа в классе В; c) каждое (рациональное) число г0 служит рубежом двух различных сечений. В одном из них класс А состоит из чисел г^г0 (а класс В из чисел 1"^>г0), в другом — класс А со- состоит из чиселг<^л0 (а класс В из чисел г'^ г0); d) распадение всей совокупности сечений множества R на два типа — имеющих рубеж и не имеющих рубежа, — очевидно, является внутренней структурной особенностью множества R; это есть факт, который остался бы в полной силе и в том случае, если бы мы и не помышляли никогда о введении каких- либо других чисел, кроме рациональных. 3. Теперь уже пример с числом \^2 прямо подсказывает нам дальнейший образ действия. Каотин'а ясна: с интуитивной, наглядной стороны перед нами — числовая прямая, веществен- вещественная ось, которую мы в определённом месте разрезали, причём оказалось, что в месте разреза находилась точка, которой никакое рациональное число не соответствует; мы не можем отказаться от мысли о существовании этой точки; без неё наша прямая и тот континуум, то множество, чисел, которое пробегает переменная величина при своём изменении, утратили бы свою непрерывность, сплошность, т. е. именно ту черту, от которой континуум получил своё имя; говоря несколько грубо, нам прямо видно, что если бы мы заставили нашу пере- переменную изменяться, принимая одни только рациональные зна- значения, то ей пришлось бы при этом от одного значения к другому перепрыгивать через зияющие пустоты; со стороны практической, как мы уже раньше об этом говорили, все при- прикладные науки (и прежде всего геометрия) вынуждены были бы испытывать весьма значительные неудобства, если бы мы примирились с отсутствием какого бы то ни было рубежа между нашими двумя классами. Поэтому мы, побуждаемые как требованиями нашего наглядного представления, так и вес-, кими практическими соображениями, вводим в наш числовой мир новое число |/2, которое по определению служит рубе- рубежом нашего сечения и которое мы называем иррациональным числом. Но выбранное нами сечение ничем принципиально не отли- отличается от любого другого сечения множества /? того же типа,
континуум 21 т. е. не имеющего (рационального) рубежа. В порядке постро- построения общей теории мы поэтому естественно распространяем наше определение на случай любого такого сечения. Каждому сечению множества R, не имеющему рационального рубежа, мы ставим в соответствие некоторое новое, иррациональное число, которое по определению является его рубежом. Таким образом, с помощью этого единого принципа мы сразу определяем всё множество иррациональных чисел. Вме- Вместе с существовавшими уже ранее рациональными числами они образуют множество всех вещественных чисел илн континуум, который является теперь полностью определённым. Теория континуума. Однако введённым нами принципом построения иррациональных чисел теория континуума, разу- разумеется, не исчерпывается; наоборот, здесь она в сущности только начинается; программа работ, которые мы должны вы- выполнить, прежде чем мы сможем говорить о действительно завершённой теории континуума, ещё чрезвычайно обширна. Мы должны, прежде всего, упорядочить наш континуум, т. е. точно определить, при каких условиях данное вещественное число мы будем считать бдльшим или меньшим другого дан- данного вещественного числа. Далее, мы должны определить дей- действия над вещественными числами; ведь до сих пор мы не имеем, например, ни малейшего представления о том, что зна- значит сложить между собою числа 1 и у 2 ; далее мы должны тщательным образом убедиться, что эти действия обладают всеми теми свойствами, к которым мы привыкли в области рациональных чисел; так, независимость суммы от порядка сла- слагаемых (коммутативный или переместительный закон сложения) есть теорема, которую мы обязаны заново обосновать для лю- любых вещественных ' чисел; наконец, мы должны найти способ убедиться, что определённый нами континуум действительно отвечает всем тем запросам практики и нашего наглядного представления, для удовлетворения которых он был нами по- построен. Разумеется, детальное выполнение этой программы в рамках наших лекций совершенно невозможно; да оно было бы и в высшей степени скучным; мы в дальнейшем коснёмся лишь некоторых, принципиально наиболее важных моментов этой программы. Прежде всего, очень легко упорядочить наш континуум. Пусть мы имеем два вещественных числа а^ и а2; требуется
22 ЛЕКЦИЯ ПЕРВАЯ определить, какое из них больше и какое меньше другого. Если оба числа рациональны, то этот вопрос решается в ариф- арифметике и здесь нас занимать не должен; если, например, ал иррационально, а а2 рационально, то вопрос также немед- немедленно решается: ctj есть рубеж некоторого сечения множества R; в соответствии с самим определением рубежа мы полагаем а2 <^ Oj или а2 ^> Oj в зависимости от того, принадлежит ли рациональное число а2 к классу А или классу В в этом сече- сечении. Пусть, наконец, числа а2 и а2 оба иррациональны; так как эти числа между собою различны, то различны между со- собою и те два сечения, рубежами которых они служат; в част- частности, различны между собою левые классы А1 и А2 этих двух сечений; это значит, что в каком-нибудь из этих множеств например, в Л2, найдётся такое рациональное число г, кото- которого нет в Лт; из г?А2 следует /"<^а2; из г^А11) сле- следует г^В1 и, следовательно, г^а-^; таким образом, суще- существует такое рациональное число г, что ах<^г<^а2\ в этом случае мы условимся считать ctj <^a2; если бы, наоборот, нашлось такое г', что a2<^r'<^aj, то мы считали бы a2<^aj; одно из двух, как мы сейчас убедились, обязательно должно иметь место, и этим, очевидно, упорядочение континуума за- завершено. » Впрочем, завершено только определение, свойства его ещё должны быть доказаны; надо убедиться, что а^<^а2 несов- несовместимо с aj ^> a2; что из cfj<^a2 вытекает a2^><Zi, и об- обратно; наконец, что из аг<^а2 и ct2<^a3 вытекает at <^а3,— словом, что неравенства между вещественными числами под- подчиняются тем же основным законам, что и неравенства между рациональными числами. Вы легко справитесь сами с доказа- доказательствами всех этих предложений. Последнее проведённое нами рассуждение показывает, ме- между прочим, что между любыми двумя иррациональными чис- числами найдётся всегда рациональное число; мы знаем, что то же самое остаётся верным, если оба данных числа рациональны. Пусть теперь число г рационально, число a — иррационально и пусть для определённости г<^а; покажем, что и в этом слу- случае между г и а найдутся рациональные числа. Число а есть рубеж сечения (А, В) множества R, причём из г<^а выте- ') Запись а?М означает: а не есть элемент множества М.
континуум 23 кает г ? А; но в сечении с иррациональным рубежом класс А не содержит наибольшего числа, поэтому существует рацио- рациональное число г' ^> л, которое так же, как и г, принадлежит классу А и потому меньше, чем а; таким образом, г<^г' <^а, что и требовалось доказать. Итак, мы убедились, что между двумя любыми веществен- вещественными числами найдётся рациональное число, а значит, оче- очевидно, и бесчисленное множество рациональных чисел; это важное свойство множества R выражают обычно, говоря, что R всюду плотно (на континууме). Легко убедиться, что и множество иррациональных чисел всюду плотно; проще всего сделать это, рассматривая совокупность всех чисел вида г\^2, где г — любое рациональное число, все такие числа иррацио- иррациональны, и уже они одни образуют всюду плотное множество; впрочем, говоря строго, выражение г у'2 получает точный смысл только после того, как определены действия над веще- вещественными числами, к чему мы теперь и переходим. У нас нет оснований рассматривать этот вопрос во всех деталях, так как для выяснения всей идейной стороны этого определения нам достаточно будет внимательно разобрать один пример. Пусть а, и а2 — два вещественных числа и пусть мы хотим определить их сумму а1 -\- а2. Будут ли числа ctj и а2 рациональными или иррациональными, во всяком случае они оба служат рубежами некоторых сечений множества R, кото- которые мы обозначим соответственно через (А1, В-^) и (Л2, В2). Пусть, далее, ах, Ьг, я2, Ь2 означают любые числа, принад- принадлежащие соответственно множествам А1ш Blt A2, B2. Очевидно, что всякое рациональное число вида й|-|-я2 меньше любого рационального числа вида Ьх + Ьг. Мы теперь установим су- существование и единственность такого вещественного числа а, что при любых а,, я2, Ь1г Ь2 (принадлежащих, конечно, соот- соответствующим множествам) Это число а мы естественным образом и определим как сумму чисел Oj и а2, существование и единственность которой будут тем самым установлены для всех случаев. Рассмотрим сечение (А, В) множества R, определяемое сле- следующим образом: если рациональное число г меньше всех чи-
24 ЛЕКЦИЯ ПЕРВАЯ сел вида ftj -j- b2, мы отнесём его к классу А; в противном случае — к классу В (вы убедитесь очень легко, что так определённое разбиение множества R действительно есть сече- сечение). Рубеж этого сечения обозначим через а. Очевидно, что все числа вида а1-\-а2 принадлежат классу А, а все числа вида />j -(- b2 — классу В; поэтому h 4- b2, B) т. е. число а действительно удовлетворяет поставленным усло- условиям. Нам остаётся установить его единственность. С этой целью убедимся сначала, что числа аг и bt мы можем выбрать с таким расчётом, чтобы их разность Ь1 — а1 была как угодно малой. В самом деле, пусть а — любое рацио- рациональное число класса А-^ и пусть с — как угодно малое поло- положительное рациональное число; в последовательности рацио- рациональных чисел а, а -\- с, а-\-2с, ..., а -\- пс, ... первый член принадлежит классу Аг; в дальнейшем, вообще говоря, ещё несколько членов будут принадлежать классу Аг; но с некоторого места все последующие члены уже будут при- принадлежать классу Bv так как а-\-пс безгранично возрастает вместе с п. Поэтому найдётся такое целое число k, что откуда разность Ь1— аг =с и, следовательно, сколь угодно мала; этим наше утверждение и доказано. По такой же при- причине, разумеется, и числа а2, bz, а значит, и числа аг -\~ аг, Ь1 -4- Ь2 могут быть выбраны сколь угодно близкими друг к другу. Пусть теперь, если это возможно, существуют два вещест- вещественных числа а и а', удовлетворяющих всем неравенствам вида B), и пусть для определённости а<^а'. Как мы знаем, существует такая пара рациональных чисел г, г', что вместе с неравенствами \2) эти сеотношения показывают, что любое число вида аг -\- а2 отстоит от любого числа вида b1 -\- b2 на величину, превышающую постоянное число f — г. Это же,
континуум 25 очевидно, противоречит только что полученному нами резуль- результату. Таким образом доказана и единственность числа а. Приведённое нами определение сложения по своей форме удобно в том отношении, что позволяет непосредственно рас- распространить все основные законы, которым подчиняется сло- сложение рациональных чисел, на сложение любых вещественных чисел. Попытайтесь проделать это хотя бы для переместитель- ного закона, и вы немедленно увидите, как просто всё это выходит. Как мы уже сказали, мы здесь не будем останавливаться на определении других действий и доказательстве управляю- управляющих ими законов. Заметим только, что умножение лучше всего определять аналогично сложению, а вычитание и деление — как обратные действия. Мы же теперь обратимся к последнему крайне важному в этом круге идей вопросу: как убедиться, что определённый нами континуум действительно являет собой ту непрерывность, сплошность, которая необходима ему как базе математиче- математического анализа и отсутствие которой у множества R заставило нас в своё время прибегнуть к введению иррациональных чисел? Чтобы ответить на этот вопрос, вспомним, что дало нам по- повод говорить об отсутствии такой непрерывности у множе- множества R. Это был тот факт, что среди сечений множества R оказались не имеющие рубежа, принадлежащего этому мно- множеству R. Поэтому, если мы покажем, что для континуума такой факт никогда не может иметь места, т. е. что всякое сечение континуума имеет рубеж, принадлежащий этому самому континууму, то мы сможем считать себя удовлетво- удовлетворёнными и надеяться, что континуум, построенный нами в ка- качестве базы математического анализа, будет отвечать предъяв- предъявляемым к нему запросам. Заметим во избежание недоразумений, что только что фор- формулированное нами предложение не вытекает непосредственно нз предыдущего, ибо до сих пор мы всегда говорили о сече- сечениях множества R, теперь же впервые говорим о сечении кон- континуума; формально определение сечения мы при этом мыслим себе неизменным. Докажем теперь наше утверждение. Пусть (А, В) есть лю- любое сечение континуума; всякое рациональное число, как и
26 ЛЕКЦИЯ ПЕРВАЯ вообще всякое вещественное число, принадлежит либо классу А, либо классу В; таким образом, сечение (А, В) континуума непосредственно индуцирует некоторое совершенно определён- определённое сечение (А', В") множества R. Пусть а — вещественное число, служащее рубежом сечения (А\ В'); убедимся, что оно же служит рубежом сечения (А, В), чем наше утверждение и будет доказано. Нам предстоит показать, что всякое вещественное число аг <^ а принадлежит классу А, а всякое вещественное число а2^>а - классу В; из соображений симметрии достаточно до- доказать первое утверждение. Пусть г — рациональное число, лежащее между ctj и а; так как г<^а, то г? А'с А1); а так как cij <^ г, то отсюда вытекает, что и сц ? А, что и требо- требовалось доказать. Основные леммы. Логический фундамент математического анализа, таким образом, построен. Последовательно воздвигая иа этой базе основы анализа, мы, разумеется, бываем выну- вынуждены очень часто ссылаться на заложенный фундамент, т. е. обращаться непосредственно к установленному нами определе- определению вещественного числа. Это сопряжено с известными не- неудобствами, так как построение и исследование необходимых ири этом сечений обычно бывает в достаточной мере гро- громоздким. Тот путь, которым наука находит выход из этого затруд- затруднения, в высшей степени поучителен, так как его можно счи- считать типичным для всех подобного рода логических ситуаций, часто встречающихся в математической науке. В ходе разви- развития математического анализа было замечено, что хотя непо- непосредственно применять в рассуждениях определение веществен- вещественных чисел с помощью сечений приходится очень часто, однако многие их этих применений в формальном отношении весьма похожи друг на друга, так что фактически почти вся сово- совокупность этих применений совершается по трём-четырём формальным схемам (наполняемым, конечно, всякий раз осо- особым содержанием). Но если создалось такое положение, то было бы, конечно, очень неэкономно и весьма затруднило бы как построение, так и усвоение данной дисциплины, если бы 1) Запись Ас В означает: множество А содержится в множе- множестве В.
континуум 27 мы стали десятки раз повторять одну и ту же логическую конструкцию, наполняя её только всякий раз новым предмет- предметным содержанием. Математическая наука уже давно—и, конечно, с полным основанием — усвоила обычай во всех подобного рода случаях явно формулировать такую логиче- логическую схему в виде некоторого вспомогательного предложения (леммы), с тем, чтобы, раз навсегда доказав эту лемму, в дальнейшем уже иметь возможность не повторять всякий раз той формальной конструкции, которая лежит в основе этой леммы, а просто ссылаться на готовую лемму. Доказав три-четыре таких вспомогательных предложения, мы получаем возможность во всём дальнейшем уже почти никогда не воз- возвращаться к конструкции сечений, всякий раз заменяя такую конструкцию ссылкой на одну из основных лемм, состав- составляющих как бы небольшую группу мостов, соединяю- соединяющих математический анализ с его логической базой. Само собой разумеется, что выбор этих основных лемм может быть различным в различных изложениях; однако во всех случаях можно рекомендовать не жалеть времени и сил на возможно тщательное усвоение возможно большего числа таких лемм, ибо каждая из них имеет своим назначением существенное облегчение работы в будущем, и поэтому затраченные на овладение ею усилия без всяких сомнений не пропадут даром. Примерный тип формулировки и доказательства такого рода лемм мы покажем теперь на нескольких примерах. 1. Лемма о монотонной последовательности. Последо- Последовательность вещественных чисел а,, а2, ..., ап, ... C) называется монотонной, если либо для любого п an^an+iy либо для любого п ап~^ап + л\ в первом случае мы говорим, точнее, о монотонно неубывающей, во втором—о монотонно невозрастающей последовательности. Последовательность C) называется ограниченной, если существует такое положитель- положительное число с, что (я=1, 2, ...). Лемма 1. Всякая монотонная ограниченная последова- последовательность имеет предел.
28 ЛЕКЦИЯ ПЕРВАЯ Пусть для определённости ап^ап+1 и \ап |<^с(л = 1,2,...). Разобьём континуум на два множества А и В, помещая в В всякое вещественное число, превосходящее все числа ап (так что, например, число с входит в множество В), а в А — все остальные числа (в частности, например, все ап); очевидно, что это разбиение континуума есть сечение. Пусть а — ру- рубеж этого сечения. Покажем, что \\тап=а, чем лемма 1 и л-»оэ будет доказана. Прежде всего заметим, что для любого п в самом деле, при ап^>а мы по определению рубежа имели бы ап ? В, что противоречит определению множества В. Если, вопреки нашему утверждению, а не есть предел последова- последовательности C), то существует такое постоянное положитель- положительное число е, что для бесконечного множества чисел п откуда ctn<^a — s; но в силу монотонности последователь- последовательности C) это неравенство, выполняясь для бесконечного мно- множества значений п, должно выполняться для всех п, по опре- определению множества В отсюда следует а — е ? В, тогда как ввиду а — s<^a число а—е должно принадлежать классу А [ибо а есть рубеж сечения (А. В)]. Полученное противоре- противоречие доказывает наше утверждение. Разумеется, в предпосылках леммы монотонность не мо- может быть отброшена; из одной только ограниченности после- последовательности C) не вытекает существование предела, как показывает пример ап = (—1)". Лемма о монотонной последовательности находит себе весьма многочисленные применения не только в анализе, но даже и в элементарной математике; в последнем случае её часто вводят в качестве «аксиомы», иногда не учитывая того, что при имеющемся в распоряжении учащихся весьма скудном запасе вещественных чисел эта «аксиома» просто неверна; впрочем, этот дефект приходится наблюдать не только в эле- элементарной математике, но и в «упрощённых» курсах матема- математического анализа.
континуум 29 В частности, существование длины окружности (т. е. пре- предела периметров вписанных правильных многоугольников при безграничном увеличении числа сторон) в геометрии и суще- A \ " 1-| 1 в основах анализа дока- зываются проще всего ссылкой на эту лемму. Наряду с леммой 1, характеризующей основную черту монотонных ограниченных последовательностей, не меньшее значение имеет для анализа и аналогичное предложение, ка- касающееся монотонных функций непрерывно изменяющейся ве- величины. Лемма Г. Если величина х, возрастая, стремится /спи если функция f(x) ограничена и монотонна в неко- некотором отрезке, имеющем точку а своим правым концом, то f(x) стремится к определённому пределу при х—<-а. При этом ограниченность функции f(x) внутри отрезка с концами а — s и а (е ^> 0) означает существование такого числа с, что |/(лг)|<с (a — 6< монотонность же её означает, что отношение -—5 * 2* X] Х% либо S* 0 для любой пары л:,, х2, хЛфхг, чисел этого отрезка, либо =?: 0 для любой такой пары. Доказательство леммы Г очень просто проводится на основании леммы 1. Пусть для определённости функция f(x) — неубывающая, т. е. f(x2)^=f(x1) при а ^> лг2 J> х1 ^> а — г. Так как при п ^> -j <й> то возрастающая числовая последовательность а > —j расположена внутри отрезка с концами а — е и а и имеет пределом а; последовательность чисел f(a ) (л^>—), очевидно, ограниченная и неубывающая; поэтому в силу леммы 1 существует предел limffa ) = ft. Если число л:
30 ЛЕКЦИЯ ПЕРВАЯ достаточно близко к а, то найдётся такое п = п(х), что а ^х <^а а значит, и в силу монотонности функции /. Но при х —>. а, очевидно, п—>-оо, вследствие чего левая и правая части неравенств D) имеют своим пределом Ь, откуда следует, что и / (х) —* b при х—>-й; этим лемма 1' доказана. 2. Лемма о стягивающейся последовательности отрез- отрезков. Условимся закрытый отрезок с концами аи Ь, т. е. совокупность всех вещественных чисел х, удовлетьоряющих неравенствам а^х ^.Ь, обозначать через [а, Ь], а откры- открытый отрезок с теми же концами, т. е. совокупность всех вещественных чисел х, удовлетворяющих неравенствам а<^х<^Ь, обозначать через (а, Ь). Последовательность отрезков [av ft,], [av ftj, ..., [an, bn\, ... E) мы будем называть стягивающейся, если она подчинена сле- следующим двум требованиям: 1°. я„=?=оп + 1<6п+]==?бп (л=1, 2, . ..), т. е. каждый последующий отрезок целиком содержится в предыдущем; 2°. Iim(?n — ап) = 0, т. е. длины отрезков при безгранич- л-»-оо ном возрастании их номеров стремятся к нулю. Лемма 2. Если E) — стягивающаяся последователь- последовательность отрезков, то существует единственное вещественное число а, принадлежащее всем этим отрезкам. Можно было бы, конечно, провести доказательство этой (часто очень полезной) леммы, конструируя соответственные сечения; однако значительно проще — сослаться на лемму 1. В самом деле, в силу условия 1° последовательность монотонна и ограничена (последнее видно из того, что ап <^ Ьу для всех п); в силу леммы 1 она имеет предел; положим
континуум 31 Так как при любом k an^bk (n=\, 2, ...), то и так что ап^а^Ьп (л=1, 2, ...). ^ F) Таким образом, число а принадлежит каждому из отрезков [ап, Ьп] и, следовательно, удовлетворяет условиям леммы. Единственность его вытекает из того, что при наличии двух чисел аир, удовлетворяющих неравенствам F), мы имели бы (предполагая для определённости а• п<$ьп («=1. 2, ...). откуда что противоречит свойству 2° стягивающейся системы. Таким образом, лемма 2 доказана. Стоит заметить, что для леммы 2 весьма существенно при- причисление к каждому отрезку его концов ап, Ьп; если бы мы отказались от этого и вместо [ап, Ьп] рассматривали открытый отрезок еп<^х<^Ьп, то лемма была бы неверна; так, после- последовательность открытых отрезков 0 <^х<^— (я^ 1, 2,...) не имеет общей всем отрезкам точки. 3. Лемма Гейне-Бореля. Это вспомогательное пре'дложе- ние более недавнего происхождения также часто бывает очень удобным орудием доказательства теорем анализа. Условимся говорить, что (вообще говоря, бесконечное) семей- семейство М отрезков покрывает отрезок (закрытый) [а, Ь], если каждая точка этого последнего лежит внутри по меньшей мере одного из отрезков системы М. Лемма 3. Если система М покрывает отрезок [а, Ь], то из неё можно выделить конечную систему отрезков М', также покрывающую отрезок [а, Ь]. В самом деле, если отрезок А, = [а, Ь] не допускает тре- требуемого леммой конечного покрытия, то, разделив его пополам, мы можем утверждать, что по меньшей мере одна из двух по- половин также не допускает конечного покрытия (так как, оче-
32 ЛЕКЦИЯ ПЕРВАЯ видно, если бы обе его допускали, то допускал бы его и весь отрезок Aj). Обозначим эту половину через Д2 (если обе по- половины не допускают конечного покрытия, то А2 может озна- означать любую из них) и разделим её опять пополам; снова мы можем утверждать, что но меньшей мере одна из двух поло- половин (обозначим её через Д3) не допускает конечного покрытия. Этот, процесс мы можем продолжать безгранично, причём от- отрезки А,, Дг, As,..., очевидно, образуют стягивающуюся систему отрезков. На основании леммы 2 существует единственная точка а, принадлежащая всем этим отрезкам. Пусть А—отрезок системы М, содержащий внутри себя точку а; так как при п —- оо длина отрезка Дп стремится к нулю, причём а ? Ап, то для достаточно больших п Ап с А, и мы приходим к про- противоречию: отрезок Дп, по своему определению не допускаю- допускающий конечного покрытия, покрывается одним отрезком А системы М. Этим противоречием и доказывается лемма 3. Теперь мы не только научились строить фундамент мате- математического анализа, но, доказав три важнейших воспомога- тельных предложения, подготовили этот фундамент к наиболее удобному применению его в процессе дальнейшей конструкции основного здания. Какими методами воздвигается это здание, каковы основные понятия, идеи и способы рассуждения, упо- употребительные при его построении, — всё это вы узнаете из следующих лекций.
ЛЕКЦИЯ II ПРЕДЕЛЫ Что такое предел. — Различные типы стремления к пределу. — Предел постоянной величины. — Бесконечно малые и бесконечно большие.— Критерий Коши. — Замечание Об основных теоремах. — Частичные пределы; верхний предел и нижний предел. — Пределы функций нескольких переменных. Что такое предел. Понятие предела, наряду с понятием функциональной зависимости, есть одна из важнейших концеп- концепций математического анализа. Вы, конечно, знаете много теорем о пределах; и тем не менее, нам придётся со всей осно- основательностью заняться этим понятием, чтобы отчасти уточнить, а отчасти дополнить, углубить и расширить ту его концепцию, к которой вы привыкли. Займёмся прежде всего вопросом о том, что означает фраза «переменная величина х (в данном явлении или процессе) стре- стремится к числу а (или, что то же, имеет своим пределом чи- число а)»,— фраза, которую мы символически записываем одним из двух способов: х—>-а или limjc = a. Если мы хотим при определении предела соблюсти все формальные требования (а без этого вообще нельзя строить математическую науку), то мы сейчас же сталкиваемся со своеобразным и характерным затруднением. Дело в том, что в точном определении понятия предела, конечно, не может быть места таким терминам, как «явление» или «процесс», математический смысл которых со- совершенно неясен. А между тем, без этих (или равнозначных им) терминов формулировать обычное, знакомое вам определе- определение понятия предела очень затруднительно. Мы ведь обычно говорим так: какова бы ни была окрестность U числа а1), 1) Окрестность числа а есть любой открытый отрезок, содер- содержащий число а внутри себя. 3 А. Я. Хинчин. Восемь лекций
34 ЛЕКЦИЯ ВТОРАЯ все значения величины х, начиная с некоторого момента данного процесса, принадлежат окрестности Uг). И вот теперь мы должны найти способ так формулировать это определение, чтобы ино не содержало никаких терминов, точный математи- математический смысл которых не был бы определён заранее. Надо прямо сказать, что задача эта вряд ли удовлетворительно разрешима. Современные математики предпочитают вовсе отказаться от её решения и считают запись Нш х = О лишён- лишённой математического содержания. Это не значит, конечно, что они вовсе отказываются от понятия предела. Как же они выходят из этого затруднения? Дело в том, что фактически мы' в анализе всегда встреча- встречаемся с таким положением вещей, когда к пределу стремится некоторая функция v при некотором определённом поведении независимой переменной х, т. е., например, «.у имеет пределом Ь, когда х стремится к а» или «ап стремится к а, когда п безгранично возрастает», и т. п. Такая фраза (и соответствую- соответствующая ей запись 󗕦 Ь, или \\ту=Ь, или ап—>а) имеет л-»а *-ю л-кэо уже совершенно определённый смысл. Так, выражение \\ту = Ь х-*а означает следующее: какова бы ни была окрестность V числа Ь, существует такая окрестность U числа а, что у ? V всякий раз, когда x?U, за исключением, быть мо- может, х=а*). Вы видите, что это безукоризненно чёткое определение понятия предела действительно не нуждается в представлении о процессе. Оно просто говорит, что у сколь угодно близко к b при х, достаточно близком к а3). Конечно, 1) Конечво, иногда редактируют эту фразу и иначе; так, говорят: сколь бы мало ни было положительное число е, величина к — а с течением данного процесса становится и остаётся по абсолют- абсолютному значению меньше, чем ?. Как бы то ни было, во всех распро- распространённых определениях фигурирует это упоминание о процессе, без которого самое понятие предела кажется лишённым определён- определённости. 2) Функция у может быть не определена при х = а\ может также случиться, что у при jc = o имеет определённое значение, но это значение отлично от Ь. 3) При этом случаи х -^ со, х ->- — со, у —¦ <х>, у -*¦ — оо ие тре- требуют специальных определений, если под окрестностью -\- оо ( — оо) понимать любое множество чисел, больших (меньших) некоторого определённого числа.
ПРЕДЕЛЫ 35 для того, кто не свыкся ещё с типическими чертами матема- математического формализма, может показаться странным: как же, в самом деле, фраза (А): «предел v равен Ь при условии, что предел х равен а> может иметь определённый смысл, в то время как само условие: «предел х равен а» не имеет смысла? На самом же деле, в таком положении вещей нет ничего не только неприемлемого, но даже и необычного. Фраза (А) опре- определяется как нечто монолитное, целое, и вовсе не обязательно, чтобы отдельные выхваченные нами её части также имели смысл, если только всей этой фразе, взятой целиком, припи- приписывается точно определённое содержание. Само собой понятно, что данное нами определение понятия предела включает в себя оба наиболее важных для анализа случая — предел последовательности liman и предел функции я-voo от непрерывно изменяющейся величины lim_y, где а есть либо вещественное число, либо -|- оо, либо — со; точно так же предел самой функции у может здесь пониматься в любом из этих трёх смыслов. Различные типы стремления к пределу. Пусть y = f(x) есть функция от х, имеющая пределом число Ь, когда х стре- стремится к а, причём а также число; предположим для простоты, что все значения величины х больше а; символически это выражают очень удобной записью х—>-а-|-0 (вместо х—+ а, х^>а); таким образом, мы имеем lim f(x) = b. A) х-*а+О Допустим сначала, что для всех х ~^> а, достаточно близ- близких к а, мы имеем f(x)^>b; тогда функция f(x) имеет вблизи точки а, в обычном геометрическом изображении, один из двух видов, иллюстрируемых на черт. 1 и 2. В случае черт. 1 f(x) тем ближе к Ь, чем х ближе к а; у—»Ь, монотонно убывая при х—>-а-\-0. В случае черт. 2 всё это не так: у—> Ь, то приближаясь, то удаляясь от своего -предела: при х—-а-\-0 функция f(x) изменяется не монотонно: она то возрастает, то убывает. Разумеется, что все эти существенные различия не препятствуют нам аналитически выражать обе картины одним и тем же соотношением A), описывающим 3*
36 ЛЕКЦИЯ ВТОРАЯ основной факт, общий обоим случаям: у как угодно близко к Ь, если х достаточно близко к а. Случай, когда для всех дг^>а, достаточно близких к а, мы имеем у<С.Ь, совершенно аналогичен предыдущему; он У Ь- а Черт. 1. охватывается картинами, изображёнными на черт. 3 и 4, и, очевидно, не нуждается в пояснениях. Наконец, может быть случай, когда вправо от точки а и в любой близости к этой точке функция y = f(x) принимает У b Черт. 3. Черт. 4. как значения, большие чем Ь, так и значения, меньшие чем Ь (черт. 5). В этом случае стремление величины у к пределу Ь при х—»-д-|-0 не может, очевидно, быть монотонным. При этом если функция / (х) непрерывна (как мы неявно предпола-
ПРЕДЕЛЫ 37 гали на всех чертежах), то она необходимо становится равной своему предельному значению b в бесчисленном множестве точек, лежащих вправо от с и сколь угодно близких к а; говоря геометрически, график функции f(x) в соседстве точки а бесчисленное множество раз пересекает прямую у Этими случаями ис- исчерпываются, очевидно, все возможные типы не- непрерывно изменяющихся величин, стремящихся к b при х—»-a-j-O. Мы не будем отдельно рассмат- рассматривать случая х —•- а — О, когда все значения вели- величины х<^_ а; соответствую- Черт. 5. щие картины получаются, очевидно, зеркальным отражением черт. 1—5 в прямой х = а. Если, как мы предположили, у—-Ь при х—>сто, конеч- конечно, мы имеем как у—-Ь, так и у—>¦ Ь\ при этом любой из *->й-)-0 х-*а—О пяти упомянутых нами типов приведения функции у вправо от У ъ- О Черт. 1'. Черт. 2'. точки а может сочетаться с любым из пяти аналогичных типов её поведения влебо от точки а, так что мы получаем всего 25 различных типов поведения функции у, стремящейся к b при х—-а.
38 ЛЕКЦИЯ ВТОРАЯ Заметим ещё, что случаи, изображённые на черт. 1, 2 и 3, 4, удобно иногда записывать соответственно в виде y—~b-\-Q и у—^Ь—0. дг-со+О дг-ю-f-O До сих пор мы предполагали а и b числами. Нетрудно перечислить все возможные типы поведения функции у и в У b- (I V/ 3? Черт. 3'. Черт. 4'. тех случаях, когда одна из этих букв (или обе буквы) озна- означает-)-со или — ос; Вы сами без труда их найдёте; для при- примера укажем, что в случае, когда а = -j- со, а Ь—число, возможны типы, изображён- изображённые на черт. Г—5'. Функция f(x) монотонна в случае черт. Г и 3' и не монотонна в остальных случаях; в случае черт. 5' функция f(x) (если она не- непрерывна) становится равной своему предельному значению b бесчисленное множество раз и притом для сколь угодно больших значений х. В случае, когда а — число, а Ь=-\-оо, возможны, оче- очевидно, при х—«-a-f-О только два типа, изображённых на черт. 6 и 7. • Предел постоянной величины. Вы, конечно, знаете, что предел постоянной величины, т. е. величины, способной при- принимать одно единственное значение, принимается всегда суще- существующим и равным этому единственному значению; такое соглашение иногда вызывает недоумение; ведь мы вначале Черт. 5'.
ПРЕДЕЛЫ 39 говорим о пределе переменной величины; как же в таком случае может существовать предел у величины постоянной? Однако такое соглашение, во-первых, логически обяза- обязательно для нас, если мы не хотим вступать в противоречие с нашим определением предела; в самом деле, если у=?при у любом значении величины х, то, какова бы ни была окрест- окрестность V точки Ь, мы имеем при любом х соотношение V а Черт. 6. а Черт. 7. откуда по определению предела мы обязаны заключить, что при любом а limy =6. B) JC-Ю Но такое соглашение, во-вторых, весьма целесообразно (в сущности, почти неизбежно) и практически; в самом деле, допустим на минуту, что мы условились считать постоянную величину не имеющей предела, и пусть для некоторой функции имеет место соотношение B); тогда, как известно, lim (— у) = —Ь. х-*а ' Но у-\-{—у) = 0 при любом х; сумма величин у и — у, каждая из которых имеет предел, оказывается величиной по- стоянной и, значит, по нашему соглашению, не имеющей пре- предела. Таким образом, формулируя известную теорему о пределе
40 ЛЕКЦИЯ ВТОРАЯ суммы двух переменных величин, мы вынуждены внести в неё оговорку: «если только эта сумма не есть постоянная величи- величина»; подобные же оговорки, искусственность и обременитель- обременительность которых ясны сами собой, нам пришлось бы внести почти во все теоремы теории пределов. От всего этого мы полностью освобождаемся, приписывая предел всякой постоян- постоянной величине. А так как при этом, как мы только что видели, мы не совершаем никакой погрешности против установленного нами определения понятия предела, то это соглашение всегда принимается при изложении основ математического анализа. Бесконечно малые и бесконечно большие. Величина y — f(x) называется бесконечно малой при х—>-а, если у - » О при х—-а. Во многих изложениях анализа понятие бесконечно малой играет в теории пределов основную роль; оно опреде- определяется раньше, чем общее понятие предела, и, напротив, опре- определение последнего редуцируется к понятию бесконечно малой величины. В противоположность этому некоторые современные учёные рекомендуют при изложении курса анализа обходиться вовсе без понятия бесконечно малой величины, полагая, что понятие это, будучи излишним, в то же время способно по- посеять, и фактически сеет, множество недоразумений. По этому поводу следует заметить, что речь идёт здесь, конечно, не о понятии величины, стремящейся к нулю (это понятие при любом построении анализа, а также и во всех его приложениях, играет очень существенную роль), а лишь о термине «бесконечно малая величина». Это название действи- действительно весьма неудачно и часто даёт повод к недоразумениям; оно как бы стремится охарактеризовать размер той величины, к которой оно относится, — как-то неудобно называть беско- бесконечно малой величину, которая на известных стадиях своего изменения может быть и вовсе не малой; между тем, на самом деле оно, конечно, призвано описывать только характер из- изменения данной величины, а отнюдь не её размеры; эта тер- терминологическая неудача является следствием исторического пережитка: бесконечно малые величины получили своё наиме- наименование в эпоху, когда смысл этого понятия был совершенно иным, чем мы его устанавливаем теперь. Однако величины, стремящиеся к нулю, встречаются в ана- анализе и его приложениях, как мы уже заметили, столь часто, что отказаться от специального краткого наименования для
ПРЕДЕЛЫ 41 них было бы очень трудно. С другой стороны, заменять исто- исторически прочно, веками утвердившееся наименование каким- либо другим означало бы такую терминологическую катастро- катастрофу, какая в математике всегда ощущается очень продолжи- продолжительно и болезненно. Наконец, если, как это делаем сейчас мы, не принимать бесконечно малую величину за основание теории пределов, а понимать её лишь как частный случай общего понятия величины, стремящейся к пределу, то опас- опасность злокачественного смешения не так уж велика и не гро- грозит столь тяжёлыми последствиями. Величина у называется бесконечно большой, если lim|_v|= -f- сю. Таким образом, бесконечно большая величина либо стремится к-{-сю, либо стремится к —сю, либо не стремится ни к ка- какому пределу, принимая значения то положительные, то отри- отрицательные, но по абсолютной величине безгранично возрастаю- возрастающие. Примером поведения последнего типа служит величина _у = (—1)"и при и—>--}-оо, причём и, возрастая, принимает только целые значения. О самом термине «бесконечно боль- большая» можно повторить всё то, что выше сказано о «беско- «бесконечно малой». Нам нет надобности останавливаться здесь на хорошо из- известных вам теоремах о сумме, разности и произведении бесконечно малых величин. Напомним только два момента, недостаточное внимание к которым часто приводит к недора- недоразумениям: 1) В теоремах о сумме и произведении бесконечно малых очень существенно требование, чтобы число слагаемых (или сомножителей) оставалось «ограниченным; без этой оговор- оговорки обе теоремы становятся неверными, как легко убедиться на простых примерах. 2) Об отношении двух бесконечно ма- малых нельзя сделать никакого общего утверждения; такое от- отношение может иметь любой характер изменения, в частности, может и не стремиться ни к какому пределу. Прежде чем мы пойдём дальше, нам надо сделать ещё не- несколько замечаний о символах -)-оо и —оо, с которыми мы теперь уже достаточно часто встречались. Вы знаете, конечно, что эти символы не служат обозначением для каких-либо чисел. На вопрос о том, что означает, например, символ -|-ос, пра-
42 ЛЕКЦИЯ ВТОРАЯ вильнее и яснее всего будет ответить, что, взятый сам по себе, он лишён всякого смысла; смысл получает только выраже- выражение «окрестность -|-оо», и под этим выражением разумеется совокупность всех вещественных чисел, превышающих неко- некоторое (любое) число а; иметь для такой совокупности краткое наименование очень удобно, так как с совокупностями такого рода мы в анализе встречаемся на каждом шагу. Но вместе с выражением «окрестность -|-сс» тотчас же получают смысл и такие выражения, как Иту = -\-оо (где само а может хьа также быть одним из символов -\- со и —со); в самом деле, в данном нами определении предела limy^b о буквах а и b х-*а упоминается исключительно в связи с их окрестностями; по- поэтому любая из этих букв может быть со смыслом заменена символом -\- со (или —со) после того, как мы установили, какие множества мы называем окрестностями этого символа; при этом нет надобности приписывать какой-либо смысл самому этому символу. Из всего этого ясно, с какой осторожностью необходимо относиться к употреблению символов -foe и — со; в частно- частности, совершенно недопустимо применять к ним какие-либо арифметические операции (—=0 и т. п.), как это принято в некоторых «упрощённых» курсах анализа. Равным образом лишены смысла и всякого рода равенства, в которых символ -|- оо или — со выступает не в прямо указанной роли пре- предела, как, например, распространённые в тригонометрии записи вида tg-r- = ^h оо!), и т. п. Напротив, неравенствам вида а<^-{-оо, Ь^>— оо, —ск><^с<^-\-оо придаётся опреде- определённый смысл; они последовательно означают: 1) что а есть либо число, либо символ — оо; 2) что b есть либо число, либо символ -|-оо; 3) что с есть число. > Наконец, необходимо точно уговориться, будем ли мы, го- говоря о существовании предела функции y^f(x), подразуме- Правильная формулировка, конечно, такова: lira tg;c = -r-ool lira tgjc = —оо.
ПРЕДЕЛЫ 43 вать при этом существование числа, служащего пределом этой величины, или будем допускать в качестве пределов также и символы + со, —оо. Ясно, конечно, что в этом терминоло- терминологическом вопросе мы формально можем принять любое из двух решений и что, следовательно, выбор должен быть принят на основе целесообразности. Обычно соглашаются понимать утвер- утверждение «з» имеет предел» в .смысле существования числа, служащего пределом величины у; если же имеется в виду широкое понимание этого утверждения, то делаются специаль- специальные оговорки. Так мы и будем поступать в дальнейшем. Критерий Коши. Одной из важнейших задач теории пре- пределов является, очевидно, следующая: дана функция f(x) = y; определить, имеет ли она предел при х—>-а. При этом: 1) согласно только что принятому нами соглашению речь идёт о существовании такого числа Ь, что у—*-Ь при х—»-а; 2) напротив, а может означать либо число, либо один из символов -|-ос, '—оо; 3) в этой задаче ставится вопрос только о существовании предела; отыскание же этого предела в данный момент нас совсем не должно занимать. Следующий важный признак существования предела спо- способен оказать весьма существенные услуги, в особенности в теоретических исследованиях. Критерий Коши. Для того чтобы функция y=f{x) имела предел при х—>-а, необходимо и достаточно выпол- выполнение следующего условия: (А) как бы мало ни было поло- положительное число е, существует такая окрестность U числа (или символа) а, что для любых двух чисел хх и х2 окрест- окрестности U Доказательство. 1) Пусть при х—>-а величина у стремится к числу Ъ. По определению предела существует такая окрестность U числа а, что при x?U поэтому, если хх g U и х2 g U, то f(xx) и /(дгг) заключены между b—tj- и Ъ -f--j 1 а следовательно, отличаются друг от друга менее, чем на е. Это доказывает необходимость усло- условия (А).
44 ЛЕКЦИЯ ВТОРАЯ 2) Допустим теперь, что условие (А) выполнено. Для каж- каждого натурального числа п существует такая окрестность Un числа а, что при jc, ? Un, х2 ? Un мы всякий раз имеем !/(*,) — /(*я)|<4- C) Каждую такую окрестность ?/п мы будем считать (закрытым) отрезком; при этом мы имеем право предполагать, что Un+1cUn (л =: 1, 2, ...); в самом деле, если бы отрезок Un+i не состав- составлял части отрезка (Jn, то мы просто заменили бы отрезок ?/„+1 общей частью ?/„+, отрезков Un и Ua+12); очевидно, что f/n+j есть отрезок, причём [fn+1(Z.Un и для любых jCjGf/лч-], Jc2€^n+i мы имеем так что окрестность t/n+l может во всех отношениях заменить окрестность ?/п+1. Так как функция f(x) в отрезке Un подчинена условию C), то всё множество Мп значений, принимаемых ею в этом отрезке, может быть заключено внутрь некоторого отрезка Дп длины —. Но Un+1cUn; следовательно, Мп+1сМп, а потому отрезок Ап+1 может быть взят целиком заключённым в отрезке Дп: Дп+1сДп; а так как длина — отрезка Дп стремится к нулю при и—<-оо, то последовательность "отрезков Дп A,2,...) образует стягивающуюся систему отрезков; в силу леммы 2 лекции I (стр. 30) мы можем утверждать, что существует единственное число Ь, принадлежащее всем отрезкам Дп. Наконец, убедимся, что limy=b. С этой целью обозна- JC-MZ чим через V любую окрестность числа Ь; по определению этого числа Д„с V для всех достаточно больших и; поэтому, если x?Un, то f (х) ? Mn(Z.lncz V, откуда по определению предела и следует, что lira у = Ь. Которая, очевидно, не пуста.
ПРЕДЕЛЫ 45 Таким образом, критерий Коши доказан полностью. В част- частности, для того чтобы последовательность чисел я,, а2, ..., ап,... имела предел, необходимо и достаточно, чтобы при любом ?^>0 и всех достаточно больших пит Критерий Коши лишь в редких случаях получает конкретное применение в смысле доказательства существования предела у некоторой индивидуальной функции; с этой целью обычно применяются критерии более простые, но зато не являющиеся характеристическими, т. е. одновременно необходимыми и до- достаточными. Напротив, в общих теоретических исследованиях эта особенность критерия Коши делает его, как мы увидим .дальше, почти незаменимым орудием. Замечание об основных теоремах. Основные теоремы теории пределов, т. е. теоремы о пределе суммы, разности, произведения и т. д., вам, конечно, хорошо известны; нам нет надобности здесь не только доказывать, но даже форму- формулировать и\. Однако одно замечание, связанное с этим циклом теорем, нам всё же придётся сделать; при этом, так как оно будет в равной мере относиться ко всем теоремам этого цикла, нам достаточно будет иллюстрировать его на какой-нибудь одной из них. Когда мы говорим «предел суммы двух величин равен сумме их пределов» (а именно в этой краткой редакции тео- теорема встречается в большинстве «упрощённых» курсов), то тем самым мы подразумеваем (хотя и не упоминаем этого), что все три величины (оба слагаемых и сумма) стремятся к пределам, и вопрос идёт лишь о взаимоотношении этих пределов. На самом деле, мы при этом предполагаем больше, чем нужно; достаточно предположить существование предела у каждого из слагаемых; тогда можно доказать, что и сумма должна иметь предел (равный сумме пределов слагаемых); доказательство это не требует никаких дополнительных рас- рассуждений, автоматически вытекая в виде дополнительного результата при любом доказательстве теоремы о пределе суммы.
46 ЛЕКЦИЯ ВТОРАЯ Напротив, из того, что сумма имеет предел, ещё не выте- вытекает существование предела у каждого из слагаемых; в самом деле, пусть величина у при х—>-а не стремится ни к какому пределу: очевидно, что то же самое будет иметь место для вели- величины 1 —у; между тем, сумма этих двух величин, будучи по- постоянной (у-\- 1 — v=l), имеет предел 1 при х—>-а. Таким образом, наиболее совершенная формулировка тео- теоремы о пределе суммы должна гласить: если каждая из дан- данной конечной совокупности величин имеет предел при х —<-а, то и сумма их имеет предел при этом условии, и предел суммы равен сумме пределов слагаемых. Аналогичную фор- формулировку получают и все другие теоремы этого цикла. Частичные пределы; верхний предел и нижний предел. Мы теперь должны подробно заняться изучением таких функций величины х, которые при х—-а не имеют предела; так назы- называемые «упрощённые» курсы оставляют обычно этот вопрос совершенно без рассмотрения. Условимся называть число Ь частичным пределом функции y = f(x) при х—*а, если, каковы бы ни были окрестность U числа а и окрестность V числа Ь, найдётся такое x?U, от- отличное от а, что / (х) ? V. Это простое определение без всяких изменений распространяется и на тот случай, когда b есть один из символов -f- оо, — со. Таким образом, частичный предел Ь есть такое число, что как угодно близко к а най- найдутся значения величины х, при которых величина у как угодно близка к b [в случае, когда а или b есть -}~сс, мы должны, конечно, вместо чисел «как угодно близких к а (или Ь)ъ говорить о числах «как угодно больших»; аналогично и в случае, когда а или b есть — со]. Аналогично определяется частичный предел последователь- последовательности alt с2, . .., ап, ... при п —> оо. Если \irny существует, то он, как мы непосредственно JCMJ видим из определения понятия предела, есть вместе с тем частичный предел (и притом единственный) величины у, неза- независимо от того, является ли этот предел числом или одним из символов -}-оо, —оо; но если этого предела нет, то- величина у необходимо имеет по меньшей мере два различных частичных предела; таким образом, любая функция y = f(x\ имеет при х—*а по меньшей мере один частичный предел;
ПРЕДЕЛЫ 47 для того чтобы он был единственным, необходимо и достаточно существование lim_y. х-*-а Чтобы убедиться в справедливости всех этих утверждений, мы, очевидно, должны доказать два предложения: 1) любая функция v = /(.*:) имеет при х—+а по меньшей мере один частичный предел и 2) если b есть единственный частич- частичный предел функции y = f(x) при х—*а, то lim y= Ъ. х-*а При этом во всех случаях все пределы и частичные пре- пределы могут быть как числами, так и символами -J- со и—сю. Доказательство утверждения 1. Если один из символов -\- со или — со служит частичным пределом вели- величины v при х —>- а, то утверждение доказано; поэтому мы допустим, что это не так, и покажем, что в таком случае существует число Ь, являющееся частичным пределом вели- величины у при х—-а. Но если ни -|-сю, ни —оо не служит частичным пре- пределом функции f(x) при х—>-а, то, очевидно, существует такая пара чисел а, р (а <^ fS), что для всех х, достаточно близких к а, В частности, значит, в любой окрестности числа а най- найдётся такое число х, что f(x) принадлежит отрезку [а, р], который мы для краткости обозначим через А,; условимся обозначать через А только что формулированное свойство отрезка А.,; если мы разделим этот отрезок пополам, то по меньшей мере одна из его половин должна обладать свойст- свойством А (ибо, если бы, например, окрестность ?/, числа а не содержала ни одного х, для которого f(x) принадлежит левой половине А,, а окрестность ?/г — ни одного такого, для кото- которого f(x) принадлежит правой половине этого . отрезка, то окрестность U, служащая общей частью U} и Uv очевидно, не могла бы содержать ни одного х, для которого f(x) ? Aj, т. е. отрезок Aj не обладал бы свойством А). Обозначим че- через А, половину отрезка Д1? обладающую свойством А, и поступим с ней так, как мы поступили с отрезком Д.,, т. е. разделим её пополам и возьмём её половину Д3, обладающую
48 ЛЕК11ИЯ ВТОРАЯ свойством А. Продолжая этот процесс безгранично, мы, оче- очевидно, получаем стягивающуюся систему отрезков Д.,, Д2, Д3> ..., Дп,... Пусть b—существующее в силу леммы о стягиваю- стягивающейся системе отрезков единственное общее число всех этих отрезков и пусть U и V означают соответственно любые окрестности чисел аи ft; по определению числа b найдётся отрезок Дп с V; но каждый отрезок Дп обладает свойством А, следовательно, существует такое число х ? U, что f(x) ? \ncV. Но это и значит, что b есть частичный предел величины у при х—>-а. Доказательство утверждения 2. В силу утвер- утверждения 1 величина у имеет при х —> а по меньшей мере один частичный предел Ь; если соотношение lim_y=ft неверно, то существует окрестность V числа (или символа) Ь, обладаю- обладающая тем свойством, что в любой окрестности (J числа (или символа) а найдётся такое число х, для которого f(x) лежит вне V. Очевидно поэтому, что должна иметь место одна из следующих двух ситуаций: либо один из символов -j-oo, —оо, ипритом отличный от Ь, является частичным пределом величины у при х—»а, либо существует отрезок [а, [}], лежащий вне V и такой, что любая окрестность U числа (или символа) а содержит число х, для которого f(x) ? [а, [$]. В первом случае утверждение 2 доказано. Во втором случае мы в точности тем же путём, как при доказа- доказательстве утверждения 1, убедимся,-что величина у имеет при х—»-а частичный предел Ь', принадлежащий отрезку [а, р] и, следовательно, отличный от Ь; таким образом, и в этом случае утверждение 2 доказано. Итак, мы установили, что всякая величина, которая в данном процессе не имеет предела, должна обладать по меньшей мере двумя частичными пределами. Вообще говоря, ничего большего утверждать нельзя; так, величина у^(—1)" (где п—натуральное число) имеет при и—>оо, очевидно, в точности два частичных предела 1 и — 1. С другой стороны, существуют величины, которые в определённых процессах изме- изменения могут иметь и бесконечное множество частичных пре- пределов; так, функция у = sin — имеет при х—*-0 в качестве частичных пределов все числа отрезка [—1,-}-1]; в самом
ПРЕДЕЛЫ 49 деле, при лг—>0 вечичина —, возрастая непрерывно и безгра- безгранично, имеет синус, бесчисленное множество раз непрерывно изменяющийся от — 1 до —[— I и обратно; каково бы ни было число $ отрезка [—1,-)-1], мы можем, следовательно, найти сколь угодно малое (т. е. принадлежащее как угодно малой окрестности числа 0) число а, для которого sin — = fi. Несмотря на то, что различные величины, как мы только что видели, в смысле множества имеющихся у них частичных пределов являют собой весьма различную картину, всё же в строении множества частичных пределов имеются черты, общие для всех переменных величин, и черты эти как раз для анализа имеют существенную важность. На некоторых из них мы должны будем теперь остановиться. Свойство 1. Если число (или симеол) b не является частичным пределом величины у при х—*а, то существует окрестность V числа (или символа) Ь, не содержащая внутри себя ни одного такого частичного предела. В самом деле, если b не есть частичный предел величины у при х —>¦ а, то существуют такая окрестность V числа (или символа) b и такая окрестность U числа (или символа) а, что у не может принадлежать открытому отрезку V при х ? U; но так как отрезок V является окрестностью любого своего внутреннего числа, то в точности то же самое имеет место и для любого такого внутреннего числа; ни одно из этих чисел на может, следовательно, быть частичным пределом величины у при х —>- а, чем и доказывается свойство 1. Прежде чем перейти ко второму свойству, заметим сле- следующее. Если среди частичных пределов данной величины у при х—>- а встречается символ -j-оо, то мы естественно прини- принимаем этот частичный предел за наибольший; подобным же образом символ —ос, если он служит частичным пределом нашей величины, мы считаем наименьшим из её частичных пределов. Условившись в этом, мы можем теперь формули- формулировать свойство 2. Свойство 2. Среди частичных пределов любой пере- переменной величины всегда имеются наибольший и наименьший. Вы понимаете, конечно, что это утверждение далеко не самоочевидно: ведь нет же, например, ни наибольшего, ни 4 А. и. Хинчин. восемь лекций
50 ЛЕКЦИЯ ВТОРАЯ наименьшего числа в открытом отрезке @, 1), и вообще да- далеко не во всяком множестве чисел имеются наибольшее и наименьшее числа (или символ); смысл нашего утверждения в том и заключается, что множеством частичных пределов данной переменной величины может быть отнюдь не любое множество (что, конечно, видно из свойства 1); оно должно обладать некоторыми специфическими чертами и, в частности, содержать наибольшее и наименьшее число (или символ); докажем это. Прежде всего будем говорить только о наибольшем частичном пределе, так как для наименьшего (это заранее очевидно) все рассуждения будут протекать совершенно аналогично. Мы можем допустить, что символ -(-ее не является частич- частичным пределом данной переменной величины (иначе он, как уже замечено, был бы наибольшим частичным пределом, и свойство 2 было бы доказано). В силу свойства 1 отсюда следует, что частичных пределов нет и в некоторой окрест- окрестности символа -(- со, другими словами, все частичные пре- пределы меньше некоторого числа. Если бы единственным ча- частичным пределом н-ашей величины был символ — оо, то он был бы и наибольшим частичным пределом, и свойство 2 было бы доказано. Поэтому мы можем предположить, что среди ча- частичных пределов Данной величины имеется некоторое число Ь. Разобьём теперь совокупность всех вещественных чисел на два класса А и В по следующему принципу: х ? Л, если вправо от х имеется хотя бы один частичный предел данной величины, и х ? В—в противном случае. Вы сами легко убе- убедитесь, что это разбиение есть сечение. Пусть а — его ру- рубеж, покажем, что а есть наибольший частичный предел данной величины. В самом деле, прежде всего а есть частич- частичный предел, так как в противном случае в силу свойства 1 некоторая окрестность (а,, а2) (а,<^а<^а2) числа а не содержала бы ни одного частичного предела; но в силу неравенства а,<^а мы имеем a, ? А, так что вправо от а, должны быть частичные пределы: так как их нет в отрезке [ctpCt.,], то они должны лежать вправо от а2, что невозможно, так как a.,?B в силу неравенства а2^>а. Лалее, вправо от а частичных пределов быть не может, так как если fi ^> а есть частичный предел, то для любого у, заключённого между
ПРЕДЕЛЫ 51 а и E, а<^ у<С Р. МЬ| имели бы у ?5 в силу у^>а и в то же время у € Л в силу -S ^> у. Таким образом, число а дейст- действительно есть наибольший частичный предел данной величины, и свойство 2 доказано. Итак, любая переменная величина в любом процессе изме- изменения имеет наибольший и наименьший частичные пределы. Эти два частичных предела имеют важное значение; их назы- называют соответственно верхним и нижним пределами величины У^/(х) при х—<-а и обозначают через \\mf(x) и lira f(x) *-*я x^h или lim sup/(лг) и lirainf/(x). х-т х-*а Очевидно, всегда lim sup f(x)^z lira inf f(x); x~*-a x~*-a в остальном эти два числа могут принимать какие угодно зна- значения, причём каждое из них или даже оба могут быть и символами -|- ею или —оо. Величина у называется ограни- ограниченной при х-—> а, если верхний и нижний пределы её при х—>-а являются числами, и неограниченной, — если хотя бы один из-них есть символ -j- оо или —оо; очевидно, ограни- ограниченность величины у при х—*а означает существование та- таких чисел a, p (а<^$) и такой окрестности U числа (или символа) а, что при любом х ? U Для существования limy (в смысле числа или символа) Х-Ю необходимо и достаточно соотношение lira у —limу, х-*а х-*а ибо совпадение верхнего предела с нижним равносильно един- единственности частичного предела. Числа, заключённые между limj> и limj>, могут как быть, ~~х~^а х^а так и не быть частичными пределами величины у при х—>а; 4*
52 ЛЕКЦИЯ ВТОРАЯ выше мы видели примеры двух крайних случаев, когда 1) ни одно из этих чисел не служит частичным пределом и 2) на- напротив, каждое из них является частичным пределом. В общем случае некоторые из них будут частичными пределами, а дру- другие— нет. Иногда верхний и нижний пределы определяются иначе, и эти иные определения полезно знать как для расширении и конкретизации самого представления об этих понятиях, так и для приложений. Число (или символ) b называют верхним пределом величины y = f(x) при х—>-а, если, каковы бы ни были числа (или символы) а, р (а <[ b <^ р), найдётся сколь угодно малая окрестность U числа (ила символа) а, содер- содержащая числа x(x=jt=a), для которых а ^ у <; р, но не содер- содержащая таких чисел х(х=/=а), для которых у^>$. Чтобы показать, что новое определение равносильно преж- прежнему, заметим прежде всего, что если число или символ b есть верхний предел величины у по новому определению, то Ь, очевидно, является частичным пределом этой величины; если бы существовал частичный предел b' ^> b, то мы могли бы найти числа а, р, а', р' так, что при этом, так как Ь' есть частичный предел, любая окрест- окрестность U числа (или символа) а должна содержать число х, для которого а' <^у<^ р', откуда У^>$; но это, очевидно, противоречит тому, что b есть верхний предел согласно новому определению. Пусть теперь, обратно, b есть наибольший частичный пре- предел величины у при х—.-а; если а<^/><[[р, то любая окрест- окрестность U числа (или символа) а содержит число х, для ко- которого a<[[j><^p (по определению частичного предела). Чтобы убедиться, что b есть верхний предел величины у в смысле нового определения, остаётся поэтому только показать, что при надлежащем выборе окрестности U мы для любого x?U будем иметь у sg; p. Если ^ = -|-оо, то доказывать нечего; если нет, то -\- со не может быть частичным пределом (ибо b есть наибольший частичный предел). Значит, существуют такое число у0 и та- такая окрестность (Jo числа (или символа) а, что У<^у0 для
ПРЕДЕЛЫ 53 всех x?Uc. Если .yossp, то всё требуемое доказано. Если У(^>$, то каждое число X отрезка [р,.Уо]> не будучи частич- частичным пределом, имеет окрестность Vx, которой соответствует /акая окрестность Ur числа (или символа) а, что для любого х ?Uxf{x)^y лежит вне Vx. Открытые отргзки Vk покры- покрывают отрезок [р,.у0]. Применяя лемму Гейне-Бореля (лемма 3 лекции 1), мы находим конечную группу окрестностей V\t, ^х.,. • •., Vkr, покрывающую отрезок [р,.у0]. Пусть тогда U есть общая часть окрестностей UM ?Д,, Uk.,, .. •, LJ\r, очевидно, что U есть окрестность числа (или символа) а и что если x?U, то соответствующее значение у не может принадлежать ни од- одному из отрезков V^, V\t, • .., Wr; другими словами, для любого x?(J, чем наше утверждение и доказано. Само собой разумеется, что аналогичное новое определе- определение получает и нижний предел и что равносильность старого и нового определений здесь доказывается совершенно анало- аналогичным образом. Если желательно бросить более конкретный взгляд на всю эту абстрактную схему, то нашим глазам открывается картина, которую без всякой претензии на формальную строгость можно попытаться описать следующими основными штрихами. Пере- Переменная величина, находясь в некотором процессе изменения, приближается при этом то к одному числу, то к другому, то к третьему и т. д. Мы называем число b частичным пределом данной величины, если она на сколь угодно далёких (позд- (поздних) стадиях процесса всё вновь и вновь как угодно близко подходит к числу b (причём вполне возможно, что в проме- промежутке между двумя такими приближениями она уклоняется от b весьма далеко; важно лишь, чтобы рано или поздно она снова подошла к b на сколь угодно малое расстояние). Если b есть единственный такой центр притяжения, то понятно, что наша величина у не только становится, но в конце концов и остается как угодно близкой к Ь, и мы имеем \\ту=Ь. Вообще же говоря, у не стремится ни к какому пределу, но, сколь бы далеко мы ни следили за процессом его изменения, пр должает, подобно незатухающему маятнику, колебаться в известных границах; эти границы (среди которых могут встре- встречаться — оо и - оо) и представляют то, что мы называли верхним и нижним пределами данной величины.
54 ЛЕКЦИЯ ВТОРАЯ Пределы функций нескольких переменных. Нам остаётся ещё рассмотреть несколько несложных вопросов теории пре- пределов, связанных с функциями нескольких переменных; мы бу- будем при этом, чтобы упростить изложение, говорить лишь о функциях двух независимых переменных; всё сказанное нами при этом может быть, с соответствующими очевидными из- изменениями, перенесено и на случай функций любого числа переменных. Каждая пара значений независимых переменных хну изображается точкой координатной плоскости (ху), и мы в даль- дальнейшем под именем точки (а, Ь) будем для краткости пони- понимать пару значений х = а,у=Ь этих переменных. Под ок- окрестностью точки (а, Ь) мы будем понимать любую область плоскости (ху)!), содержащую эту точку внутри себя; эта об- область может быть кругом, прямоугольником или иметь более сложную форму. Термин «окрестность точки (а, Ь)-» мы считаем сохраняющим свой смысл и в том случае, если а или Ь, или обе буквы означают какой-либо из символов -|- оо, — сю; так, если а — число, а Ъ—символ -j-оо, то окрест- окрестностью точки (а, Ь) мы назовём любую обпасть вида а <[ <^-vr<3>.V^>Y> где а.<^ а <3> a число у произвольно (черт. 8); если а есть — оо, а Ъ попрежнему -|- оо, то окрестностью точки (а, Ь) служит любая область вида х <^а,у ^> р, где аир — произвольные числа (черт. 9), и т. д. Мы говорим, что функция z=f(x, у) при х—>-а, у—>. b имеем своим пределом число (или символ) с, если для любой окрестности V числа (или символа) с существует такая окре- окрестность U точки (а,Ь), что в любой точке (х,у) ? U[(x,y) ф =Ф (а, bj] мы имеем z?V. Записывается это положение вещей следующим образом: limz=c или z—.-с. D) При этом определении вся теория пределов, построенная для функций одной независимой переменной, легко и естест- 1) Областью на плоскости называют множество точек плоскости, обладающее следующим свойством: если точка принадлежит этому множеству, то найдётся круг с центром в этой точке, целиком со- содержащийся в том же множестве.
ПРЕДЕЛЫ 55 венно переносится на двухмерный случай; в частности, поня- понятия частичного, верхнего и нижнего пределов сохраняют свои определения и свои свойства; точно так же в силе остаётся признак Коши и его доказательство. Что касается обоснования, то оно происходит в точной аналогии с одномерным случаем-;, единственное схгличие состоит в том, что теперь нам приходится пользоваться двухмерными вспомогательными теоремами, на- « пример, двухмерной теоремой V а. а р Черт. 8. О Черт. 9. о стягивающейся системе окрестностей, двухмерной леммой Гейне-Бореля и т. п.; все эти вспомогательные предложения доказываются так же просто и.тем же путём, как и соответ- соответствующие одномерные, так что нам нет надобности здесь иа них останавливаться. От двойного предела D) необходимо строго отличать по- повторные пределы lim(limz) и lim(limz); E) здесь вместо одного двухмерного мы имеем два последователь- последовательных одномерных предельных перехода; геометрическая картина, связанная с окрестностями точки (а, Ь) в плоскости (ху), здесь полностью исчезает; так, для получения lim(lim z) мы должны Ь сначала придать у какое-либо постоянное значение и, сделав таким образом величину z функцией одной переменной х, искать её предел при х—-а; этот предел может существовать для одних закреплённых значений величины у и отсутствовать
56 ЛЕКЦИЯ ВТОРАЯ для других её значений; если он существует для всех значе- значений у, лежащих в некоторой окрестности V точки (или сим- символа) Ь, то в этой окрестности \\mf(x, у) есть функция одной переменной у, и мы можем искать её предел при у—»- Ь\ этот последний, если он существует, и есть lim (lim z). Может случиться, что оба повторных предела E) суще- существуют, .в то время как двойной предел D) отсутствует. Рас- Рассмотрим, например, поведение функции 2xv в соседстве начала координат (то, что эта функция в самом' начале координат не определена, не имеет здесь никакого зна- значения, ибо в определении как двойного, так и повторных пре- пределов величина f(a,b) вовсе не участвует; если это угодно, можно приписать функции г при х^у = 0 любое значение). При постоянном х=?0 limz^O; при постоянном y=^=G lira 2=0;. V-»0 л:-»0 следовательно, lim (lira z) = lira (lira z) = 0. *-»0 v_»3 j/-»0 x->0 С другой стороны, любая окрестность точки @, 0) содержит- как точки, в которых х^О, у=фО, так и точки, в которых х^у=^0; так как в точках первою типа z^=0, а в точках второго типа г=1, то оба числа 0 и 1 являются частичными пределами функции z при х—> 0, 󗻦 0; наличие же по- меш шей мере двух различных пределов показывае\, что lim гь х^0 не существует. Может иметь место и обратное положение вещей, когда* двойной предел D) существует, в то время как нет ни одного- из повторных пределов E); рассмотрим функцию . — , если xv=j?= О, О , если ху = О в соседстве начала координат; так как | z \ <^ е2 для всех то- точек круга х2-\-у2<^?2, то limz=O, с друтй стороны, при
ПРЕДЕЛЫ 57 постоянном и при х —>- и при у—>• 0 (а также при постоянном 0) sin — , а следовательно, и функция г, не стре- стремится ни к какому пределу; таким образом, уже пределы lira z(y=^=0) и Нтг(лт=^=0) отсутствуют; тем более, конечно» *-»о у-»о не может быть и речи о существовании какого-либо из повтор- повторных пределов E). Можно, однако, показать, что в случае, когда все три предела D) и E) существуют, они необходимо совпадают между собой. В самом деле, пусть, например, lira (lira z) = с; Ь F) пусть V — любая окрестность числа (или символа) с и U — любая окрестность точки (а, Ь). В силу F) существует такая окрестность А числа (или символа) а, что для всех У lim z ? V; у —> b эта окрестность _A есть некоторый отрезок оси Ох; очевидно, мы можем выбрать на этом отрезке число х0 столь близким О Черт. 1и. к а, чтобы точка (лг0, Ь) принадлежала окрестно- окрестности U (черт. 10). Закрепив это значение лг0, мы в силу х0 ? А имеем: но согласно определению понятия предела это означает, что для любой окрестности V числа (или символа) сХь можно ука- указать такую окрестность ВХо числа (или символа) Ь, что г ? V при лг^лг0 и любом у?ВХо; ьо, очевидно, ничто не препят- препятствует нам выбрать окрестность V' столь малой, чтобы V d V (ибо сХв ?V); с другой стороны, так как точка (*0. b)?U, то мы можем выбрать число .Уо(Е?ао столь близ-
58 ЛЕКЦИЯ ВТОРАЯ ким к Ь, чтобы и точка (лг0, у0) принадлежала окрестности U (черт. 10). В силу v0 € ВХо при этом z ? V d V в точке (лг0, va). Вспом- Вспомним теперь, что U — любая окрестность точки (а, Ь) и V — любая окрестность числа (или символа) с; то, что мы нашли точку (х0, у0) ? U, для которой z ? V, показывает поэтому, что с есть частичный предел величины z при х—-а, у—*Ь. Если, как мы допустили, lim z существует, то он является единствен- единственная ним частичным пределом и потому должен равняться с, что и требовалось доказать.
ЛЕКЦИЯ III ФУНКЦИИ Что такое функция. — Область определения функции. — Непрерыв- Непрерывность. — Ограниченные функции. — Основные свойства непрерывных функций. — Непрерывность элементарных функций. — Колебание функции в точке. — Точки разрыва. — Монотонные функции. — Функции с ограниченной вариацией. Что такое функция. То определение понятия функцио- функциональной зависимости, которое мы напомнили и в некоторых отношениях исследовали в самом начале первой лекции, роди- родилось и окончательно восторжествовало в тяжёлой борьбе; пе- пережитки и рецидивы этой борьбы далеко не ликвидированы ещё и в настоящее время, хотя, кажется, научная актуальность приведённого нами определения никем уже не оспаривается '). Основным лозунгом этой борьбы было и остаётся преодоление того засилия аналитического аппарата, которое с 18-го сто- столетия' тяготеет над идеей функциональной зависимости. Это засилие, это превращение аналитического выражения из удоб- удобного орудия исследования в деспотического властителя идеи функции, диктующего ей свои законы, сколько-нибудь полно изжито только в пределах самой математической науки; в прикладных науках и в преподавании (даже в высшей тех- технической школе) оно ещё в весьма значительной степени со- сохранило своё влияние, и почти каждый инженер, формально признавая научное определение функциональной зависимости (в котором ни единым словом не упоминается об аналитиче- аналитическом выражении), всё же представляет себе функцию прежде всего как формулу, как аналитическое выражение и вне этой ') Если не считать интуиционистской школы; впрочем, её кон- концепция функциональной зависимости во всяком случае не знаме- знаменует собой возврата к старым представлениям.
60 ЛЕКЦИЯ ТРЕТЬЯ связи, как правило, вообще не умеет мыслить о функциональ- функциональной зависимости; этим он существенно отличается от матема- математика, привыкшего принимать всерьёз определения своих поня- понятий и*потому при слове «функция» всегда мыслящего о том соответствии между двумя множествами, о котором говорит- говорится в определении этого понятия, никак не ассоциируя его с каким-либо аналитическим аппаратом. Вы поймёте, что ввиду такого поло- положения вещей нам придётся несколько остановиться на идее функциональной за- зависимости и некоторых Связанных с нею понятиях и представлениях. Будет, может быть, луч- Черт. 11. ше всего, если мы, отказав- шисьот проведения полного и систематического анализа (на кото- который у нас и нехвагило бы времени), просто остановимся на нескольких типичных острых конфликтах, возникающих здесь между пониманием функциональной зависимости, с одной сто- стороны, математиком, а с другой—человеком, воспитанным на устаревших традициях; конфликты этого рода мы, профессора университетов, ежегодно имеем с нашими студентами-перво- студентами-первокурсниками, приносящими из воспитавшей их средней школы навыки и традиции минувших столетий. Пусть речь идёт об аналитическом выражении функции, i рафическое изображение которой мы имеем на черт. 11. Один взгляд на этот простой график убеждает нас, что мысль о реальной величине у, изменения которой происходят со- согласно указываемому им закону, не содержит в себе ни- ничего неприемлемого; и в этом утверждении, пожалуй, инженер или физик будет чувствовать себя даже увереннее, чем ма- математик. Но для поставленной задачи — выразить данную функцию анатитическн — математик сразу напишет единственное прием- приемлемое с ею точки зрения решение: A)
ФУНКЦИИ 61 Вот тут и начинается конфликт. Инженер (условимся для краткости называть этим именем представителя устаревших традиций, присутствующие среди вас товарищи-инженеры не осудят нас за это) немедленно возражает, заявляя математику, что тот «написал не одну, а две функции». На это матема- математик отвечает: а) что «написать функцию» вообще нельзя, а можно писать только аналитические выражения; 6) что он, математик, действительно написал два аналитических выражения, точно указав при этом, при каких значениях независимой пе- переменной х следует употреблять то или другое из этих выра- выражений для вычисления соответствующего значения функции у; в) что задание A) в силу принятого определения функциональ- функциональной зависимости определяет в точности одну функцию, ибо на основании этого задания каждому значению величины л: соответствует только одно значение величины у; г) что, нако- наконец, аналитическая запись A) в точности воспроизводит зави- зависимость, графически заданную на черт. 11, и тем самым пол- полностью решает поставленную задачу. Математик мог бы ещё добавить (но не делает этого из педагогических соображений), что в случае настойчивых требований он сумел бы представить функцию черт. 11 и одной формулой У= 1—1*1. B) годной для всех х, и не делает этого лишь потому, что счи- считает задание A) практически удобнее задания B), в то время как с принципиальной стороны эти два задания в его глазах совершенно равноправны. Он идёт ещё дальше и настаивает, ссылаясь на определение функциональной зависимости, на том, что, например, )х при ^ при лг=О, 1 -f- х при х ^> О есть полноценное задание одной единственной функции (черт. 12). Мы не знаем, что может возразить на всё это инженер, но на основе личного опыта тем не менее берёмся сделать прогноз: если он и ничего не возразит, он всё же уйдёт не- неудовлетворённым; привитые годами навыки не изжить, конечно, одной краткой дискуссией.
62 ЛЕКЦИЯ ТРЕТЬЯ В другой раз математик расскажет определение так назы- называемой «функции Дирихле»: ¦=U: если х— рациональное число, если х—иррациональное число. Инженер в недоумении спросит: «Какая же это функция? Её нельзя ни записать формулой, ни изобразить графиком!» На это математик возразит: а) что yt . в определении функциональной зависимости ни словом не упо- упоминается ни об аналитическом выражении, ни о геометриче- '' ; ском изображении функции и что 2 поэтому полноценность задания $ Т~ функциональной зависимости ни- нисколько не зависит от того, мо- может ли определяемая этим зада- заданием функция быть выражена ана- аналитически или изображена геоме- ерт' " трически, б) что формулиро- формулированное им определение функции Дирихле относит каждому значению величины х единственное значение величины у и потому является безукоризненно пол- полноценным, в) что, наконец, геометрическое изображение функ- функции Дирихле действительно затруднительно, в то время как выразить её формулой весьма просто: для этого достаточно обозначить её через f(x). Инженер, вначале слушавший спокойно, при последнем замечании испытывает взрыв искреннего возмущения, в ре- результате которого возникает следующий диалог: И. — Да разве же это — формула? М. - Что вы называете формулой? И. — Ну, какое-нибудь аналитическое выражение _у^лг2 — х3 или v = sinx, но какая же формула y=f(x)? М. Очень хорошо. Значит, запись y=sinx для извест- известной функции, называемой синусом, по-вашему, является ана- аналитическим выражением, а запись y=:f(x) для функции Ди- Дирихле таковым не является? Какое же принципиальное различие заставляет вас столь различно оценивать символы sin и /( )?
ФУНКЦИИ 63 И. — Но ведь каждый грамотный человек знает, что означает формула v = sinje, а обозначение y^f(x) для того, что вы называете функцией Дирихле, сейчас вами придумано и никому неизвестно! М. — Вот мы с вами, кажется, и договорились; указанное вами различие (которого я не отрицаю), как вы сами пони- понимаете, им^ет не принципиальный, а исторический характер. Ведь был такой момент, когда кто-то в пэрвыЧ раз предложил обозначать через sin л: функцию, для которой до тех пор ни- никакого общепринятого обозначения не было; этот момент для функции v=sinx был тем же, чем настоящий момент является для функции Дирихла у = /(лг); скажете ли вы, что до этого момента функция v = sinjr была аналитически невыразимой, а после него, особенно когда предложенное обозначение при- привилось и стало общепринятым, сделалась аналитически выра- выразимой? И если предложенное мною сегодня обозначение y=f(x) для функции Дирихле чепез несколько лет будет принято всем научным миром, скажете ли вы тогда, что оно стало формулой, аналитическим выражением, а сача функция Дирихле — аналитически выразимой? Нам ясно, конечно, что такое апеллирующее к научной моде понимание аналитической выразимости ни малейшего математического значения не имеет; если же от этого понимания отказаться, то вы не можете не признать, что символ /( ) принципиально столь же полноценен,, как и символ sin, и что, стало быть, функция Дирихле в та- такой же мгре и в таком же смысла аналитически выразима,, как синус и косинус; вообще дискуссия об аналитической вы- выразимости той или другой функции во всех случаях должна быть признана бессодержательной, так как мы можем обозна- обозначить эгу функцию любым символом и с полным основанием- считать это обозначение её аналитическим выражением. Нако- Наконец, могу вам сообщить, что мы умеем выражать функцию- Дирихле и с помощью привычных вам символов; но мы почти никогда не пользуемся этим выражением, потому что оно сложно- и не даёт возможности узнать что нибудь существенное о* свойствах этой функции, в то время как данное нами бесфор- бесформульное определение показывает все эти свойства, как на ладони. Мы вообще не любим фетишизировать аналитических выражений, мы охотно пользуемся ими в тех случаях, когда они помО1ают нам исследовать данную функциональную зави-^
64 ЛЕКЦИЯ ТРЕТЬЯ симость; и мы без всякого сожаления отбрасываем их, как негодное орудие, там, где исследование проще вести без них, жак это имеет место, например, в только что рассмотренном нами случае. Мы должны признать дискуссию на этом законченной, так как мы снова не видим, что бы мог возразить наш инженер; •с другой стороны, наш математик с такой чёткостью охарак- охарактеризовал отношение современной математической науки к «связи между функцией и аналитическим выражением, что вы- выводы ясны вам сами собой и не нуждаются ни в каких ком- комментариях. Область определения функции. Коснёмся ещё только одного вопроса, тесно связанного с предыдущим. Для того ¦чтобы мы могли считать функцию V^f(x) заданной, вовсе не всегда необходимо определить её значения для всех без исключения значений величины лг; очень часто случается, что .сколько-нибудь актуальным бывает только тот или другой участок всей совокупности этих значений, так что определять функцию f{x) вне этого участка представляется бесцельным, а иногда .и нелепым; при этом поводы для такого ограничения совокупности рассматриваемых значений величины х могут быть .самые разнообразные, как чисто логические, так и более ре- .альные; отчасти мы уже говорили об этом в лекции I. Если мы, например, определяем величину f(x) как периметр пра- правильного лг-угольника, вписанного в окружность радиуса 1, то само собой ясно, что этим условием она определена для !всех целых х^З, и только для них; мы говорим, что y^f(x) есть в этом случае функция от х, определённая на множестве всех целых х^З. Формально ничто не мешает нам, конечно, доопределить функцию f(x), произвольным об- .разом задавая её значения для всех остальных значений вели- величины лг; но если в этом нет надобности, то мы этого и не делаем, оставляя функцию f(x) никак не определённой вне вышеупомянутого множества. Другой пример: если в данном •физическом исследовании х означает температуру какого-либо тела, выраженную в градусах Цельсия, то, вероятно, будет ¦совершенно бессмысленно и бесцельно определять функцию f(x) для значений величины лг, меньших чем—273. Было бы, таким образом, нецелесообразно требовать от /каждой функции у=f(x), чтобы она была определена для
функции 65 \ всех значений величины х, ибо, настаивая на этом, мы должны были бы во всех реальных задачах произвольным, искусствен- искусственным и совершенно ненужным образом расширять естественную область тех значений независимой переменной, для которых представляет интерес рассматривать данную функцию. Это заставляет нас внести необходимое уточнение в самое опреде- определение функциональной зависимости. Условимся говорить, что величина y = f(x) есть функция величины х. определённая на множестве М вещественных чисел, если каждому значению х?М соответствует неко- некоторое определённое значение величины у. Это определение функциональной зависимости, несколько более точное, чем данное нами в начале лекции I, сразу разрешает все сомнения и позволяет нам при исследовании каждой отдельной функции ограничиться тем множеством значений величины лг, той есте- естественной «областью определения» функции у, какая диктуется целью данного исследования. Выбор этой области определения функции может, как мы уже знаем, диктоваться как чисто математическими, так и ре- реальными, например физическими, соображениями. Здесь необ- необходимо только предостеречь вас от одного печального смеше- смешения, к сожалению,* ещё очень часто встречающегося и основанного всё на той же рудиментарной традиции — не де- делать различия между функцией и аналитическим выражением. Область определения функции часто хотят поставить в зави- зависимость от того, в какой области имеет смысл то или другое аналитическое выражение. Так, говорят, что «областью опре- определения функции 1 1 —л:-' является отрезок [—1, -|-1]» или «областью определения функции lgJt является полупрямая л:^>0». На самом деле здесь речь идёт, конечно, не об об- области определения какой-либо функции, а о той области, в которой имеет смысл данное аналитическое выражение. Так, очень может случиться (математика знает огромное множество примеров этого рода), что нам придётся иметь дело с некото- некоторой функцией y^f(x), определённой на отрезке [0, 2] и действительно интересующей нас на всём этом отрезке, и что для 5 А. Я. Хинчин. Восемь лекции
66 ЛЕКЦИЯ ТРЕТЬЯ из этого мы никак не можем заключить, что отрезок [1, 2J лежит вне области определения нашей функции и потому нас интересовать не должен; напротив, мы будем искать для от- отрезка [1, 2] другое аналитическое выражение этой функции (основываясь, конечно, на её определении); а если нам не удастся такого найти, то будем исследовать её на этом участке другими, не аналитическими методами. Область определения каждой функции выбирается на основе соображений либо чисто математических, либо прикладных; но во всех случаях эти соображзния исходят из существа дела и не должны итти на поводу у чисто формальных осо- особенностей того или другого специального аналитического ап- аппарата. Непрерывность. Приступая к изучению функциональных зависимостей, мы должны, конечно, прежде всего с помощью целесообразной классификации внести хотя бы некоторый порядок в предстоящий нам многообразный мир. Первым та- таким классифицирующим и организующим принципом служит обычно (и с полным основанием) разделение всех функций на непрерывные и разрывные, причём математический анализ фак- фактически имеет дело почти исключительно с непрерывными функциями, лишь в сравнительно редких случаях привлекая к рассмотрению и простейшие из разрывных. Непрерывные функ- функции обладают целым рядом особых свойств, которых лишены, вообще говоря, функции разрывные; благодаря этим свойствам исследование и применение непрерывных функций весьма зна- значительно облегчаются, так что изучение этих свойств стано- становится для анализа чрезвычайно важным делом. Мы говорим, что функция v = /(jc) непрерывна щ,и х = а (или, короче, в точке а), если lim/(л:) :=/(«), или, чго в х-*а силу определения понятия предела равносильно тому же, если для любой окрестности V числа f(a) найдётся такая ок- окрестность U числа а, что для любого x?U мы имеем f(x)?V. Таким образом, для непрерывности функции в точке а требуется, во-первых, существование предела limf(x) и, во- х-^-а вторых, совпадение этого предела с тем значением, которое функция принимает при х = а. Само собой разумеется, что второе из первого ещё не вытекает, как показывает пример
функции 67 функции 2 при при х = 0. F> По поводу этого определения надо прежде всего заметить, что гак понимаемая непрерывность есть локальное (местное) свойство функции, т. е. такое свойство, которым функция может обладать в одной точке и не обладать в другой; так, функция C) разрывна (т. е. не непрерывна) при лг=О и не- непрерывна при любом другом значении лг; это — очень важное обстоятельство, которое никогда не надо упускать из вида. Далее, мы называем функцию непрерывной в данном от- отрезке [а, ?>], если она в вышеприведённом смысле непрерывна в каждой точке этого отрезка; при этом в точке а требуется лишь непрерывность справа,т.е. соотношение Пт/(лг)=/(е), .v->a+0 а в точке b—непрерывность слева, определяемая аналогичным соотношением, которое вы напишете сами (если имеется в виду открытый отрезок (а, Ь), то, разумеется, в точках а и (ют функции ничего не требуется). Заметим кстати, что матема- математики давно уже пользуются очень удобным обозначением lira /(*)=/(а4-0), lira f(x) = f(a — 0), х-*-а-\-0 х->а—0 с помощью которого определение непрерывности функции f(x) в точке а м'ожно записать посредством весьма простого соот- соотношения )=/(в—0)=/(о); это обозначение не может привести ни к каким смешениям, если только помнить, что /(а-\~0) и /(а — 0) представляют собой не значения функции f(x) в каких-либо точках, а пре- пределы таких значений при некоторых определённых изменениях величины х. Ограниченные функции. Теперь мы долж 1ы ознакомиться с другим свойством функций, которое в противоположность свойству непрерывности является не локальным, а интеграль- интегральным, т. е. может быть определено сразу для любого множества значений независимой переменной, не нуждаясь в предвари- предварительном определении для отдельных её значений (в отдель- отдельных точках). 5"
68 ЛЕКЦИЯ ТРЕТЬЯ Функция y=f (х) называется ограниченной на множестве М. если все значения, принимаемые ею на этом множестве, при- принадлежат некоторому отрезку; очевидно, вместо этого мы мо- можем предъявить и совершенно равносильное требование: суще- существует такое положительное число с, что \f(x)\<^c для всех х?М. Более детально, мы называем функцию у ограниченной сверху (снизу) на М, если существует такое число с, что/(лг)<^ <^с(/(лг)^> с) для всех х ? М. Функция просто ограниченная должна быть для этого, очевидно, ограничена как сверху, так и снизу. Свойство ограниченности не есть, подобно свойству непре- непрерывности в отрезке, совместное выполнение известных требо- требований в каждой точке этого отрезка. Число с, о котором гово- говорится в определении ограниченности, выбирается сразу для всего множества М. В каждой отдельной точке этого множе- множества, если функция в ней определена, такое число с существует тривиальным образом: для точки х достаточно положить, например, c=\f(x) -\-l. Но функция, определённая, напри- например, в каждой точке некоторого отрезка, может быть и не- неограниченной в этом отрезке; чтобы в этом убедиться, вспом- вспомним, что tg х возрастает безгранично п^и х—*-^-—0, так что функция не ограничена в отрезке 0, -^ . Как для многих интегральных свойств, можно, однако, и для ограниченности функции на данном отрезке указать такое локальное свойство, выполнение которого в каждой точке данного отрезка равносильно выполнению рассматриваемого интегрального свойства. Условимся называть функцию у огра- ограниченной в точке х, если она ограничена в некоторой окрест- окрестности U числа х (обратите внимание, что здесь локальное свой- свойство определяется через ранее определённое интегральное; в случае непрерывности дело обстояло как раз наоборот). Мы можем теперь утверждать, что для ограниченности функции y=f(x) на отрезке [а, Ь] (закрытом) необходимо и достаточно,
функции 69 чтобы она была ограничена в каждой точке этого отрезка. Необходимость этого условия вытекает из самих определений и не нуждается в доказательстве; чтобы показать его доста- достаточность, допустим, что каждое число х отрезка [а, Ь] может быть окружено окрестностью Ux, в которой функция у ограни- ограничена; применяя лемму Гейне-Бореля, мы находим, что отрезок [а, Ь] покрывается конечным числом отрезков = Д,, Д2,..., Дп, в каждом из которых у ограничена. Если l,v|<^c,- B отрезке Д.(/= 1,2,.. . ,и) и если с есть наибольшее из чисел с1? с2,...,сп, то |дМ<Сс для всех х?[а< Ь\, чем наше утвержде- утверждение и доказано. Условимся называть множество чисел N ограниченным, если все входящие в него числа могут быть заключены в неко- некоторый отрезок. Очевидно, что ограниченность функции у =/(дг) на множестве М равносильна ограниченности множества N значений, принимаемых этой функцией, когда величина х «пробегает» множество М, т. е. принимает всевозможные зна- значения, принадлежащие этому множеству. Само собою ясно, что означают термины «множество N ограничено сверху (или справа)» и множество N ограничено снизу (или слева)». Условимся называть число р верхней гранью множества N, если: 1) множество N не содержит чисел, больших чем р, и 2) в любой окрестности числа р найдётся число, принадлежа- принадлежащее этому множеству. Подобным же образом нижней гранью множества N мы назовём такое число а, что: 1) в множестве N нет чисел, меньших чем а, и 2) в любой окрестности числа а найдётся число, принадлежащее множеству N. Очевидно, что множество, имеющее верхнюю (нижнюю) грань, ограни- ограничено сверху (снизу). В анализе играет значительную роль обратное предложение: Теорема. Всякое множество чисел, ограниченное сверху (снизу), имеет единственную верхнюю (нижнюю) грань. В частности, всякое ограниченное множество имеет как верхнюю, так и нижнюю грань. Доказательство. Разобьём все вещественные числа на два класса А и В по следующему принципу: х ? А, если вправо от х имеется хотя бы одна точка множества N, и х?В — в противном случае. Вы сами без труда убедитесь, что это разбиение есть сечение; пусть а — рубеж этого сечения; по- покажем, что а есть верхняя грань множества N.
70 ЛЕКЦИЯ ТРЕТЬЯ Прежде всего убедимся, что вправо от а не может быть то- точек множества N; в самом деле, если $?.N и Р^>а. то, пола- полагая у = — (а -\- Р), мы имеем а<^у<^р;изу^>а следует у € Д а из P^>Y и Р € -^ следует у € ^. и> таким образом, мы пришли к противоречию. Далее, пусть ?/=(а,,аг)(а, <^а<^а2) — любая окрестность точки а. Очевидно, что а, ? Л, а2?В; в силу первого из этих соот- соотношений имеются точки множества /V вправо от а,, в силу же второго соотношения таких точек нет вправо от сс2; значит, такие точки имеются в отрезке (а,,а2). Число а обладает, таким образом, обоими свойствами верхней грани, существо- существование которой тем самым доказано. Эта грань единственна. Действительно, если бы множе- множество N имело две верхние грани [5 и fi' (fl <^ P'), то мы немед- немедленно получили бы противоречие, замечая, что, с одной сто- стороны, множество N не может содержать чисел ^> р (так как р есть его верхняя грань), а с другоЧ стороны, оно должно содер- содержать такие числа в силу того, что их должна содержать сколь угодно малая окрестность числа р'. Очевидно, что для случая нижней грани теорема доказывается совершенно аналогично. Наглядно мы должны представлять себе грани данного ограниченного множества, как концы наименьшего отрезка, содержащего вес числа этого множества. Очевидно, мы можем определить верхнюю грань данного множества и как наимень- наименьшее из тех чисел с, по отношению к которому все числа х ? N удовлетворяют неравенству х^с, и что аналогичное опреде- определение возможно и для нижней грани. Очень важно иметь в виду, что каждая из граней данного ограниченного множества /V может как принадлежать, так и не принадлежать этому множеству. Так, закрытый отрезок содер- содержит свои грани, а открытый их не содержит; множество чисел вида —, где п—любое натуральное число, содержит свою верхнюю грань (число 1), но не содержит своей нижней грани (числа 0). Если функция y = f(x) ограничена на множестве М, то, как мы уже заметили, множество N значений, принимаемых ею на этом множестве, ограничено и, следовательно, имеет,
функции 71 в сипу доказанной теоремы, верхнюю и нижнюю грани. Эти грани множества N мы условимся называть гранями функции у на множестве М. Таким образом, всякая функция, ограни- ограниченная на данном множестве, имеет на нём единственную верхнюю и единственную нижнюю грань. Каждая из этих граней может быть некоторым значением данной функции; тогда она служит наибольшим или наимень- наименьшим значением этой функции на данном множестве; но может случиться, что та или другая из граней вовсе не принадлежит к совокупности значений функции на данном множестве; в та- таком случае функция на этом множестве вообще не имеет наи- наибольшего (или наименьшего) значения. Так, функция v__ i х при 0==?л:<1, . у | 0 при jc=1 K ' имеет, очевидно, грани 0 и 1 на отрезке [0, 1]; нижняя грань является (наименьшим) значением этой функции (при jt:=O и jc= 1); верхняя же грань—число 1 —среди её значений не встречается; функция не имеет наибольшего значения на отрезке [0, 1]. Основные свойства непрерывных функций. Теперь мы установим четыре важнейших свойства непрерывных функций. Лемма. Если функция y^f[x) непрерывна в точке а и если f{a)<^b, то существует такая окрестность U точки а, что для всех x?U мы имеем f(x)<^b. Это — почти тривиальный вывод из самого определения непрерывности функции в точке. В самом деле, если числа аир выбраны так, что a<^f(a) <^ [3 <^ Ь, то в силу этого опре- определения для всех х некоторой окрестности числа а мы должны иметь что и требовалось доказать. Само собою ясно, что лемма остаётся верной, если всюду в её формулировке знак <^ мы заменим знаком ~^>. Теорема 1. Функция y = f(x), непрерывная на закры- закрытом отрезке [а, Ь\, ограничена на этом отрезке. Для доказательства заметим, что функция у, будучи непре- непрерывной на отрезке [а, Ь], непрерывна в каждой точке этого отрезка; пусть X — любая точка отрезка [а, Ь\; по самому опре-
72 ЛЕКЦИЯ ТРЕТЬЯ делению непрерывности существует такая окрестность U чи- числа "а, что для любого x?U /(X)—1</(*)</(Х) + 1; но это показывает, что функция f(x) ограничена в окрестности U (все её значения содержатся в некотором отрезке); значит, она ограничена в точке А (ибо ограниченность в точке нами определена как ограниченность в некоторой окрестности этой точки). Будучи же ограниченной в любой точке отрезка [а, Ь], функция у, как мы видели выше, должна быть огра- ограниченной и во всём этом отрезке. Теорема 2. Функция y = f (х), непрерывная на закры- закрытом отрезке [а, Ь], имеет на нём наибольшее и наимень- наименьшее значения. Доказательство. В силу теоремы 1 функция у ограничена на отрезке [а, Ь] и, значит, имеет на нём нижнюю грань а и верхнюю грань р; надо только показать, что эти грани являются значениями функции у. Покажем это, напри- например, для верхней грани р. Если бы р не было значением функции v в отрезке [а, Ь\, то это означало бы, что f(x)<^$ для всех чисел х этого отрезка. Пусть fiv — любое число, заключённое между f(x) и р, так что f{x)<^ $x.<^ р. В силу нашей леммы мы можем окружить точку х окрестностью LJх, для любой точки х' ко- которой f(x')<^$v- Система окрестностей Ux, построенных для всех точек х отрезка [а, Ь], покрывает этот отрезок и в силу теоремы Гейне-Бореля содержит конечную подсистему окрест- окрестностей Ux,, Ux,, ¦ ¦ ¦ , UXn, также покрывающую отрезок [а, Ь\. Но для любого числа х" отрезка Ux мы имеем f(x') ^ обозначая через ?S' наибольшее из чисел 'pXi, ^, мы видим, что для всех х ? [о, Ь\ вследствие чего C не может быть верхней гранью функции f(x) на отрезке [а, Ь\ Полученное противоречие и доказы- доказывает теорему. Выше [см. D)] мы видели пример ограниченной функции, не имеющей в данном отрезке наибольшего значения; мы знаем теперь, что это возможно лишь для разрывных функций; и действительно, функция D) разрывна при х=\.
функции 73 Важно ещё подчеркнуть, что теорема 2 справедлива топько для закрытых отрезков; так, даже столь простые функции, как у==х и v^x2, лишены наибольших и наименьших зна- значений в открытых отрезках. - Теорема 3. Если функция f{x) непрерывна на отрезке \а, Ь\ и если f(a)<^p.<^j(b) или /(а) >М >/(#), то най- дётся такое число с в отрезке [а, Ь\, что /(c) = ji. Короче говоря, непрерывная функция между любыми двумя своими значениями обязательно проходит через все промежу- промежуточные значения. Разумеется, разрывные функции, вообще говбря, не обладают этим свойством; так, функция Дирихле в любом отрезке принимает значения 0 и 1, но нигде не при- принимает ни одного промежуточного между ними значения; для функции D) мы имеем /("о")—"о"' /U) = 0> н0 ни Для од- одного х отрезка (¦=-, 1J f(x) не принимает промежуточного значения -j . .Доказательство теоремы 3. Пусть сначала ji = О, /(а)<^0, /(#)^>0; требуется доказать, что /(-*;) обращается в нуль в некоторой внутренней точке отрезка [а, Ь]. Допустим, что это не так, и разделим отрезок [а, Ь\ пополам. Очевидно, что в одной из двух половин f(x) имеет разные знаки в ксн- цах половины; эту половину мы снова делим пополам и снова выбираем ту половину, в концах которой f(x) имеет разные знаки, и т. д. Мы получаем, таким образом, стягивающуюся систему отрезков; пусть а — их общая точка, по предположе- предположению, /(а)=^=0, но если /(а)^>0, то в силу леммы стр. 71 мы имеем f(x)~^>0 для всех х некоторой окрестности (J точки а; это же невозможно, так как U содержит бесчислен- бесчисленное множество отрезков нашей стягивающейся системы, в концах каждого из которых f(x) принимает разные знаки. Тем же путём мы убеждаемся, что f(a) <^ 0 невозможно. Полученное противоречие и доказывает наше утверждение. Наконец, если ji=^=O, то для доказательства теоремы 3 достаточно применить только что полученный нами результат к функции f(x)— p. Прежде чем формулировать четвёртое свойство непрерывных функций, мы должны ввести одно новое понятие, имеющее
74 ЛЕКЦИЯ ТРЕТЬЯ для изучения этого класса функций важнейшее значение. Вы помните, конечно, что непрерывность есть локальное свой- свойство функций; это положение нисколько не меняется от того, что мы говорим о «функции, непрерывной на данном отрезке», ибо непрерывность на отрезке означает не больше, чем не- непрерывность в каждой точке этого отрезка, и потому ни в какой мере не изменяет локального характера этого понятия. Можно, однако, выразить идею непрерывности функции на данном отрезке и некоторым другим образом, причём она получает интегральный характер, т. е. непосредственно не исходит ни из каких локальных свойств, а характеризует функ- функцию сразу во всём отрезке. Условимся называть функцию y = f(x) равномерно непре- непрерывной на отрезке [а, Ь\, если она обладает следующим свой- свойством: сколь бы мало ни было положительное число s, существует такое другое положительное число Ь, что для любых двух чисел х1 и х» отрезка [а, Ь~\, отстоящих друг от друга менее чем на 5, Вы видите, что это определение не приурочено ни к какой отдельной точке, а стремится охарактеризовать поведение функ- функции во всём отрезке [а, Ь], говоря, что в двух точкак, доста- достаточно близких друг к другу, значения функции должны быть также сколь угодно близки друг к другу. Понятно, почему этот вид непрерывности называют «равномерным»: вся специ- специфика его именно в том, что здесь требуется некая одинако- одинаковость в поведении функции во всех местах данного отрезка; точки ЛГ] и х2 могут быть взяты где угодно в отрезке [а, Ь\, лишь бы их взаимное расстояние не превышало числа 8. Совершенно ясно, что функция, равномерно непрерывная в отрезке [а, Ь], по необходимости непрерывна в каждой точке этого отрезка (а значит, и во всём отрезке), ибо в силу равно- равномерной непрерывности из \х — а|<^ 5 вытекает \f(x) — f(a)\<^e, т. е. для любой окрестности V(f(a)—e, f(a)-\-?) числа /(а) найдётся такая окрестность U (а — 8, a-j-5) числа а, что из x?U вытекает f(x)? V; а это и значит, что функция f(x) непрерывна при х = а. Чрезвычайно важно, что имеет место и обратное предложение, т. е. что из непрерывности функции у в любой точке (закрытого) отрезка [а, Ь] вытекает её райю-
функции 75 мерная непрерывность на этом отрезке; требование равномер- равномерной непрерывности не сужает, таким образом, класса непре- непрерывных функций (поскольку речь идёт о закрытом отрезке). Теорема 4. Функция y = f(x), непрерывная в каждой точке закрытого отрезка [а, Ь], равномерно непрерывна на этом отрезке. Для открытых отрезков теорема неверна. Так, функция v^sin—, очевидно, непрерывная в каждой точке открытого отрезка @, 1), не может быть равномерно непрерывной на этом отрезке, так как, сколь бы мало ни было Ь~^>0, можно найти (вблизи нуля) две точки, отстоящие друг от друга менее, чем на о, и вместе с тем такие, что разность значений функ- функции v в них больше, чем 1. Доказательство теоремы 4. Пусть функция у непрерывна в каждой точке отрезка [а, Ь\; тогда для любой точки х этого отрезка найдётся такое число Ьх ^> О, что |/(-к,) — f(x2)\<^L?' если х\ и хг принадлежат от- отрезку [х—Ьх, х--Ьх\. Обозначим через Д^ отрезок д: — -к- Ьх, х -\- -к- Ьх . Очевидно, совокупность всех отрез- отрезков \х покрывает отрезок [а, Ь]. Поэтому на основании лем- леммы Бореля существует конечная система М отрезков Дд., также покрывающая отрезок [а, Ь]. Пусть ё — длина наи- наименьшего из отрезков системы М, и пусть jc, и х2—две лю- любые точки отрезка [а, Ь], отстоящие друг от друга меньше чем на 2" S. Я утверждаю, что |/(лг,) — f(x2)\<C_? (чем тео- теорема 4 и будет доказана). В самом деле, точка jc, принадле- принадлежит какому-нибудь отрезку \х\х—-^ 8Х, х-\- -fc^A системы /И; но тогда точка jc2, отстоящая от хл менее чем на -^ 5 sg: 9 ох, принадлежит отрезку [х — ёх, х -\-Ьх], в который входит, конечно,- и л,; отсюда, по самому определению числа Ьх, мы действительно имеем !/(-*:,)—f(x2) <J?. Непрерывность элементарных функций. Вы, конечно, знаете* что алгебраическая сумма и произведение любого числа непрерывных функций также являются непрерывными функциями; отношение двух непрерывных функций непрерывно в каждом отрезке, в котором знаменатель не обращается в нуль;
76 ЛЕКЦИЯ ТРЕТЬЯ все эти предложения справедливы как в локальном, так и в интегральном понимании, т. е. независимо от того, имеем ли мы в виду непрерывность в точке или на отрезке, или, наконец, равномерную непрерывность. Доказательства всех этих предложений можно найти в любом курсе анапиза; они не представляют принципиального интереса, и здесь нам нет надобности на них останавливаться. Значительно интереснее вопрос о непрерывности так назы- называемых элементарных функций, т. е. того небольшого класса функций, с которыми оперирует элементарная математика и которые и в высшей математике полностью сохраняют своё ведущее значение. Сюда относятся прежде всего все функции, значения которых получаются из значений независимой пере- переменной применением шести основных алгебраических опера- операций, а затем — небольшое число трансцендентных функций: тригонометрические функции (прямые и обратные), показатель- показательные и логарифмические функции; сюда же относятся, нако- наконец, и всевозможные конечные комбинации перечисленных видов функций, например, л:гA—jtrsinx) или cos 2*3. Все элементарные функции в основном непрерывны; лишь некоторые из них претерпевают разрывы в некоторых отдель- отдельных точках — при х=0, tgx при х = -^, и т. д. 1) . Не для всех элементарных функций, однако, доказательство этого факта легко; в курсах анализа обычно этот вопрос не рас- рассматривается во всей полноте; между тем, он имеет важное значение, и нам придётся сделать по этому поводу несколько замечаний. Прежде всего очень легко устанавливается непрерывность всех многочленов при любых значениях независимой перемен- переменной; в самом деле, так как для любого многочлена Р (х) и для любого числа а разность Р(х) — Р{а) алгебраически де- делится без остатка на разность х — а (теорема Безу), то ' Р{х) — Р(а) =(x—a)Q(x), где Q(x) — многочлен; отсюда при х—>-а, так как многочлен !) Заметим, что функции — и tg x непрерывны во всей области своего определения. В точках разрыва, о которых идёт речь, функ- функции эти не определены. О таких точках разрыва см. стр. 81.
функции 77 Q(x), очевидно, ограничен в точке а, мы имеем Р(х)—>-Р(а), т. е. многочлен Р(х) непрерывен в точке а. Далее, из не- непрерывности многочленов непосредственно вытекает непрерыв- непрерывность всякой рациональной дроби , в любом отрезке, в ко- И2 (х) тором Р2 (х) ни в одной точке не обращается в нуль. Столь же просто вопрос решается и для тригонометриче- тригонометрических функций. Формула о х-\- а . х — а sinx — sin a = 2 cos —-х— sin —^~- и вытекающее из неё неравенство х — а I sin л:— sin a I sin показынают, что sinx—>-sinc при х—»• а, т. е. что синус — непрерывная функция. Совершенно аналогично устанавливается непрерывность косинуса. Отсюда функция . sin х у = tg х = J COS X непрерывна при всех значениях х, для которых cosJtr^O, т. е. для значений вида х =^= B k -\- 1) -^, где k — любое целое число. Сложнее доказательство непрерывности показательной функ- функции ах. Допустим для определённости, что* а~^>\, так что функция у = ах возрастающая. Покажем сперва, что ах—»-ао=1, когда х—>-0. Снова для определённости допу- допустим, что х—->--]-0, т. е. будем рассматривать ах лишь для положительных значений х; случай х —> 0 разрешается совершенно аналогично. При х ^> 0 ах ^> 1, и чтобы доказать, что при х—*--]-0 функция ах—»-1, надо только убедиться, что, сколь бы мало ни было ?^>0, ах <^ 1 -|- е при достаточно малых х. Но для любого натурального числа я откуда (l-f~e)"—«--j-oo при п—*--|-эо. Значит, при доста- достаточно большом п а так как ах — возрастающая функция, то и для всех доста-
78 ЛЕКЦИЯ ТРЕТЬЯ точно малых х т. е. действительно а* —*¦ \ при х —>¦ 0. Дальнейшее уже просто. Соотношение а* — а* = яа (а*-* — 1) показывает, что при х—>-а функция ах имеет пределом а", т. е. что эта функция непрерывна при всех значениях х. Вопрос о непрерывности иррациональных, логарифмических и обратных тригонометрических функций может теперь быть решён на основании общей теоремы о непрерывности обрат- обратных функций: если функция у = f (х)— непрерывная и возра- возрастающая на отрезке [а, Ь\, то обратная функция х= w(у) также непрерывна на отрезке [a, j$], где а = /(я), р = /(?). В самом деле, пусть у— любая точка отрезка [a, jj]. Надо доказать, что lim <о (у) = to (у). Пусть сначала у—>-у—U' T- е- У приближается к у снизу; так как вместе с функцией / (х) и обратная функция ¦& (у) также — возрастающая, то lira (p(v) во всяком случае сущест- v->y—0 вует; обозначим этот предел через с и покажем, что с=й('(). Так как функция / (х) непрерывна и 'о (у) —»¦ с при у —>¦ у — О, то при у—>-у — 0 y = f[y(y)]—*f(c), откуда /(с) = у; но это непосредственно даёт: с = ъ [/(с)] = ъ (у), т. е. lim '-?(v) = 'f (у); j»-»t-o а так как, очевидно, мы тем же путём легко убеждаемся, что и lim (?(v) = ?(y), то lim ф (у) = у (у), что и требовалось доказать. Для того чтобы иметь возможность без специального ис- исследования утверждать непрерывность таких комбинированных
функции 79 элементарных функций, как Igsinx, 23x'~iJl и т. п., нужна ещё следующая «теорема о непрерывности функции от функции»: Если y = f(x)—функция, непрерывная при а^х^Ь, az=y(y) — функция, непрерывная при asgу ^ р> где а и $ суть соответственно наименьшее и наибольшее значения функции f(x) на отрезке [а, Ь], то функция z—щ [/(*)] непрерывна на отрезке [а, Ь]. Доказательство. Пусть с—любая точка отрезка [а, Ь], /(с) —у, -5(у) = ф[/(с)] = С пусть W — любая окрест- окрестность точки ?; в силу непрерывности функции '-о (у) сущест- существует такая окрестность V точки у. что '¦? (у) € W ПРИ У 6 V". наконец, в силу непрерывности функции f(x) существует такая окрестность О точки с, что при x?U мы имеем f{x)?V, a значит, ш [/ (х)] g W. Так как W есть любая окрестность точки ч^/[<р(с)], то отсюда следует т. е. непрерывность функции /[(f(jtr)] в произвольной точке с отрезка [а, Ь] доказана. Колебание функции в точке. Мы получаем наиболее удобный подход к изучению разрывных функций, вводя по- понятия колебания функции на данном отрезке и в данной точке. Пусть на отрезке [а, Ь\, за исключением, быть мо- может, конечного числа его точек, определена совершенно про- произвольная функция f(x). Если она на данном отрезке не ограничена, мы будем говорить, что колебание её на этом отрезке равно -+- оо; если же ограничена, то колебанием её на отрезке [а, Ь] назовём разность М — т между её верхней гранью М и нижней гранью т на этом отрезке; во всех случаях будем обозначать колебание функции f (х) на отрезке [а, Ь] символом w^(a, b). Если отрезок fa', b'] составляет часть отрезка [а, Ь] (т. е. если a sg; а' <^Ь' ^ Ь), то, очевидно, грани М, т' функции f(x) на отрезке [я', Ь'] подчиняются неравенствам т^т'^М'^М и, следовательно, w^(a', b')^w^(a, b). Поэтому, если мы выберем на отрезке [а, Ь] произвольную точку с1), окружим её замкнутой окрестностью [a, fi] и за- заставим концы аир этой окрестности приближаться к точке с, !) В этой точке функция может быть и не определена.
80 ЛЕКЦИЯ ТРЕТЬЯ то (oJa, р), изменяясь при этом -приближении, нпкогаа не может возрастать, а либо убывает, либо остаётся постоянной; а так как колебание (of(a, р), будучи неотрицательной вели- величиной, ограничено снизу, то в силу леммы I лекции 1 (стр. 27) оно должно при этом стремиться к некоторому пределу, ко- который мы будем обозначать через ш^(с) и называть колеба- колебанием, функции f(x) в точке с. Таким образом, ш/(с) = Нт (ог(а, 0). а->с—О Р-хЯ-0 Введение этого понятия позволяет прежде всего по-новому взглянуть на непрерывность функции в данной точке, как показывает следующая Теорема. Для того чтобы функция f(x), определён- определённая в точке с, была непрерывна в этой точке с, необхо- необходимо и достаточно, чтобы (о^(с)^О. Доказательство. 1) Пусть wJc) = 0. Это значит, что в достаточно малой окрестности U(а, р) точки с колеба- колебание функции f(c) становится как угодно малым. А так как, очевидно, для любого х ? U \f\x) f(c)\^M — m = uf(a, P) (где М и т—грани функции f(x) в окрестности U), то и подавно \f(x) — f(c)\ как угодно мало при x?U; но это означает, что функция f(x) непрерывна в точке с. 2) Если (о (с) = о) ^> 0, то, какова бы ни была окрестность U(а, Ь) точки с, М—/n^w; в силу теоремы 2 (стр. 72), существуют такие числа а ? [а, Ь\ и р g [а, Ь\, что /Р но )—/(о)]; из того, что /(Р) — /(а) 3^@, вытекает, что по меньшей мере одно из двух слагаемых правой части должно быть 5* у; таким образом, существует такая точка х отрезка [а, Ь], что \f(x) — /(с)|3г-г>-; так как окрестность U произ- произвольна, то функция f(x) не может быть непрерывной в точке с. Если функция имеет в некоторой точке (в которой она может быть и не определена) колебание, большее нуля, то го-
функции 81 ворят, что она разрывна в этой точке. Точки, в которых данная функция непрерывна, называют для краткости её точками непрерывности, а точки, в которых она разрывна, — точками разрыва. Мы видим, что (о^(с) = О в точках непре- непрерывности и ш^(с)^>0 в точках разрыва. Точки разрыва. Уже это обстоятельство даёт нам по- повод сделать попытку внесения некоторого порядка в чрезвы- чрезвычайно разнообразную совокупность возможных типов точек разрыва. Раз условие ш(с)^>0 отличает точки разрыва от точек непрерывности, то мы, естественно, ожидаем, что вели- величина соf (с), т. е. колебание функции в данной точке, сможет служить разумной и удобной мерой разрывности функции в данной точке. Мы ещё более укрепимся в этом ожидании, если вспомним определение величины со.(с); ведь <о^(а, fi) является мерой взаимного расхождения значений • функции f(x) в отрезке [а, р]; предел этой величины при условии, что отрезок [a, fi] стягивается к точке с, может поэтому рассматриваться нами как мера взаимного расхождения зна- значений функции в точках, сколь угодно близких к с, т. е. мера именно той особенности этой функции, которая обуслов- обусловливает претерпеваемый ею в точке с разрыв. Условимся, таким образом, называть величину ш^ (с) мерой разрыва функ- функции f(x) в точке с; это даёт нам возможность сравнивать между собой различные точки разрыва по той «степени раз- разрывности», какую в них обнаруживает данная функция; в част- частности, наибольшую разрывность функция имеет, конечно, в тех точках, в которых она нэограничена (со^(с) = -]-ос). С понятием меры разрыва (или колебания функции в точке) связано одно важное предложение, служащее непосредствен- непосредственным обобщением теоремы 4 о равномерной непрерывности (см. стр. 75). Теорема. Если мера разрыва (т. е. колебание) функ- функции f(x) в каждой точке отрезка [а, Ь] не превосходит числа к ^ 0, то, сколь бы мало ни было положительное число е, найдётся такое другое положительное число Ь, что колебание функции f(x) на любом отрезке длины <^д не превосходит \-\-s. Такую функцию можно было бы назвать «непрерывной с точностью до X»; при л = 0 мы получаем, в частности, как раз теорему 4. Вы без всяких затруднений сможете само- € А. Я. Хинчин. Восемь лекций
82 ЛЕКЦИЯ ТРЕТЬЯ стоятельно провести доказательство новой теоремы по той же схеме, какой мы пользовались в случае теоремы 4; всё от- отличие будет состоять в том, -что роль прежнего е теперь будет играть число Х-]-е. Вы видите, таким образом, что не только локальная не- непрерывность, но и локальное' свойство, состоящее в ограни- ограничении меры разрыва функции в данной точке, имеет свой интегральный эквивалент. Доказанная нами теорема имеет це- целый ряд приложений, в частности, в интегральном исчислении; мы встретимся ещё с нею в одной из следующих лекций. Весьма важным для точек разрыва оказывается и другой классификационный принцип, в основном позволяющий срав- сравнивать их между собой не по величине, а, так сказать, по форме разрыва. Как мы знаем, критерием непрерывности функции /(л;) в точке а могут служить равенства /(а-|-0) = = f(a) = f{a — 0); может случиться, что /(a-J-O) и f(a — 0) существуют, но по меньшей мере одно из этих двух чисел отлично от f(a); в этом случае мы называем точку а точкой Черт. 13. Черт. 14. разрыва первого рода для функции f(a). Таким образом, точка разрыва первого рода характеризуется тем, что при подходе к ней как справа, так и слева существует предел функции /(лг), но что либо эти два предела различны между собою, либо, совпадая между собою, они отличны от значе- значения функции в этой точке. Пример первого типа даёт (схема- (схематически) черт. 13 (здесь значение функции в точке разрыва может быть каким угодно), пример второго типа — черт. 14. Точки разрыва первого рода представляют собой простей- простейший тип точек разрыва; сравнительная лёгкость их изучения обусловливается, разумеется, существованием пределов / (с -|- 0)
ФУНКЦИИ 83 и f(a — 0). Все другие точки разрыва называют точками разрыва второго рода. Значит, в точке разрыва второго рода функция не стремится ни к какому пределу по меньшей мере при одном из двух подходов (справа или слева) к этой точке; пример такого поведения даёт неоднократно уже упоминав- упоминавшаяся нами, весьма поучительная функция j = sin— при л; = 0 (черт. 15). Здесь в любом отрезке, содержащем 0, верхняя грань функции равна -|-1, а нижняя грань функции равна —1, поэтому шу.@) = 2. Функция Дирихле, которую мы рассматривали в начале этой лекции, в каждой точке имеет, очевидно, разрыв второго рода. Монотонные функции. Функция y = f{x) называется неубывающей на отрезке [а, Ь\, если при а^хА^х2^Ь всегда f{x})^f(x2); если при том же условии всегда f(xl)^f(x2), функция f(x) называется невозрастающей на отрезке [а, Ь]. Неубывающие и невозрастающие функции вме- вместе образуют класс монотонных функций. Монотонные функции обладают целым рядом специальных свойств, которые делают их во многих случаях очень удобным орудием исследования. Прежде всего всякая функция f(x), монотонная на дан- данном отрезке [а, Ь\, ограничена на этом отрезке [как обычно, отрезок предполагается закрытым; для открытых отрезков утверждение неверно: функция у= — монотонна, но не огра- ограничена в открытом отрезке @, 1)]; в самом деле, при 6*
84 ЛЕКЦИЯ ТРЕТЬЯ заключено между /(а) и f{b); очевидно, далее, что гранями монотонной функции служат её значения f(a) и f(b) в концах данного отрезка; эти же числа служат наибольшим и наименьшим значениями монотонной функции f(x) в отрезке [а, Ь]. Монотонная функция может иметь точки разрыва, как нас учит один взгляд на черт. 13. Однако разрывы такой функции ограничены как по своему характеру, так и по сво- своему числу. Прежде всего, в силу ограниченности монотонные функции не могут иметь разрывов бесконечной меры. Далее, число точек, в которых мера разрыва монотонной функ- функции f{x) превосходит какое-либо положительное число т, в отрезке [а, Ь] не больше, чем х • В самом деле, пусть для определённости f(b)~^>f(a) и пусть функция f(x) имеет в отрезке [а, Ь]п точек, в каждой из которых мера разрыва этой функции превосходит т; обозначим эти п точек, считая слева направо, через с,, с2, ... , сп, так что при сколь угодно малом е^>0 —/(ct —е)>т {\ если мы (что всегда возможно) выберем е столь малым, чтобы с<с, —е, с„+?<*> и с*-М<^+.-е (l^ftssn—1), т. е. чтобы окрестности (ck — e, ck-\-e) попарно не имели общих точек и целиком умещались в отрезке [а, Ь], то, очевидно, откуда что и требовалось доказать. В частности, таким образом, монотонная функция может иметь лишь конечное число таких точек, в которых мера разрыва её превосходит данное поло- положительное число. Для функций немонотонных дело обстоит иначе; так, мера разрыва функции Дирихле в каждой точке равна единице.
функции 85 Наконец, если функция f(x) монотонна на отрезке [а, Ь], то пределы /(с-{-0) и f(e — 0) в силу леммы Г лекции I (стр. 29) существуют в каждой точке с этого отрезка (в точке а существует лишь первый, в точке Ъ — лишь второй из этих пределов); отсюда следует, что монотонная функция может иметь точки разрыва только первого рода. Функция с ограниченной вариацией. Пусть на отрезке [а, Ь] определена функция /(л:). Разобьём этот отрезок лю- любым способом на любое число п частичных отрезков, обозна- обозначим точки деления слева направо через xit х2, ... , хп_х и положим ещё для общности а^х0 и Ь а = х0 О, < х2 < ... <*„_, <*„ = Ь; сумма зависит от" произведённого нами разбиения отрезка [а, Ь]; для различных разбиений эта сумма имеет, вообще говоря, различную величину; производя указанное разбиение всевоз- всевозможными способами (причём и число п может меняться про- произвольным образом), мы получаем бесконечное множество сумм 5. Верхнюю грань М этого множества (которая может, конечно, быть и равной -|- оо) называют полной вариацией функции f(x) на отрезке [а, Ь\, мы будем обозначать её че- через Vf(a, b). Если V(а, Ь) есть число (Vf(a, b)<^-\-oo), то функцию f(x) называют функцией с ограниченной вариа- вариацией на отрезке [а, Ь]. При Vf(a, b) = -\-co говорят, что вариация функции f(x) на отрезке [а, Ь] бесконечна (или неограничена). Класс функций с ограниченной вариацией играет весьма заметную роль в анализе и его приложениях. Очевидно, в частности, что всякая функция, монотонная на отрезке [а, Ь], есть функция с ограниченной вариацией на этом отрезке; в самом деле, для монотонной функции f(x) сумма 5 при любом разбиении равна \f(b)—f(a)\, вследствие чего и Vf(a, b) = \f[b) — f(a)\. Для исследования общих свойств функций с ограниченной вариацией имеет основное значение одна теорема, в силу ко- которой исследование самых общих типов таких функций может
86 ЛЕКЦИЯ ТРЕТЬЯ быть целиком сведено к изучению монотонных функций; именно, оказывается, что всякая функция с ограниченной вариацией есть разность двух неубывающих функций (или, что то же, сумма двух монотонных функций, из которых одна — неубывающая, а другая — невозрастающая). В силу этого предложения все основные свойства монотонных функ- функций, касающиеся числа и характера возможных точек разрыва, распространяются и на все функции с ограниченной вариацией. Чтобы доказать эту основоположную теорему, условимся для краткости писать V(x) вместо V t(a, x) и положим отсюда и наша теорема будет доказана, если мы покажем, что функ- функции N(x) и Р(х) — неубывающие на отрезке [а, Ь]. Пусть а <: лг, <^ х2 <: Ь\ так как то для нашей цели достаточно показать, что V(x2) — V (*,)>!/(*,) — /(*,)!¦ E) Пусть е — произвольное положительное число; по опреде- определению величины V (х,), как верхней грани сумм 5, сущест- существует такое разбиение отрезка [а, хг\, что соответствующая сумма 5 = 5(а, л:,) превосходит V(х) — е; но сумма S(a, лг,)-|- -\-\f(x2)—f(X))\ = S(a, x2) есть, очевидно, одна из сумм S для отрезка [а, х2] и потому не превосходит верхней грани У{х2) таких сумм; таким образом, мы получаем /, , + / = S(a, ^W откуда V{xt)— V(jf,)> |/•(*,) — f(x,)\— e; так как е произвольно мало, то отсюда следует E), и наша теорема доказана.
ЛЕКЦИЯ IV РЯДЫ Сходимость и сумма ряда. — Критерий Коши. — Ряды с поло- положительными членами. — Абсолютная и условная сходимость.— Бесконечные произведения. — Ряды функций. — Степенные ряды. Сходимость и сумма ряда. Сегодняшнюю лекцию, мы посвятим одному из важнейших инструментов математического анализа — бесконечным рядам. Как вам известно, перед лицом больших аналитических проблем бесконечный ряд представ- представляется нам чисто техническим орудием исследования, очень полезным и удобным, но скромным по своему принципиальному значению. Тем не менее, орудие это вполне заслуживает того, чтобы даже в нашем кратком курсе ему была посвящена осо- особая лекция; и не столько потому, что многочисленными при- применениями его проникнуто всё здание как самого анализа, так и почти всех опирающихся на него прикладных наук, сколько по той причине, что на сравнительно несложном материале, какой представляет нам собою теория рядов, типичные для всего анализа ходы мыслей, цепи представлений и образов и даже целые логические схемы выступают в теории рядов с особенной ясностью и рельефностью; хорошо известно, что учащемуся, который активно и прочно овладел теорией рядов, дальнейшее усвоение основных разделов анализа обычно не до- доставляет уже никаких затруднений. Бесконечным числовым рядом называется выражение вида «i + «2 + ---+«n + -- ¦• О) или п=1
88 ЛЕКЦИЯ ЧЕТВЁРТАЯ где все ип— числа, которые мы будем предполагать вещест- вещественными. Числа ип называются членами ряда. Конечные суммы мы будем называть частичными суммами ряда A). Основной вопрос, который ставится в отношении каждого данного ряда A), есть вопрос о его сходимости. Если предел lim sn = s и->оо существует, ряд A) называется сходящимся, а число s — его суммой. В противном случае ряд A) называется расходящимся и суммы не имеет. Случай, когда sn—>сю или sn—> сю при п —*сю, мы формально вправе, конечно, отнести к любой из этих двух разновидностей бесконечных рядов; обычно в этом случае признают ряд расходящимся, т. е. под суммой ряда всегда разумеют некоторое число; однако, при этом мы, объ- объединяя под одним именем расходящихся как ряды с бесконеч- бесконечными суммами, так и ряды, вовсе не имеющие сумм, должны помнить, что эти два типа рядов не имеют в своей основе ничего общего и объединяются лишь потому, что оба проти- противостоят (хотя и в разных смыслах) рядам с конечными сум- суммами. В основных своих разделах анализ оперирует только схо- сходящимися рядами. У того, кто впервые приступает к изучению рядов, первичное представление о сумме ряда и процессе её получения неизбежно складывается по полной, часто не под- подвергаемой критическому анализу, аналогии с конечными сум- суммами; sn — это сумма п первых членов ряда, as — сумма всех его членов. Очень часто и сам лектор стимулирует и даже прямо воспитывает такое представление. И надо признать, что если относиться к нему достаточно осторожно и не утрачивать критической настроенности, это представчение действительно способно как содействовать усвоению основных фактов теории рядов, так и эвристически предвидеть новые, ещё не знакомые закономерности. Однако ни на одну минуту нельзя забывать и об опасности зайти в этой аналогии слишком далеко, а тем более — придавать ей доказательную силу. Как вы знаете, аналогия между бесконечными рядами и конечными суммами
ряды 89 сколько-нибудь далеко может быть проведена только для так называемых абсолютно сходящихся рядов (о которых мы будем говорить ниже); для рядов же «условно сходящихся» наше стремление представлять себе их суммы образующимися ана- аналогично конечным суммам немедленно наталкивается на неодо- неодолимые препятствия; трудно, в самом деле, представлять себе «суммою всех членов ряда» такую сумму, величину которой мы можем изменить, изменив порядок слагаемых. Наконец, слишком крепко угнездившееся представление о сумме ряда, как о чём-то очень похожем на конечные суммы, таит в себе и серьёзную методологическую опасность, угрожая выхолостить всё специфическое идейное и предметное содержание суммы бесконечного ряда. Дело в том, что процесс образования суммы ряда вовсе не подобен процессу конечного суммирова- суммирования и вовсе не состоит в том (как иногда себе представляют), чю члены ряда прибавляются один за другим, «покуда не бу- будут все исчерпаны»; это было бы, разумеется, совершенно безнадёжным предприятием; исчерпать члены ряда последова- последовательным прибавлением нельзя, ибо их бесконечное множество и если мы всё же имеем возможность говорить о сумме ряда, то это именно потому, что мы отказываемся от этого безнадёж- безнадёжного процесса бесконечного прибавления и заменяем его совсем друюй операцией (предельным переходом), сразу приводящей нас к цели. Вот подробное описание того, как формируется сумма бесконечного ряда: начинаем мы, разумеется, как и в случае конечных сумм, с последовательного прибавления, т. е. образуем суммы st, s2 и т. д.; но мы вовсе не имеем в виду продолжать этот процесс безгранично; образуя частичные сум- суммы, мы внимательно исслгдуем их природу и строение, прежде всего — их зависимость от числа п взятых членов; другими словами, предметом нашего изучения служит величина sn как функция от п (во многих случаях для получения полной кар- картины этой функциональной зависимости вовсе нет надобности в изучении сумм sv s2 и т. д. небольшого числа членов, а удаётся сразу получить, например, удобное аналитическое вы- выражение функции sn; именно так обстоит дело, например, в из- известном из элементарной алгебры случае геометрической про- прогрессии). Точнее, мы стараемся узнать, стремится ли вели- величина sn при п—>-оо к некоторому пределу и если стремится, то к какому именно. Таким образом, формирование суммы
90 ЛЕКЦИЯ ЧЕТВЁРТАЯ бесконечного ряда слагается из двух последовательных мо- моментов: 1) формирование частичных сумм sn и изучение их зависимости от п; 2) переход к пределу при п—>оо. Вы, ко- конечно, видите, что всё это весьма мало похоже на «прибавле- «прибавление до полного исчерпания»; и забывать об этом различии, конечно, ни на минуту нельзя, если мы не хотим иметь над собой постоянной угрозы впадать в ошибки на базе необосно- необоснованных аналогий. Сделаем ещё следующее замечание. Мы видим, что вопрос о сумме данного ряда A) целиком сводится к вопросу о пре- пределе связанной с этим рядом последовательности *,, s2 , .*„, ...; B) обратно, если задана .совершенно произвольная последователь- последовательность B), мы всегда можем, полагая свести вопрос о пределе последовательности B) к вопросу о сумме ряда A); таким образом, с этой точки зрения основ- основная задача теории рядов ничем не отличается от основной задачи теории пределов (для последовательностей). На самом деле, конечно, специфика теории рядов, её задач и её методов обусловлена именно той особой концепцией, ко- которую получают члены последовательности B), когда мы рас- рассматриваем их как последовательные частичные суммы некото- некоторого ряда A); и эта концепция оказывается достаточно интересной в идейном и достаточно важной в прикладном от- отношении, чтобы составить собою предмет особой теории; эта теория и есть теория бесконечных рядов. Критерий Коши. Если ряд A) сходится, то ип—>-0 при п—>-оо. В самом деле, ип = sn — sn_, при я^>1; так как при п—> оо sn и sn_] имеют один и тот же предел*, то ип—>-0. Это свойство сходящихся рядов важно потому, что во многих случаях позволяет легко установить расходимость ряда: для этого достаточно показать, что ип при п —> оо не является бесконечно малой величиной. Однако, как вы знаете, из того, что ип —«-0 при п—> оо, нельзя ещё заключить, что ряд A) сходится; так, «гармонический» ряд
ряды 91 как вам известно, расходится {sn—>-оо при п —*¦ -4-оо), хотя /г-й член его и бесконечно мал при п —>¦ оо. Такая односто- односторонность рассматриваемого признака (необходимость без доста- достаточности), конечно, в значительной мере ограничивает сферу его применения. Вопрос о сходимости ряда есть, как мы видели, только специальная форма вопроса о существовании предела у неко- некоторой числовой последовательности. Поэтому мы получаем не- необходимый и достаточный признак сходимости ряда, переводя на язык теории рядов известный нам уже критерий Коши существования предела у последовательности (лекция II, стр. 43—44). Для того чтобы последовательность частичных сумм sn ряда A) имела предел при п—>-оо, необходимо и до- достаточно, как мы знаем, чтобы при любом ?^>0 для всех до- достаточно больших п и для любого k ^ О выполнялось нера- неравенство n-f * Так как sn^k — «„= 2 а/> то мы непосредственно прихо- /Ц1 дим к следующему предложению. Критерий Коши. Для сходимости ряда A) необхо- необходимо и достаточно, чтобы для любого е ^> 0 при всех до- достаточно больших п и любом натуральном k выполнялось неравенство Выражаясь образно, условие критерия Коши состоит в том, чтобы достаточно удалённый и как угодно длинный скусок» ряда становился сколь угодно малым по абсолютному значению. Разумеется, как и в теории пределов, критерий Коши может только установить существование суммы ряда, но ничего не говорит нам о её величине. Критерий Коши, будучи очень плодотворным орудием общетеоретического исследования, сравнительно редко приме- применяется, как мы уже говорили по аналогичному поводу в лек- лекции 11, к установлению сходимости индивидуальных, конкретных рядов; причиной этого является то, что обычно бывает нелегко установить, выполняется ли для данного конкретного ряда условие C).
92 ЛЕКЦИЯ ЧЕТВЁРТАЯ Поэтому, как вы знаете, теория рядов строит большое число других признаков сходимости; эти признаки, не имея присущей критерию Коши характеристичности (т. е. необходи- необходимости и достаточности одновременно), зато с несравненно боль- большим удобством применяются к отдельным конкретным рядам. Большинство этих признаков относится к рядам с положитель- положительными членами. Этот простейший и вместе с тем важнейший класс рядов методологически удобно рассмотреть в самом на- начале, чтобы затем постараться по возможности свести изуче- изучение произвольного ряда к исследованию рядов этого простей- простейшего типа. Ряды с положительными членами. Если все члены ряда A) неотрицательны, то sn, очевидно, есть неубывающая функция от п\ в силу леммы 1 лекции I возможен поэтому лишь один из двух случаев: либо ряд A) сходится, либо lim sn = -\-ao; я-»оо другими словами, ряд A) сходится или расходится, смотря по тому, ограничена или не ограничена величина sn при п—>-эо. Все признаки сходимости для рядов этого класса устанавли- устанавливаются поэтому таким1 образом, что доказывается ограничен- ограниченность функции sn при соответствующих условиях. В основе большинства этих признаков лежит следующий, чрезвычайно мощный принцип сравнения: Если все члены рядов «,+«2 + - ..+"„+•.. (А) неотрицательны и если при п^ п0 ип *? V (С) то из сходимости ряда (В) вытекает сходимость ряда (А) (и, значит, из расходимости ряда (А) вытекает расходимость ряда (В)). Доказательство этого основного принципа очень просто: обозначим соответственно через sn и s'n частичные суммы рядов (А) и (В); если ряд (В) сходится, то величина s'a ограничена; а так как в силу условия (С) 'n — S'n>
ряды 93 s'n -f- (sKo—s'n ) также ограничена, а следо- следовательно, сходится и ряд (А). Взяв в качестве ряда (В) какой-нибудь ряд, сходимость ко- которого уже установлена, обычно затем доказывают, что в слу- случае, когда ряд (А) подчиняется какому-либо определённому условию, члены его необходимо связываются с членами ряда (В) соотношением (С); всякое такое условие и может служить при- признаком сходимости для ряда (А). Так, если выбрать в качестве ряда (В) обыкновенную геометрическую прогрессию, то мы этим путём получаем для ряда (А) как раз простейшие, веро- вероятно, хорошо известные Вам признаки сходимости Даламбера, Коши и т. п. Как эти, так и все другие признаки всегда предста- представляют собой условия, в той или другой конкретной форме высказывающие требование, чтобы члены ряда (А) достаточно быстро убывали с ростом п; так, известный признак Даламбера требует, чтобы отношение -ОН при достаточно большом п оста- валось не больше числа, меньшего единицы, что очевидным образом характеризует собой именно достаточную быстроту убывания величины ип с ростом п. Здесь нам нет надобности останавливаться на признаках этого типа; вы найдёте их, вместе с исчерпывающими доказа- доказательствами, в большом числе в каждом курсе анализа. Вместо этой, в основном формальной, теории постараемся лучше повни- повнимательнее вглядеться в наши представления о быстроте схо- сходимости ряда с положительными членами. Вопрос этот, хотя им почти никогда не интересуются курсы, предназначенные для будущих практических работников, как раз имеет, независимо от своего принципиального интереса, и непосредственно прак- практическое значение. В самом деле, если ряд сходится медленно, т. е. если для получения суммы sn, сколько-нибудь близкой к предельному значению s, приходится суммировать очень большое число п его членов, то такой ряд, при всей своей тео- теоретической полноценности, не может служить инструментом для приближённого вычисления числа s и потому в практи- практическом отношении, по крайней мере непосредственно, не может принести значительной пользы. Заметим вскользь, что иногда приходится встречаться и с обратным положением вещей: рас- расходящийся ряд при известных условиях может оказаться очень удобным орудием для практического вычисления некоторых
94 ЛЕКЦИЯ ЧЕТВЁРТАЯ величин. Это обстоятельство дало повод известному француз- французскому учёному Анри Пуанкаре, занимавшемуся исследова- исследованием этого явления, высказать парадоксальную мысль о том, что сходящиеся ряды иногда оказываются «практически расхо- расходящимися» и, наоборот, расходящиеся ряды — спрактически сходящимися». Для всякого сходящегося ряда «остаток» rn=s — sn=un ,-]- ~\~ ап+г Н~ • • • есть величина бесконечно малая при п —- оо; быст- быстрота сходимости ряда целиком зависит от порядка этой беско- бесконечно малой, т. е. от того, насколько быстро она стремится к нулю при п —»• со. Обычно считают, что ряд сходится с хорошей быстротой, если при п—> со остаток гп убывает подобно члену геометрической прогрессии; для этого достаточно, чтобы члены ип данного ряда при достаточно большом п сами не превос- превосходили соответствующих членов некоторой геометрической прогрессии; в самом деле, из 0 и q @ <^ ^<^ 1) — постоянные, вытекает, что при п^п^ + - ¦ ¦)= ^гдЯ". Значительно медленнее сходятся ряды, у которых с ростом п остаток убывает, как некоторая отрицательная степень числа п, 1 1 ~ т. е., например, имеет порядок — , -| и т. п. Такие ряды часто представляют уже затруднения для практического использо- использования. При этом надо иметь в виду, что если ип при достаточно- большом п оказывается меньше, чем ап~к, где а^>0 и k~^> 1 — постоянные (причём число k отнюдь не обязательно целое), то rn<^bn~k+'1, где Ь — другая положительная постоянная; в са- самом деле, применяя к функции f(x) = xk~l теорему Лагранжа о конечном приращении, мы находим при лг]>0: (лг+1)*-1—х*-* = {к—l)(*-f 6)*-2>(А— 1)лг*-2(О<6<1); отсюда, полагая х = п — 1 и деля обе части на nk~1 (п — (к— 1)(п-
ряды 95 и, следовательно, J если un<^an~h, то это даёт: и, следовательно, 1=1 1=1 — ° „-А + 1 — к-\п что мы и утверждали. Возвращаясь теперь к вопросу о признаках сходимости, сделаем следующее замечание. Для всякого сходящегося ряда ип —- 0(я —- оо); однако, даже для ряда с положительными чле- членами это стремление «общего члена» ип к нулю может не быть монотонным; простым примером может служить ряд, полу- полученный из геометрической прогрессии с помощью перестановки й, с и2, ца с и4 и т. д., т.' е., например, ряд 1+1+ 1 +1 + +-J-+-! г- Однако в подавляющем большинстве случаев конкретные числовые ряды с положительными членами, встречающиеся в анализе и его приложениях, обладают тем свойством, что ня+]^ня(я=1, 2,...), т. е. ип—i-О в этих рядах, моно- монотонно убывая с возрастанием п. Поэтому заслуживает боль- большого внимания группа специальных критериев сходимости рядов с монотонно убывающими положительными членами, тем бо- более, что в этой группе имеются признаки характеристические (т. е. необходимые и достаточные) и в то же время часто находящие себе удобное применение к исследованию отдель- отдельных конкретных рядов. Мы рассмотрим два из этого рода признаков. Теорема. (Интегральный признак Кош и.) Пусть f(x) — положительная непрерывная и невозраапаю- щая функция на полупрямой О^лг<^ + оо. Тогда для схо-
96 ЛЕКЦИЯ ЧЕТВЁРТАЯ Замости ряда /(¦!)'+/B) + -..+/(«) + ... (А) необходимо и достаточно, чтобы существовал конечный предел при а —- -\- do (а ^> 0) интеграла а \f(u)du (В) (для чего, в свою очередь, необходимо и достаточно, разу- разумеется, чтобы этот интеграл оставался ограниченным при а—>-оо). Для удобства расположения доказательства мы формули- формулировали этот признак, отправляясь от данной функции, а не от данного ряда; ясно, однако, что для любого ряда (А) с монотонно убывающими положительными членами можно легко построить сколько угодно функций f(x), удовлетворя- удовлетворяющих требованиям нашей теоремы и таких, что/(я) = ап (я^1); таким образом, наша теорема действительно служит характе- характеристическим критерием сходимости для рядов указанного типа. Доказательство. Так как, очевидно, в силу монотон- монотонности (невозрастания) функции f(x) п—1 ТО + \ f(u)du, " п «"И \f(u)du7s: %f(k)^ о fe* i f(u)du; эти неравенства непосредственно показывают, что при п —>¦ со величины 5j f(k) и \f(u)du либо обе ограничены, либо k = \ i обе не ограничены, чем теорема и доказана, так как в обоих случаях ограниченность равносильна существованию конечного преде.л-а. Применения этого критерия к отдельным рядам, как мы уже заметили, во многих случаях очень просты. Пусть, на- например, ип = п ~* (а ^> 0). Полагая «Hi
ряды 97 мы, очевидно, получаем функцию, удовлетворяющую всем тре- требованиям нашей теоремы; но при а =? 1 О 1 откуда в силу интегрального признака наш ряд сходится при а ^> 1 и расходится при а <^ 1; наконец, при а = 1 1 при а—>--|-оо, т. е. гармонический ряд 2^ п расходится. Переходим ко второму критерию. Теорема. Если ип 5= ип+1 ^> 0(/гЗз 1), /ио <9ля сходи- сходимости ряда (I) необходимо и достаточно, чтобы сходился ряд Доказательство. В силу монотонного убывания чле- членов ип ряда A), 2" (число членов суммы в средней части неравенств есть 2"~1), откуда п—1 I" л • » fc=0 V „А ^ — V Эти неравенства непосредственно показывают, что частичные суммы рядов A) и D) либо одновременно ограничены, либо одновременно неограничены, откуда и следует утверждение теоремы. В случае ип = я~а (а^>0) ряд D) имеет общим членом со 2«и—а). в сИЛу последней теоремы ряд 2 п~а поэтому схо- дится при а ^> 1 и расходится при а ^ 1. ^ А. Я. Хинчин. Восемь лекций
98 ЛЕКЦИЯ ЧЕТВЁРТАЯ Абсолютная и условная сходимость. Мы переходим теперь к рядам с членами произвольного знака; как вы знаете, сходящиеся ряды этого общего типа принято с самого начала разделять на два класса, действительно существенно различ- различных по своим свойствам: ряды, абсолютно сходящиеся, и ряды, сходящиеся условно. Мы говорим, что ряд A) сходится абсо- абсолютно, если сходится ряд -; E) если же ряд A) сходится, а ряд E) расходится, те мы на- называем ряд A) условно сходящимся. Здесь прежде всего надо обратить внимание на то, что абсолютная сходимость данного ряда определяется, как схо- сходимость некоторого другого ряда; поэтому совсем нетривиаль- нетривиальной является (известная вам, конечно) теорема: всякий абсо- абсолютно сходящийся ряд сходится. Смысл этой теоремы состоит, конечно, в том, что из сходимости ряда E) вытекает сходимость ряда A); доказа- доказательство её проще всего проводится на основе критерия Коши: так как при любых я^>0, k~^>0 k h I 2и„+/1< 2к+н н так как, согласно критерию Коши, в случае сходимости ряда E) правая часть сколь угодно мала при всех достаточно больших п и любом k, то то же справедливо и для левой части, откуда в силу того же критерия Коши вытекает схо- сходимость ряда A). Абсолютно сходящиеся ряды обнаруживают в своих свойст- свойствах далеко идущее сходство с конечными суммами: их можно почленно перемножать, как конечные суммы (распределитель- (распределительный закон); члены их можно произвольно перемещать (пере- местительный закон) и группировать (сочетательный закон), не нарушая этим сходимости ряда и не изменяя его суммы (в частности, всеми этими свойствами обладают, конечно, ряды с положительными членами, сходимость которых всегда имеет абсолютный характер). Мы не будем здесь останавливаться на доказательствах этих свойств; они чисто формальны, и те изложения, которые Вы найдёте в руководствах, не вызовут } Вас никаких затруднений.
ряды 99 Вглядимся зато несколько подробнее в условно сходящиеся ряды; вот перед нами сходящийся ряд A); представьте себе, например, известный ряд Лейбница 1 + + Ь всё обстоит благополучно, частичные суммы стремятся к пре- пределу, остаток стремится к нулю (и даже не слишком медленно), как у всякого сходящегося ряда. Но как шатко это благопо- благополучие! Стоит только надлежащим образом изменить порядок членов, и ряд получает другую сумму, а то и вовсе перестаёт сходиться. И всё это потому, что ряд E) (в нашем примере — это гармонический ряд) расходится. Вы понимаете, конечно, что такое суммирование, при котором результат зависит от порядка слагаемых, не может приводить к конструкциям, сколько-нибудь аналогичным конечным суммам; самое наимено- наименование «условно сходящиеся ряды» имеет, повидимому, своей психологической предпосылкой желание называть такие ряды сходящимися только с известной оговоркой. Что касается возможности изменять сумму и даже нару- нарушать сходимость условно сходящихся рядов с помощью пере- перестановки их членов, то в этом направлении любой условно сходящийся ряд действительно предоставляет нам совершенно неограниченные возможности, как показывает следующая про- простая, но изящная Теорема. Если ряд A) сходится условно и если а — любое число или любой из символов Л^оо, то надлежаще выбранной перестановкой членов этого ряда всегда можно заставить новый ряд сходиться к а. Для доказательства установим прежде всего одну лемму, , которая и сама по себе не лишена интереса: если ряд A) сходится условно, то его положительные члены образуют расходящийся ряд A), и точно так же его отрицатель- отрицательные члены образуют расходящийся ряд A"). В самом деле, пусть sn = s'a-\-s'^, где s'n — сумма положительных, a s"n отрииательных членов ряда A), входящих в частичную сумму sn. Если бы оба ряда (Г) и A") сходились, то s'n и s"n имели бы пределы при я.—>¦ со, а следовательно, и s'n — s"n = Uj | -j-1 a2 | -(- ... -|-1 un | стремилось бы к некоторому 7*
100 ЛЕКЦИЯ ЧЕТВЁРТАЯ пределу, т. е. ряд A) был бы абсолютно сходящимся; если бы один из рядов A') и A"), например (Г), был расходящимся, а другой, A"), сходящимся, то при п—> со мы имели бы s'n—>--)-ос, s"n—>-с, 'где с—число, откуда sn = s'n-\- -\-s'^—,,-j-ac, т. е. ряд A) был бы расходящимся; таким об- образом, ряды (Г) и A")' необходимо должны оба расходиться. Переходим теперь к доказательству теоремы. Рассмотрим два случая: 1) а есть число; пусть для определённости а]>0; будем тогда располагать члены ряда A) в следующем порядке: сна- сначала будем брать положительные члены в их естественном порядке (т. е. в том порядке, в каком они встречаются в ряде A)); при этом сумма взятых членов будет возрастать; как только эта сумма превзойдёт а, мы назовём её поворот- поворотной суммой и начнём присоединять к ней последовательно отрицательные члены ряда A), опять-таки в их естественном порядке; при этом сумма взятых членов будет уменьшаться; как только она сделается меньше а, мы снова назовём по- полученную сумму поворотной и опять начнём её увеличивать, прибавляя следующие по порядку положительные члены ряда A), и т. д. Продолжая этот процесс неограниченно, мы тем самым, очевидно, расположим члены ряда A) в некото- некотором определённом порядке. Мы должны будем показать, что вновь образованный ряд имеет сумму а; однако прежде этого мы должны ещё осветить одну из деталей произведённой конструкции: откуда мы знаем, что мы можем, беря доста- достаточно много положительных членов ряда A), получить сумму, большую чем а? Здесь приходит на помощь наша лемма: в силу неё ряд, составленный из положительных членов ряда A), расходится, и, следовательно, беря достаточно боль- большое число этих положительных членов, мы можем получить сумму как угодно большую — в частности, большую чем а. В силу этой же леммы мы и, в дальнейшем ходе нашей конст- конструкции всякий раз можем быть уверены, что прибавление по- положительных членов рано или поздно сделает сумму всех взятых членов больше а, а прибавление отрицательных — меньше а. Убедившись таким образом в возможности нашей конст- конструкции, мы должны теперь показать, что частичные суммы нового ряда, становясь то больше, то меньше чем а, безгра-
ряды 101 нично приближаются к этому числу. Из нашего построения очевидно, что если мы возьмём две последовательные пово- поворотные суммы нового ряда, то все дальнейшие его суммы будут уже заключены между ними. Поэтому нам достаточно доказать, что поворотные суммы будут иметь своим пределом а. Но ясно, что каждая поворотная сумма отстоит от а не больше, чем на абсолютную величину своего последнего члена, т. е. величину, заведомо стремящуюся к нулю, так как этот член есть член нашего первоначального (сходящегося) ряда. Таким образом, в этом случае теорема доказана. 2) Пусть теперь а = -|-оо (в случае а =—оо доказа- доказательство совершенно аналогично); так как ип—*-0 при я—*-оо, то множество чисел \ип\ (и=1, 2,...) ограничено; пусть 'р — его верхняя грань; рассмотрим последовательность поло- положительных членов ряда A) и разобьём её на участки так, чтобы сумма членов каждого участка была больше, чем 2[} (это возможно в силу доказанной нами леммы); расположим теперь члены ряда A) так: сперва возьмём первый из только что построенных участков (в его естественном порядке), за- затем присоединим первый отрицательный член, затем второй участок, второй отрицательный член, и т. д. Так как сумма членов каждого участка ^>2р, а каждый отрицательный член по абсолютной величине sg: p, то после взятия я положитель- положительных участков и я отрицательных членов мы получим сумму, превосходящую 2ря— ;}я^ря, откуда и видно, что частич- частичные суммы вновь построенного ряда безгранично возрастают при я—<- оо. Мы нарочно с такой подробностью остановились на этих конструкциях; они столь же интересны, как и поучительны, заставляя нас вплотную вглядываться в структуру ряда, как бы логически анатомировать его. Для вас будет интересным и полезным упражнением показать, что надлежащей перестанов- перестановкой членов из каждого условно сходящегося ряда может быть получен ряд, не имеющий ни конечной, ни бесконечной суммы. Бесконечные произведения. Наряду со сложением и дру- другое арифметическое действие — умножение — может быть при- применено к сколь угодно большому числу чисел; как там мы искали предел суммы безгранично возрастающего числа сла- слагаемых, так и здесь мы можем ставить вопрос о пределе произведения безгранично возрастающего числа сомножителей;
102 ЛЕКЦИЯ ЧЕТВЁРТАЯ мы можем, подобно теории бесконечных рядов, создать тео- теорию бесконечных произведений. Эта теория, созданная в ос- основном уже очень давно, имеет, правда, до сих пор не столь исключительное число применений, как теория рядов; тем не менее область этих применений уже настолько широка (и с каждым десятилетием всё более расширяется), что в наши дни она необходимо входит в арсенал орудий каждого обра- образованного математика. Бесконечным произведением называется выражение вида 00 z1z2...zn...= П г„; F) п=г величины ттп = ZjZ2 ... zn (я = 1, 2,...) мы называем частич- частичными, произведениями, a lim тт„, если он существует, — вели- о-м» чиной произведения F). Во всём дальнейшем мы будем считать всегда-все сомножи- сомножители zn положительными. Такое ограничение, всегда прини- принимаемое в области вещественных множителей, есть следствие отнюдь не желания упростить исследование, а просто того факта, что изучение произведений с отрицательными множите- множителями, с одной стороны, изменением знака всего произведения сразу приводится к случаю положительных сомножителей, а с другой,— не представляет реального интереса; к послед- последнему заключению приводит целый ряд соображений; так, по- подобно тому свойству сходящихся рядов, что я-й член ряда стремится к нулю при я—»-оо, в сходящемся бесконечном произведении я-й множитель zn должен (как легко предвидеть и как мы скоро докажем) стремиться к единице, и, значит, все множители, начиная с некоторого из них, должны быть не только положительны, но даже сколь угодно близки к единице. В случае положительных сомножителей исследование бес- бесконечного произведения, очевидно, простым логарифмирова- логарифмированием приводится к исследованию бесконечного ряда; полагая wn = lnzn, zn = evr,, мы видим, что сходимость произведения F) равносильна сходимости ряда и что сумма s этого ряда равна (в случае сходимости) ло- логарифму величины л произведения F). Есть только одно
ряды 103 исключение из этого правила: если тг = О, то ряд G), оче- очевидно, расходится (частичные суммы имеют пределом —оо). но бесконечные произведения, величина которых равна нулю, и во многих других отношениях имеют совершенно особое поведение, приближающее их скорее к расходящимся рядам, чем к сходящимся; так, в случае тг = О необязательно, чтобы было zn—> 1 при п—»-оо (пример: zn= — , п=\, 2,...). Все эти обстоятельства привели к тому, что при тг=:О про- произведение F) обычно называют расходящимся, так что схо- сходимость этого произведения определяется как существование положительного предела тг=Нттгп. При таком определении П-+ОО сходимость произведения F), очевидно, в точности эквива- эквивалентна сходимости ряда G). Возможность указанной нами полной редукции теории бесконечных произведений к исследованию рядов могла бы подать повод думать, что в построении особого учения о бес- бесконечных произведениях нет никакой надобности. Однако, как и во многих подобных случаях, такое заключение было бы ошибочным; как это часто бывает в математике, новая форма постановки прежнего круга проблем здесь, с одной стороны, приводит к совершенно новой проблематике, а с другой, — эвристически стимулирует методы решения поставленных задач. В теории бесконечных произведений принято писать множи- множители zn в виде 1 -\-ип, где, значит, —\ <^ип<^-{-оо; при 00 этом ттп= 1 1 A -|— иА), а произведение F) записывается в виде тс ..A+в»)...= П A+ия). (8) . Если произведение сходится, то при и —> оо ттп —>- тт, ^[1, вследствие чего при п—.-оо п = -^- —1—0, *=J!a- —1. Сопоставление произведения (8) с рядом G) показывает, что рядам с положительными членами соответствуют произве- произведения, у которых zn~s?\ или, что то же, ия :> 0 (л= 1, 2,...) (а рядам с отрицательными членами — произведения, имеющие
104 ЛЕКЦИЯ ЧЕТВЁРТАЯ zn^l, йп^0). Это заставляет нас в первую очередь ис- исследовать бесконечные произведения, у которых все ип имеют один и тот же знак. Основное, наиболее употребитель- употребительное предложение, касающееся таких произведений, состоит в следующем. Теорема. Если все ип имеют один и тот же знал, то для сходимости произведения (8) необходимо и доста- достаточно, чтобы сходился ряд Доказательство. Прежде всего, мы вправе предпо- предположить, что ип—»-0 при п—>-оо, так как в противном слу- случае, как мы знаем, расходится как произведение (8), так и ряд (9), и следовательно, теорема оказывается верной. В даль- дальнейшем мы различаем два случая. 1) Пусть к„^0 (я=1, 2,...); так как при х—*0ех отличается от 1 -(-л: на положительную бесконечно малую второго порядка относительно х, то при достаточно большом п обозначая через sn частичные суммы ряда (9) и предполагая для простоты, что неравенства A0) выполняются для всех п (это не ограничивает общности рассуждения, так как в воп- вопросах сходимости можно всегда отбросить, без влияния на результат, любое число начальных членов как ряда, так и произведения), мы находим почленным перемножением этих неравенств при п^ 1, 2,..., т Y Sm O если ряд (9) сходится, то при т—* оо sm <[ s <[ т}- оо , а потому тгш <^ ея <^ -\- оо , т. е. величина ттт остаётся ограни- ограниченной, и, следовательно, произведение (8) сходится. Обратно, если сходится произведение (8), то при т—>-со пт <^ тс <^ -|- оо, а значит, «<1 т. е. сумма sm остаётся ограниченной и ряд A0) сходится.
ряды 105 2) Пусть и„<0 (л=1, 2,...); подобно предыдущему находим (здесь sm < 0): 2^ откуда аналогично предыдущему убеждаемся, что при sm У> s ^> — ос (случай сходимости ряда (9) ттт ^> ем ^> 0, и произведение (8) сходится; обратно, при пт ^> тг ^> 0 мы имеем sm J3= 1птгт^> 1птг^>— оо,, т. е. из сходимости произведения (8) вытекает сходимость ряда (9). Сопоставление произведения F) или (8) с рядом G) непо- непосредственно приводит к критерию Коши для бесконечных произведений; для сходимости произведения (8) необходимо и достаточно, чтобы, как бы мало ни было е^>0. при всех достаточно больших п и любом k~^>0 мы имели n-\-k 1—е< П A +«,)<!+е. A1) Однако для произведений, в которых ип сохраняет постоян- постоянный знак, этот критерий в силу доказанной нами теоремы заменяется другим, в большинстве случаев значительно более удобным (так как оценивать суммы бывает, вообще говоря, значительно легче, чем произведения); именно, мы можем, очевидно, ничего не меняя в словесной формулировке только что приведённого критерия, заменить неравенства A1) неравен- неравенством п+к I 2 «,-1О; необходимо только помнить, что эта форма критерия Коши имеет силу лишь в случаях, когда все ип сохраняют одинако- одинаковый знак. К сожалению, в рамках настоящего курса мы по интерес- интересному вопросу о бесконечных произведениях должны ограни- ограничиться сказанным и перейти к следующей теме. Ряды функций. До сих пор члены рассматриваемых нами рядов были числами. Но вы знаете, конечно, что анализу в первую очередь нужны функциональные ряды, т. е. такие ряды, члены которых являются функциями одной или несколь- нескольких независимых переменных. Для теории этих рядов всё,
106 ЛЕКЦИЯ ЧЕТВЁРТАЯ что мы до сих пор рассматривали, играет роль подготовитель- подготовительного материала. Пусть есть ряд, члены которого — функции одной и той же не- независимой переменной х, определённые в некотором отрезке [а, Ъ\ Давая этой переменной какое-нибудь числовое значе- значение х = а, мы превращаем ряд A2) в обыкновенный числовой 00 > ряд 2ки(а^; с точки зрения теории числовых рядов можно поэтому сказать, что формула A2) выражает собой не один ряд, а целый континуум различных рядов. Ясно, конечно, что для функциональных рядов проблема сходимости ставится совсем иначе, чем для числовых; по от- отношению к ряду A2) не имеет смысла ставить вопрос о том, сходится он или расходится, так как, вообще говоря, он будет сходиться прн одних значениях х и расходиться при других значениях. Осмысленная постановка вопроса здесь гласит: при каких значениях величины х в данном отрезке [а, Ь] ряд A2) сходится и при каких расходится? Условимся называть областью сходимости данного ряда множество тех значений х, при которых он сходится, и областью расходимости — совокуп- совокупность значений, делающих его расходящимся. Мы видим, что проблема сходимости для функционального ряда состоит в пер- первую очередь в отыскании его области сходимости. Мы не будем здесь тратить времени на рассмотрение примеров, так как у riac их достаточно будет в дальнейшем. Для всех аналитических применений теории функциональ- функциональных рядов имеет основное значение понятие равномерной сходимости. Вот как лучше всего подойти к определению этого понятия. Если ряд A2) сходится в каждой точке не- некоторого множества М (т. е. для всех значений х^М), то остаток этого ряда (будучи, конечно, подобно сумме ряда s (x) и частичным суммам sn {х), функцией от х) для любого х ? М стремится к нулю при п —>¦ оо. Для нашей цели нам потребу- потребуется более детально описать этот факт: каково бы ни было
ряды 107 х?М и каково бы ни было е^>0, существует такое п0 (зависящее, конечно, как от е, так и от х), что для всех я Эг я„ | гп (х) | <^ ?. Оставим теперь е неизменным, но заставим число х пробегать всё множество М; при этом для каждого х найдётся своё я0, т. е. своё «место» в данном ряду, начиная с которого | гп (х) | <^ s; но существует ли в этом ряду такое «место», начиная с которого неравенство I /¦ (лг) | <^ е выполня- выполнялось бы уже для всех х ? М? Очевидно, это зависит от того, будет ли множество тех чисел я0, которые мы выше по- построили для различных х, ограниченным или нет; если среди этих чисел есть наибольшее, то оно, очевидно, и сможет служить тем «местом», начиная с которого |гл(х)|<^е для всех х ? М. Если же среди построенных нами чисел nQ встречаются сколь угодно большие, то это показывает, что, как бы далеко мы ни продвигались в нашем ряду, всегда найдутся такие х?М, для которых искомое «место» ещё не достигнуто и лежит дальше; в этом случае выбор такого я0, которое в указанном смысле годилось бы для всех х ? М, очевидно, невозможен. Приведём пример этого последнего типа. Пусть для «„(*) = *•(!— х") @<*<1), т. е. ип (х) = хп A — х ) — хп~л A — х "-1). Очевидно, для любого *€[0, 1]«п(л:)—>¦ 0 при п—»• оо , так что гп (х) = — sn(x) = — x«(\— *«)> отсюда гпB~^ = ~4" («=1,2,...); так как число 2 п при любом я принадлежит отрезку [0, 1], то сколь бы велико ни было число я, неравенство | гп (х) \ <^ <^j не может быть выполнено для всех х ? [ 0, 1 ]. Значит, мы имеем здесь, действительно, дело со вторым из вышеописан- вышеописанных случаев. На черт. 16 изображены для наглядности кривые у = | г, (х) | и (схематически) у= \гп(х)\ для боль- шого п. Кривая у=:\гп (х) | при х = 2 " имеет максимум,
108 ЛЕКЦИЯ ЧЕТВЕРТАЯ равный -г-; влево же от этой точки всюду, за исключением ближайшего её соседства, | rn (х) | чрезвычайно мало; при возрастании я точка 2 " неограниченно приближается к 1. Из этого чертежа мы непосредственно видим, как протекает явление; тот парадоксальный на первый взгляд факт, что для Черт. 16. каждого х мы имеем гп (х) —<- 0 при я —»- со , в то время как для каждого п существует такое х, что | гь (х) | = -j- объ- объясняется именно тем, что точка, в которой | гп (х) | достигает этого максимального значения, при возрастании п не остаётся на месте, а продвигается вправо, безгранично приближаясь к 1 при я —»- оо , это явление «отставания» гп (х) в его стремле- стремлении к нулю перемещается, таким образом, всё ближе к точке 1, когда я возрастает; мы невольно ожидаем, что в самой точке 1 это отставание, сгустившись, создаст расходимость ряда; но на самом деле в точке 1 всё обстоит в высшей степени благополучно, так как здесь гп(х) = 0 при любом я. Вернёмся теперь к тем двум случаям, которые мы услови- условились различать выше. В первом из них мы говорим, что ряд A2) сходится равномерно на множестве Ж, а во втором — неравномерно. Таким образом, ряд A2) равномерно сходится на некотором множестве М, если при сколь угодно малом е ^> 0 существует такое я0 (зависящее только от е), что для всех п^п0 и для всех х ? М Мы подробно рассмотрели выше пример, показывающий типичную картину неравномерной сходимости. Заметим ещё,
ряды 109 что в точности таким же образом определятся равномерная сходимость последовательности функций /iD U(x), .... fn[x) ... к предельной функции f(x), если под гп(х) подразумевать разность f(x)—fn(x); мы можем, таким образом, сказать, что равномерная сходимость ряда равносильна равномерной сходимости последовательности его частичных сумм. Если для арифметического оперирования над рядом важна, как мы видели, его абсолютная сходимость, то для значитель- значительной части умозаключений аналитического характера очень удоб- удобной, а иногда и неизбежной предпосылкой служит равномер- равномерная сходимость его; мы сейчас рассмотрим несколько примеров, подтверждающих это. В первую очередь рассмотрим вопрос о том, при каких условиях можно быть уверенным в непрерывности сумм s(x) ряда A2), если известно, что все его члены непрерывны в от- отрезке [а, Ь]. Что сумма s(x) может при этом оказаться и раз- разрывной, показывает следующий пример: ип (х)=хп~1—хп(п ^ I, О < х ==: 1); sn (х) = 1 — хп (п 5== 1); s(x) = { \ при °<f<1' v ' \ 0 при х=\. Покажем теперь, что если ряд A2) сходится равномерно, то из непрерывности его членов вытекает непрерывность суммы. В самом деле, пусть на отрезке [а, Ь] ряд A2) схо- сходится равномерно и пусть все ип (х) (а значит, и все частич- частичные суммы sn(x)) непрерывны на [я, Ь\, пусть а—любое число отрезка [a, ft] и ? — сколь угодно малое положитель- положительное число; в силу предположенной равномерной сходимости ряда A2) мы можем взять п столь большим, что | sn (х) — s (х) |< -|- для всех х ^ [а, Ь]. Закрепив временно это значение я и поль- пользуясь тем, что функция $п (х) непрерывна в отрезке [а, Ь\ и зна- значит, в частности, в точке а, мы можем утверждать, что для всех точек х некоторой окрестности U точки а
1 1 О ЛЕКЦИЯ ЧЕТВЁРТАЯ но в таком случае для любого х ? U а это и показывает, что функция s{x) непрерывна при х = а. Предложение, обратное только что доказанному, было бы неверным. Сумма ряда может оказаться в некоторых случаях непрерывной функцией и при неравномерной сходимости этого ряда; это можно усмотреть из примера, приведённого нами на стр. 94, где ряд сходится неравномерно, между тем как сумма его равна нулю на всём рассматриваемом отрезке. Равномерная сходимость ряда непрерывных функций, гарантируя непрерыв- непрерывность его суммы, не является, таким образом, необходимой предпосылкой этой непрерывности; теория, несколько более развитая, чем приведённые нами соображения, позволяет уста- установить и характер сходимости, служащий необходимой и доста- достаточной предпосылкой непрерывности суммы; однако, на прак- практике почти всегда непрерывность суммы устанавливается как следствие равномерной сходимости ряда. Другой вопрос, в котором идея равномерной сходимости находит себе существенное применение, это — задача о «почлен- «почленной интеграции» функционального ряда. Пусть все члены ряда A2) — функции непрерывные (и, следовательно, интегрируемые) на отрезке [а, Ь\, можно ли утверждать, что в таком случае и сумма s(x) этого ряда интегрируема на этом отрезке и что Ь со b A3) подобно тому, как мы это имеем для конечных сумм? Легко видеть, что во всех рассмотренных нами до сих пор примерах равенство A3) действительно имеет место. Оно равносильно, конечно, любому из равенств ь ь lim \ sn(x)dx=\s(x)dx, в-*оо ( lim \ гп (х) dx = 0.
РЯДЫ 111 Можно, однако, показать, что эти соотношения не всегда имеют место. Прежде всего может оказаться, что функция s{x) неинтегрируема в отрезке [а, Ь); для этого достаточно, напри- например, выбрать (черт. 17) п2х @ < х < М , (< < х U^*^1 (соответственное выражение для ип (х) =sn (x) — ?„_](*) Вы, i i i i Черт. 17. Черт. IB. если угодно, легко установите сами); функция I— при 0<^ х<^ 1, ( 0 при x—0,s как вы знаете, неинтегрируема на отрезке [0, 1] (ибо \ s (x) dx — л- 1 0). = In »- оо при а а г Но может случиться и так, что функция 5 (х) интегрируема в отрезке [а, Ь], а равенство A3) всё же оказывается неверным. Например, пусть (черт. 18) = лл*-1A— хг—г
112 ЛЕКЦИЯ ЧЕТВЁРТАЯ Так как при 0^л<1 Hm «x~i = Oi), то s(x) = 0 (О ==S *=s? 1) n-*cc и, значит, 1 ^ s (л:) dx = 0; о между тем, как легко вычислить, Г Г 1 ' 1 \.sn(x) dx = n \ (*-' _**»-*) <fc.= _ — ^=1, ' о о вследствие чего равенство A3) действительно не имеет места. Но легко убедиться, что для всякого равномерно сходяще- сходящегося ряда непрерывных функций равенство A3) справедливо. Прежде всего, в этом случае, как мы уже знаем, функция s. (x) непрерывна и, следовательно, интегрируема на отрезке [а, Ь\, далее, для любою s ^> 0 существует такое целое число л0, что при п ^ па и любом х отрезка [а, Ь] Применяя известную вам теорему интегрального исчисления, согласно которой из \f(x) \ ^у (х) (а^х ?^Ь) вытекает ь ъ мы находим поэтому ь — а) ввиду произвольности ? это и показывает, что ь rn (x) dx — 0 а это равносильно равенству A3). 1) Элементарно это доказывается так: пусть 0 < х < 1, — = г, -1 = у О 0); тогда *» = A + У)" >\+пу + " (~ V >"("~1) и значит, /ьс" = — < г-—5 —*¦ 0 ПРИ п —* °°- г« in 1)уа
ряды 113 Равномерная сходимость, будучи, таким образом, достаточ- достаточной предпосылкой почленной интегрируемости ряда непрерыв- непрерывных функций, не является, как и в предыдущей проблеме, необходимым условием этой интегрируемости. Чтобы в этом убедиться, достаточно снова рассмотреть пример, приведённый на стр. 107; здесь сходимость неравномерна, но в то же время при п —>¦ оо т. е. имеет место равенство A3). Равномерная сходимость конкретно заданных рядов чаще всего устанавливается с помощью следующего простого призна- со ка: если 2 ап — сходящийся ряд с положительными членами п=Л и если для всех достаточно больших п и всех х ? М то ряд A2) равномерно сходится на множестве М. В самом деле, в условиях теоремы при достаточно большом п и любом для всех I ««+1 (х) ~\- ил+2(х) -\- ... + un+k(x)\ sS " n+k n+k 2 KM «? S a,.<s l=n+l i=n+l (последнее неравенство выполняется в силу критерия Коши для всех достаточно больших п при любом k ^> 0), откуда в силу критерия Коши ряд A2) сходится, и при достаточно большом и для всех х?М. I гп (х) | < ?, » что и требовалось установить. Степенные ряды. Бесспорно наиболее важный для анализа специальный класс функциональных рядов составляют так 8 А. Я. Хинчин. Восемь лекций
114 ЛЕКЦИЯ ЧЕТВЁРТАЯ называемые степенные ряды, т. е. ряды вида где с0, av а2,..., ап, ... суть данные вещественные числа. Мы рассмотрим здесь некоторые важнейшие свойства этого клас- класса рядов. Вы знаете прежде всего, что для степенного ряда всегда существует некоторый открытый отрезок (— г, 4- г) с центром в точке 0, так называемый интервал сходимости, внутри ко- которого данный ряд сходится, а вне — расходится; число г назы- называется радиусом сходимости данного ряда; г может иметь лю- любое значение от 0 до -}-оо, включая оба эти крайние значения (так. г=0 при ап = п\, г= 4- оо при ап = —-t); заданием ра- радиуса сходимости область сходимости данного ряда определяется с точностью до двух граничных её точек; именно, область сходи- сходимости может быть либо закрытым, либо открытым отрезком, либо, наконец, «полузакрытым», т. е. содержащим один из своих концов и не содержащим другого; так, каждый из трёх рядов с коэффициентами соответственно ап=\, ап= . , ап= I 1м имеет радиус сходимости, равный единице. Пер- Первый из этих рядов расходится при х=\ и х = — 1, т. е. в обоих концах интервала сходимости (этот ряд есть геометри- геометрическая прогрессия со знаменателем х); второй ряд при лг=1 обращается в гармонический ряд, а при х=— 1 в «ряд Лейб- Лейбница» • он, следовательно, расходится при х=\ и условно сходится при х = — 1; третий ряд абсолютно сходится в обоих концах интервала сходимости. Напомним вкратце, как устанавливается эта специальная форма области сходимости для степенных рядов. Вывод её основан на замечательной теореме: если ряд A4) сходится при х = а то он абсолютно сходится при люб ш значении х, для которого \х\<^а. Вот её доказательство: из сходимости ряда A4) при х=а вытекает, что апа"—»-0 при п—>оо; значит, существует такое с ^> 0, что | апап | <^ с (п = 1,2,...); пусть
ряды 115 теперь \х\ <^а|, тогда k=\ k=\ k=l 1 — так как правая часть от п не зависит, то левая остаётся ограни- ограниченной при п—»-оо, т. е. ряд A4) абсолютно сходится. Из этой теоремы сразу вытекает специальная форма области сходимо- сходимости для степенных рядов, так как вместе с точкой х этой области принадлежат и все точки, лежащие к нулю ближе, чем х. Другим следствием этой теоремы является то, что в каждой внутренней точке интервала сходимости ряд A4) сходится абсолютно. Что касается равномерной сходимости, то для всего интервала сходимости мы её утверждать не можем, как пока- показывает уже пример геометрической прогрессии (ял = 1): как оо бы велико ни было п, г (х) = 2 хк становится сколь угодно А+1 + большим, если х достаточно близко к единице. Но легко пока- показать, что степенной ряд сходится равномерно в любом отрезке, концы которого лежат внутри интервала сходимости. В са- самом деле, пусть г есть радиус сходимости ряда A4) и пусть О <^ г1 <^ /•; для всех х, удовлетворяющих неравенству | х j ^ г1, мы имеем при любом п ТО а так как 2 I ап I г'п есть сходящийся ряд с положительными и=1 членами, то ряд A4) по признаку, доказанному на стр. 113, равномерно сходится на отрезке | л: | <:/"'. Из этой теоремы между прочим вытекает то весьма важ- важное следствие, что сумма степенного ряда есть функция не- непрерывная в каждой внутренней точке интервала сходи- сходимости. В случае, когда ряд A4) сходится при x = r, можно впрочем утверждать, что он равномерно сходится на отрезке [0, г\ (и, значит, сумма его непрерывна на эгом отрезке); эта за- 8*
1 1 6 ЛЕКЦИЯ ЧЕТВЁРТАЯ мечательная теорема Абеля играет важную роль в теории функций. Для доказательства её установим сначала следующую эле- элементарную лемму, также принадлежащую Абелю: Щ "а п=п, п=п, где п2^>п^0, а яА и bk — любые числа. В самом деле, />,-! (««,_] — а«.) 4- *л,а„, = Теперь переходим к доказательству самой теоремы. Теорема Абеля. Если ряд A4) сходится при х= г ^> 0, /ио ом равномерно сходится на отрезке 0 sg: х < г. Доказательство. Пусть ? — произвольное положи- положительное число: в силу критерия Коши при всех достаточно больших п и любом k^>0 n-\-k /¦=rt+l л+ft положим для краткости 2 °/'' = ^(о0=0),так что | ak \ <[е /+1 fe=0, !,2, ...). Тогда при 0 n+ft л+ft А /i «"=«+1
ряды 117 а потому в силу доказанной леммы (и ввиду равенства а0 = 0) «=л-Н A * "+l -7) 1-7JgG в силу критерия Коши мы заключаем отсюда, что ряд A4) схо- сходится; переходя же к пределу при k—»-оо, получаем из послед- последнего неравенства, что при достаточно большом п \гп(х)\^е (О^х^г); зто и означает, что ряд A4) равномерно сходится на от- отрезке [0, г]. Необходимо отметить, однако, что из -ходимости ряда A4) при х = г неправильно было бы заключать о его равномерной сходимости во всём отрезке (—г, -\-г); так, ряд 1 1+2 3 +¦•• ' сходящийся при х=1, очевидно, расходится при х^—1 и не может сходиться равномерно на всём интервале сходимости (— 1, +1). Непосредственно ясно, что одна из важнейших задач, свя- связанных со степенными рядами, состоит в определении радиуса сходимости г по данным коэффициентам ряда ап; как Вы, ве- вероятно, знаете, элементарные признаки сходимости числовых ря- рядов с положительными членами дают возможность решить эту задачу в некоторых частных предположениях; так, например, если существует lim ^/|ал|=/ при п—»-оо, то /•=—, 4-°о л-»со ' или 0, если, соответственно, 0-<^/<^ —|— оо, / = 0и/=-}~:50- Можно, однако, указать метод, позволяющий решить эту за- задачу во всех случаях.
118 ЛЕКЦИЯ ЧЕТВЁРТАЯ л Теорема. Положим lim \Г\ ап | = /. Тогда. п-*оа — , если 0</<+со, О, если /= -f-oo, -j-oc, если /^0. Так как верхний предел (конечный или бесконечный) су- существует у всякой последовательности, то этой теоремой поставленная задача действительно решается во всех случаях. Прежде чем перейти к доказательству, вспомним: если число / есть верхний предел некоторой последовательности, то при любом е ^> 0 с некоторого места все члены этой последовательности меньше чем /-j-e; напротив, как уго но далеко в данной последовательности будут встречаться числа, большие чем / — е. Доказательство теоремы. 1) Пусть 0<^/<^4-°°; положим r=j-; нужно доказать, что, ряд A4) сходится при 0<^x<V и расходится при х^>т. j 1а) Пусть 0<С-*:<СГ==Г> так что 1х<^\; очевидно, можно выбрать число е^>0 столь малым, что (/ -\- е) х <^ 1; из определения числа / вытекает, что при достаточно боль- большом п и, следовательно, так как (/ -{- е) х <^ 1, то члены ряда A4) по абсолютной величине при достаточно большом п не превосходят соот- соответственных членов сходящейся геометрической прогрессии, откуда следует сходимость ряда A4). 1Ь) Пусть х~^> Г = -Г' так что ^х^> 1; при достаточно малом е ^> 0 мы будем иметь (/ — г) х ^> 1. По определению числа / существуют сколь угодно большие значения п, для л которых ]/~\ап\~^>1 — е, откуда \а„\~^>A — s)n, и, следова- следовательно,
ряды 119 Отсюда следует, что ряд A4) содержит бесконечное множе- множество членов, абсолютная величина которых превосходит еди- единицу; общий член его не может быть поэтому бесконечно малым, и ряд расходится. 2) Пусть / = 0; требуется доказать, что ряд A4) сходится для любого л: ^> 0. По определению числа / при достаточно большом п т. е. и-й член ряда A4) при достаточно большом п по абсо- абсолютному значению снова меньше л-го члена некоторой схо- сходящейся прогрессии; значит, ряд A4) сходится. 3) Пусть 1=-\~оо; требуется доказать, что ряд A4) расходится при любом х~^>0. По определению / мы для сколь угодно больших п должны иметь: снова, значит, общий член ряда A4) не может быть бесконечно малым, и ряд расходится. Таким образом, теорема доказана во всех случаях.
ЛЕКЦИЯ V ПРОИЗВОДНАЯ Производная функция и производные числа. — Дифференциал.— Теорема Лагргнжа. — Повторное дифференцирование.— Пределы отношений бесконечно малых и бесконечно больших. — Формула Тэйлора. — Экстремальные значения. — Частное дифференцирова- дифференцирование. — Неявные функции. Производная функция и производные числа. До сих пор мы преимущественно имели дело с возведением вспомога- вспомогательных аналитических конструкций или с анализом осново- основоположных понятий. Сегодня мы переходим в центральное здание математического анали а, которое составляют учения о дифференцировании и интегрировании. Пусть _у=/(х) есть функция переменной х, определённая в некоторой окрестности точки х = а. Если мы от этой точки перейдём к точке a-\-h, то функция у получит «приращение» f(a-\-h)—/(а). Если мы хотим получить представление о том, как быстро меняется величина у при изменении независимой переменной х, насколько «чувствительна» функция f(x) к та- такому изменению, то мы должны, конечно, так или иначе сопоставить, сравнить между собой приращение функции у и то изменение h величины х, которое повлекло за собой это приращение; естественнее всего рассматривать с этой целью отношение /(а-|-ft)-/(а) п ' v ' которое даёт нам среднее приращение функции у, рассчитан- рассчитанное на единицу приращения величины х; однако, расчёт этот произведён при определённом значении h и будет, вообще говоря, давать различные результаты при различных h\ для того, чтобы поставленная задача получила однозначное реше-
ПРОИЗВОДНАЯ 121 ние, мы должны будем условиться выбирать величину h на основе какого-либо единого принципа. Если нашей целью является исследование поведения функ- функции f(x) в ближайшем соседстве точки а, то ясно, что величина A) в качестве меры «изменчивости» функции у будет тем больше удовлетворять нашим запросам, чем меньше мы выберем |Л|; в самом деле, ведь величина A) характе- характеризует нам «среднюю изменчивость» функции в отрезке [a, a-\-h], который тем ближе примыкает к точке а, чем меньше |А|. От этих соображений для нас, знакомых с поня- понятием предельного перехода, уже всего один шаг до признания, что мы получим наиболее удовлетворительное решение нашей задачи, если за характеристику изменчивости нашей функции в ближайшем соседстве точки а примем предел величины A) при h—>-0 (в предположении, разумеется, что этот предел существует), т. е. величину fc-»0 " другая общепринятая система обозначений есть, как вы знаете: h = д*, f(a + Л) — f(a) = by, f (a) = llm Q . Cljc-уО *x Эту последнюю величину мы называем производной функции f(x) в точке а (или «при х^а»). Таким образом, производ- производная данной функции в данной точке призвана характеризовать собой относительную изменчивость этой функции в непосред- непосредственном соседстве данной точки; чем больше \f (а) |, тем чувствительнее величина у к малым отклонениям величины х от её начального значения а; знак же величины f (а) харак- характеризует направление этой изменчивости: величина /' (а) поло- положительна или отрицательна в зависимости от того, возрастает или убывает функция у при малых увеличениях, которые претерпевает величина л;, отправляясь от начального значения а. Если функцию y = f{x) изобразить графически, то инте- интересующая нас изменчивость иллюстрируется, очевидно, тем, насколько круто поднимается или опускается начерченная кривая, когда переменная величина х проходит через значе- значение а; в точных терминах, как вы знаете, производная иллю-
122 ЛЕКЦИЯ ПЯТАЯ стрируется угловым коэффициентом касательной к кривой y=f^x) при х=а. Наиболее простое реальное истолкование производная по- получает в том случае, когда независимая переменная х симво- символизирует время. При этом условии величина A) представляет собой среднюю скорость изменения величины у в течение промежутка времени [а, а-\-h\, а производная /'(а)—«истин- /'(а)—«истинную скорость» этого изменения в момент а; в частности, если y = f(x) означает путь, пройденный движущейся точкой за время от некоторого постоянного момента а до момента х, понятие производной в точности совпадает с механическим по- понятием мгновенной скорости. В математическом естествознании и других приложениях анализа производная играет такую выдающуюся роль именно потому, что она даёт локальную характеристику изучаемого явления в наиболее важном отношении — количественно оце- оценивает изменяемость одной из двух связанных между собой переменных величин при изменении другой. Если бы вы сегодня здесь слышали о производной в пер- первый раз, вы, вероятно, теперь спросили бы: почему же гово- говорят производная, откуда этот женский род? Ведь речь идёт о пределе, числе и т. "д. Но вы, конечно, знаете, в чём дело: «производная» сокращённо означает «производная функция»; весь расчёт и все рассуждения, проведённые нами для одной (произвольно выбранной) точки а отрезка [а, Л], мы можем проделать для любой точки х этого отрезка (в предположе- предположении, разумеется, что каждый раз вычисляемый предел суще- существует); получаемая таким образом функция /' (х) и называется производной функцией. Само собой разумеется, всё это рассуждение ничего не меняет в том основном факте, что производная есть локальная характеристика данной функции, особо вычисляемая для каждой отдельной точки и призванная описывать собой поведение этой функции не в целом отрезке [а, Ь], а лишь в ближайшем соседстве его отдельных точек. Функция f(x) называется дифференцируемой при х = а, если она имеет производную в точке а; она дифференцируема в отрезке [а, Ь], если производная существует в каждой внутренней точке этого отрезка. Очевидно, что дифференци- руемость есть, подобно непрерывности, локальное свойство функций. Вы'знаете, конечно, что дифференцируемой в точке а
ПРОИЗВОДНАЯ 123 может быть только функция, непрерывная в этой точке; это видно из того, что когда знаменатель дроби A) стремится к нулю, то для существования предела необходимо, чтобы стремился к нулю и числитель этой дроби, а это как раз и выражает непрерывность функции f(x) в точке а. Вы знаете, вероятно, также, что обратное заключение неверно: непрерыв- непрерывная функция может и не иметь производной; так, функция f(x), у которая изображена на черт. 19 и для которой нет надобности приводить аналитическое выраже- выражение, очевидно, непрерывна; в точке а существует предел выра- выражения A) при h —<¦ -\- О и при h—>¦ — 0, но эти два предела различны между собой (геометри- (геометрически это сказывается в том, что в точке а кривая не имеет единой касательной; можно надеяться, что О х Черт. 19. после нашей третьей лекции никто из вас не станет утверж- утверждать, что черт. 19 изображает «не одну, а две функции»). Поэтому предел при Л ->0 не существует. Пределы выраже- выражения A) при Л —>--|-0 и h—> 0, если они существуют, называ- называются соответственно правой и левой производной функции f(x) в точке а. Для дифференцируемости функции f(x) в точке а, очевидно, необходимо и достаточно, чтобы правая и левая производные в этой точке существовали и совпадали между собой. Черт. 19 даёт нам простейший пример случая, когда не- непрерывная функция в отдельной точке лишена производной; однако, здесь всё же существуют правая и левая производные; естественно поставить вопрос, всегда ли дело обстоит так; и легко убедиться, что бывают случаи, когда непрерывная функция недифференцируема в гораздо более глубоком смысле. Черт. 20 схематически изображает поведение функции у = = х sin — в соседстве точки х = 0; так как при х —»- 0 л: sin — ¦о,
124 ЛЕКЦИЯ ПЯТАЯ то, полагая дополнительно v = 0 при х = 0, мы видим, что функция у непрерывна в точке 0; но так как при стремлении х к нулю (например, справа) »- -\- оо и потому sin — бес- бесчисленное множество раз колеблется между -\-\ и —1, то У Черт. 20. jcsin — совершает бесчисленное множество колебаний между прямыми .у = х и у=^ — х; выражение A), равное в нашем случае sin— (при а = 0 и Л = д:), имеет частичными пре- пределами все числа отрезка [—1, -}-1]; верхний предел его есть -\-\, нижний —1; в точности то же самое мы имеем при х—»- — 0; таким образом, здесь в точке 0 нет ни правой, ни левой производной. В общем случае выражение A) имеет верхний и нижний пределы как при h—»--|-0, так и при h—»¦—0; эти четыре
производная 125 предела называют производными числами данной функции в данной точке; каждое 'из них может быть либо числом, либо одним из символов +;ос. Таким образом, любая функ- функция в любой точке (в некоторой окрестности которой она определена) имеет четыре производных числа: правое верхнее, правое нижнее, левое верхнее, левое нижнее; если оба правых (левых) производных числа совпадают, функция имеет в данной точке правую (левую) производную; в случае, когда все четыре числа конечны и совпадают между собой (и только в этом случае), функция дифференцируема в данной точке. Пример случая, когда все четыре производных числа в некоторой точке бесконечны, даёт функция ! 1 | х \ sin — при х =7^=0, у= \ х \ 0 при х=0 в точке х=0, как вы теперь легко разберётесь сами. Если теперь принять во внимание, что только что нари- нарисованная нами картина может для одной и той же функции в разных точках складываться совершенно по-разному, то вы поймёте, какое сложное образование может являть собой одна и та же функция в отношении к идее дифференцирования. Явления, подобные изображённому на черт. 20, отнюдь не всегда являются принадлежностью лишь отдельных, изолиро- изолированных точек; существуют непрерывные функции, имеющие с,толь же сложную структуру в соседстве каждой точки (и в частности, значит, нигде не дифференцируемые); к сожа- сожалению, рамки наших лекций не позволяют нам остановиться на каком-либо из построенных теперь уже в большом числе примеров подобных функций. Вместо этого рассмотрим пример применения производных чисел. Вы знаете, конечно, что для дифференцируемых функ- функций поведение их в смысле возрастания и убывания тесно связано со знаком производной функции. В частности, если во всех точках отрезка [а, Ь] /'(х)^О(^. 0), то функция f(x) — неубывающая (невозрастающая) на этом отрезке. Эти признаки возрастания и убывания не оставляют, конечно, же- желать ничего лучшего в тех случаях, когда они применимы, т. е. когда данная функция имеет производную; но в случае недифференцируем ых функций признаки этого рода, разу-
126 ЛЕКЦИЯ ПЯТАЯ меется, не дают ничего; а между тем при ближайшем иссле- исследовании оказывается, что идея подобного рода признаков возрастания и убывания функций ни в какой степени не стоит в зависимости от их дифференцируемое™; чтобы в этом убе- убедиться, докажем следующее предложение. Теорема. Пусть f (х) — непрерывная функция на от- отрезке [а, Ь] и пусть одно из четырёх производных чисел этой функции — обозначим его через Df(x) — неотрица- неотрицательно для всех а^х^Ь; тогда f(b)^f(a). Само собой понятно, что эта редакция признака сущест- существенно сильнее обычной, так как здесь речь идёт о любой непрерывной функции, вообще говоря, недифференцируемой. Доказательство. Пусть, в противоречие с утвержде- утверждением теоремы, f(b)<^f(a), и число е таково, что _ ^> ^> е ^> 0; пусть для определённости Df(x) — правое верхнее производное число функции f(x). Положим y(x)^f(x) — — j (а) -\- ? (х — а); очевидно, <и(а) = 0 и )(). B) Пусть М—множество точек отрезка [а, Ь], в которых О, и а — верхняя грань этого множества; если бы мы имели щ(а)^>0 (или !f(a)<^0), то точку а можно было бы окружить окрестностью U, в любой точке х которой и> (х) ^> 0 (или соответственно (р(дгХ'О); с другой стороны, в силу опре- определения верхней грани любая окрестность точки а должна со- содержать точки, где w(x) = 0. Это противоречие показывает, что ф(а) = 0. Так как;р(?)<^0, то, очевидно, cp(jc)<^0 для а. <^ х =s: b; для любого такого х х — о вследствие чего и Dtp (a) sS 0. Но откуда что стоит в противоречии с условием теоремы, которая таким образом доказана.
ПРОИЗВОДНАЯ 127 Дифференциал. Следующим основным понятием учения о дифференцировании служит понятие дифференциала. В на- настоящее время мы считаем дифференциал вторичным понятием, определяемым через понятие производной; однако это не все- всегда было так; в'эпоху зарождения анализа бесконечно малых и ещё долгое время спустя первичным понятием анализа счи- считали именно дифференциал, производную же определяли как отношение дифференциалов, т. е. как вторичное понятие. При этом часто понятие дифференциала оставалось без чёт- чёткого определения и даже несло в себе противоречивые черты, так как в эту эпоху в математике диалектические приёмы мышления, способные охватить в качестве единого объекта переменную величину в процессе её изменения, не получили ещё достаточного развития. Формальное определение дифференциала вам, конечно, из- известно: мы называем дифференциалом функции y = f(x) ве- величину где Дл: — приращение независимой переменной; дифференциал функции /(х) есть, таким образом, функция двух независимых между собой переменных — величины х и её приращения Ах; значения этих двух переменных никак между собой не связаны и могут быть выбраны совершенно независимо друг от друга. Рассматривая, в частности, функцию у = х, мы приходим к выводу, что dx=\x, т. е. для независимой переменной дифференциал и приращение всегда совпадают между собой; подставляя в формулу C) dx на место Ад:, мы находим: dy = f'(x)dx, откуда т. е. производная равна отношению дифференциала функции к дифференциалу независимой переменной. Эти чисто формальные рассмотрения не позволяют ещё, однако, понять то огромное значение, какое имеет понятие дифференциала для анализа и его приложений. Чтобы разо- разобраться в этом вопросе, надо вглядеться в идею дифферен- дифференциала по существу. Будет, может быть, всего убедительнее начать с рассмотрения того частного случая, когда х означает
128 ЛЕКЦИЯ ПЯТАЯ время, a y = f(x) — путь, пройденный движущейся точкой за промежуток времени от 0 до л. В этом случае, как мы знаем, производная /' (х) означает мгновенную скорость движу- движущейся точки в момент х; следовательно, dy = f'(x)\x есть величина того пути? который прошла бы движущаяся точка за промежуток времени [х, х-\-Ьх], если бы в течение этого промежутка она двигалась равномерно с той скоростью, какую она имеет в начале этого промежутка. Действительное рас- расстояние, пройденное точкой за этот промежуток времеьи, бу- будет, вообще говоря, другим, так как скорость не будет оставаться постоянной. В общем случае, как мы знаем, производная /' (х) может рассматриваться как мера относительной изменчивости вели- величин у и х при данном значении х; дифференциал dy = f (x) Ад: мы можем поэтому рассматривать как то приращение, которое получила бы функция у (при изменении величины х от её первоначального значения но х-\- \х), если бы во всех точках отрезка [х, х-\-1х\ эта мера оставалась такой же, какова она в начале этого отрезка. Эту концепцию наглядно иллю- иллюстрирует черт. 21: dy есть приращение, которое получила бы на пути от х до х-\-&.х ордината кривой y^f(x), если бы наклон кривой на всём этом промежутке был такой же, как в точке х, т. е. если бы мы эту кривую заменили касатель- касательной, проведённой к ней в точке, абсцисса которой равна х.
ПРОИЗВОДНАЯ 129 Вероятно, многим из вас известно, что в прикладных нау- науках при малых значениях Ах часто не делают различия между приращением Д_у и дифференциалом dy функции y^f(x); иногда это даёт даже повод к неправильному и вредному представлению о дифференциале как о «бесконечно малом приращении» (в действительности дифференциал, вообще говоря, не является ни приращением, ни бесконечно малой величиной). Нам полезно будет постараться ответить на два вопроса, естественно встающих по поводу такой замены: 1) в какой мере эта замена обоснована? и 2) какую пользу может она принести? Чтобы ответить на первый вопрос, будем исходить из со- соотношения обозначим через а бесконечно малую в силу этого соотноше- соотношения разность д=- — /' (х); это даёт C') Так как а—»-0 при Дх-^О, то произведение а Ах есть бес- бесконечно малая высшего порядка сравнительно с Ах; но отноше- отношение -р =/'(-*•) есть величина постоянная, а отношение -Л- при Ах—»-0 имеет эту постоянную величину своим пределом; по- поэтому, если только /' (х) ^= О, все три величины Ах, Ay, dy имеют одинаковый порядок малости, так что величина а Ах, будучи бесконечно малой высшего порядка сравнительно с Ах, есть вместе с тем бесконечно малая высшего порядка и отно- относительно каждой из величин Ay, dy; таким образом, получен- полученное нами соотношение показывает, что, если f'(x)^4=0, раз- разность между приращением и дифференциалом функции при Ах—»-0 есть бесконечно малая высшего порядка по сравне- сравнению с каждой из этих величин в отдельности; другими словами, заменяя приращение дифференциалом (или обратно), мы допускаем лишь бесконечно малую относительную по- погрешность. 9 А. Я. Хинчин. Восемь лекций
130 лекция пятая Полученное нами соотношение при /' (х) =fc 0, очевидно, равносильно соотношению йу ' /' (х) -0), показывающему, что Ду и dy — эквивалентные бесконечно малые при Дх—>-0. На этих результатах и основывается возмож- возможность замены приращения функции при малых \х, в порядке приближения её дифференциалом. Чтобы ответить на второй поставленный вопрос — какую пользу может принести замена приращения функции её диф- дифференциалом, заметим, что строение дифференциала теорети- теоретически проще и практически удобнее, чем строение приращения; дифференциал dy есть линейная функция величины \х, ха- характер её изменения при изменении \х исключительно прост и изучение его не требует ничего, кроме вычисления значения /' (х) в одной точке; разумеется, ничего похожею мы не имеем для величины Ау. Представьте себе, например, что вы хотите составить таблицу значений функции _у = sin x при значениях х, очень близких к 60°, например 6О°ОГ, 60С02' и т. д. У вас нет средств для отыскания точной величины этих значений. У Уз Вы знаете, что при х=§0°y=-^~ , но при переходе к дру- другим, близлежащим значениям х у вас нет метода для отыска- отыскания соответствующих приращений Д_у величины у; теперь посмотрите, что получится, если вы, пользуясь малостью при- приращений 1х в вашей задаче, решитесь заменять приращения Д_у дифференциалами dy, так как у' = cos 60°= -^-, то dy^ -^ ±х, где 1х выражено в радианной мере fare Г = 18(Гвп), вслед- вследствие чего мы сразу получаем:
ПРОИЗВОДНАЯ 131 Как мы видели, дифференциал dy обладает следующими двумя замечательными свойствами: 1) он есть линейная функ- функция от Ддг и 2) он отличается от Ьу на бесконечно малую высшего порядка по сравнению с Да:. Покажем теперь, что этими двумя свойствами дифференциал полностью определяется, так что можно было бы начинать учение о дифференциале именно с такого определения (хотя, конечно, для доказатель- доказательства существования дифференциала у всякой дифференцируе- дифференцируемой . функции всё равно нельзя было бы избежать введения производной). В самом деле, пусть dy=alx-\-b, где а и b не зависят от Ад;, и пусть Ау — dy^=a Ал% где а —»- 0 при Ал: —<- 0. Тогда ky = dy-\-a lx=(a-\-a)\x-\-b; если функция у непрерывна (что мы предположим), то 1у—>-0 при Адг—>-0, вследствие чего необходимо ft = 0 и Лу = (а -|-a) Ал\ откуда = а + а lim = /'(л:) = а что и требовалось доказать. Из других свойств дифференциала важное значение имеет (но во многих руководствах не оттеняется в достаточной мере) так называемая инвариантность его относительно любой за- замены независимой переменной. Вот что это значит. Если х есть независимая переменная, то, как мы видели, dy = f'(x)lx = f(x)dx; D) пусть теперь мы устанавливаем взгляд на величину х как на функцию л; =ii(?) новой переменной t; ясно, что при этом оба соотношения D) не могут остаться справедливыми, так как теперь уже (вообще говоря) dx = у' (t) \t =? Адг. Замечательно, что второе соотношение, т. е. dy = f'{x)dx, остаётся в силе при любой такой замене; в самом деле, в результате этой замены у становится функцией от t: 6 отсюда по правилу дифференцирования функции от функции dy = ф' $) dt=f [f (t)\ f (t) dt, 9*
132 ЛЕКЦИЯ ПЯТАЯ а так как w(t) = x, w'[t)dt=dx, то, действительно, dy = ==/' (x)dx, как если бы х была независимая переменная. Таким образом, в выражении производной у'=^ безразлично, есть ли х независимая переменная или функция какой-нибудь дру- другой переменной. Мы только что пользовались правилом дифференцирования функции от функции. Вообще говоря, мы в этих лекциях не собираемся говорить об элементарных правилах дифференциро- дифференцирования; но именно этому правилу стоит уделить немного внима- внимания, потому что в большинстве руководств оно выводится либо неправильно, либо излишне сложно; вот его простой и правильный вывод1): пусть у = /(л:), л: = ср(?), y=ty(t) = ==/[<?(')]; функции / и ц> предполагаются, разумеется, диф- дифференцируемыми, так что в соотношении C') а—> 0; при Да:—>• 0; из этого соотношения но при М—>¦ 0 мы имеем а—«-О, ¦?—*¦<?'(*) и -^—>¦ ф'(<), вследствие чего в пределе Ф' (t) = Г (х) <?' @ = Г[ч (/)]'/ (t); это и есть правило, которое мы имели в виду вывести. Теорема Лагранжа. Построение здания дифференциаль- дифференциального исчисления в значительной своей части основано на тео- теореме Лагранжа, являющейся первым образцом так называемых «теорем о среднем значении», которым мы, ввиду их крайне важного значения для всех разделов анализа, и в дальнейшем должны будем уделять достаточное внимание. Теорема Лагранжа. Если функция f(x) непрерывна на отрезке [а, Ь] и дифференцируема внутри его, то суще- существует такая внутренняя точка с этого отрезка, для которой Сообщёв М. А. Крейнесом.
ПРОИЗВОДНАЯ 133 Доказательство. Очевидно, что функция дифференцируема в отрезке [а, Ь\\ так как »(а) = ср (?) = (), то либо ъ(х) = 0 для всех х?[а, Ь], и тогда для всех таких х у'(х) = 0; либо же <р (л:) внутри отрезка принимает отличные от нуля значения, и тогда среди этих значений найдётся либо наибольшее, либо наименьшее (так как функция ъ (лг) непре- непрерывна); пусть для определённости функция у(х) принимает наибольшее значение при х = с, а<^с<^Ь; тогда необходимо <р'(с)=О, ибо при ш'(с)~^>0 мы имели бы для достаточно малых положительных h у {с -f- h) — ? (о h откуда '? (с -\- h) ~^> ф (с), что противоречит определению точки с; в случае w'(c)<^0 мы получаем аналогичное противоречие, давая h отрицательные значения; но из ф' (с) = 0 вытекает (А), и теорема доказана. Очень часто её формулируют в другой системе обозначений: если концы данного отрезка суть х и х-\-Ьх, то говорят о существовании такого числа б@<^6<^ 1), что /' (л: -|— 6Ллг) Ал: = = /l*-f Ддс) — f[x). Для функций, обладающих производными высших порядков, теорема Лагранжа допускает важное обобщение, которое мы сейчас докажем. Теорема. Если функция y = f(x) на отрезке [х, х-\- -\- п 1х] имеет непрерывную производную порядка п — 1, а внутри отрезка — производную порядка л1), то сущест- существует такще число 6 @<^6<^1), что Ьпу = р"Цх-{-{)п\х)(\х)п. (В) Здесь Д"у означает так называемую «разность порядка п> данной функции y^f(x); разность первого порядка есть про- просто приращение А^ = f(x -j- Ал:) — f(x); разность порядка п-\-\ определяется, как (первая) разность от разности по- 1)- На концах отрезка достаточно существование односторонних производных порядка л — 1.
134 ЛЕКЦИЯ ПЯТАЯ рядка п, так что, в частности, = [f(x + Ьх + А*) — f(x + А*)] — [/(* + Ах) — f(x)] = = /(* 4- 2 Аде) — 2/(лс 4" Д«) 4- /(*): A3 .У = /(* 4-ЗД*) — 3/(дс + 2Д*) 4- 3/(х 4- А*) — fix) и т. д. Вообще, как легко доказать методом полной ин- индукции, ... 4-( — 1 У1 я/(дг + Длг) 4- ( — 1)" Доказательство. При п = 1 доказываемая теорема совпадает с теоремой Лагранжа. Допустим поэтому, что тео- теорема верна для разностей порядка п, и покажем, что она верна и для разностей порядка и-J- 1. Мы предполагаем, следо- следовательно, что функция y = f{x) имеет непрерывную производ- производную порядка п на отрезке [х, х-\-(п -\- 1) Адг] и производную порядка я-(-1 внутри него; отсюда функция \y=f(x-\- -\- Адг) —f ix) имеет производную порядка п на отрезке [х, х-\-п\х]; мы можем, следовательно, применить нашу теорему к её разности л-го порядка, что даёт Д« (Ду) = (Ал:)" {/«> (л-4- Ал-ГЛ« Алг) — /<«> (а: + 6,и Ал;)}, где 0<^6,<^1; но из наших предпосылок вытекает, что функ- функция /*"' непрерывна на отрезке [аг4-Й1иАдг, дг4-A -(-&,«)Адг] и дифференцируема внутри него; поэтому, применяя к фигур- фигурной скобке предыдущего равенства теорему ЛагрДпка, нахо- находим: 4- ei«AA: 4- 62Дл") = что и требовалось доказать. Другое важное обобщение теоремы Лагранжа представляет собой замечательная «формула Коши». Пусть мы имеем бее функции /, (дг) и f2ix), непрерывные на отрезке \а, Ь\ и диф- дифференцируемые внутри него, причем f'2ix) нигде внутри
производная 135 этого отрезка не обращается в нуль. Тогда существует внутри [а, Ь\ такая точка с, что v ' Доказательство этой общей формулы (при f2 (х) = х пере- переходящей в теорему Лагранжа) проводится совершенно так же, как и в случае теоремы Лагранжа; полагая ?(¦*) = /, (¦*) [/.(*) — /*(«)] —/*(*) [f^ (*)— U М- мы находим, что ц(а)=.ъ(Ъ\, поэтому функция ц>(х) либо постоянна в отрезке \а, Ь], либо принимает внутри этого отрезка наибольшее или наименьшее значение; отсюда в точ- точности тем же путём, как в доказательстве теоремы Лагранжа, мы заключаем, что в некоторой точке с, а<^с<^ Ь, мы должны иметь <р' (с) = 0, что равносильно утверждаемому равенству (С). Заметим ещё, что левая часть этого равенства не может оказаться лишённой смысла, так как при f2(a)= f2(t>) функ- функция /я{х) в силу теоремы Лагранжа должна была бы обра- обращаться в нуль внутри [a, b\, что исключается предпосылками теоремы. Повторное дифференцирование. Производные и диф- дифференциалы высших порядков определяются, как вы знаете, индуктивно: производная порядка п получается дифференциро- дифференцированием производной порядка п — 1 и аналогично обстоит дело для дифференциалов. Производные и дифференциалы высших порядков функции y = f(x) связаны между собой соотношениями dny = fn)(x)dxn E) (где dxn означает п-ю степень первого дифференциала неза- независимой переменной х), которые доказываются также индук- индуктивно: если х—независимая переменная, то а"х = Лх не за- зависит от а:, а потому, дифференцируя соотношение E), нахо- находим (штрих Означает дифференцирование по х): dn+1y = d(d"y) = (d"y)' dx = fn^
136 ЛЕКЦИЯ ПЯТАЯ Как мы видели выше, при п=: 1 соотношение E) остаётся верным и в том случае, когда х (а значит, и у) есть любая диф- дифференцируемая функция независимой переменной /: x = y(t). Легко убедиться, что уже при п = 2 дело обстоит иначе: диф- дифференциалы высших порядков не инвариантны относительно замены независимой переменной. В самом деле, будем обозна- обозначать второй дифференциал функции y = f(x) через (cPv)x или (d2y)t в зависимости от того, считаем ли мы независимой переменной величину х или величину t. Тогда между тем как = f (х) dx* Мы видим, что эти дна выражения различны; второе содержит добавочный член f [w (t)] у" (t) dt2, которого нет в первом и который тождественно обращается в нуль только в том случае, когда х есть линейная функция от t; to (t) = at -\- b; таким образом, второй дифференциал, в отличие от первого, инва- инвариантен лишь относительно линейных преобразований независи- независимой переменной. Можно определять производные высших порядков и иначе, связывая их с разностями соответствующих порядков; подобно тому, как первая производная является пределом отношения -Л- при Дл: —>¦ 0, можно показать, что Если функция /("> (а:) непрерывна, то соотношение F) является непосредственным следствием формулы (В), но важно устано- установить, что справедливость соотношения F) не зависит от этой предпосылки. Так как соотношение F) верно при й=1, то надо только, предположив, что оно верно для некоторого числа*л, убедиться, что оно должно оставайся верным и для числа п -\- 1 (причём, конечно, предполагается, что функция у = /(х) имеет произ-
ПРОИЗВОДНАЯ 137 водную порядка л-|-1). Пусть же соотношение F) для дан- данного п (и для любой п раз дифференцируемой функции у) справедливо. Так как функция имеет производную порядка п, то мы можем применить к ней формулу (В); это даёт (как мы уже видели, стр. 133): }, G) где 0<^6<^1. Но так как в силу существования fn+if (х) /i»> (х 4- Ьп Д* + Д*) — /(П> (*) = A + «0) Д* {/ln+1) ix) + ax}, /") (а:-(-0« Д^) —/(П) W = «6 Да: {/("+J> (л:) где а,—»0 и а2 —^ 0 при Да:—-0, то = Ьх р»+п (х) 4- а, A + пЬ) Дл: — а2 лб Да:, вследствие чего соотношение G) даёт откуда в пределе при Да:—«-0 получается что и требовалось установить. Пределы отношений бесконечно малых и бесконечно больших. Среди приложений формул Лагранжа и Коши рас- рассмотрим в первую очередь важный вопрос, фигурирующий обычно в курсах анализа под совершенно нелепым наимено- наименованием «раскрытия неопределённостей» '). По существу здесь речь идёт об использовании методов дифференциального исчи- исчисления для отыскания пределов отношений двух бесконечно малых или двух бесконечно больших величин. 1) Ещё более нелепо наименование «нахождение истинных значе- значений неопределённых выражений»: не говоря уже о том, что никаких «неопределённых выражений» анализ вообще не содержит, здесь «истинным значением» функции в данной точке называется число, вообще говоря, отличное от её фактического значения.
138 ЛЕКЦИЯ ПЯТАЯ Пусть /, (а) = /2 (fl) = O, причём в некоторой окрестности точки а обе функции дифференцируемы, и f^(x)^=0 при х=?а- Так как при /, (а) = /2 (а) = 0 формула Коши (С) даёт то мы можем утверждать (правило Лопнталя): если /, (а) = /! <*> = Д (а) = 0 и отношение —— стремится к некоторому пределу при х —>- а, /яо л: тому же пределу стремится Если /| (а) = /i(fl) = 0, то, повторяя это рассуждение, мы находим (предполагая, разумеется, существование вторых про- производных функций /, (а:) и /2 (д:) в некоторой окрестности точки а): при /j (a) =/2 (л) = /I (а) ^У^ (а) = 0 из соотноше- соотношения lim -i— = / вытекает, что и lim ^г =/; вообще, если х-ю /, (fl) = /, (а) =... = /}п-1} (а) = /2 (а) = и если функции /, (лг) и /2 (а:) в некоторой окрестности точен а /\п) W , имеют производные порядка п, то из соотношения ——г > I (л:—*а) вытекает, что и'^ +1(х—-а). Если f\n) (х) и J^n)(x) непрерывны в точке а и J^n) (а)^=0, то отсюда сле- следует, что ^ 4^. (8) ¦x-o/j^) 4 («> Правило Лопиталя является весьма мощным орудием вы- вычисления пределов и во многих случаях позволяет с большой лёгкостью находить эти пределы там, где применение элемен- элементарных методов вызвало бы большие затруднения. При /, (а:) = = tg х — sin x, f2 (x) = х3 мы имеем /, @) = /J @) =
ПРОИЗВОДНАЯ 139 = /1-@)=0,Д"'@)=3, /2@)=/2@)=/1"@)=0, Л'"@)=6, вследствие чего по формуле (8) tg х — sin x /i"(°) 1 Правило Лопиталя остаётся в силе и в случае В самом деле, Mm ^= в силу же доказанного нами правила Лопиталя последний предел совпадает с f 1 /1 \ = llm ? в случае, когда этот предел существует; конечно, необходи- необходимой предпосылкой правила здесь служит условие lim /,(*)= Hm f2(x)=0. Более того, правило Лопиталя может быть применяемо и к отысканию предела отношения бесконечно больших величин, хотя здесь доказательство его несколько сложнее. Пусть для определённости при х —^а /,W- + ~nf!W^ + o°: а х 5 а кроме того, мы предположим, — • ¦ ¦ как и прежде, что f2 (x> не Черт. 22. обращается в нуль в некото- некоторой окрестности точки а. Возьмём в этой окрестности две любые точки х и а так, чтобы х лежало между а и а; пусть для определённости а<^х<^а (черт. 22); в силу формулы Коши.(С) мы имеем:
140 ЛЕКЦИЯ ПЯТАЯ где ? — некоторая внутренняя точка отрезка [л:, о]. Так как, с другой стороны, 1 А (¦*•)-/! И = A W А и» то равенство (9) даёт нам ( Я i AW Теперь мы распорядимся выбором точек л: и а более де- детально. Если, как мы предполагаем, существует г К(Х) / lim —— = /, то при сколь угодно малом е ^> 0 найдётся такая окрестность U точки а, что для всех x?U пусть а (а значит, и а:) принадлежит этой окрестности; тогда и ??(J, а потому / — ?<С~—<СЧ~?> оставим теперь а неизменным, а х будем неограниченно приближать к а; так как при этом /, (а:)—>- -f-оо и /2{х)—> + ос, то второй множитель правой части формулы A0) стремится к единице, так что для всех х в некоторой окрестности V точки а он будет заключён между 1—ей 1 -j-e, вследствие чего для всех x?V формула A0) даёт так как е сколь угодно мало, то х-*а что и требовалось доказать.
ПРОИЗВОДНАЯ 141 Это правило, подобно правилу для отношения двух бес- бесконечно малых, остаётся в силе и при а = +00. Примеры: 1) f1(x) = lnx, f2(x) = — при лг—>-0. /it-*)—~ — °°. Ых) —+ °°. J~ =—х —°: отсюда |^| = -0 при лг—>-0. 2) При /2 (*) = .*:—»--j-oo мы имеем /, (л:) = 1п лг —>• -j- оо, причём —}— = »¦ 0; отсю- h (х) х In X _ . . „ дат^= »-0 (лг—»--^оо); полагая лг = еу, находим: хе-*—~0 (лг—^ + оо). Формула Тэйлора. Теперь мы должны остановиться на формуле Тэйлора, служащей, как вам, вероятно, известно, одним из важнейших орудий исследования как в самом ана- анализе, так и в его приложениях. Эта формула, подробно рас- рассматриваемая во всех курсах анализа, требует 'Нашего внима- внимания потому, что при обычных изложениях её вывода идейная сторона дела остаётся совершенно в тени, уступая место ничем не оживлённому формализму, вследствие чего для мно- многих учащихся в дальнейшем то важное значение, которое получает эта формула, является неожиданным, а подчас и навсегда остаётся загадкой. Как мы уже не раз отмечали, основное соотношение Л-0 h может быть записано в эквивалентном виде где а—>-0 при h—>-0; здесь ah есть, следовательно, беско- бесконечно малая высшего порядка относительно Л, т. е. величина, отношение которой к h стремится к нулю при h —>¦ 0. Условимся вообще обозначать через о(х) всякую вели- величину, отношение которой к величине л: стремится к нулю в данном процессе изменения; тогда произведение ah мы мо- можем записать в виде о (Л); так как для всякого о (Л) по определению
142 ЛЕКЦИЯ ПЯТАЯ то и, обратно, всякое o(h) может быть представлено в виде ah, где а—>-0 при h—»-0; поэтому соотношение A1) может быть записано в виде как мы видим, эта формула имеет место во всех случаях, когда существует /' (а); мы уже не раз имели случай приме- применять её, и непосредственно ясно, чему она обязана этой своей плодотворностью: если h столь мало, что величинами типа о (А) можно пренебрегать, то приближённая формула позволяет нам в целях исследования заменять ту сложную, вообще говоря, функцию от h, какую представляет собой f(a-\-h),—линейной функцией, стоящей в правой части; ясно, какую это даёт существенную выгоду. Теперь будет совершенно понятным, если мы пожелаем продолжить это полезное мероприятие несколько дальше. Если мы хотим получить лучшую точность, то мы иногда не можем довольствоваться приближёнными формулами, погреш- погрешность которых мала сравнительно с /г, может, например, слу- случиться, что мы должны ещё учитывать величины порядка Л2, а пренебрегать можем лишь величинами типа о (Л2), т. е. бесконечно малыми сравнительно с Л2, тогда мы, естественно, ставим вопрос об отыскании такой функции второй степени au-\-axh-\-a^№, чтобы при малых h имело место соотноше- соотношение вообще, если мы хотим учитывать величины порядка Л", но соглашаемся пренебрегать величинами типа о (Л"), то мы, естественно, ищем такой многочлен а0 -\- axh -\-.. . -\- anhn = = Я„(Л), чтобы имело место соотношение ) = Pn(h)-\-o(h"); если эту задачу удаётся решить, то мы получаем возмож- возможность во всех вопросах, где можно пренебрегать величинами типа о (Л"), вместо сложной, вообще говоря, функции f(a-\-h) пользоваться простым многочленом я-й степени.
ПРОИЗВОДНАЯ 143 В случае п = 1 мы получили решение поставленной за- задачи, предполагая, что функция f(x) имеет первую производ- производную при л: = й; в общем случае мы, естественно, будем ис- исходить из предположения, что существует /^"' (а); очевидно, это требует от функции f(x) существования производных всех низших порядков в некоторой окрестности точки а. Знаменитая теорема Тэйлора в основном как раз и даёт решение поставленной нами задачи, т. е. доказывает сущест- существование искомого многочлена Рп (Л) и даёт выражение для его коэффициентов. В силу этой теоремы, в случае, если /(п) (а) существует, многочлен Рп (Л) однозначно определяется формулой Рп (*) = / И + hf (а) + -J /" (я) +... + ^ /I») (С). Иначе говоря, в силу этой теоремы /(а + Л) = /(а) + Л/'(а) + |1/"(а)+... + 2 + о(А"). A2) Положим тогда для доказательства нашего утверждения достаточно убедиться, что ^— 0 при Л— 0. A2') С этой целью заметим, что <р (*) = / (* + *) — f(a) — hf(a) — ... — ~faHa), <р' (Л) = / (а + А) — /' И — Ц" (а) — ... — ^Гу /"> {а), "-2> (Л) = /t"-2> (а + Л) — /("-2» (а) — Л/(п-1> (а) — у /1"> (а), "-!) (Л) =/l"-D (а + Л) — /'n-D (й) — Л/1") (а), откуда <р @)= »' @) = ... = 'ХI«—2) @) = 0. Так как произ- производные функции h" до порядка п — 2 включительно также обращаются в нуль при Л = 0, а производная порядка п—1
144 ЛЕКЦИЯ ПЯТАЯ равна n\h, то по правилу Лопиталя если только предел правой части существует; но }=о. так как /(л) (а) по предположению существует; этим доказано соотношение A2'), и тем самым закончен вывод формулы Тзйлора A2). В дальнейшем представляет, конечно, интерес найти удоб- удобные выражения для «остаточного члена» o(h") формулы A2), чтобы в нужных случаях оценивать его с возможной точностью. Мы здесь напомним наиболее употребительные формы этих выражений, не приводя их выводов, которые вы можете найти в любом полном курсе анализа. Обозначим через Rn (h) ве- величину, имеющую в формуле A2) анонимное обозначение o(hn). В силу самой формулы Тэйлора мы при существова- существовании /^я+1)(а) имеем: .. *„№)__/*"+') (я) . если мы допустим, что /(п+1'(лг) существует не только при х = а, но и во всех точках отрезка [a, a-\-h], то мы мо- можем получить для Rn(h) известную «форму Шлёмильха»: АЯ + 1П fiyi + l—p Я» <А) = п\р где О<^0<^1, а р — произвольное положительное число eg; n _|_ 1. Из этой весьма общей формы при специальных выборах числа р получается ряд различных особых форм; наиболее употребительные из них получаются: 1) при р = « —|— 1 «форма Лагранжа»: 2) при р=1 «форма Коши»:
производная 14о В Этих специальных формах, как и в общей формуле Шлё- мильха, предполагается, что /(™+1)(лг) существует в каждой точке отрезка [a, a-\-h]. Вы знаете, что формулой Маклорена называют (ничем особо не замечательный) частный случай формулы Тэйлора при а=0: Л0) + Экстремальные значения. Важной областью применения формулы Тэйлора в элементах дифференциального исчисления служит теория максимальных и минимальных значений, с осно- основами которой Вы, конечно, знакомы. Если разыскивается, скажем, точка отрезка [а, Ь], в ко- которой функция y = f(x), дифференцируемая в этом отрезке, принимает своё наибольшее значение, то этот «абсолютный максимум» может, очевидно, осуществиться либо в одном из концов отрезка [а, Ь], либо в некоторой внутренней его точке с; в последнем случае точка с есть вместе с тем точка «отно- «относительного максимума»; это значит, что /(с) 5^ f(x) для всех х, принадлежащих некоторой окрестности точки с. Таким образом, отыскание абсолютного максимума функции в данном отрезке сводится к отысканию всех её относительных макси- максимумов в этом отрезке; именно к этой задаче и применяются методы дифференциальною исчисления. Вы знаете, конечно, что необходимым условием для того чтобы точка х (а <^ х <^ Ь) давала относительный максимум (или минимум) дифференцируемой функции f(x), служит равенство f(x) = 0. A3) Таким образом, первым шагом к решению поставленной за- задачи является отыскание всех вещественных корней уравне- уравнения A3) — так называемых «критических значений» переменной х; после того как это сделано, каждое отдельное критическое значение подвергается особому исследованию, которое должно установить, имеет ли место в данной точке максимум или минимум или нет ни того, ни другого; вот на этом-то иссле- исследовании мы теперь немного остановимся. Пусть а — одно из критических значений х для функции /(*), т. е. а<^а<^Ь и /'(а) = 0; допустим для общности, что 10 А. Я. Хинчин. Восемь лекций
146 ЛЕКЦИЯ ПЯТАЯ /><>(а) = 0 при 1 ==?/<«, но /<")(а)фО. В таком случае фор- формула ТэйлораA2) даёт А»^^ + о(А»); A4) очевидно, что знак правой части, второе слагаемое которой бесконечно мало сравнительно с первым, при достаточно ма- малых | h | совпадает со знаком её первого слагаемого, т. е. со знаком произведения Л"/'"' (а). Если число п нечётное, то Л", а значит, и это произведение, меняет знак при изме- изменении знака величины А; в силу A4) в этом случае и знак разности f(a-\-h) — f(a) будет различным для приращений Л разного знака, а это, очевидно, означает, что при х^а функ- функция f(x) не может иметь ни максимума, ни минимума. Пусть теперь п — четное число, так что Л"^>0 при любом h=/=0; тогда знак разности f(a -f- h) — f(a) для всех достаточно малых \h\ совпадает, очевидно, со знаком величины /1л) (а), уже не за- зависящей от Л; в случае /<"' (а) ^> 0 это означает, что для всех достаточно малых | h \ т. е. что в точке а функция f(x) имеет относительный мини- минимум; точно так же мы убеждаемся, что в случае /*">(а)<^0 функция f(x) имеет относительный максимум при х^а. Та- Таким образом, мы приходим к следующему правилу: пусть сре- среди производных функции f(x) при лг = а первая не обраща- обращающаяся в нуль имеет порядок п; тогда при чётном п f(x) имеет в точке х=а максимум, если /(")(а)<^0, и мини- минимум, если /("'(а)^>0; при нечётном же п f(x) не имеет в точке а ни максимума, ни минимума. Вы видите, что этим правилом вопрос о природе каждой критической точки решает- решается до конца, если только функция дифференцируема в этой точке достаточное число раз л если не все её производные обращаются в нуль в этой точке. Частное дифференцирование. Теперь мы должны обратить- обратиться к функциям нескольких переменных; для простоты мы огра- ограничимся при этом рассмотрением случая двух независимых переменных х и у.
производная 147 Вы знаете, конечно, что частная производная f'x (x, у) или , функции f(x,v) по переменной х определяется как т. е. как обыкновенная производная той функции от х, в ко- которую переходит функция /(лг, у) после придания переменной у какого-либо постоянного значения; аналогично определяют -^L=f'(x, у); каждая из этих частных производных есть функция тех же двух переменных лг и у, от которых зависит и /(лг, у). Ради удобства и наглядности мы будем и здесь часто слова «при х = а, д>=Л» заменять выражением «в точ- точке (а, Ь)», имея в виду точку плоскости (л:, v) с декартовыми координатами х = а, у = Ь. Прежде всего надо определить понятие дифференцируемо- сти данной функции z = f(x, у) в данной точке (а, Ь). В слу- случае функции одной переменной существование производной, конечно, равносильно существованию дифференциала; при этом, как мы видели, дифференциал dy может быть определён для функции у —f(x), как такая линейная функция приращения Дл:. которая при Длг —•¦ 0 отличается от приращения \у функ- функции у на бесконечно малую высшего порядка. Посмотрим теперь, как обстоит дело в случае функции двух переменных z = f(x, у); условимся и здесь называть диф- дифференциалом dz функции z такую линейную комбинацию А \х -j- В 1у -\- С приращений Дх и Ду, которая при Дл: —> 0, 1у —>- 0 отличается от приращения Дг на бесконечно малую высшего порядка; в случае одномерном мы могли при этом (предполагая, что /' (х) =^= 0) принять за основную беско- бесконечно малую любую из величин Дл:, Дд>, dy (порядки малости которых совпадают между собой); в двухмерном случае удобно (хотя отнюдь не обязательно) принять за основную бесконечно малую величину р^ \^\х2 -\-\у2, выражающую собой рассто- расстояние «смещённой» точки (лг -(- Дл:, у -|- \у) от «первоначаль- «первоначальной» (л:, у); если бесконечно малые Длг и ку имеют одинако- одинаковый порядок малости, то тот же порядок имеет, конечно, и ве- величина р. Таким образом, выражение А 1х -|- В Ay -j- С есть 10*
148 ЛЕКЦИЯ ПЯТАЯ ' дифференциал dz функции z = f(x, v), если при Дл:—»0, Ду —*0 о(р). A5) Покажем теперь, что если dz существует, то существуют и частные производные -^— и -j— , причём А=%-ъ В = -?> С=°. дх ду так что . dz , . dz . d A\* В самом деле, прежде всего в силу непрерывности функции z (что мы, конечно, предполагаем) соотношение A5) даёт в пре- пределе С^О; установив это, положим в формуле A5) Ду^О (по нашему условию эта формула должна иметь место при лю- любом законе стремления величин \х и Ау к нулю); это даёт (Azfoy = о = А Лл: -)- о (Дл:), откуда совершенно аналогично устанавливается и то, что В =з- . При этом, очевидно, самое существование частных производных -- и -^ вытекает из наших рассуждений и является, таким дх ду у j образом, следствием существования дифференциала dz. До сих пор всё протекает, как вы видите, в полной анало- аналогии с одномерным случаем. Однако, в противоположность одномерному случаю, суще- dz dz ствование в данной точке частных производных -р и ^- ещё не гарантирует существования в ней дифференциала dzj так, для функции 2 при [ 0 при х=у=0 в точке @, 0) мы имеем, очевидно, = о = (Аг)дг = 0 = 0,
производная 149 вследствие чего если бы дифференциал dz существовал прилг=у = 0, то он должен был бы поэтому в силу A6) тождественно равняться нулю, т. е. мы должны были бы в силу A5) иметь Д,г = о(р); но это неверно, так как, например, при Дл: = Ду=^=0, очевидно, Az=J/2 Длг, р = ]/2 Длг, Az = p. Заметим впрочем, что если ^- и J- непрерывны в точке (л:, у), то в этой точке выражение A6) есть дифференциал функции z = f(x, у). В самом деле, Дг = /(* + Д*. у + Ду) — /(х, у) = = [f(x ~\- Длг, y+&y}—ftx, у + by) ]+ [f(x, у + by)—f(x, у)]. Первая из разностей правой части в силу теоремы Лагранжа имеет вид а так как в силу предположенной непрерывности функции f{x,y) в точке (х, у) при Длг—.-0, Ду—>-0 ^{х, v) —о, то указанная первая разность отличается от f'x (x, у) \х на величину типа о^Дл;) = о(р): , у-{-Ay) — f{x, а так как, с другой стороны, очевидно, по самому определению частных производных f[x, у+±у) — f(x,y) = fy(x,y)\y+o(ly)=f'y(x,y)by+o{p), то что и требовалось доказать. Как показывает наше рассужде- рассуждение, достаточно предположить даже непрерывность одной из двух частных производных в точке (х, у).
150 ЛЕКЦИЯ ПЯТАЯ Р(х.у) Р,1х+3х.у) Как бы то ни было, в общем случае существование частных производных возможно и без существования дифференциала. Поэтому при определении дифференцируе мости функции двух переменных перед нами стоит выбор: опираться ли на суще- существование частных производных или на существование диф- дифференциала? Общепри- Общепринято называть функ- функцию дифференцируе- дифференцируемой в данной точке, если она в этой точке имеет дифференциал; такое определение, тре- требующее от дифферен- дифференцируемой функции не- несколько больше, чем существование частных производных, удобно потому, что, как показывает дальнейшее развитие теории, только функции, обладающие дифференциалом, обнаруживают в своих свойствах сколько-нибудь полное сходство с диффе- дифференцируемыми функциями одной независимой переменной. Для получения частной производной -^— мы даём прираще- приращение одной только переменной х, оставляя у неизменным; го- говоря геометрически, мы смещаем точку Р(х, у) параллельно Ох в точку Р1 (jc-J-Дл:, у) (черт. 23); частная производная -?- определяется как предел отношения f(Pi)-J\P) Черт. 23. при Р1 —>- Р; здесь РРг = Ах есть расстояние между точками Р и Plt f(P) — f(x, у), f(P1) = f(x-\-Hx, у). Подобным же образом, дг ,. / (Ро) — / (Р) — = lim ' Оу р., _,. р ррч где Р2 — точка с координатами (лг, у-\-ку), которую- мы не- неограниченно приближаем к точке Р вдоль прямой, параллель- параллельной Оу. Можно, таким образом, сказать, что для функции z в гочке Р -?- ееть производная ,<по направлению Ох», а ^
производная 151 производная «по направлению О у». Но ясно, что совершенно аналогичным образом мы можем определить частную производ- производную функции z=f(x, у) и по любому другому направлению, составляющему произвольный угол <р с осью Ох; для этого надо только сместить точку Р в точку Q так, чтобы вектор PQ составлял угол у с направлением Ох, и приближать затем точку Q к точке Р вдоль этого вектора. Величину Q^P PQ если она существует, естественно называть производной функ- функции z по данному, характеризуемому углом у, направлению. Очевидно, что задание такого направления равносильно установ- установлению определённой линейной связи (Лу = tg ц> Дл;) между прира- приращениями Дл: и Ду при их одновременном стремлении к нулю. Можно условиться обозначать, например, через D (z) про- производную функции z по направлению, составляющему угол ^ с направлением оси Ох, так что %- = D0(z), ~ = DK (z). дх о * " ду i v Докажем теперь, что функция z = f(x, у), дифференци- дифференцируемая в точке (х, у), имеет в этой точке производную по любому направлению, причём zV2r)cos;? + sin? В самом деле, так как при смещении точки (х, у) по на- направлению <р на расстояние р . дг , . дг , . . причём Ах = р cos to, \у = р sin 'f, то Дг дг . дг . . ... co<p+sinf+A) т. е. .. Аг _ . дг , дг U, Т = *(z)=лГС05 'f+^sm ь что и требовалось доказать.
152 ЛЕКЦИЯ ПЯТАЯ Неявные функции. Дальнейшее развитие учения о част- частном дифференцировании совершается в достаточно полной ана- аналогии с дифференциальным исчислением одномерного случая; за недостатком времени мы поэтому его касаться не будем; зато нам необходимо остановиться ещё на некоторых важных задачах одномерного случая, для решения которых применяется частное дифференцирование. Сюда относятся прежде всего теоремы о существовании и дифференцировании «неявных» функций (этот общепринятый термин, безусловно, неудачен; правильно было бы говорить о «неявно заданных» или «неявно определённых» функциях, так как речь идёт не об особом классе, а именно об особом способе задания функций). Вам, конечно, приходилось много раз слышать о том, что уравнение F(x,y) = 0 A7) определяет величину у как «неявную» функцию величины х. Под этим имеют в виду существование такой функции y=^f(x), что F(x,f(x)) = 0 A8) тождественно. Само собой разумеется, что условия, обеспечи- обеспечивающие существование такой функции, свойства её, а также и область значений х,- для которых выполняется соотноше- соотношение A8), подлежат специальному исследованию. Мы здесь докажем в этом направлении только основную теорему; осно- основанное на ней дальнейшее развитие теории «неявных» функ- функций вы найдёте в любом полном курсе анализа; оно уже не представляет принципиальной новизны. Теорема. Пусть функция F(x, у): 1) непрерывна в не- некоторой окрестности тонки (х0, j/0), 2) дифференцируема в точке (хи, у0) и 3) обращается в этой точке в нуль, в то время как F" (хи, у0) =^ 0. Тогда существует функция y = f(x), для которой f(xo)=:yo и A8) тождественно вы- выполняется в некоторой окрестности точки хи. Эта функ- функция f(x) дифференцируема в точке xv и J \хо) — 7J~. г ¦
ПРОИЗВОДНАЯ 153 Доказательство. Для определённости допустим, что F' (лг0, у,,) ^> 0; тогда при достаточно малом В^>0 мы будем иметь: причём функция ^(х, у) в обеих этих точках непрерывна; поэтому, если а ^> 0 достаточно мало, то для всех точек х а (хо<Уо*Р) а отрезка (черт. 24) (хи — а, xo-fa) f В силу той же непрерывности функции F для каждого такого значения х найдётся поэтому, на основании теоремы 3 лек- лекции III (стр. 73), такое значе- значение у (|jM<CP)' для КОТОРОГО F(x, y) = 0. Это значение у (или одно из них, если их не- несколько), зависящее от х, мы будем обозначать через /(х), так что F(x,f[x)) = (Ш Черт. 24. при хи — а ^ л: ==? л:0 -\- а; при х = хи функция/(л:), очевидно, имеет лишь одно возможное зна- значение vc, так что f(xo)=yu. Нам остаётся доказать существование /' (лг0) и найти вели- величину этой производной. Пусть |Дх|^а, Ду = /(х0-)-Ал:) — — / (д;0); тогда в силу A8) F(х0 + Ал:, v0 + &у)"-" F {х0 -\- Ах, /(дги-(-Лд:)) = О, откуда в силу дифференцируемое™ функции F(x,y) в точке (хи, уи) 0 = F (л-о + Ал:, j0 + Ду) — F(л:с, у0) = АГ = = ^ (¦*!.> Jo) ^J + ^ (-^о. V0) Ал: -f- о (р), где
154 ЛЕКЦИЯ ПЯТАЯ Отсюда где л—^0 при р—*0; иначе, \Р'У (-«о. Л)± X] Av + \Р'Х (¦*. v0)± л] Д* = 0; так как Y = F'y(x0, уо)^> О, то при достаточно малых г и y (а значит, и достаточно малых |Ajc|, |Ду| и р) мы имеем: ГлК-^-у Fy(x0, а, следовательно, Лу F'x К il<: T T У ' 2 отсюда прежде всего видно, что при \х—» 0 и &у—»-0, а по- потому и р—> О, Л—> 0; значит, / () др, л^о лх Fy (л0, >0) что и требовалось доказать. Заметим ещё, что если F' существует и ^0 не только в точке (лг0, у0), но и в некоторой её окрестности, то найден- найденное нами решение уравнения A7) является единственным; в самом деле, при у1<С.У2, F(x,y1)=r0, F(x, у2) = 0 на основании теоремы Лагранжа F (х, у2) — F (х, v,) = 0 = (у2 — у,) F (х, у), где У^<^у<СУъ' откуда F' (х, у) = 0, что по нашему пред- предположению невозможно. Применим теперь найденное правило дифференцирования неявных функций к простейшей задаче на так называемый «условный экстремум»; обобщение этой задачи на случай боль- большего числа переменных составляет собой важную и интересную теорию условно экстремальных значений, которую мы не мо- можем, к сожалению, развернуть здесь во всей широте. Рассмотрим дифференцируемую в некоторой области функ- функцию F(x, у) и будем считать величину х независимой пере-
производная " 155 менной, а величину у— функцией от х, определяемой в неко- некотором отрезке [а, Ь] соотношением Ф[х,у) = О, A9) где функция Ф (х, у) также дифференцируема; таким образом, F(x, у) фактически является функцией одной независимой переменной х, заданной указанным сложным образом; и в ана- анализе, и в приложениях очень часто приходится .исследовать функции, заданные именно таким способом. Разыскиваются экстремальные значения заданной функции в отрезке [а, Ь]. Согласно общей теории эти экстремальные значения (отно- (относительные максимумы и минимумы) должны обращать в нуль производную данной функции; мы должны, таким образом, приравнять нулю производную данной функции z= F(x, у) по х, считая при этом, конечно, у функцией от х, определяемой соотношением A9), т. е. приравнять нулю так называемую «полную» производную -г- этой функции по х: dx дх ' ду dx v ' о dF dF . В этом уравнении -т- и ^- являются функциями от л: и у; dy для определения величины -г- мы должны, конечно, приме- применить правило дифференцирования неявных функций; определя- определяющее функцию у соотношение A9) даёт дФ dy дх dx дФ ' ду в результате чего уравнение B0) приводится к виду дРдФ d<PdF Q дх ду дхду ' это уравнение вместе с уравнением A9) и позволяет опреде- определить все «критические» пары (х, у), т. е. все точки, в которых — = 0. Дальнейшего исследования мы здесь касаться не можем.
ЛЕКЦИЯ VI ИНТЕГРАЛ Введение. — Определение интеграла. — Условия интегрируе- интегрируемости. — Схема геометрических и физических приложений. — Связь с дифференцированием. — Теоремы о средних значениях. — Обобщённые интегралы.— Вычисление двойных интегралов. — Обшая идея интеграла. Введение, Интегральное исчисление первоначально разви- развивалось независимо от учения о дифференцировании. Только к концу 17-го столетия, когда обе ветви получили уже зна- значительное развитие и научились решать — каждая своими соб- собственными методами — большое число задач геометрии и ме- механики, была со всей полнотой раскрыта существовавшая между ними глубокая связь: их основные проблемы оказались двумя взаимно-обратными задачами анализа бесконечно малых; интегрирование и дифференцирование функций стоят друг к другу в том же отношении, как сложение и вычитание чисел. Этот исторический момент обычно считают датой рожде- рождения того учения, которое в наше время называют математи- математическим анализом. И действительно, именно с этого времени, когда главным движущим рычагом как дифференциального, так и интегрального исчисления сделалась эта идея их нераз- неразрывной принципиальной связанности, развитие обеих ветвей пошло с исключительной быстротой; в особенности интеграль- интегральное исчисление с этого момента получило возможность перейти от решения отдельных разрозненных задач к созданию доста- достаточно мощных общих методов. Эта своеобразная историческая судьба взаимосвязи между двумя основными разделами анализа до сих пор находит себе отражение в системах изложения их на страницах учебных руководств: в то время как одни авторы в целях большей
ИНТЕГРАЛ 157 логической стройности определяют интеграцию функций, как операцию, обратную дифференцированию, другие предпочита- предпочитают, до известной степени воспроизводя историческое разви- развитие, определять обе операции независимо друг от друга, что- чтобы лишь позднее установить взаимную связь их. С формальной стороны, конечно, безразлично, какой из этих двух путей мы выберем; но и по существу трудно, даже, пожалуй, невоз- невозможно утверждать, что тот или другой из этих путей заслу- заслуживает предпочтения перед другим; дело в том, что здесь многое, в сущности, почти всё, зависит от запросов и инте- интересов учащихся: тот, в ком логический, идейный интерес к математике доминирует над прикладным, практическим, будет приветствовать введение интегрирования как операции, обрат- обратной дифференцированию, ибо, может быть, сам он уже но свойственной математикам привычке, учась дифференцировать, думал о том, как выглядит обратная операция; напротив, для учащегося с прикладным направлением интересов этот путь может показаться вычурным; изучение обратной операции кик таковой, когда не видно ещё, для каких конкретных задач она может оказаться полезной, естественно покажется ему недостаточно аргументированным. Определение интеграла. Понятие интеграла возникло и постепенно укрепилось в своём значении, когда целый ряд задач геометрии и механики приводил к необходимости про- производить над функциями одну и ту же аналитическую опе- операцию, содержание которой составлял предельный переход некоторого совершенно определённого типа. Природа этой опе- операции вам, конечно, хорошо известна. Пусть задана некото- некоторая функция f (х) на отрезке [а, Ь]. Разобьём этот отрезок ла п частей, обозначая точки деления через ¦в каждом из отрезков [лгл_1, xk] (А=1, 2, .. . , п) выберем произвольную точку $ft; значение функции f(x) в точке Zk умножим на длину хк— хк_1 соответствующего отрезка и со- составим сумму всех таких произведений «
158 ЛЕКЦИЯ ШЕСТАЯ представим себе теперь, что перед нами вся совокупность по- подобного рода разбиений отрезка [а, Ь\ и всех возможных выбо- выборов точек Sft (причём и число п частичных отрезков может как угодно варьировать), а значит, и всех возможных значений суммы A); обозначим через / длину наибольшего из частичных отрезков [л^р xk] в данном разбиении. Если существует такое число /, что сумма A) стремится к / при /—>-0, каковы бы ни были предпринятые разбиения и выбранные точки %к, то это число называют интегралом функции f(x) в отрезке [а, Ь\ и обозначают через ь \ f(x) dx. а Несколько более точная формулировка гласит: число / на- называется интегралом функции f(x) в отрезке [а, Ь], если, как бы мало ни было е ^> О, найдётся такое другое положитель- положительное число о, что при любом разбиении отрезка [а, Ь], удовле- удовлетворяющем требованию /<^5, и при любом выборе точек 3А Как бы то ни было, мы видим, что здесь речь идёт о свое- своеобразном и довольно сложном предельном переходе; процесс, лежащий в основе этого предельного перехода, трудно описать (как мы это делаем обычно) указанием на поведение одной какой-либо независимой переменной; можно за такую перемен- переменную принять / (и описывать процесс символом I—>-0), но при этом нельзя терять из вида, что сумма A), о пределе которой идёт речь, не есть однозначная функция величины /, ибо дан- данному значению /, очевидно, соответствует бесчисленное мно- множество различных разбиений, а при выбранном разбиении — ещё бесчисленное множество возможностей в отношении выбора точек ?k; для существования предела / нужно, чтобы вся эта совокупность значений суммы A) при достаточно малом / была как угодно близка к /. Такая сложность в процессе, лежащем в еснове интеграции, приводит к некоторым неудобствам; и в общих теоретических построениях, и в конкретно-практических случаях требуемая определением независимость предела / от характера разбиений
ИНТЕГРАЛ 159 и выбора точек Sft хотя и может быть строго доказана, но до- доказательство эти своей формальной громоздкостью часто очень обременяют оассуждения. Вот почему во многих современных изложениях принято определять интеграл несколько видоиз- видоизменённым путём, избегающим на первых порах какого бы то ни было предельного перехода. К этому новому определению (которое, конечно, формально эквивалентно предыдущему) мы теперь и переходим. Пусть f(x)— любая ограниченная функция на отрезке [а, Ь\; обозначим её грани через М (верхнюю) и т (нижнюю). Для любого разбиения Т отрезка [а, Ь\ обозначим через Mk и тк соответственно верхнюю и нижнюю грани функции f(x) на отрезке [xk_v xk] и положим xk — хк_1 = Aft(l Пусть, далее, k=\ таким образом, каждому разбиению 7" соответствует опреде- определённая «верхняя» сумма ST и определённая «нижняя» сумма sT; при этом, очевидно, m-^mk^Mk^M (\ ^k^n), так что при любом разбиении Т m(b — a)^sT^ST^M(b — a); совокупность значений, принимаемых как верхней суммой ST, так и нижней суммой sT при всевозможных разбиениях отрезка [а, Ь], есть, таким образом, ограниченное множество. Нижнюю грань множества всех верхних сумм ST мы называем верхним интегралом функции f(x) на отрезке [а, Ь] (или в пределах от а до Ь) и обозначаем через ь * Подобным же образом верхнюю грань всех нижних сумм sT мы называем нижним интегралом функции f(x) на отрезке [а, Ь\ (или в пределах от а до Ь) а обозначаем через
160 ЛЕКЦИЯ ШЕСТАЯ Таким образом, верхним и нижним интегралами в данном отрезке обладает всякая ограниченная функция; эти два ин- интеграла определяются, как вы видите, без всякого предель- предельного процесса, как грани некоторых множеств. Если верхний и нижний интегралы функции f(x) на от- отрезке [а, Ь] совпадают между собой, то общее значение их называется интегралом данной функции в пределах от а до b и обозначается через ь /=[f(x)dx; а функция f(x) в этом случае называется интегрируемой на отрезке [а, Ь]. Для того чтобы сделать из этого определения нужные нам выводы, нам понадобится несколько совсем элементарных вспомогательных предложений. Условимся говорить, что раз- разбиение Т' отрезка \а, Ь] является продолжением разбиения Т, если все точки деления разбиения Т служат вместе с тем и точками деления для разбиения Т (но, вообще говоря, Т со- содержит и новые точки деления, не содержащиеся в Т). Лемма I. Если V есть продолжение разбиения Т, то St' sg ST, sT, ^ sT. В самом деле, при переходе от разбиения Т к его продол- продолжению Т каждый член AlftAft суммы ST заменяется группой членов где Д^, Д^, . . . , \kr — длины тех отрезков, на которые раз- разбивается отрезок [лгЛ_,, xk] при переходе от разбиения Т к разбиению V, а М^ — верхняя грань функции f(x) на отрез- отрезке Д*г; так как, очевидно, Mkr^Mk (I <r^s), то r=l r = l т. е. та группа членов, которой заменяется Mk\k, имеет сумму, не большую чем Mk\k, а так как это справедливо для всех k.
ИНТЕГРАЛ 161 то St> =s^ ST; совершенно аналогично доказывается и второе из утвср кдаемых неравенств. Лемма II. Для любых разбиений ТЛ и Т2 отрезка [а, Ь] В самом деле, совокупность всех точек деления обоих раз- разбиений ТЛ и Т2 определяет некоторое третье разбиение Т, являющееся, очевидно, продолжением каждого из разбиений 7", и Т2; но для одного и того же разбиения Т, очевидно, S^S поэтому в силу леммы I что и требовалось доказать. Непосредственным следствием леммы II является Лемма 111. Для любой (ограниченной) функции I В самом деле, так как любая из сумм sT не превосходит любой из сумм ST, то и верхняя грань / совокупности всех sT не может превосходить нижней грани / совокупности всех ST. Пусть теперь 1Т означает длину наибольшего из частичных отрезков, на которые распадается отрезок [а, Ь] в силу раз- разбиения Т. Лемма IV. При любом е ^> О существует такое X ^> О, что для всех разбиений, для которых 1Т<^\, мы имеем ST</'+?. sr>/-e. Это предложение иногда выражают несколько короче, го- говоря, что ST—>/ и sr—>I, когда 1Т—«-О; такая редакция не может привести к смешениям, если только помнить, что ST и sT не являются однозначными функциями от 1Т. Доказательство. Не ограничивай общности рассу- рассуждения, мы можем допустить, что f(x)^=0 при а^х^Ь (этого мы можем всегда достигнуть прибавлением к f(x) до- достаточно большого числа А, причём все интегралы и суммы увеличиваются на А (Ь — а)). По определению нижней грани существует разбиение То, для которого STe <С ^ ~Ь f • Обозна- Обозначим через Xj, jc2, . . ., хп внутренние точки деления отрез- отрезка [а, Ь] при этом разбиении, и пусть М — верхняя грань функции f(x) на отрезке [а, Ь]. Положим, наконец, X = -^п г II А. Я. Хинчин. Восемь лекций
162 ЛЕКЦИЯ ШЕСТАЯ и пусть Т — любое разбиение отрезка [а, Ь], для которого 1Т <[ /.. Мы покажем, что ST <^ I + е. С этой целью разобьём частичные отрезки, на которые распадается отрезок [а, Ь] при разбиении 7", на две группы; к первой группе отнесём всякий отрезок, целиком принадле- принадлежащий одному из отрезков [xk — /., jcft —j— >.] (l^k^n), a ко второй группе остальные частичные отрезки (черт. 25). Со- П П П В U U В В I I О П Черт. 25. ответственно этому и сумма ST распадётся на суммы Slr и SJJ. В сумме S]. все члены имеют первые множители, не превосхо- превосходящие М, в то время как сумма длин отрезков, составляю- составляющих вторые множители, не более чем 2«X = 2Tj, так что С другой стороны, часть суммы .SJJ, относящаяся к отрез- отрезкам разбиения Т, содержащимся внутри отрезка \хк_{, xk] (черт. 25), имеет первые множители, не ббльшие, чем Mk, a сумму вторых — не ббльшую, чем xk — xk_1 = kk, вследствие чего величина этой части не больше, чем M,^k, а значит^ л = Sr0. Таким образом, 1 = 7+8, что мы и хотели доказать. Совершенно аналогично доказывается, конечно, и второе из утверждаемых неравенств. Теорема. Пусть функция f(x) интегрируема на отрез- отрезке [а, Ь\; тогда, сколь бы мало ни было е^>0, существует такое положительное число л, что при любом разбиении Т,
ИНТЕГРАЛ 163 для которого 1Т <^ X, мы будем иметь, как бы мы ни вьюи- рали точки ?ft (xk_1 s? ?ft =ss xft) A ==S ? =ss я): k=i ь где I=\ f(x)dx. a В самом деле, так как, очевидно, при любом выборе точек ?ft в соответствующих частичных отрезках, то но. с другой стороны, в силу леммы IV для всех разбиений с достаточно малым 1Т е = /+ е; сопоставляя эти неравенства с предыдущими, находим, что для всех разбиений с достаточно малым 1Т что и требовалось доказать. Обратная теорема, как легко видеть, также верна; в самом деле, если при любом разбиении с достаточно малым 1Т и при п любом выборе точек ?ft сумма V /(Et)Aft как угодно близка к числу /, то и ST при достаточно малом 1Т будет меньше, чем /4~е; с другой стороны, всегда ST i& 7, откуда / <^ / -\- е, а значит, / ^ /, так как е произвольно мало, подобным же образом />/, так что /<S,J, откуда, в силу леммы III, 1 = 1 = 1, т. е. функция f(x) интегрируема на отрезке [а, Ь\. Таким образом, данное нами новое определение интеграла, действительно, в точности равносильно первоначальному. 11*
164 ЛЕКЦИЯ ШЕСТАЯ Примечание. Из леммы IV, очевидно, вытекает: если мы обозначим через toft = ./Wft — mft колебание функции f(x) на отрезке [xk_x, xk], то для того чтобы функция f{x) была интегрируема на отрезке [а, Ь], необходимо и доста- достаточно, чтобы сумма п ?>*Aft==<Sr — sT B) ft=i была как угодно мала для всех разбиений Т с достаточно малым 1Т. Условия интегрируемости. Сам по себе указанный в по- последнем примечании необходимый и достаточный признак инте- интегрируемости ещё мало удобен, так как в большинстве слу- случаев для конкретно заданных функций нелегко бывает непосредственно судить о поведении суммы B). Однако, с по- помощью этого признака очень легко устанавливать общие усло- условия интегрируемости для более или менее широких классов функций. Мы теперь и пойдём по этому пути. Покажем прежде всего, что всякая функция f(x), непре- непрерывная на отрезке [а, Ь], интегрируема на этом отрезке. В самом деле, по свойству равномерной непрерывности (тео- (теорема 4 лекции III, стр. 5) для каждого положительного числа е найдётся такое положительное число \, что колебание функции f(x) будет меньше е на любом отрезке, длина ко- которого меньше X. Но тогда при любом разбиении Т, для ко- которого /Г<^Х, все <ok в сумме B) будут меньше, чем е, вслед- вследствие чего п * =i * =i т. е. сумма B) становится как угодно малой при достаточно малом 1Г, откуда, как мы знаем, и вытекает интегрируемость функции f(x) на отрезке [а, Ь]. Может ли разрывная функция оказаться интегрируемой? Легко видеть на примерах, что может; легко даже установить в этом направлении и некоторые общие закономерности. По- Покажем, например, что ограниченная функция f(x), имеющая на отрезке [а, Ь\ только одну точку разрыва с, интегри-
ИНТЕГРАЛ 165 руема на этом отрезке (каков бы ни был характер разрыва в точке с). С этой целью обозначим через р. верхнюю грань функции |/(jc)| на отрезке [а, Ь] и выберем произвольное положитель- положительное число е; на отрезках \а, с—^-\ и сЧ~<г . Ь\ функ- функция f(x) непрерывна; мы можем поэтому снова найти такое положительное число X, что колебание функции на любом отрезке длины <^Х, целиком помещающемся либо в отрезке /тип йттп Imun мень ше. Черт. 26. \а, с — ^- , либо в отрезке с + ^-,6 , будет чем е. Пусть теперь снова Т есть любое разбиение отрезка [а, Ь], для которого iT<^h среди отрезков ДА будут, вообще говоря, такие, которые целиком помещаются в одном из двух вышеупомянутых отрезков, а также и такие, которые хотя бы частично захватывают отрезок с — ?"'С~Ь^1 (чеРт- 26). Для отрезков ЛА первого типа колебания wft в сумме B) меньше, чем е, вследствие чего относящаяся к отрезкам пер- первого типа часть суммы B) меньше, чем e(b — а). Для отрез- отрезков Aft второго типа относительно колебаний шА мы можем только утверждать, что каждое из них не больше, чем 2ji; но так как все отрезки второго типа целиком принадлежат отрезку с — ^ X, с + "Г~г"^ • то сумма длин их не пре- превосходит — -J- 2X, а следовательно, соответствующая им часть суммы B) не больше, чем 2д (— -\- 2Х) =2s-)-4Xfx; сопо- сопоставляя это с найденной выше оценкой для первой части суммы B), мы находим, что при
166 ЛЕКЦИЯ ШЕСТАЯ так как е и \ сколь угодно малы, то этим установлена интегри- интегрируемость функции f(x) на отрезке [а, Ь]. Мы сознательно провели с такой подробностью это неслож- несложное рассуждение; здесь важно уловить основную мысль дока- доказательства; сумма B) оказывается малой потому, что: 1) в об- областях, где функция непрерывна, малы первые множители wft (равномерная непрерывность!) и 2) отрезки, заключающие точки разрыва, дают малую сумму вторых множителей; отсюда малыми оказываются обе части суммы B), а значит, и вся эта сумма. Теперь ле1ко понять (и строго доказать, конечно), что ¦и любое конечное число разрывов функции f(x) на отрезке [а, Ь] не помешает её интегрируемости, если только она оста- остаётся ограниченной. Напротив, если точки разрыва заполняют слишком большую долю отрезка [а, Ь], то функция может стать неинтегрируемой. Так, функция Дирихле (лекция III, стр. 62—63), имеющая разрыв в каждой точке, неинтегрируема ни на каком отрезке; в самом деле, в любом отрезке Aft для этой функции wft=l, вследствие чего при любом разбиении отрезка [а, Ь] п п ?°>А = ?** = * — а. Занимающий нас круг вопросов находит полное разреше- разрешение всех относящихся сюда задач в следующем предложении. Теорема. Для того чтобы ограниченная функция / (х) была интегрируема на отрезке [а, Ь], необходимо и доста- достаточно выполнение следующего условия: как бы мало ни было г ~^> О, все точки отрезка [a, h], в которых колеба- колебание функции f(x) превосходит е, могут быть заключены в конечное число отрезков, сумма длин которых меньше, чем г. Доказательство. 1) Пусть условие теоремы выпол- выполнено. Пусть Sj, S2, ... , Ьп—система отрезков, заключающих внутри себя все точки, на которых функция / (х) превосхо- п дит е; пусть при этом ~S\ oi <^ е; систему дополнительных от- резков будем обозначать через dx, dv ..., dN. Так как в лю. бой точке любого отрезка d{ колебание функции f(x) не пре. восходит ?, то согласно теореме на стр. 81 лекции III колебание
ИНТЕГРАЛ 167 этой функции будет меньше, чем 2е, на любом отрезке доста- достаточно малой длины, целиком лежащем в одном из отрезков dt. Теперь остаётся только вообразить себе любое достаточно мелкое (т. е. обладающее достаточно малым 1Т) разбиение отрезка [а, Ь] на частичные отрезки Aft и провести дальней- дальнейшее рассуждение по схеме стр. 163—164; разбивая сумму B) на две части, соответственно тому, принадлежит ли отрезок \k целиком одному из отрезков dt или хотя бы частично захваты- захватывает один из отрезков bt, мы легко находим, что первая часть суммы B) меньше, чем 2s (b—а), а вторая не превосходит 2р. (е -|- 2и/г), где д—верхняя грань функции \f(x) на от- отрезке [а, 6], а п — число отрезков Ъ.; выбирая е и /7 доста- достаточно малыми, мы можем, таким образом, сделать сумму B) как угодно малой, что и требовалось доказать. 2) Пусть функция f(x) интегрируема на отрезке [а, Ь] и пусть е — любое положительное число; мы можем выбрать такое разбиение отрезка [а, Ь], чтобы соответствующая сум- сумма B) была меньше, чем е2; заметим теперь, что все слага- слагаемые суммы B) неотрицательны и что, следовательно, мы не увеличим эту сумму, если сохраним в ней только те члены, в которых o)ft^>e, выбросив все остальные; таким образом, k = 1 ш k > е ША > е откуда но отрезки Aft, входящие в состав этой последней суммы, оче- очевидно, содержат все точки отрезка [а, Ь\, в которых колеба- колебание функции f(x) превосходит е (ибо такая точка не может принадлежать отрезку ДА, для которого w^sge); таким обра- образом, условие интегрируемости, формулированное в доказыва- доказываемой нами теореме, действительно является необходимым. Из доказанной теоремы, в частности, следует интегрируе- интегрируемость всякой монотонной функции в отрезке [а, Ь\; в са- самом деле, как мы видели в лекции 111, всякая такая функция необходимо ограничена в данном отрезке; далее, мы видели, что как бы мало ни было е^>0, число точек отрезка \а, Ь\, в которых такая функция имеет колебание ^> е, обязательно
168 ЛЕКЦИЯ ШЕСТАЯ Черт. 27. конечно; но конечную группу точек всегда можно, разумеется, заключить в конечную группу интервалов, сумма длин кото- которых как угодно мала; таким образом, признак интегрируемости, о котором идёт речь в только что доказанной нами .теореме, необходимо выполняется для каждой монотонной функции. Схема геометрических и физических приложений. Рас- Рассмотренное нами понятие интеграла, тесно связанное (при по- посредстве идеи предела у или грани) с суммами определённого вида и не стоящее само по себе ни в какой связи с понятиями дифферен- дифференциального исчисления, имеет, как вы знаете, большое число геоме- геометрических и физиче- физических применений. Нам нет, конечно, надоб- надобности останавливаться здесь на этих приложениях ради них самих или хотя бы со- составлять примерный перечень наиболее важных из них. Од- Однако, очень важно для нас проследить, что во всех случаях подобного рода применений мы встречаемся со своеобразной и несколько тонкой логической ситуацией, очень важная в принципиальном отношении специфика которой обычно недо- недостаточно подчёркивается в руководствах. Пусть, например, речь идёт о вычислении площади «криво- «криволинейной трапеции» черт. 27, ограниченной сверху графиком функции y=.f(x), которую мы для простоты предположили положительной и непрерывной. Конечно, всем вам хорошо знакома эта задача, так же как и её решение с помощью интегрального исчисления. Вдумаемся, однако, несколько под- подробнее в ту логическую ситуацию, в которой мы здесь нахо- находимся. Вычислять площадь той или другой фигуры имеет, очевидно, смысл лишь тогда, если самое понятие площади точно определено. В данный момент, когда мы ищем метода, который позволил бы вычислить площадь криволинейной тра- трапеции черт. 27, владеем ли мы уже таким определением, знаем ли мы точное определение той величины, которую мы со-
ИНТЕГРАЛ 169 бираемся вычислить? Конечно, нет; мы знаем определение площади лишь для прямолинейных фигур (многоугольников) и некоторых частей круга; кривая же y^f(x), ограничиваю- ограничивающая нашу трапецию, вообще говоря, ничего общего не имеет с окружностью. Как же мы можем, не зная, что такое искомая площадь, приступить к её вычислению? И — что всего удивительнее — как же это вычисление нам всё-таки удаётся, хотя мы и не знаем даже, что именно мы вычисляем? Дело заключается в том, что фактически мы ставим и решаем здесь задачу гораздо более ответственную, чем простое вычисление; мы одно- одновременно определяем понятие площади для нашей криволиней- криволинейной трапеции и находим метод вычисления этой площади. Ко(да мы утверждаем, что площадь нашей фигуры равна пре- пределу площадей тех прямолинейных фигур лестничного вида, одна из которых изображена на черт. 27, то такое утвержде- утверждение является не теоремой, а определением площади нашей криволинейной трапеции; пытаться доказывать это утвержде- утверждение было бы, поэтому, бессмысленным; напротив, утверждение, что упомянутый предел существует при тех или других условиях (например, в случае непрерывности функции f(x)), есть теорема, которая может и должна быть доказана. И в точности такой же характер имеет логическая природа любой из подобного рода геометрических и физических задач; собираемся ли мы вычислять длину криволинейной дуги, объём или поверхность тела вращения, или работу данной силы на данном участке пути и т. д., ао всех случаях речь идёт об отыскании количественной меры для такого понятия, которое до этого момента оказывается определённым лишь в некото- некоторых простейших частных случаях; задача состоит в том', чтобы дать этому понятию целесообразное общее определение, кото- которое одновременно содержало бы метод получения количествен- количественной оценки для соответствующей данному понятию величины. Спросим себя теперь, какие же общие черты перечисленных выше (и, конечно, многих других) задач геометрии и физики обусловливают возможность аналитически одинаково решать эти задачи, используя во всех случаях именно интеграл в каче- качестве орудия, логически определяющего искомую величину и вместе с тем дающего ей количественную оценку. Таких основных черт можно отметить две. Во всех случаях искомая
170 ЛЕКЦИЯ ШЕСТАЯ величина зависит от некоторого отрезка [а, Ь], на который она «распространяется» и с изменением которого она меняется. Так, на черт. 27 мы получим другую площадь, если отрезок \а, Ь] заменим другим отрезком (сохраняя, конечно, функцию f(x) неизменной); работа силы различна на различных участках пути движущейся точки, и т. д. С другой стороны, изучаемая величина в каждой конкретной задаче зависит от некоторой функции f{x); в случае черт. 27 — это ордината той точки верхней стороны рассматриваемой трапеции, абсцисса которой равна х, в случае вычисления работы — это величина силы, действующей на расстоянии х от начала отсчёта, и т. д. Та- Таким образом, для того чтобы задача рассматриваемого нами типа получила определённую постановку, необходимо прежде всего задание некоторой функции f(x) и некоторого отрезка а^х^ Ь, к которому мыу относим нашу задачу; можно ска- сказать, что та величина, определения и численной оценки кото- которой мы ищем, есть функция V (/; а, Ь) трёх элементов, которые могут быть выбираемы независимо друг от друга: функции f(x) и чисел а и Ь. Легко видеть, что применение интеграла как метода решения всех перечисленных (и многих других) задач в основном обусловлено следующими свойствами этой зависимости V (f; a, b). 1) Как функция отрезка [а, Ь] величина V аддитивна, т. е. при а<^с<^Ь V (/; a,b)=V (/; а, с) + V (/; с, Ь). Действительно, площадь фигуры черт. 27 при всяком разумном определении, очевидно, должна равняться сумме площадей криволинейных трапеций, на которые она распадается при разбиении отрезка [а, Ь] на частичные отрезки. Объём тела вращения равен сумме объёмов, расположенных вокруг отдельных участков, на которые мы разбиваем ось вращения; длина дуги кривой равна сумме длин её участков; работа силы на данном пути равна сумме работ, производимых ею на раз- различных участках этого пути при любом его разбиении, и т. д. 2) Если функция f(x) постоянна на участке [a, b\, f(x) = C, то
ИНТЕВРАЛ 1 7 1 Действительно, если f(x) = C (a zszxzg: b), фигура черт. 27 есть прямоугольник, площадь которого равна С(Ь— а), если в случае тела вращения f(x) означает площадь поперечного сечения и если f(x)=C(a^x^b), то мы имеем дело с ци- цилиндром, объём которого равен С(Ь — а); если сила, которая действует на точку, сохраняет на пути а^х^Ь постоянное значение С, то работа этой силы на данном пути будет С(Ь — а), и т. д. Легко теперь убедиться, что во всех случаях, когда зави- зависимость искомой величины V от данных элементов f(x), аи b обладает чертами 1) и 2), то естественно ожидать, что задача будет иметь своим решением интеграл ь В самом деле, если мы данный отрезок [а, Ь] разобьём, как обычно, на части с помощью точек деления то прежде всего в силу свойства 1) если бы функция f(x) для всех х отрезка [лгА_1, xk] имела не- некоторое постоянное значение "Cft, то в силу свойства 2) мы имели бы k_,, xk) = Ck (xk — xk^); в действительности фуикция f(x), вообще говоря, не постоянна в отрезке [лгА_1, xk]. Но если эта функция непрерывна и если отрезок [¦*?_!. xk] очень мал, то все значения функции f(x) в этом отрезке мало отличаются друг от друга; взяв ка- какое-нибудь одно /(ift) из этих значений, мы можем сказать, что на всём отрезке [xft_,, xk\ функция f(x) приблизительно равна /Cft), вследствие чего величину V (/; xk_v xk) нам естественно принять (не надо забывать, что эта величина ещё не определена) приблизительно равной /(Sft)(x
172 ЛЕКЦИЯ» ШЕСТАЯ так что приближённо л ; a, ft)* ?/(**)(**—**-i). где S— любая точка отрезка [xft_1, xk\. При этом мы, есте- естественно, полагаем, что погрешность этого приближённого равенства тем меньше, чем меньше отрезки [-*rft_,, xk], т. е. чем меньше 1Т для предпринятого разбиения; но отсюда уже совершенно естественно определять точное значение величины V как л * lim У / (?ft) (xk — xk_,) = Г / (х) dx. 'r^°^i ? Связь с дифференцированием. На первом этапе развития интегрального исчисления, когда огромное значение связи между интегрированием и дифференцированием не вошло ещё в должной мере в идейный мир учёных, задачи описанного нами типа решались прямым вычислением интеграла, как пре- предела суммы. Выбором особенно удобных разбиений и специально подо- подобранных значений ?k старались в каждом отдельном случае, т. е. применительно к каждой индивидуальной функции f(x), по возможности облегчить и упростить это, вообще говоря, очень громоздкое вычисление. Некоторые задачи были решены таким путём уже в древ- древности, позднее к ним присоединился ряд новых успехов; и, однако, всё же до того момента, когда основным методом вычисления интегралов сделалось использование связи между интегрированием и дифференцированием, все результаты оста- оставались разрозненными и каждая вновь возникающая задача требовала в сущности создания нового метода для своего ре- решения. Свои общие и полноценные методы интегральное исчи- исчисление приобрело только в тесном взаимодействии с учением о дифференцировании. Вы хорошо знаете, конечно, в чём состоит связь интегри- интегрирования с дифференцированием: интеграл
ИНТЕГРАЛ 173 имеет своей производной «подинтегральную функцию» f(x) в каждой точке, где эта функция непрерывна (в частности, для непрерывной функции — всюду). Доказательство очень просто: если \h\ достаточно мало, то при х—|( || h\ мы имеем: /(*) —е</(и) *?/(*)+е, где е — заранее выбранное, как угодно малое положительное число; отсюда hf(x) — е|Л|^ j f(u)du<hf(x)-\-?\h\, X и значит, x+h 1 Г ,. , , F(x-\-h)— Fix) , — e=s?-r- I f(u)du^ ——!—^ ^/ X Ввиду произвольной малости е отсюда в самом деле вытекает F'(x)=f(x). В силу этой связи всякое правило дифференцирования даёт некоторое правило интегрирования, будучи прочитанным, так сказать, справа налево. Но более того: многие общие приёмы дифференцирования допускают по меньшей мере частичное обращение и приводят, 1аким образом, к важнейшим общим приёмам интегрирования; так, правило дифференцирования алгебраической суммы полностью обращается и даёт правило интегрирования алгебраической суммы (которое впрочем легко может быть выведено и из первоначального определения инте- интеграла); правило дифференцирования произведения приводит к так называемой «интеграции по частям», силу которой вы хорошо знаете; обращением правила дифференцирования «функ- «функции от функции» служит известный вам ещё более мощный приём «интеграции посредством подстановки». Применение всей совокупности этих приёмов приводит к возможности интегрировать большое число элементарных функ- функций (в частности, все рациональные функции). И если тем не менее для очень многих элементарных функций мы всё же не умеем написать их интегралов, то происходит это не в силу недостаточной мощности применяемых нами методов, а по дру-
174 ЛЕКЦИЯ ШЕСТАЯ гой причине, имеющей несравненно большее принципиальное значение; если при дифференцировании элементарных функций мы во всех случаях снова приходим к элементарным функциям, то интегрирование элементарных функций представляет в этом отношении совсем другую картину; очень часто бывает, что интеграл такой функции, хотя, конечно, и существует, но не является элементарной функцией и не может поэтому быть выражен никакой элементарной формулой; так обстоит дело, например, с интегралами таких простых функций, как -j— и - . Такую новую функцию приходится исследовать, У а.-з -|- 1 не имея для" этого (по крайней мере на первых порах) ника- никакого орудия, кроме определяющего её интеграла. Теоремы о средних значениях. В дифференциальном исчислении теоремой о среднем значении обычно называют теорему Лагранжа: если функция f(x) непрерывна на отрезке [а, Ь] и дифференцируема внутри его, то существует такая внутренняя точка с этого отрезка, что f(b)—f(a)=f'(c)(b — a). Вообще для «теорем о средних значениях» характерно это присутствие в их формулировках некоторого числа с («сред- («среднего значения» величины х между а и Ь), о котором известно только, что оно лежит внутри отрезка [а, Ь], а более точно оно не характеризуется. В этом смысле и формула Коши (лекция V), и написанная с тем или другим видом остаточного члена формула Тэйлора представляют собой теоремы о сред- средних значениях; очень часто формулируют теоремы этого рода в несколько иных обозначениях: говорят об отрезке [a, a-\-h\, а неопределённо расположенную внутреннюю точку этого отрезка обозначают через a-f-6/г, где двойное неравенство О <^ 6 <^ 1 есть всё, что утверждают теоремы о числе 6; при- присутствие в формулировке такиго неопределённого числа, под- подчинённого неравенствам 0 <^ 6 <^ 1, также может служить типичным симптомом теорем о средних значениях. В интегральном исчислении роль теорем о средних значе- значениях во всяком случае не меньше, чем в дифференциальном; с одной из них, так называемой первой теоремой о среднем значении, Вы, несомненно, знакомы; в простейшем случае она
ИНТЕГРАЛ 1 75 утверждает, что если функция f(x) непрерывна на отрезке [а, Ь\, то $/(*) <i*=/(e) (ft — a), C) где с — некоторая внутренняя точка отрезка [а, Ь]; это утвер- утверждение доказывается непосредственным применением теоремы X Лагранжа к функции F(x) = \f(u)du на отрезке [а, Ь\^ а Более общими являются соотношения m i где т и М соответственно означают нижнюю и верхнюю грани функции f(x) на отрезке [а, Ь}; эти соотношения имеют место для любой ограниченной интегрируемой функции f(x); однако, и в случае, когда эта функция непрерывна, равен- равенство C) ввиду неизвестного положения точки с даёт в смысле оценки входящего в него интеграла в сущности не больше,, чем неравенства D). Более общая формулировка «первой» теоремы о среднем значении гласит: если функция у(х) в отрезке [а, Ь\ нигде не отрицательна, то * ь j / (х) <р (х) dx = / (с) J <р (х) dx, E)- а а где с снова означает некоторую (точнее не определяемую) внутреннюю точку отрезка [а, Ь]. Для простоты будем счи- считать функции f(x) и у(х) непрерывными и допустим, что у{х)^>0 (а^х^Ь); для доказательства формулы E) (в част- частном случае (р (х) = 1 переходящей в формулу C)) достаточно, применить формулу Кош и в отрезке [а, Ь\ к функциям
176 ЛЕКЦИЯ ШЕСТАЯ что даёт )_ f Jyh ь Ф(Ь)—Ф(а) Ф'(с) ) <t (x) dx a т. е. формулу E). Значительно более тонким аналитическим инструментом является, однако, так называемая вторая теорема о среднем значении, к рассмотрению которой мы теперь переходим. Эта теорема также имеет своим объектом интеграл F) но только в случае, когда один из двух множителей подин- тегральной функции есть функция, монотонная в отрезке [а, Ь]. Пусть функция <в (х) — неотрицательная и иевозра- стающая для а<^х<^Ь. Произведём, как обычно, разбиение Т отрезка [а, Ь\ и сохраним наши обычные обозначения. Пока- Покажем, что интеграл F) есть предел суммы при lT —> 0. В самом деле, обозначая через fi верхнюю грань функции \f{x)\ в отрезке [а, Ь) и через \ — разность между суммой G) и интегралом F), мы ввиду предположенного моно- монотонного невозрастания функции tp (x) будем иметь: | п и, следовательно, Д —> о при
ИНТЕГРАЛ 177 Заметив это, преобразуем теперь сумму G) с помощью леммы Абеля (лекция IV, стр. 116); полагая f(x)dx=Ak (k = 0, 1, 2 п), а мы находим: п S = Z ?(**) $ №**= X ?E*)И* —At-i) = я—1 ? (Sft+1)] + ^ (=„); (8) обозначим теперь через /И и т грани функции J /(«) <*« (9) на отрезке a sg л: < Ь; очевидно, что т s? Ak ^ /W @ sg: Л ^ л), а гак как в силу предположенных свойств функции ср (х) все Ak в правой части формулы (8) умножаются на неотрицатель- неотрицательные множители, то эта формула даёт но при 1Т—>-0 мы имеем ъ <р E,) — -f (о + 0), 5 — j Д вследствие чего ifrf (a + 0) < j /(jc) ? (*) dx ^ /M'f (a + 0), a или, если tp(a-|-O)=^O (случай f(a-\-0) = 0, разумеется, тривиален), ь fl + 0) J ^( 12 А. Я. Хинчин. Восемь лекций
178 ЛЕКЦИЯ ШЕСТАЯ но функция (9), будучи непрерывной, должна в некоторой внутренней точке ? отрезка [а, Ь] принимать промежуточное между её гранями значение, стоящее в средней части этих неравенств; отсюда $ <a). A0) Эта формула и составляет собой содержание второй тео- теоремы о среднем значении в наших специальных условиях (т. е. когда функция »(х) — неотрицательная и невозрастаю- щая, a f(x)—любая интегрируемая). «Среднее значение» ? выступает здесь в своеобразной роли одного из пределов ин- интеграции. Если предположить функцию cs (х) снова неотрицательной, но на этот раз неубывающей, то, полагая х=Ь— у, Ь—y)=z<b(y), мы найдём: ь—а <p (*)/** = ) f(b—y)b(y)dy; 0 так как функция d> (у), очевидно, неотрицательная и невозра- стающая при 0<^у<^Ь — а, то мы можем применить к по- последнему интегралу формулу A0): b — a Tj Ь \ f(b—y)')?(y)dy=<]? (+0)J f(b —у) dy = ?(b — 0) j / (x)dx, о о —%, где 0<Crl<C.b—а, и следовательно, а<^?=? — ri<^b; та- таким образом, в этом случае вторая теорема о среднем значе- значении принимает вид * *. \f(x)<?(x)dx=y(b—0)\f{x)dx. а (. Будем, наконец, предполагать функцию ip (x) монотонной, например, невозрастающей, но о знаке её не будем делать никаких предположений; так как функция у(х) — <р (Ь—0) в отрезке [а, Ь] неотрицательная и невозрастающая, то, при-
ИНТЕГРАЛ 179 меняя формулу A0), находим: ь е j f (х) [<р (х) — у (Ь — 0)] dx = [<р {а + 0) — <р (ft — 0)] J /(др) Ас, а а откуда ft Е 6 J /(*) <р (х) rfjr=<p(a+O) j /(*) djc+ (p(ft — 0) j f(x) dx. a a t Таково выражение второй теоремы о среднем значении в об- общем случае; в частности, если функция <р(х) непрерывна в точках а и Ь, ь t ft =<?(a)^ f(x) dx-{-y(b) ^ f(x)dx a ? Обобщённые интегралы. Мы должны теперь уделить не- некоторое внимание двум важнейшим обобщениям первоначальной идеи интеграла: интегралам с бесконечными пределами и инте- интегралам от неограниченных функций. В обоих случаях речь идёт о действительном обобщении самой идеи, а не просто о применении её в новых условиях, к первоначальной конструк- конструкции интеграла присоединяется ещё новый, дополнительный предельный переход; обобщённый интеграл представляет собой уже не предел или грань определённого вида сумм, а предел обыкновенных интегралов. 4- ос ft -t-oo Вы знаете, что символы \ , \ и \ определяются со- а —ос —оо ответственно как lim Г ft-» +C»J а > а lim I , -» — ccj а lim я—coj Ь-*Л-соа Чтобы лучше рассмотреть основную идею этого обобщения, остановимся на простом частном случае. Пусть функция f(x) — положительная и невозрастающая при х^а (черт. 28); гео- геометрически интеграл J f(x) dx 12*
180 ЛЕКЦИЯ ШЕСТАЯ иллюстрируется тогда площадью, заштрихованной на черт. 28. При возрастании Ь эта площадь увеличивается; когда b—>• ос, она может либо возрастать безгранично, либо оставаться огра- Черт. 28. ниченн"ой и, следовательно, стремиться к некоторому пределу. Этот предел мы и называем обобщённым интегралом f(x)dx; геометрической иллюстрацией его может служить площадь, заключённая между осью Ох и кривою y = f(x) вправо от точки а; площадь может оставаться конечной, несмотря на то, что соответствующая фигура простирается неограни- неограниченно. Простейший случай второго обобщения — интеграла неогра- неограниченной функции,—хотя и решает, повидимому, совсем дру- другую задачу, но по существу почти не отличается от только что рассмотренного. Проще всего в этом убедиться, замечая, что его геометрический образ может быть получен просто зеркаль- зеркальным отражением черт. 28 в биссектрисе угла хОу. Если функция f(x), например, становится неограниченной в сосед- соседстве точки а, то г ь [f(x)dx а Ь определяется как предел обыкновенных интегралов \ f(x)dx
ИНТЕГРАЛ 181 при ?—>--1-0 (черт. 29). Вы видите, что речь здесь снова идёт о возможности приписать определённую величину площадм фигуры, простирающейся в бесконечность. Эта фигура — того же типа, как и в первом случае, и только имеет другое рас- расположение; кроме того, вы видите, что в качестве прибли- приближённых площадей здесь берутся площади фигур иного типа, чем в первом случае; но всё это не имеет, конечно, сущест- существенного значении. В общем случае, т. е. когда поведение функции / (х) ка- какое угодно1), определения об- обобщённых интегралов остаются теми же хотя и не получают уже столь простой геометриче- геометрической иллюстрации. В случае, когда соответствующий предел существует, говорит, что дан- ный обобщённый интеграл суще- существует, или имеет смысл, или сходится. Таким образом, вопрос о сходимости обобщённого интеграла того или другого типа всегда представляет собой задачу о существовании пре- предела у некоторой данной функции; все общие предложения теории пределов имеют поэтому силу и для обобщённых ин- интегралов; в частности, имеет место критерий Коши, который здесь, очевидно, получает следующую формулировку: если функция f(x) интегрируема в отрезке (а, Ь) при любом ко- конечном Ь~^>а, то для сходимости обобщённого интеграла \ f(x)dx fl o,f Черт. 29. необходимо и достаточно, чтобы, как бы мало ни было при любых достаточно больших Ьх и Ь2 мы Ц Конечно, в случае неограниченности речь должна итти о не- неограниченности в соседстве одной точки.
182 ЛЕКЦИЯ ШЕСТАЯ имели Точно так же имеют место следующие две важные теоре- теоремы, являющие собой, как вы узнаете сразу, полную аналогию соответствующим предложениям теории рядов. 1. Если при а<^х<^ -^-оо 0 s^f(x)s^y(x), причём f(x) и у (х) интегрируемы на любом отрезке [a, b] (b~^>a), то из сходимости интеграла j y{x)dx а следует сходимость интеграла J f(x)dx. Эта теорема может быть названа «принципом сравнения интегралов» и совершенно аналогична «принципу сравнения рядов» (лекция IV, стр. 92—93); точно так же и доказательство этой теоремы Вы без затруднений проведёте самостоятельно на основе изложенной там идеи. 2. Из сходимости интеграла \f{x)\dx A1) вытекает сходимость интеграла J f(x)dx. A2) а Эта теорема, очевидно, в точности аналогична соответству- соответствующей теореме из лекции IV (стр. 98) и может быть доказана в полной аналогии с этой последней; и здесь мы говорим, что интеграл A2) сходится абсолютно, если сходится интеграл A1). J) Здесь и в дальнейшем мы ради краткости говорим лишь об одном типе обобщённых интегралов; однако, все сказанное с соот- соответствующими изменениями (которые вы, конечно, легко найдёте сами) переносится и на все другие типы.
ИНТЕГРАЛ 183 С помощью этих теорем легко устанавливается сходимость большого числа часто встречающихся интегралов; так, из (непосредственно усматриваемой) сходимости интеграла С Сх в силу теоремы 1 вытекает сходимость интеграла | sin л: | dx, 1 а отсюда в силу теоремы 2 — сходимость (и притом абсолют- абсолютная) интеграла sinjt , г- dx. 1 Если в теореме 1 в качестве функции ;р (х) выбирать раз- различные положительные функции с заведомо сходящимися инте- интегралами, то она даёт целый ряд признаков сходимости непо- непосредственно для интегралов с положительной подинтегральной функцией, а с помощью теоремы 2 — и для подинтегральных функций произвольного знака. Несомненно, некоторые из этих признаков вам известны; мы на них останавливаться не будем. Зато мы рассмотрим два признака, менее широко известных и более тонких, так как в них речь идёт об интегралах, ко- которые могут и не быть абсолютно сходящимися (откуда, между прочим, видно, что эти признаки не могут быть выведены из теоремы 1). Признак 1. Пусть функция <р (х) монотонна и lim щ (х) = 0, а функция f(x) такова, что а остаётся ограниченным при х —> оо. Тогда интеграл J y{x)f[x)dx A3) а сходится.
184 ЛЕКЦИЯ ЦШСТАЯ В самом деле, в силу второй теоремы о среднем значении при а <^ bx <^ Ь2 <^ -|- оо существует такая внутренняя точка р! отрезка (?,, Ь2), что J f (*) /(*) ^ = <Р (*i + 0) J /(х) rfx + tp (Ь2 — 0) f /(jc) ах = ' =<p(ft,+ 0)[/r(p) —^(M +<Р (^ —°) [^(*2) —^(Р)]- (А) Так как при 6,—*оо, Ь2—* оо в силу условий теоремы шF, -(-0) и а (?>2— 0) стремятся к нулю, в то время как все встречающиеся значения функции F(x) остаются ограничен- ограниченными, то правая, а следовательно, и левая часть последнего равенства стремится при этом к нулю, что в силу критерия Коши доказывает сходимость интеграла A3). Пример. Интеграл - Со sinх л .. —-— dx A4) I сходится, как непосредственно вытекает из признака 1, если положить (р(л:):=л:~1, f(x) = smx, F(x)=^zos\—cosx; можно, однако, легко показать, что сходимость интеграла A4) не является абсолютной. Признак 2. Если функция у(х) монотонна и ограни- ограничено, то из сходимости интеграла A2) следует сходимость интеграла A3). Для доказательства снова применим вторую теорему о сред- среднем значении; в первом равенстве (А) при Ь}—<-оо, Ь2—* сх> величины !о(Ь^-\-0) и w(b2 — 0) остаются ограниченными, в то время как оба интеграла стремятся к нулю в силу критерия Коши и предположенной сходимости интеграла A2); значит, левая часть при этом стремится к нулю, откуда опять в силу критерия Коши мы заключаем, что интеграл A3) сходится. Пример. Полагая f(x) = и w(je) = arctgje, мы из доказанной сходимости интеграла A4) заключаем, что сходится и интеграл + 00 • Г sin Jtaictg x dx J * '
ИНТЕГРАЛ 185 Двойные интегралы. Тот специальный процесс суммиро- вания, который лежит на основании интегрального исчисления, может быть с успехом применён и к функциям, зависящим от нескольких переменных. В большом числе прикладных обла- областей, и в особенности в механике и физике, такие многомер- многомерные или, как их чаще называют, «кратные» интегралы играют значительную роль. Теория этих интегралов, не содержащая в принципиальном отношении почти ничего нового сравнительно с теорией обыкновенного интеграла, с формальной стороны очень громоздка. В дальнейшем мы, оставаясь в пределах двухмерного слу- случая, кратко покажем, как идеи, изложенные нами в начале настоящей лекции, в почти неизменном виде находят себе применение к определению кратных интегралов и установле- установлению целого ряда их свойств. Пусть мы имеем функцию двух переменных z^f(x, у), определённую и ограниченную в некоторой замкнутой1) огра- ограниченной области D координатной плоскости ху. Пусть Мит означают соответственно верхнюю и нижнюю грани функции f(x, у) в области D, площадь которой мы условимся обозна- обозначать той же буквой D. Подобно тому как мы поступали в од- одномерном случае, мы и здесь будем рассматривать различные разбиения Т области D на части. Конечна, здесь мы имеем картину значительно более сложную, чем раньше. В одномер- одномерном случае как основная область, так и те части, на которые мы её разбивали, имели одну форму — это были отрезки; в том случае, который мы рассматриваем теперь, как область D, так и те части А,, Д2, . . . , Д„, на которые мы её разбиваем, мо- могут иметь весьма различную форму. Для теории выгодно по возможности ничем не ограничивать вида всех этих областей. Важно, конечно, только, чтобы каждая из этих областей имела определённую площадь и чтобы площадь общей части (т. е. взаимной границы) любых двух различных областей А, и Aft была равна нулю. В остальном мы не будем пока налагать на разбиение Т никаких специальных требований. Пусть, как в одномерном случае, Mk и mk соответствен- соответственно означают верхнюю и нижнюю грани функции f(x, у) на 1) Т. е. точки границы присоединяются к области.
186 ЛЕКЦИЯ ШЕСТАЯ части ДА; положим, как прежде, где ДА символизирует, конечно, площадь области, обозначенной тем же символом. Как и ранее, мы имеем, очевидно, mD s? sT =sS Sr ==S MD, так что множества всех сумм ST и sT ограничены сверху и снизу. Пусть / и / соответственно означают нижнюю грань множе- множества всех сумм ST и верхнюю грань множества всех сумм sT; мы и здесь будем называть эти два числа соответственно вер- верхним и нижним интегралами функции f(x, у) в области D. Если 7= /, то функция f(x, у) интегрируема в области D и интеграл её равен \\ y)dxdy. В основе всей теории таких «двойных» интегралов лежит ряд предложений, в точности аналогичных тем, которые мы имели в одномерном случае. Мы теперь кратко рассмотрим их, останавливаясь на доказательствах только в тех случаях, где они отличаются от данных нами прежде. Условимся за отсутствием более удобного термина называть ячейками те части А,, Д2, . .., Дп, на которые мы разбиваем основную область D. Диаметром данной ячейки мы будем на- называть верхнюю грань расстояний между всевозможными парами принадлежащих ей точек. Для каждого разбиения Т обозна- обозначим через dT наибольший из диаметров ячеек Д,, Д2, . .., Дп; очевидно, эта величина должна играть здесь ту же роль, как величина 1Т в одномерном случае. Будем, наконец, говорить, что разбиение V есть продолжение разбиения Т, если ка- каждая ячейка разбиения Т принадлежит целиком одной из ячеек разбиения Т. Теперь установим четыре вспомогательных предложения, в точности совпадающих с теми четырьмя леммами, которые мы имели в одномерном случае. Лемма I. Если разбиение V есть продолжение разбие- разбиения Т, то Оу-r ^=^ О у, Sj.1 521 Sj*«
ИНТЕГРАЛ 187 Доказательство может быть буквально перенесено из одно- одномерного случая. Лемма П. Для любых двух разбиений 7", и Т2 Доказательство, указанное нами для одномерного случая, может быть в точности повторено. Пояснения требует лишь построение разбиения Т, служащего продолжением каждого из двух данных разбиений Г,; мы просто принимаем за ячейку разбиения Т совокупность всех точек, принадлежащих одной из ячеек разбиения 'Г, и одной из ячеек разбиения Т2. Соста- Составляя всевозможные такие пары, мы и получим все ячейки раз- разбиения Т; по самому определению продолжения тогда очевидно, что разбиение Т является одновременно продолжением как разбиения 7",, так и разбиения Т2. Лемма III. 7Ъз= /. Это предложение, как и в одномерном случае, есть непо- непосредственное следствие леммы П. Лемма IV. Как бы мало ни было е^>0,* существует такое число Ь ^> 0, что при любом разбиении Т, удовле- удовлетворяющем требованию dT <^ й, Короче говоря, при dT—>-0 суммы ST стремятся к своей ниж- нижней, а суммы sr — к своей верхней грани. Доказательство этого предложения принципиально также не отличается от того, которое мы привели для одномерного случая; однако, здесь более сложное строение ячеек всё же требует, для соблюдения формальной безупречности, детального изложения. Прежде всего, так как / определяется как нижняя грань всех сумм ST, то существует разбиение То, для которого STo<^/ -f~^ Пусть Aft — любая ячейка этого разбиения То. Совокупность точек плоскости, отстоящих от контура этой ячейки не более, чем на 8, образует, очевидно, род «кольца» вокруг этого контура (на черт. 30 границы этого «кольца» намечены пунктиром). Нетрудно убедиться, что площадь такого
188 ЛЕКЦИЯ ШЕСТАЯ «кольца» при достаточно малом 8 равна 2Ык где lk — длина контура ячейки А^1)- Положим / тогда площадь области D,, образованной совокупностью" всех «колец» построенного типа, будет не больше, чем 25/. (она может быть меньше, так как ,''" ~-^ «кольца» могут перекры- перекрываться между собой). Пусть теперь Т — любое разбие- \ ние, для которого dT<^e; j ячейки этою разбиения мы / разделим на две группы, относя к первой каждую ячейку, целиком принадле- принадлежащую области D,, а ко второй — все другие ячейки; соответственные этим двум группам части суммы ST обозначим через Sty и Sty. Оценим каждую из этих сумм в отдельности. При этом, как и в одномерном случае, мы, не ограничивая общности рассу- рассуждения, допустим, что f(x, у) >0 во всей области D, Так как в членах суммы Sty первые множители не превос- превосходят М, а сумма площадей ячеек, участвующих в Sty, не превосходит площади области D, (которая, как мы видели. не больше, чем 25/.), то Sty^2MLe; A5) что же касается ячеек, входящих в состав суммы Sty, то каждая из них целиком принадлежит какой-либо одной из Черт. 30. !) Само собой разумеется, что здесь мы предъявляем уже не- негласно к ячейкам наших разбиений более стеснительные требования, чем вначале; так, мы постулируем, что каждая ячейка есть одно- связная область, имеющая контур конечной длины. К сожалению, в рамках наших лекций мы лишены возможности подробнее осве- осветить эти детали.
ИНТЕГРАЛ 189 ячеек Aft разбиения То; в самом деле, ячейка Д второй группы, не удовлетворяющая этому требованию, должна была бы со- содержать в себе точку Р контура какой-либо из ячеек Д^,; но, будучи ячейкой второй группы, Д не может целиком принад- принадлежать «кольцу», окружающему этот контур, а потому должна содержать точку Q, лежащую вне этого «кольца», однако, тогда расстояние точек Р и Q, а значит, и подавно — диа- диаметр ячейки Д превосходит о, что невозможно. Мы ,не уменьшим сумму S^\ если в каждом её члене за- заменим первый множитель величиной Mk, соответствующей той ячейке Дд, разбиения То, часть которой составляет входящая в данный член ячейка Д (второй группы) разбиения Т; с дру- другой стороны, не уменьшенная, таким образом, сумма в силу не- неотрицательности функции f(x, у) будет, очевидно, всё же не больше, чем STq; таким образом, Сопоставляя это неравенство с неравенством A5) и выбирая число 5, до сих пор остававшееся с произвольным, меньшим, чем ^j- , мы получаем: ST = S(p + S<p < 2MLZ \ТЛ-\ <7+ е. В точности таким же способом можно показать, что sT^>I — ? при условии dT<^5, чем и завершается доказатель- доказательство леммы IV. Теорема. Если функция f(x, у) интегрируема в об- области D, то для всех разбиений Т с достаточно малым йТ где е — любое заранее выбранное положительное число, а (?*> rlk) (&=1. 2, ...,и) — любая точка ячейки \k. п Говоря короче, сумма *S\ f (Sft, щк) lk стремится к ин- тегралу / при dT —>• 0, равномерно относительно всех возмож- «ых выборов как разбиения Т, так и точек (?ft, 7jft).
190 ЛЕКЦИЯ ШЕСТАЯ Обозначая для краткости эту сумму просто через Ът, мы из очевидных неравенств имеем при любом разбиении и любом выборе точек (cft, Sj. ^ Lj. *S Су, а значит, в силу леммы IV при достаточно малом dT откуда | Ег—/|<^е. Обращение доказанной теоремы также справедливо и доказывается в точности так же, как в одно- одномерном случае. Универсальный необходимый и достаточный признак схо- сходимости п k\k-~0 (rfr —0) доказывается, как прежде: 1) если этот признак выполнен, то в силу неравенств ST^ / ^= /^sT (при любом разбиении) мы при достаточно малом dT имеем / — I ^ST — sT<^e, откуда У = / ввиду произвольности ?; 2) если функция f(x, у) ин- интегрируема, то в силу леммы IV при достаточно малом dT мы имеем Sr<^J-\-?, s7^>/ — е, откуда ST — sr<^2e, и зна- значит, Sr — sr—> 0 при dT—-0. Наконец, интегрируемость непрерывных функций доказы- доказывается здесь в точности тем же рассуждением, как и в одно- одномерном случае; в основании этого доказательства и здесь лежит тот факт, что непрерывная функция всегда обладает равномерной непрерывностью (в закрытой, т. е. содержащей свою границу, области). Вычисление двойных интегралов. Уже по поводу обык- обыкновенных интегралов мы выше имели случай говорить о том; что процесс суммирования, лежащий в основании определения интеграла, почти ничего не даёт, если мы пытаемся сделать его орудием фактического вычисления интегралов; тем менее мы можем, конечно, рассчитывать, чтобы двойные интегралы
ИНТЕГРАЛ 191 удобно было вычислять с помощью только что описанного процесса двухмерного суммирования. В случае обыкновенных интегралов мы видели, что мощ- мощные общие методы вычисления интегралов рождаются только путём использований связи интегрального исчисления с диф- дифференциальным. Для двойных (и вообще многомерных) инте- интегралов такие связи тоже могут быть обнаружены; однако, мы получаем наиболее общий и эффективный способ вычисления двойного интеграла известным приведением этой задачи к двум последовательным одномерным интеграциям; рассмотрим кратко, как это делается. Пусть область D, в которой определена непрерывная функ- функция f(x, у), такова, что всякая прямая, параллельная одной из координатных осей, пересекает её контур не более, чем в двух точках (черт. 31). Разбиение Т этой области, которое мы производим для построения интеграла / функции f(x, у), может иметь ячейки какой угодно формы, лишь бы диаметры их становились сколь угодно малыми. Мы теперь проведём это разбиение с помощью сети прямых, параллельных коор- координатным осям, так что ячейки будут прямоугольниками (за исключением тех, которые расположены в непосредственной близости контура области D). Мы будем обозначать, считая слева направо, через ?,, ?2'--- абсциссы прямых, параллельных
192 ЛЕКЦИЯ ШЕСТАЯ оси О_у;-через tj,, rj2, ... (считая снизу вверх)—ординаты прямых, параллельных оси Ох; через а и b — соответственно нижнюю и верхнюю грани абсцисс точек области D; через _У = '-?](¦?) и у = у2(х)— соответственно уравнения нижней и верхней границ области D; через Д,.— ячейку, ограниченную прямыми х = ?1_1, х= ?., _у = г|/._], _y = j].; положим, нако- наконец, ?,.— ?/_-, = Л,-, г,,- — rj,._] = ft/., так что ^.lj = hikj, если только ячейка Д^. имеет прямоугольную форму, т. е. не ле- лежит у контура области О. Если все h( мало, и интеграл / достаточно малы, то dT сколь угодно сколь угодно мало отличается от t.i суммы A6) Освободимся прежде всего от неудобных ячеек непрямоуголь- непрямоугольной формы, расположенных у контура области D.' Обозначим через 8 наибольшее из чи- чисел ht, чённая может непрямо- k.. Полоса, заклю прямыми Черт. 32. между jc=c,-_, и * = ? содержать ячейки угольной формы вверху и внизу; на черт. 32 изобра- изображена схематически пример ная форма верхнего оконча- окончания такой полосы; ячейки (на черт. 32 их три) за- заштрихованы и заключены которого равно /zf, а высо- в прямоугольнике, основание та, очевидно, не превосходит <о,-|-23, где to,- — колеба- колебание функции <?2(х) в отрезке [?,-_,, *,-] (этот прямоугольник и изображён на черт. 32); если § достаточно мало, то в силу равномерной непрерывности функции у%(х) все со,-, а значит, и все со,- -\- 2§ будут меньше как угодно малого положитель- положительного числа е, так что сумма площадей изображённых на черт. 32 непрямоугольных ячеек будет меньше, чем г/г,-, а следовательно, сумма площадей всех таких ячеек, прилегаю- прилегающих к верхней половине контура области D, меньше, чем е 2.hi = e(b — а); такую же оценку получает, очевидно, и
ИНТЕГРАЛ 193 площадь множества ячеек, примыкающих к нижней половине этого контура, так что все вместе взятые «неполные» ячейки дают площадь, не превышающую 2е(Ь — а), следовательно, распространённая на эти ячейки часть суммы A6) по абсо- абсолютной величине ие превосходит 2М(Ь — а) е (где М — верх- верхняя грань функции \f(x, у)\ в области D) и потому сколь угодно мала при достаточно малом 5. Поэтому, распространяя во всём дальнейшем сумму A6) только на прямоугольные ячейки, мы попрежнему будем иметь |/ — 5|<^едля всех раз- разбиений с достаточно малым dT\ при этом теперь •s= ?М, чУ) а,*, = ? а, X/ft. V V Если мы, закрепив определённую систему значений ?,, ?2, ..., будем безгранично уменьшать все разности ft. = 7j.— »j,-_,, то внутренняя сумма ?/(?,, ty)^ будет иметь своим пре- / делом интеграл который мы ради краткости обозначим через F(^), полагая вообще 9. = \ ( (при интеграции* х считается постоянным, так что f(x, у) ин- интегрируется как функция одной переменной у). Мы можем взять величины k. столь малыми, что для любого / откуда А. Я. Хин чин. Восемь лекций
194 ЛЕКЦИЯ ШЕСТАЯ наконец, при достаточно малых hi сумма ^F (?,)/!,, оче- i видно, сколь угодно близка к интегралу * \F(x)dx. а Итак, мы видим, что при надлежаще выбранном разбиении области D все три разности: /—5, 5—^^(У^ и V F^/jhi— I F(x)dx становятся сколь угодно малыми; зна- i a Ъ чит, то же справедливо и для их суммы /— \ F(x)dx, кото- а рая, не завися ни от каких разбиений, должна поэтому рав- равняться нулю. Таким образом, мы получаем: ь % (х) \\f(x,y)dxdy= \dx [ f(x,y)dy, D a <p, (x) так что вычисление двойного интеграла действительно сво- сводится к двум последовательным обыкновенным интеграциям. Внутренний интеграл, разумеется, зависит от х, но уже не зависит от у. Конечно, вместо выбранного нами порядка ин- интеграции может быть взят и обратный; это замечание иногда получает существенное практическое значение: именно, может случиться, что, меняя порядок интеграции, мы придём к функ- функциям, значительно легче интегрируемым. Общая идея интеграла. Наша лекция затянулась. И всё же, прежде чем закончить её, мы хотим ещё бросить общий взгляд на картину, лежащую в основе всякого процесса ин- интеграции, будет ли то обыкновенный, или многомерный, или даже ещё более общий и отвлечённый интеграл. Прежде всего мы имеем дело с определённой областью D некоторого пространства, причём этот термин «пространство» надо понимать здесь в весьма широком значении: это может быть и прямая, и плоскость, и наше обычное трёхмерное, и любое многомерное, и даже какое-либо совсем иное простран- пространство; мы не собираемся здесь давать этому термину общего
ИНТЕГРАЛ 195 определения; для нашей цели важно только, чтобы, во-первых, две любые точки нашего пространства были отделены опре- определённым расстоянием и чтобы, во-вторых, область D и те её части («ячейки»), которые мы будем рассматривать, имели определённую протяжённость; эта протяжённость, смотря по характеру пространства, называется обычно длиной, площадью, объёмом и т. п.; для общности мы будем называть её просто мерой соответствующей части нашего пространства. Теперь представьте себе, что в области D распределена некоторая субстанция; пусть это слово не страшит вас — мы не сделаем попытки определять выражаемого им понятия; для нас субстанция есть просто нечто такое, чего прихо- приходится определённая порция на всякую часть области D; это может быть масса, электрический заряд, теплота — все величины, могущие быть самым различным образом распреде- распределёнными в данной области D; это может быть, например, ко- количество осадков, выпадающих на ту или иную часть плоской области D за данный промежуток времени. Само собой ра- разумеется, что для построения нашей математической картины природа этой субстанции глубоко безразлична, нам важно только, чтобы на каждую рассматриваемую нами часть Д обла- области D приходилось определённое количество F(&) этой суб- субстанции. При каждом разбиении Т области D на части («ячейки») Aj, Д2, ..., Дп общее количество субстанции F(D) слагается из количеств субстанции, приходящихся на отдель- отдельные ячейки: Во всех реальных интерпретациях нарисованной нами фор- формальной схемы играет существенную роль понятие «плотности» субстанции в данной точке Р области D, с математической стороны определяемое, как мы сейчас увидим, дифференци- дифференцирующим процессом. Если Д — любая часть области D, имею- имеющая определённую меру /иД, то естественно называть отноше- отношение —— средней плотностью нашей субстанции в области Д; это — количество субстанции, в среднем приходящееся в об- области Д на единицу протяжённости (меры). Пусть теперь Р — любая точка области D; если мы окружим эту точку какой- либо областью Д малого диаметра d(\) (а диаметр любой об- 13*
196 ЛЕКЦИЯ ШЕСТАЯ ласти в нашем пространстве вполне определён, ибо определено расстояние между двумя любыми точками), то средняя плот- плотность субстанции в этой малой области Д будет характеризо- характеризовать нам густоту распределения этой субстанции в ближай- ближайшем соседстве точки Р; а если эта средняя плотность, как мы допустим, стремится к определённому пределу f(P), когда область Д стягивается к точке P(d(A)—>-0), то этот предел f(P) мы называем плотностью нашей субстанции в точке Р. Именно так определяется плотность для всех физических суб- субстанций— массы, электричества и т. п. Мы видим, что плот- плотность субстанции /(Р) есть функция точки нашего простран- пространства, в то время как количество субстанции F(h) является функцией области. Можно сказать, что функция F(h) даёт интегральную (по областям), а функция f(P) — локальную (по точкам) характеристику распределения нашей субстанции в области D. Если функция ^(Д) задана, то f(P) находится из неё с помощью некоторого дифференцирующего процесса; сущ- сущность дифференцирующего процесса в принципиальном плане, пожалуй, лучше прямо и определять, как переход от интегрально- интегрального описания какого-либо явления к локальной его характеризации. Но пусть теперь, обратно, нам задана в каждой точке Р области D плотность распределения f(P) некоторой субстан- субстанции, и требуется определить общее количество F(D) субстан- субстанции, заключённой в этой области. Эта задача и есть проблема интегрирования в её наиболее общей форме: переход от ло- локальной к интегральной характеризации изучаемого явления. Пусть, для простоты, функция /(Р) непрерывна (а значит, и равномерно непрерывна) в области D (мы предполагаем эту область замкнутой). Для решения нашей задачи мы тогда раз- разбиваем область D на ячейки Д,, Д^ .... Дп малых диамет- диаметров; в каждой ячейке Дй выбираем произвольную точку Рк; f(Pk) есть предел отношения —У-при условии, что область Д, всё время заключая в себе точку Pk, безгранично уменьшается в диаметре; поэтому, если ячейки Дй очень малы, то где е—любое заданное заранее положительное число; отсюда
интеграл 197 а суммируя эти неравенства по k, находим: п F(D) —emD<? f(Pk)m±k<F(D)-\-?mD, 4=1 откуда в пределе при неограниченно убывающих диаметрах ячеек Таким образом, мы видим, что по данной функции f(P) (плотности распределения) величина F(D) (т. е. общее коли- количество субстанции) действительно определяется с помощью хорошо знакомого нам интегрирующего процесса: мелкое раз- разбиение области D на ячейки \к, выбор точек Рк, составление суммы произведений вида f(Pk)mkk по всем ячейкам и, на- наконец,— переход к пределу при условии, что диаметры ячеек стремятся к нулю. Таким образом, с рассматриваемой нами весьма общей точки зрения процесс интеграции в каких угодно простран- пространствах представляется методом, позволяющим определить при- приходящееся на ту или иную область количество субстанции, зная плотность распределения этой субстанции в каждой от- отдельной точке рассматриваемой основной области. Всякий та- такой метод имеет своим неизбежным коррелатом некоторый (решающий обратную задачу) дифференцирующий процесс, целью которого является нахождение локальной плотности распределённой субстанции, когда известно количество её, при- приходящееся на любую область. Имеется полная возможность, достаточно точно перечислив основные предпосылки, строить теорию интеграции на этой общей абстрактной базе; тогда обыкновенные, двойные и другие специальные интегралы ста- становятся частными случаями такой общей теории* важнейшие свойства которых раз навсегда установлены этой общей тео- теорией и не требуют особых для каждого отдельного случая доказательств.
ЛЕКЦИЯ VII РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ Ряды в роли аппарата для исследования функций. — Разложе- Разложение в степенные ряды. — Ряды многочленов. — Теорема Вейер- штрасса. — Тригонометрические ряды. — Коэффициенты Фурье. — Аппроксимация в среднем.—Замкнутость системы тригонометри- тригонометрических функций. — Сходимость рядов Фурье для функций, имею- имеющих ограниченную интегрируемую производную. — Распространение на произвольные отрезки. Ряды в роли аппарата для исследования функций. Когда мы даём синусу и косинусу их первоначальное геоме- геометрическое определение, то целый ряд важнейших свойств этих функций мы выводим непосредственно из их определения. Когда мы затем вводим для этих функций общепринятые обо- обозначения sin х и cosjc, то эти «аналитические выражения» ничего нового к нашим сведениям о выражаемых ими функ- функциях, разумеется, не прибавляют, точно так же, как мы не узнаём ничего нового о свойствах функции Дирихле, обозна- обозначая её через f(x). Но когда мы позднее находим для триго- тригонометрических функций новые аналитические выражения, пред- представляющие их в виде степенных рядов: то с помощью этих представлений мы легко обнаруживаем целый ряд таких свойств этих функций, которых мы совсем не могли бы или могли бы лишь очень сложным путём полу- получить из их первоначальных определений; и прежде всего, эти разложения дают нам возможность с максимальной принципи- принципиальной простотой вычислять значения тригонометрических функций при любых значениях аргумента.
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 199 В лекции III мы говорили о тех опасностях, которые таит в себе чрезмерное преклонение перед аналитическими выра- выражениями; действительно, в среде представителей прикладных наук мы часто встречаемся с вредными последствиями этого явления, о которых мы в своё время подробно говорили; но нельзя отрицать, что среди современных математиков мы ино- иногда встречаем противоположную крайность, способную прине- принести не меньше вреда: принципиальное пренебрежение к ана- аналитическим выражениям, практически ведущее к неумению и беспомощности в обращении с ними. Аналитическое выражение, если мы с самого начала по- подойдём к нему в роли хозяев, а не покорных и немудрству- ющих подчинённых, если мы будем видеть в нём лишь то, что оно есть на самом деле, — послушное нашим целям и за- замыслам орудие исследования функций, — может сыграть в этом исследовании огромную, решающую роль и принести чрезвы- чрезвычайно много пользы. Более того, можно считать нормальным и естественным такое положение вещей, когда математик, стоящий перед задачей исследования какой-либо определённой функций"!* прежде всего ищет для неё удобного аналитического выражения; из деталей такого выражающего данную функцию аналитического аппарата в большинстве случаев и удаётся наиболее рациональным способом вычитать нужные свойства этой функции. Среди различных аналитических аппаратов, могущих в этом смысле служить орудиями исследования функций, первое ме- место по своей простоте, гибкости, прозрачности и удобству употребления, без сомнения, занимают функциональные ряды. Идея этого важнейшего аналитического аппарата очень проста: функция, которую мы хотим исследовать, представляется, как предел последовательности других, более простых и доступ- доступных исследованию функций (частичных сумм изображающего ряда); если такая частичная сумма на всём рассматриваемом участке весьма близка к изучаемой функции, то мы имеем основание рассчитывать из свойств этой приближённой частич- частичной суммы узнать, хотя бы приближённо, некоторые свойства изучаемой функции; в частности, умея приближённо вычислять, при тех или других значениях аргумента, значения этих ча- частичных сумм, мы тем самым имеем метод для приближённого вычисления соответствующих значений изучаемой функции.
200 ЛЕКЦИЯ СЕДЬМАЯ Какими же функциями всего удобнее и выгоднее пользо- пользоваться в качестве элементов разложения, т. е. членов того ряда, который призван изображать собою изучаемую функцию и помочь нам в её исследовании? На этот вопрос, как и есте- естественно ожидать, нельзя дать единого ответа, пригодного для всех случаев; здесь почти всё зависит от природы изуча- изучаемой функции и характера тех задач, которые мы по отно- отношению к ней себе ставим. Необходимо только отметить, что существует несколько важнейших типов функциональных ря- рядов, в такой степени зарекомендовавших себя в этой своей роли, что применение их совершается на каждом шагу и, есте- естественно, вызвало создание соответствующих общих теорий; сюда относятся в первую очередь степенные ряды (где элемен- элементами разложения служат целые, в первую очередь — неотри- неотрицательные степени независимой переменной) и тригонометри- тригонометрические ряды (с элементами вида s\nkx, cos&jc, где k^O, I, 2, ...). Однако, в очень многих случаях в качестве элемен- элементов разложения бывает удобнее выбрать не эти простейшие, «универсальные», а совсем другие функции, хотя и не столь простые, но зато по своим свойствам более тесно связанные с изучаемой функцией (например, так называемые «собствен- «собственные функции» в краевых задачах). Вообще при выборе типа разложения основным руководящим принципом должно слу- служить отсутствие всякой предвзятости, которое в максимальной степени позволило бы учесть в каждом отдельном случае всю специфику поставленных нами перед собою задач. В дальней- дальнейшем мы кратко коснёмся лишь наиболее важных в принципи- принципиальном отношении вопросов, связанных с разложением функ- функций в степенные и тригонометрические ряды. Разложение в степенные ряды! Мы знаем, что областью сходимости степенного ряда всегда служит некоторый (от- (открытый, закрытый или полуоткрытый) отрезок с концами — гиг. Какими свойствами должна обладать функция f(x) для того, чтобы она допускала разложение л=0 сходящееся в этом отрезке? Мы знаем, что для этого функ- функция f(x) должна быть непрерывной в открытом отрезке
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 201 (—г,-\-г) (лекция IV, стр. 115); однако этого далеко не- недостаточно; покажем, прежде всего, что при —г<^х<^г функция f(x) должна иметь производную в точке х; одновре- одновременно мы установим, что эта производная /' (х) изображается степенным рядом папх»-\ 1 A) получаемым почленным дифференцированием данного ряда и сходящимся в открытом отрезке (— г, г); при доказательстве надо всё время иметь в виду, что ни существование производ- производной f{x), ни сходимость ряда A) нам заранее не даны, так что оба факта должны быть установлены в процессе рас- рассуждения. Пусть | х | <^ г и пусть р —любое число, заключённое между | лг | и г, при |Л|<^р—\х\ мы имеем | ¦«-|-Л | <^ р <^ г и, следовательно, п—0 откуда _ у где положено N sN(h)— 2- an _ (x-\-h)»—xn «=0 Так как то при \h <^р — л: но р <^ г, и следовательно, сумма в правой части этого не- неравенства, будучи остатком сходящегося ряда, при достаточно
202 ЛЕКЦИЯ- СЕДЬМАЯ большом N становится меньше как угодно малого положитель- положительного числа е; таким образом, если N достаточно велико и 1Л|<^р — | лс|, то \RN{h)\<s, и следовательно, Если мы теперь, оставляя N неизменным, заставим h стремить- стремиться к нулю, то сумма SN(h), очевидно, будет иметь пределом сумму N следовательно, последние неравенства позволяют утверждать, „ / (jc 4- А) — / (х) что как верхний, так и нижний пределы величины ——!—^—i-5—¦ при этом будут не более, чем на г, отличаться от величины SN и, следовательно, не более, чем на 2г, отличаться друг от друга; в силу произвольности е отсюда вытекает, что эти пределы совпадают между собой, т. е. что существует и не больше, чем на е, отличается от суммы SN: при единственном условии, что N достаточно велико; но это означает, что ряд A) сходится и имеет своей суммой /' (х). Таким образом, мы доказали все наши утверждения. Итак, функция, изображаемая степенным рядом, должна быть не только непрерывной, но и дифференцируемой. Но и этого мало. Мы только что видели, что /' (х) изображается степенным рядом, сходящимся для всех |лг|<^г; в силу самой только что доказанной теоремы поэтому всюду в открытом отрезке (—г, г) должна существовать и вторая производ- производная f"{x); продолжая же это рассуждение, мы приходим к выводу, что функция, изображающаяся на некотором отрезке степенным рядом, должна в каждой внутренней точке
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 203 этого отрезка иметь производные всех порядков. При этом каждая из этих производных изображается в том же (откры- (открытом) отрезке степенным рядом, получаемым из данного ряда путём повторенного соответственное число раз почленного дифференцирования, так что оо оо /(*) = V апх", f (х) = X папх"-\ л = 0 и = 1 и вообще ? —1)... (и—K Полагая в этом соотношении х = 0, мы находим: откуда Этим мы одновременно доказали единственность разложения функции в степенной ряд и нашли выражение коэффициентов этого разложения через значения производных данной функ- функции при х = 0. Таким образом, если функция f(x) вообще разлагается в степенной ряд, то это разложение имеет вид Это — так называемый ряд Маклорена; полагая х = а-\- h, f(a-\-h)=;<Q(h), мы получаем: что по возвращении к старым обозначениям приводит к более общему ряду Тэйлора: оо /(*)=-¦ Е^-'(*-«)"¦ C) л=0
204 ЛЕКЦИЯ СЕДЬМАЯ Положение вещей становится особенно ясным при сопостав- сопоставлении всех этих фактов с тем, что мы говорили в лекции V о формулах Тэйлора и Маклорена. Там у нас не было речи о бесконечных рядах; величину i Rn(x)=f(x)— 2 мы называли остаточным членом данной формулы Маклорена и исследовали её поведение, предполагая х бесконечно малым. Теперь мы видим, что поведением этой же величины решается вопрос о разложимости функции f(x) в степенной ряд; но в лекции V мы считали п постоянным и заставляли х стремиться к нулю; теперь же, напротив, мы должны, выбрав какое-либо значение х, закрепить его и заставить число п безгранично возрастать. Условие очевидно, необходимо и достаточно для того, чтобы имела место формула B). Обычно разложимость данной функции в ряд Маклорена устанавливается выбором для остаточного чле- члена Rn (х) какой-либо из большого числа найденных для него форм, с несколькими из которых мы ознакомились в лекции V. ,Какую из этих форм выгоднее всего выбрать для этой цели,— это полностью зависит, конечно, от природы той функции, разложения которой мы ищем. Как мы видели выше, функция, разлагающаяся на данном отрезке, в степенной ряд, должна иметь в каждой внутренней точке этого отрезка производные всех порядков. Так как, об- обратно, для любой функции, обладающей этим свойством, ряд Тэйлора C) формально может быть написан в соседстве любой точки а этого отрезка, то может возникнуть соблазн пред- предполагать, что это условие и достаточно для разложимости данной функции в степенной ряд. Однако, это не так. Прежде всего, может случиться, что формально написанный для данной функции ряд Маклорена B) окажется расходящимся для всех х=^0; значительно более интересным является, однако, то, что даже в случае, когда построенный для данной функции ряд Маклорена сходится, он может иметь своей суммой совсем
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 205 не эту, а другую функцию; пример этого случая, ставший до известной степени классическим, даёт функция О (*=0). Как легко вычислить, при лг=О сама функция и её произ- производные всех порядков обращаются в нуль, вследствие чего все коэффициенты ряда Маклорена (а значит, и сумма его при всех значениях х) равны нулю. Отсюда, между прочим, следует, что если данная функция, как мы видели, может разлагаться в степенной ряд не более, чем одним способом, то, напротив, всякий сходящийся степен- степенной ряд служит рядом Маклорена не для одной, а для бес- бесчисленного множества функций. В самом деле, пусть f(x) — сумма данного ряда, который служит, как мы видели, рядом Маклорена для этой функции; очевидно, что в таком случае все функции семейства f(x)-\-aw(x), где а — любое веществен- вещественное число, a <p(x)—функция, которую мы определили выше, будут иметь данный ряд в качестве своего ряда Маклорена. Разумеется, изображаться данным рядом (т. е. быть его суммой) может только одна из функций этого семейства. Ряды многочленов. Теорема Вейерштрасса. Так как по- последовательные частичные суммы степенного ряда представляют собой многочлены всё возрастающих степеней, то всякая функ- функция f{x), разлагающаяся в степенной ряд, может быть при- приближённо представлена многочленом с любой степенью точности. Более точно это следует выразить так: если функция f(x) изо- изображается степенным рядом, радиус сходимости которого равен Л то для любого положительного р <^ г и любого е ^> 0 сущест- существует многочлен, отличающийся от f(x) менее, чем на е, для всех х отрезка [— р, -)- р] (мы не можем утверждать того же для отрезка (—г, г), хотя бы даже открытого, так как на этом отрезке сходимость данного степенного ряда может быть не- неравномерной). Вспомним, что именно об этой задаче прибли- приближённого выражения функций через многочлены мы говорили в лекции V в связи с формулами Тэйлора и Маклорена. Однако, если всякая функция, разложимая в степенной ряд, может быть с любой степенью точности аппроксимирована ? помощью многочлена, то обратное утверждение, по меньшей
206 ЛЕКЦИЯ СЕДЬМАЯ мере, не очевидно. Из того, что функция f(x) в данном от- отрезке [а, Ь] может быть представлена в виде многочлена с любой наперёд заданной степенью точности, очевидно, ещё не возникает разложимости её где бы то ни было в степенной ряд. Это замечание имеет важное принципиальное значение; в самом деле, приближённое представление функций в виде многочленов является одним из важнейших орудий исследова- исследования этих функций и оперирования над ними; с другой стороны, мы знаем, что разложение в степенные ряды допускает лишь сравнительно узкий класс функций — в состав этого класса входит даже не всякая функция, имеющая производные всех порядков, что само по себе составляет уже весьма стеснитель- стеснительное требование; таким образом, если бы разложимость функ- функции в степенной ряд была необходимым условием приближённой представимости её с помощью многочленов, то этой (весьма ценной) представимостью оказался бы обладающим лишь очень узкий класс функциональных зависимостей. В действительности дело обстоит иначе. Оказывается, что необходимым и достаточным условием приближённой предста- представимости данной функции на некотором отрезке с любой сте- степенью точности с помощью многочлена является непрерывность её на этом отрезке. Таким образом, даже функции, нигде не дифференцируемые, могут допускать такое приближённое пред- представление. Необходимость непрерывности, конечно, очевидна: функция, приближённо могущая быть представленной много- многочленом с любой степенью точности, есть предел равномерно сходящейся последовательности (и значит, сумма равномерно сходящегося ряда) многочленов, т. е. непрерывных функций, и, следовательно, в силу известной теоремы (лекция IV, стр. 109) также должна быть непрерывной. То, что это необходимое условие вместе с тем является и достаточным, представляет собой один из самых глубоких и важных фактов математи- математического анализа и составляет содержание знаменитой теоремы Вейерштрасса, к доказательству которой мы и переходим '). При этом, как Вы сейчас увидите, нам придётся начать не- несколько издалека. I) В настоящее время известен целый ряд весьма разливных доказательств этой теоремы; мы здесь выбираем одно из наиболее интересных в методологическом отношении.
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 207 Рассмотрим интеграл очевидно, при любом /г= 1,2,... это — положительное число; разобьём область интеграции на две части, а именно, будем рассматривать отдельно интеграл — _ i_ распространённый на (малый при большом п) отрезок / -I- _ V и дополнительный интеграл \ Vя Vn I A — и2)" du, представляющий собой в сущности сумму двух интегралов, рас- распространённых соответственно на отрезки / — 1, ¦ \ и j \ vn J — , 1 ) . Когда п безгранично возрастает, область интегра- ции интеграла Кп стягивается к точке 0, область же интегра- интеграции интеграла Ln, напротив, расширяется, стремясь охватить собой весь отрезок [—¦ 1, 1J; мы убедимся теперь, что, несмотря на это, при больших значениях п величина Кп исчерпывает собой почти всю величину /п, а на долю интеграла Ln остаётся лишь ничтожно малая часть этой величины; объясняется это, конечно, тем, что при большом п подинтегральная функция A—-и2)" лишь для очень малых значений \и\ имеет значения, сколько-нибудь заметные, будучи при сколько-нибудь больших значениях ,а| ничтожно малой; график этой функции схемати- схематически представлен на черт. 33.
208 ЛЕКЦИЯ СЕДЬМАЯ Лемма. При п—>-оо Так как каждое из этих двух соотношений, очевидно, яв- является следствием другого, то достаточно доказать какое- нибудь одно из них. Подинтегральная функция в интеграле Ln имеет, очевидно, наибольшее значение при \и\ = п ; так как область инте- У грации составляет часть отрезка [— 1, 1], то поэтому С другой стороны, очевидно, и следовательно.
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 209 Но !„ з !_^л з вследствие чего или, полагая -г п3 =z, L,. , 8 , ~t ^ IF z '• но при и—> оо и z—> оо, а так как при этом ze~z—>-02), то lim ^^0, п-юо п что и доказывает нашу лемму. Какое же значение может иметь проведённое нами деталь- детальное исследование интеграла /я для доказательства столь об- общего предложения, каким является теорема Вейерштрасса? В математическом анализе это — далеко не единичный пример такого случая, когда теорема чрезвычайно большой общности доказывается применением очень специального аналитического инструмента, каковым в нашем примере служит интеграл /п; то специфическое свойство этого интеграла, которое делает его удобным орудием установления теоремы Вейерштрасса, на- находит себе выражение именно в доказанной нами лемме; Вы видите, таким образом, что излагаемое нами доказательство теоремы Вейерштрасса может служить методологически поучи- поучительным примером аналитического рассуждения. 1) Известно, что \-\-х<Сех при любом х Ф 0; проще всего в этом убедиться, отыскивая наименьшее значение функции ех — 1-х. Щ Проще всего в этом убедиться, замечая, что при г > 0 z1 I z 2 ег= 1-f-г-|-Kf-f-. ..> —г2, вследствие чего ге~г = —г< — . 14 А. Я. Хинчин. Восемь лекций
210 ЛЕКЦИЯ СЕДЬМАЯ Пусть теперь нам задана произвольная функция f(x), не- непрерывная на отрезке [0, 1J. Интеграл 1 пп {х) -_-_-_ J. Г f lv) {! _.. KV _ x)^ndVi Q рассматриваемый как функция от х, представляет собой, оче- очевидно, многочлен степени 2п (ибо таким многочленом является иодинтегральная функция). Преобразуя переменную интеграции с помощью подстановки v = x-\-u, мы находим: 1— X 1 п J ПустьО<а<Р<1 и р; тогда —л:^—а<0<1 — -—р<1—х; поэтому, если п настолько велико, что п 3 не превосходит меньшего из чисел а и 1 — $, то — л:<^ — п 3<[и 3<^1—х (as В последнем равенстве мы можем написать: _ 1 _.! з з" п 1—х —п \ — х 1 1 — X —X Но, обозначая через М наибольшее значение функции |/(л:)| на отрезке [0, 1], мы, очевидно, имеем: J + J \f{u+x)(\—u*rdu
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 211 при п —> оо в силу доказанной леммы; при этом, так как ML —у-Ц от х не зависит, левая часть этого соотношения при 'п п —* оо стремится к нулю равномерно относительно х во всём отрезке [a, PJ. Полагая \ 1 1—Д i 1-д мы имеем, таким образом, п 3 — я причём Ra (х) —>. 0 при п —> оо равномерно на отрезке [а, р]. Вы уже, вероятно, догадались, .что именно в лице много- многочлена Рп(х) мы хотим найти многочлен, приближённо выра- выражающий функцию f(x); если так, то Вам должен быть ясен и дальнейший план доказательства: ввиду равномерной малости величины Rn (x) при больших значениях п надо только пока- показать, что первое слагаемое правой части последнего равенства при этом на всём отрезке [a, fij близко к f(x); это же почти очевидно, ибо f(u-\-x) под интегралом мало отличается от /(х), так как значения \и\, входящие в промежуток интегра- интеграции, ничтожно малы; заменяя же f(u-\-x) через f(x), мы тем самым заменяем всё первое слагаемое выражением f(x) j-5 , 'л которое в силу нашей леммы стремится к f(x) при п—<-оа. Чтобы завершить доказательство, нам остаётся только прове- провести это рассуждение со всей формальной строгостью; проще всего воспользоваться для этого первой теоремой о среднем значении (лекция VI, стр. 174—175), в силу которой 1 "~ з" 14'
212 ЛЕКЦИЯ СЕДЬМАЯ где — 1 <^ 0 <^ I; мы находим, таким образом, \f(x)— Pn(x)\ = \f(x)— /(* 4-0л")?5—/?„ Пусть е^>0 произвольно мало; как мы уже знаем, при доста- достаточно большом я I я» (*) К 4 (* с другой стороны, так как ~i —> 1 при п —<¦ со, а функция f(x) равномерно непрерывна во всём отрезке [О, 1J, то при достаточно большом п таким образом, при достаточно большом л другими словами, при п —>¦ ее многочлен Рп (х) равномерно стремится к функции f(x) на отрезке \а, fi]. В основном этим теорема Вейерштрасса доказана; нам остаётся лишь избавиться от нескольких малосущественных ограничений; во-первых, мы должны перейти от специального отрезка [О, 1J к произвольному отрезку [a, ftj; и во-вторых, мы должны показать, что требуемая теоремой Ввйерштрасса равномерная аппроксимация имеет место не только в любом отрезке fa', b'\, целиком лежащем внутри [а, Ь\ (именно так у нас ведь обстояло дело, ибо наш отрезок [а, р] был любым oi резком, целиком лежащим внутри [О, 1J), но и во всём отрезке \а, Ь\. Для достижения первой из этих двух целей положим f[x) = Да + (* — a) y\ = f (y).
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 213 Когда х пробегает отрезок [а, Ь\, у пробегает отрезок [0; 1], и если функция f(x) непрерывна на отрезке [а, Ь\, то функция ц>{у) непрерывна на отрезке [О, 1J. Пусть а<^а' ^i' ^Ь положим В силу того, что мы только что доказали, для любого найдётся такой многочлен Рп (у), что иначе, но очевидно, что относительно х есть многочлен той же степени, что и Рп(х); таким образом, функция f{x), непрерывная на произвольном отрезке [а, Ь\ равномерно аппроксимируется многочленами с любой степенью точности на любом отрезке [а1, Ь'\, целиком лежащем внутри отрезка [а, Ь\. Чтобы снять, наконец, и последнее ограничение, допустим снова, что функция f(x) непрерывна на отрезке [a, bj, и по- положим ¦ {a 5g; лг=^: b). Очевидно, что функция F(x) определена и непрерывна на от- отрезке [а—1, д-\- 1J, внутри которого целиком лежит отрезок [а, Ь\\ в силу доказанного, она равномерно аппроксимируется многочленами, с любой степенью точности, на отрезке \а, Ь\; но так как на этом отрезке F(x) = f(x), то то же самое справедливо и для функции f(x), чем теорема Вейерштрасса окончательно доказана. Эту теорему можно формулировать и так: всякая непре- непрерывная функция есть сумма равномерно сходящегося ряда многочленов; ибо, если, например, Р„(х) означает (сущест- (существующий в силу доказанного) многочлен, отличающийся от f(x)
214 ЛЕКЦИЯ СЕДЬМАЯ менее, чем на —, на всём протяжении отрезка [a, h\ то рял Р,(х) + {Р2(*) — Рл (х)\ +... + {Рп(х) — Р„_, члены которого являются многочленами, очевидно, равномерно сходится к функции f[x) на отрезке \а, Ь\. Тригонометрические ряды. Тригонометрическим рядом называется ряд вида оо ^^ancosnx-\-bnsmnx). D) л=1 Так как все слагаемые этого ряда'—периодические функции с периодом 2тс, го такой же периодичностью обладает и сумма этого ряда. Поэтому, если функция, которую мы имеем в виду разложить в такой ряд, этой периодичностью не обладает, то имеет смысл искать её разложения лишь в отрезках, длина которых не превосходит 2тс. Вследствие этой же периодично- периодичности все рассмотрения, связанные с рядом D), достаточно вести на каком-либо определённом отрезке длины 2тс, например, на отрезке (— тс, тс]. Приведём прежде всего три соображения, в силу которых в некоторых случаях разложение функции в ряд типа D) может оказаться более'Целесообразным, чем разложение в сте- степенной ряд. 1) Как мы знаем, в степенной рял разлагаются только функции, имеющие производные всех порядков (причём даже это стеснительное требование, вообще говоря, ещё не оказы- оказывается достаточным); напротив, как мы увидим дальше, для разложимости функции в ряд вида D) достаточно гораздо более скромных предпосылок; в частности, такое разложение допускает, как мы увидим дальше, всякая функция, имеющая ограниченную и интегрируемую производную, причём и эта предпосылка не является необходимой. 2) Члены ряда D) — периодические, волнообразные функ- функции; некоторый элемент этой волнообразной периодичности со- сохраняют и частичные суммы этого ряда — черта, вообще говоря, отсутствующая у степенных рядов; поэтому, если ис- исследуемая функция (как это часто бывает, например, в меха- механике, физике, биологии, экономике) обнаруживает некоторую
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 215 тенденцию к хотя бы приближённой волнообразное™, то мы с полным основанием можем ожидать, что частичные суммы тригонометрического ряда будут имитировать поведение такой функции лучше, чем многочлены, каковыми являются частичные суммы степенных рядов. 3) Наконец, тригонометрические функции, представляющие собой члены ряда D), обладают одним замечательным свой- свойством, которое в чрезвычайной степени облегчает как иссле- исследование тригонометрических рядов, так и оперирование с ними, и которого совершенно лишены члены степенных рядов. Это свойство есть так называемая ортогональность системы функ- функций 1, sin тис, cos ял: (я=1, 2, ...); E) оно состоит в том, что интеграл произведения двух любых различных между собой функций этой системы, взятый по любому отрезку длины 2п, равен нулю (свойство это вы либо уже знаете, либо легко докажете, преобразуя стоящее под знаком интеграла произведение в сумму на основании элемен- элементарных тригонометрических формул). Важность этого замеча- замечательного свойства трудно переоценить; даже гораздо более сложные функции, чем тригонометрические, если только они образуют ортогональную систему, во многих случаях оказы- оказываются в качестве элементов ряда исключительно удобным инструментом для исследования функций; многие свойства три- тригонометрической системы E) оказываются общими свойствами любых ортогональных систем, что привело к создании» целой особой теории таких систем, в настоящее время уже широко развитой и насчитывающей в своём составе много важных и глубоких аналитических фактов. Коэффициенты Фурье. В случае степенных рядов мы видели, что коэффициенты ряда легко определяются, если известны значения разлагаемой функции и её производных при л-=0. Этот же вопрос естественно поставить в первую очередь и для тригонометрических рядов. Пусть функция f{x) изображается в отрезке \—тс, тс} равномерно сходящимся ря- рядом D). Умножая обе части равенстве) /(х) = Ц-\- ^ (а„cosnx-\- Ьпsin их) п=1
216 ЛЕКЦИЯ СЕДЬМАЯ на cos Ал:, где k — одно из чисел ряда 0, 1, 2, ..., мы, оче- очевидно, получаем представление функции f(x) cos kx в виде некоторого также равномерно сходящегося ряда; поэтому, беря интегралы обеих частей полученного равенства в преде- пределах от —тс до -f-тг, мы можем интегрировать почленно ряд, стоящий в правой части (см. лекцию IV, стр. 112—113). Но в силу ортогональности системы тригонометрических функций интегралы всех членов этого ряда обратятся в нуль, за исклю- исключением единственного интеграла It при этом мы предположили, что &^>0; при & = 0 мы полу- получаем в качестве единственного отличного от нуля интеграла л J ^dx=na0, — п так что общий результат F) сохраняется и в этом случае (именно с этой целью первый член ряда D) и пишут обычно в виде -т?Ь таким образом, мы имеем при любом \ / (х) cos kx dx = nak, или ak = ~\jf(x)coskxdx (* = 0, 1, 2, ...); G) IT подобным же образом мы находим: ?А=— | /(jr)sin kxdx (k—\, 2, ...). (S>
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 217 Формулы G) и (8) и решают поставленную нами задачу — выражают коэффициенты ряда D) через изображаемую этим рядом функцию. Эти формулы, как вы видите, сами но себе не требуют от функции f(x) даже существования первой про- производной; коэффициенты ак и Ьь могут быть построены по этим формулам для любой интегрируемой функции; их называют обычно коэффициентами Фурье данной интегрируемой функ- функции f(x), а построенный с их помощью ряд D) — рядом Фурье этой функции (хотя формулы G) и (8) впервые были найдены Эйлером). Однако, из этого, конечно, никак не следует (логи- (логическая ситуация здесь полностью аналогична той, с какой мы встретились при исследовании степенных рядов), что построен- построенный для нашей интегрируемой функции ряд Фурье должен сходиться; а если он сходится, то из предыдущего никак не вытекает, что сумма его должна совпадать с функцией f(x). И в действительности существует сколько угодно случаев, когда построенный для интегрируемой функции ряд Фурье оказывается расходящимся. Всё, что установлено нами до сих пор, можно формулировать так: если функция f(x) может быть изображена равномерно сходящимся на отрезке \—п, я] тригонометрическим рядом, то этот ряд есть её ряд Фурье, т. е. коэффициенты его выражаются через данную функцию посредством формул G) и (8). В случае ряда Маклорена мы пришли к совершенно аналогичному заключе- заключению, с той только разницей, что там нам не приходилось особо требовать равномерной сходимости, так как из самой природы степенного ряда вытекает, как мы знаем, равномерная сходимость его во всяком отрезке, целиком помещающемся •внутри интервала сходимости. Очевидно, что основная задача теории тригонометрических рядов состоит в установлении тех предпосылок, при соблюде- соблюдении которых данная функция является суммой своего ряда Фурье. Этой проблемой занималось очень большое число ис- исследователей, ей посвящена огромная литература; в дальней- дальнейшем мы рассмотрим несколько простейших результатов, свя- связанных с этим вопросом. Аппроксимация в среднем. Но прежде покажем, как коэффициенты Фурье естественно появляются в связи с реше- решением совсем другой задачи. Пусть мы имеем ограниченную и интегрируемую в отрезке [—ti, ttJ функцию f{x); желая найти
218 ЛЕКЦИЯ СЕДЬМАЯ для неё приближённое выражение в виде «тригонометрического многочлена порядка п» п К (*) = т + X (°* cos kx Л- h si" **). спросим себя, как надлежит выбрать коэффициенты ak, Eft, чтобы сделать эту аппроксимацию возможно точной. Конечно, в такой постановке наш вопрос ещё не имеет определённости; мы ведь не определили, какой величиной мы будем измерять доброкачественность полученного приближения. Ясно, что выбор этой величины в широких пределах является произвольным; так, мы могли бы принять за погрешность нашего приближе- приближения верхнюю грань разности \/(х) — Пп(х)\ для —itsgjrsSTi; другой возможный выбор величины, оце- оценивающей погрешность того или другого приближения, при- приписывает этой величине выражение IT J \/{х)—П„{х)\Их; —It наконец, можно оценивать эту погрешность и интегралом J \f[x) — II (x)\*dx; (9) —п последнее выражение с формальной стороны наиболее удобно как в теоретических изысканиях, так и в практических расчё- расчётах, ибо оно не пользуется символом абсолютного значения, очень часто приносящим затруднения при аналитических опе- операциях. На этой последней форме оценки погрешности мы и остановимся; аппроксимацию, связанную с таким определением величины погрешности, в математике принято называть «аппрок- «аппроксимацией в среднем». Теперь перед нами стоит совершенно определённая задача выбрать числа ak, §k таким образом, чтобы интеграл (9) но* лучил наименьшее возможное значение. Очевидно, этот инте- интеграл есть функция 2/z-f-l переменных ао,'а,, р,, ..., an, jin, гак что мы имеем дело с многомерной задачей на минимум;
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 219 специальная природа этой задачи позволяет, однако, при ре- решении её обойтись без методов дифференциального исчисления. Представим интеграл (9) в виде П П It • j f (x) dx + J IP (x) rf* — 2 $ f{x) П„ (jc) dx. П It ~It Обозначая через ak, bk коэффициенты Фурье функции f(x), мы в силу формул G) и (8), очевидно, имеем: f{x) Ц„ (х) dx = и { a-f° + X (aA + pA6ft)}• 00) It k = l С другой стороны, если мы учтём, что ф И IT \ cos2 kxdx= \ sin2 kx dx = я, то ортогональность системы E) легко даёт нам (И) Сопоставляя формулы A0) и A1) и пользуясь элементарными соотношениями a*— 2akak=(ak — аь? — а|, мы получаем: j' 2
220 ЛЕКЦИЯ СЕДМАЯ и следовательно, 4 f I/w - и» мр ^ = Г z2 w ^-*(^+X к+*у \+ В правой части только последнее слагаемое зависит от чисел ak и pt; мы должны поэтому найти минимум этого последнего слагаемого; но все члены его неотрицательны, и потому оно получает своё наименьшее значение (нуль), когда все эти члены обращаются в нуль, т. е. когда ао—ао, ak = ak, %k = bk (k= 1, 2, ..., л); таким образом, решение поставленной нами задачи гласит, что из всех тригонометрических многочленов порядка п наилучшую аппроксимацию в среднем данной ограниченной и интегрируемой функции f(x) даёт многочлен, коэффици- коэффициентами которого служат коэффициенты Фурье этой функ- функции. Обозначая этот тригонометрический многочлен через Р„ (х)у мы имеем: п 2 n = Г f {х) dx-J^- -f ? (а\ + Ь\)\. Это соотношение между прочим доказывает одно очень важное предложение: так как левая часть, очевидно, неотрицательна, то мы имеем при любом и: ft=1 —It Так как правая часть этого неравенства от п не зависит, то сумма, стоящая в левой части, при возрастании п остаётся ограниченной; другими словами, ряд сходится, какова бы ни была ограниченная интегрируемая функция f(x). Отсюда, в частности, следует, что коэф-
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 221 фициенты Фурье ак, Ьк каждой такой функции стремятся к нулю при k—>оо. Эти результаты, полученные совершенно элементарным пу- путём, имеют очень большое значение для теории рядов Фурье. Замкнутость системы тригонометрических функций. Как мы видели в теории степенных рядов, один и тот же ряд может служить рядом Маклорена для бесчисленного множества различных функций. Возможно ли аналогичное явление для рядов Фурье? Вопрос этот тесно связан с одним замечательным свойством системы E) тригонометрических функций. Если ряд D) служит рядом Фурье для двух непрерывных1) в отрезке [ — тт, тг] и различных между собой функций /, (х) и /2(-*0, то это означает, что все соответственные коэффициенты Фурье этих двух функций совпадают между собой, а следовательно, разность этих двух функций, не равная тождественно нулю в отрезке [—тт, тг], имеет все коэффициенты Фурье равными нулю; но это, очевидно, в силу G) и (8) равносильно утверждению, что функция f(x) ортогональна всем функциям системы E), таким образом, в этом случае ортогональная система E) была бы, как говорят, незамкнутой, т. е. к ней можно было бы добавить новую, не тождественно равную нулю функцию так, чтобы расширенная система оставалась ортогональной. Очевидно, возможно и обратное заключение; если система E) незамкнута, то добавочная функция /(-*:), ортогональная всем функциям системы E), очевидно, тем самым имеет все коэффи- диенты Фурье равными нулю; но тогда все функции семейства где а — любое вещественное число, имеют один и тот же ряд коэффициентов Фурье. Покажем, что на самом деле система E) замкнута; другими словами, всякая непрерывная функция, ортогональная всем ¦функциям системы E), должна тождественно обращаться в нуль. !) Если не налагать никаких требований непрерывности, то по- поставленная задача решается тривиально, так как две функции, отли- отличающиеся друг от друга только в какой-либо одной точке, оче- очевидно, имеют все коэффициенты Фурье соответственно совпадающими между собой.
222 ЛЕКЦИЯ СЕДЬМАЯ Пусть fix) — такая функция. Очевидно, что тогда для любого тригонометрического многочлена Т(х) мы имеем: f{x)T[x)dx = 0. т Допустим, что f{x) не есть тождественный нуль, и пусть для определённости /(лг)^>0 при х = а; гогда, как мы знаем из теории непрерывных функций, можно найти такие положитель- положительные числа с и 8, что при — тт<^а — (' Рассмотрим теперь выражение производя возведение в степень по формуле бинома, мы нахо- находим для функции Тп (х) выражение вида г=0 но, как известно из тригонометрии, любая степень cos"л: может быть выражена как линейная комбинация функций 1, cos х, cos 2х, ..., cos пх с постоянными коэффициентами (доказывается очень просто методом полной индукции); таким образом, мы получаем. л Тп{х) = ]?<!, cos r (х— а); /¦=0 замечая же, наконец, что cos r(x — а) = cos ra cos rx -\- sin ra sin rx, мы, очевидно, приходим к выражению л Т„(Х) = f + X (Ur COS ГХ + Pr Sin ГХ)> г=0 где аг, Рг — постоянные коэффициенты. Таким образом, функ- !) Очевидно, что в наших условиях а можно считать внутренней точкой отрезка [— it, п].
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 223 ция Тп (х) при всяком п есть тригонометрический многочлен, вследствие чего и [ f(x)Tn(x)dx = 0 (я=1,2,...). A2) С другой стороны, представим себе в основных чертах поведе- поведение функции Тп(х) при больших значениях я; так как функ- функция '° s_ —— на отрезке [—тг, тг| заключена, очевидно, между 0 и 1, причём она равна единице только при х=а, то при больших значениях п величина Тп (х) неотрицательна, равна единице при х^а и ничтожно мала для всех значений, сколько-нибудь удалённых от а; другими словами, течение её имеет график того типа, какой изображён на черт. 33 (стр. 208), с той только разницей, что отрезок [ — 1, 1J надо заменить отрезком [—тг, тт] и максимум вместо точки х=0 поместить в точке х=а. Отсюда ясен план наших дальнейших рассуждений. Так как при больших значениях п функция Тп (х) ничтожно мала вне отрезка [а — д, а-)-5], то и соответствующие части интеграла A2) ничтожно малы, вследствие чего знак его определяется знаком интеграла \f(x)Tn(x)dx; A3) а—8 а так как под этим интегралом 7"п(л:)^>0 и f{x) ~^> с,то надо только убедиться, что откинутые нами части интеграла A2) по абсолютному значению малы сравнительно с положительным интегралом A3), чтобы установить, что интеграл A2) не может равняться нулю, и тем самым притти к противоречию. Про- Проделаем необходимые для этого оценки. Положим a-j-5 a—ё п ) f(x)Tn[x)dx = /lt j" + $ f{x)Taix)dx = /t, а—5 —к o-J-5 так что 0 = Принимая во внимание равенство ———^~ -=cos2 х~- ,
224 ЛЕКЦИЯ СЕДЬМАЯ имеем: /, Зге [ cos2"^-=- dx = а—5 5 5 = с |"cos2"|-rfy = 2c ГA—sin2^- *J %j -i 0 но при данной области интеграции 0<sin|-<l, вследствие чего ¦j(.--nf)". cos| V 1 V или, полагая sin -^=2, -^ cos -^ rfy = dz, sin j- j U-^^^jl-O-sini)-}; о а так как при достаточно большом п выражение в фигурной скобке, очевидно, больше -= , то С другой стороны, если мы обозначим через М наибольшее значение функции f{x) на отрезке [ — тс, тт] и заметим, что в пределах тех двух интегралов, которые составляют собой /2, cos2 —тт— <! cos2 75- , и следовательно, то мы получим: |/2КМcos2" -|-(а — 5-J-tt-I-tt — a < 2тт/И cos2" |- = 2ттуИр", A5)
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 225 где положено P = cos*i<l. Так как /, -|-/2 = 0, то |/,| = |/г|, откуда в силу A4) и A5) > (+1)РЛ+1>Й но это и создаёт искомое противоречие, ибо яр" —> 0 при п —•- оо ') и потому не может оставаться при любых я больше постоянного положительного числа —-. . Таким образом, мы доказали замкнутость ортогональной системы E). Как мы уже видели, отсюда следует, что данный тригонометрический ряд D) может служить рядом Фурье не более чем одной непрерывной функции. В частности, если этот ряд сходится равномерно, сумма его и есть единственная непрерывная функция, имеющая этот ряд своим рядом Фурьэ. Сходимость рядов Фурье для функций, имеющих огра- ограниченную интегрируемую производную. Покажем теперь, что всякая функция f(x), периодическая с периодом 2тт и имеющая ограниченную и интегрируемую производную, разла- разлагается в равномерно сходящийся тригонометрический ряд (ко- (который, следовательно, есть её ряд Фурье). Условимся обозначать коэффициенты Фурье функции f(x) через ак, bk, а коэффициенты Фурье функции /' (х) — через a'k, Ь'к. Тогда интеграция по частям дает: п nak = \ f(x) cos kx dx = Л* 1 Г J _- * J J J f (X) Sln k*dx=-T, Полагая л In — =x, имеем: In — p как мы видели в сноске на стр. 209. 15 А. Я. Хинчин. Восемь лекций т- хе-х—*0(->t —v oo),
226 ЛЕКЦИЯ СЕДЬМАЯ г ak и подобным же образом тг?.=-т-. В дальнейшем нам удобно я к будет применить так называемое неравенство Коши-Шварця; ft=l *=1 имеющее место для любых вещественных чисел uk, v и лю- любого л1). Замечая, что aftcos kx -f- bk sin kx = — ( — ft'ft cos Ax -j- a'k sin /глг), мы в силу неравенства (a cos tp + p sin aJ = a2 + p2 — (a sin ф — p cos (pJ ^ a2 -f- ps находим при т^> п: m m )\ = ^-r(—ft^c X (— *'*cos **+«isin ft = л m m l) Доказательство: ^ (ufr!t4-t't)a. как функция от х, есть ft=i трёхчлен второй степени, никогда неотрицательный; следовательно, дискриминант его
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 227 оо Но ряд 2^ ki СХ°ДИТСЯ- Точно так же и ряд А1 сходится (см. стр. 220), так как a'k и b'k — коэффициенты Фурье ограниченной интегрируемой функции f (х). Следова- Следовательно, в правой части последнего неравенства оба множителя стремятся к нулю при п—>¦ оо и т~^>п (критерий Коши!); а значит, и т lim ^ (ak cos kx -f- bk sin kx) = 0, и притом равномерно относительно х, ибо правая часть преды- предыдущего неравенства от х не зависит. Но это и означает в силу критерия Коши, что ряд D) равномерно сходится на отрезке [ — тг, —^— тг]; обозначая сумму его через s(x), мы видим, что ряд D) является рядом Фурье для каждой из функций f(x) и s (x); но в таком случае эти функции, будучи непрерывными, должны, как мы знаем, тождественно совпадать; этим наше утверждение доказано полностью. " Современная теория тригонометрических рядов доказывает сходимость рядов Фурье для значительно более широких клас- классов функций, чем класс, рассмотренный нами; однако, очень далеко такое расширение простираться не может, так как из- известно, что даже среди непрерывных функций имеются такие, для которых ряды Фурье сходятся не при всех значениях х. Здесь мы, конечно, не имеем возможности подробнее заняться этим кругом вопросов. Заметим только, что теория тригоно- тригонометрических рядов, которой посвящена огромная, в том числе и учебная, литература, до настоящего времени сохраняет в своём составе большое число важных проблем, которые ещё не удалось решить, и потому, естественно, привлекает к себе усилия многих исследователей. Распространение на произвольные отрезки. До сих пор у нас шла речь о функциях, определённых на отрезке [ — тс, тт], и только в этом отрезке мы искали разложение данной функции в тригонометрический ряд; при этом мы в сущности негласно 15*
228 ЛЕКЦИЯ СЕДЬМАЯ предполагали ещё, что f(n)=:f{,—тг), ибо лишь при этом условии функция f(x) может изображаться рядом вида |4) во всех точках закрытого отрезка [—тг, тг]. Теперь мы должны посмотреть, как можно освободиться от этих ограничений, ибо ясно, что теория тригонометрических рядов может получить сколько-нибудь широкие применения лишь в том случае, если мы сумеем разлагать в тригонометрические ряды функции, определённые на любых отрезках и не стеснённые никакими требованиями периодичности. Прежде всего, очевидно, что (как мы, впрочем, указывали ещё в самом начале) во всём предшествующем ничего не изменится, если вместо отрезка [—тт, тт] мы положим в ос- основу наших рассуждений любой отрезок [а, а -\- 2тт] длины 2тт, лишь бы мы имели f(a-\-2ti) = f(a). Таким образом, в нашем изложении предъявлялись требования лишь к длине рассмат- рассматриваемого отрезка, а не к его положению; от функции же требовалось совпадение её значений в концах данного отрезка. Пусть теперь мы хотим разложить в тригонометрический ряд функцию f(x), определённую на совершенно произвольном отрезке [а, Ь\ и не подчинённую никаким условиям периодич- периодичности; мы будем только предполагать, как и прежде, что функ- функция fix) дифференцируема в каждой точке отрезка [a, ft] и что её производная ограничена и интегрируема в этом отрезке. Допустим сначала, что ft— а <^ 2тт. Очевидно, что мы можем бесчисленным множеством способов определить в отрезке [а, а -\- 2тг] функцию /* (х), которая имела бы в этом отрезке ограниченную интегрируемую производную, удовлетворяла тре- требованию /* (а-|-2тт) =/* (а) и совпадала с функцией f(x) во всех точках отрезка [а, ft]. В силу того, что мы доказали выше, функция /* (х) разлагается в отрезке [а, а -\- 2ttJ в равномерно сходящийся тригонометрический ряд. Очевидно, что в отрезке [а, ft] этот ряд изображает функцию f(x) и, таким образом, полностью решает поставленную нами задачу. Пусть теперь ft— o.^>2ti. Тогда мы прежде всего возь- возьмём любое число Ь'^> b w определим на отрезке [a, ft'] функ- функцию f* (x) так, чтобы она имела в этом отрезке ограниченную и интегрируемую производную, удовлетворяла требованию f*(b') = f*{a) й совпадала с f(x) во всех точках отрезка Га, ft]. Если мы, сверх того, озаботимся тем, чтобы было y*'(ft') = yr*'(а) (что, конечно, всегда возможно), и будем пе-
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 229 риодически продолжать функцию f*(x) за пределы отрезка [а, Ь'] в обе стороны, то мы. получим периодическую функ- функцию f* (х) периода Ъ'—а=2/^>2тт, обладающую производ- производной, ограниченной и интегрируемой в любом отрезке, и сов- совпадающую с f(x) на отрезке [а, Ь\ Положим теперь Так как у пробегает отрезок [ — тт, тс], когда х изменяется от—/ до /, то функция (р (у) обладает ограниченной интегри- интегрируемой производной на отрезке [—тт, тт], причём ю(—тг) = ==/*(—/)=г/*(/) = (й(тг); в силу нашей теории ряд Фурье функции и (у) равномерно сходится к этой функции в отрезке [ — тг, ttJ: ' Но отсюда, очевидно (у=^ (f ^) A6) равномерно на отрезке — / < х ^ /; так как функции cos у х и sin -г х имеют, подобно функции /* (х), период 21, то разло- разложение A6) имеет место равномерно на всей числовой прямой, откуда, в частности, на отрезке [а, Ь\ равномерно со г. . On , V** / ЛП /(¦*)= у+ 2- [ап cosy 1 й=1 Итак, мы видим, что функция f(x) изображается на отрезке [а, Ь] тригонометрическим рядом, отличающимся от ряда D) лишь тем, что элементами разложения вместо функций cosnx, sin ял: служат функции cos«y.*:, sin я у х, имеющие период 11 вместо прежнего 2тт. Этот результат решает поставленную
230 ЛЕКЦИЯ СЕДЬМАЯ нами задачу наилучшим возможным образом, ибо, конечно, заранее было ясно, что рядом вида D), все члены которого имеют период 2тг, функция f(x) в отрезке [а, Ь], вообще говоря, изображаться не может (в силу неравенства b— а ^> 2тт). Мы должны ещё посмотреть, как можно найти по функции f{x) коэффициенты ап, Ьп изображающего её ряда. Для этого заметим, что по первоначальному определению п п ак = \\ <Р (v)cos ky dy, bk = ~ \ y(y) sin ky dy. Полагая у=-^- х, находим: — i r= — \ f* (x) cos k y x dx= -j \ f*(x) cos k -j x dx — i и аналогично: =\ \f*{x)sinkjxdx. Так как функций /* (x), удовлетворяющих всем поставлен- поставленным нами требованиям, существует бесчисленное множество, то ak и bk заданием функции f (х) в отрезке (а, Ь) ещё не определяются однозначно. Это не должно удивлять нас: ряд A6) призван изображать функцию f (х) лишь в интервале [а, Ь], длина которого меньше, чем период 2/ элементов разложения; совершенно аналогично и в первоначально разобранном нами случае мы могли бы получить бесчисленное множество раз- различных рядов вида D), изображающих функцию f(x) на лю- любой части отрезка [ — к, тт] (но не во всём этом отрезке).
ЛЕКЦИЯ VIII ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ Основные понятия. — Существование решения. — Единственность решения. — Зависимость решений от параметров. — Преобразова- Преобразование переменных. — Системы уравнений высших порядков. Основные понятия. В конце нашей шестой лекции мы говорили о том, что в идейном плане целью всякого процесса интеграции является установление суммарных «.интегральных* черт изучаемого явления по данным его локальным характе- характеристикам. Задачи, идущие в этом направлении, весьма мно- многочисленны во всех прикладных науках, пользующихся сред- средствами математического анализа. Однако, те весьма разнообразные запросы, которые предъявляют этого рода задачи к матема- математическому аппарату, далеко не могут быть удовлетворены таким элементарным с идейной точки зрения орудием, каким является интеграл — обыкновенный или многомерный; этот простейший интегрирующий аппарат лишь в сравнительно немногих, наиболее примитивных, случаях оказывается доста- достаточным для исчерпывающего решения поставленной задачи. Чаще всего дело обстоит так, что известные нам локаль- локальные черты изучаемого явления приводят к построению диф- дифференциальных уравнений (т. е. уравнений, связывающих между собой значения независимых переменных, функций и их производных различных порядков), в которых в качестве неиз- неизвестных фигурируют как раз функции, описывающие искомые интегральные черты этого явления; решение поставленной конкретной задачи математически сводится, таким образом, к решению некоторой системы дифференциальных уравнений, т. е. к определению входящих в эти уравнения неизвестных функций; эта математическая задача значительно более сложна, чем простое интегрирование функций, которое с точки зрения
232 * ЛЕКЦИЯ ВОСЬМАЯ теории дифференциальных уравнений является лишь простей- простейшим и притом тривиальным частным случаем; это находит себе выражение в том, что всякий раз, когда решение какого- либо inna дифференциальных уравнений тем или другим спо- способом удаётся свести к простому интегрированию функций (или, как принято говорить в теории дифференциальных урав- уравнений, к «квадратурам»), общая задача тем самым считаете» решённой. Нам будет полезно рассмотреть на каком-нибудь очень простом примере, каким образом наше знакомство с локальными чертами явления может породить дифференциальное уравнение, решение которого затем позволяет дать этому явлению и суммарное интегральное описание. Представьте себе сосуд вместимостью а л, наполненный, водой, в которой растворена какая-либо соль; пусть через- этот сосуд непрерывно протекает жидкость, причём в него вливается в единицу времени b л чистой воды и из него выте- вытекает столько же литров раствора; пусть ещё известно, что в некоторый начальный момент времени ? = 0 сосуд содержал с кг соли; мы хотим узнать, какое число х кг соли наш со- сосуд-будет содержать по истечении t единиц времени1). Какие локальные черты явления нам даны в поставленной задаче?Мы знаем, что раствор вытекает из сосуда со скоростью b л в единицу времени; в данный момент времени t сосуд содержит неизвестное нам число хкг соли, а так как вместимость сосуда составляет а л, то каждый литр раствора содержит — кг соли, а b литров — кг. Значит, если бы в течение единицы времени, начиная с момента t, концентрация раствора оставалась посто- постоянной (такой, какова она в момент t)t то количество соли в сосуде за эту единицу времени уменьшилось бы на — кг; их такова, следовательно, скорость — уменьшения количества соли в сосуде для момента t (знак — здесь необходим потому) 1) При этом мы предполагаем перемешивание раствора столь быстрым, что практически можно считать концентрацию соли одной. и той же во всех точках сосуда в каждый данный момент.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 233 dx .. что —- есть скорость прироста количества соли). Мы имеем dx bx ... это соотношение, выражающее мгновенную скорость прироста dx количества соли ——- через наличное в данный момент ее ко- количество х, и даёт нам локальную (здесь, конечно, более удобно говорить: «моментальную» или «мгновенную») харак- характеристику явления. Функция x = x(t), которую мы хотим найти, есть неизвестная, искомая функция полученного урав- уравнения. Может ли эта функция быть найдена непосредственно методами интегрального исчисления? Нам дано выражение её производной, а отыскивать функцию, когда дана её производ- производная, и есть ведь основное дело интегрального исчисления. Однако, задача всё же не вполне обычна: производная иско- искомой функции выражена не через независимую переменную (как мы привыкли), а через самую неизвестную функцию; непо- непосредственно интегральное исчисление решением подобного рода задач не занимается, и потому формально мы стоим перед принципиально новой задачей — решением дифференциального уравнения A); однако, в данном случае вопрос, конечно, три- тривиальным образом приводится к задаче интегрального исчисле- исчисления; написав уравнение A) в виде dx b .. — = at, х а ' мы, как говорят, «разделяем» переменные; простая интегра- интеграция даёт налево 1п х, направо 1, так что —- а где k — постоянное число; для определения этого числа мы (это весьма характерно для всей практики дифференциальных уравнений) обращаемся к «начальному» условию: при t—О х = с; это даёт нам k = \nc, так что окончательно —-t х = се а ;
234 ЛЕКЦИЯ ВОСЬМАЯ этим поставленная нами задача полностью решена; мы видим, что количество соли в сосуде убывает с течением времени по «показательному» закону. Теперь представьте себе, что жидкость, вытекающая из нашего сосуда, протекает ещё через второй сосуд той же вместимости, первоначально (т. е. в момент Г:=0) заполнен- заполненный чистой водой, и что здесь также втекает и вытекает по b л жидкости в единицу времени. Очевидно, что в этот вто- второй сосуд постоянно вводится тогда соль; требуется узнать число у кг соли, которое будет содержаться во втором со- сосуде в момент t. Здесь опять нам первоначально даны только локальные (мгновенные) характеристические черты явления. Очевидно, в единицу времени во второй сосуд втекает столько же соли, сколько её вытекает из первого, т. е., как мы знаем, ь Ь be ~~Б' — х =—е кг; а а ' с другой стороны, в момент t каждый литр жидкости во вто- втором сосуде содержит — кг соли, а значит, те b литров, которые из него вытекают в единицу времени, содержат — у кг соли; следовательно, общий прирост количества соли во втором сосуде в единицу времени для момента t равен Вы видите, что и здесь локальное описание явления нашло своё математическое выражение в некотором дифференциаль- дифференциальном уравнении B); снова нам даётся выражение производной —j- искомой функции у; однако, на . этот раз решен и е полу- полученного уравнения уже далеко не так легко найти, как прежде; уравнение B) даёт нам выражение производной -~- , содер- содержащее как независимую переменную t, так и искомую функ- функцию у, и «разделить» переменные, как мы это сделали в уравнении A), здесь непосредственно не удаётся. Таким обра- образом, мы стоим перед принципиально новой задачей, которая,
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 235 правда, в данном конкретном случае может быть решена сравнительно просто, но для решения которой в общем слу- случае у нас никаких методов нет. Как же выглядит этот «общий случай», как определяется общее понятие дифференциального уравнения? В наших при- примерах мы имели дело с уравнениями вида -g=/(^), C) где х — независимая переменная, а у — неизвестная функция от х; функция f(x, у), конечно, задана нам. Задача состоит в отыскании функции у = у(х), удовлетворяющей уравне- уравнению C), т. е. такой, что тождественно в некотором отрезке ~~~ ~~~ ?'(*)=/(¦*.?(*))¦ Несколько более общий тип дифференциального уравнения представляет собой соотношение где снова х — независимая переменная, у — неизвестная функ- функция от х и у1 = —— . Как и прежде, разыскивается функция у = w (х), тождественно удовлетворяющая соотношению F{x,w(x), ?'(jc)) = O. Далее, бывают случаи, когда локальные черты изучаемого явления требуют для своего выражения не только первой про- производной искомой функции, но и её производных высших порядков, так что дифференциальное уравнение задачи полу- получает вид F(x,y,y',...,yW) = 0; D) такое уравнение называется дифференциальным уравнением порядка п; очевидно, это есть самый общий тип дифферен- дифференциального уравнения для задач, имеющих дело лишь с одной неизвестной функцией и одной независимой переменной. Однако, таково положение вещей лишь в простейших случаях; часто приходится иметь дело с несколькими искомыми функциями, зависящими от нескольких независимых переменных.
236 ЛЕКЦИЯ ВОСЬМАЯ Пусть сначала речь идёт о любом числе неизвестных функций улг у2,..., yk, зависящих, однако, лишь от одной независимой переменной х; чтобы задача получила определён- определённость, локальные характеристики явления должны приводить нас к. системе дифференциальных уравнений, число которых равно числу k неизвестных функций. Общий вид такой системы уравнений, очевидно, таков: ^(*. Уг> y'v ¦•¦' Ani)> yv У'?--- >-УBПя)- • ¦ • • У» У*> - • ¦ ¦ .... //**>) = 0 (/=1, 2,..., k). Вместе с тем мы получили и наиболее общую задачу теории так называемых «обыкновенных» дифференциальных уравне- уравнений; этим термином обычно принято характеризовать диф- дифференциальные уравнения и системы уравнений, содержащие лишь одну независимую переменную. Хорошим примером может служить (известная вам, ко- конечно) система уравнений движения материальной точки: d*x v I dx dy dz dx dy dz х-у>2>1пгчпчп db _ / _, dx dy d = Z(txyz-^ где единственной независимой переменной служит время t, а неизвестными функциями являются координаты х, у, z ма- материальной точки; т здесь означает массу этой материаль- материальной точки, а X, Y, Z—компоненты равнодействующей приложенных к ней сил, в общем случае зависящие от вре- времени, положения и скорости движущейся точки; начальными данными могут служить три координаты и три компоненты скорости этой точки в некоторый определённый «начальный» момент времени t = t0. Если независимых переменных имеется несколько, то мы имеем дело с уравнением (или системой уравнений) с част- частными производными; неизвестные функции являются теперь функциями нескольких переменных, и уравнения естественно содержат их частные производные по этим переменным. Тео- Теория уравнений с частными' производными, как легко понять,
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 237 значительно сложнее теории «обыкновенных» уравнений; здесь мы совсем не будем её касаться. Но и теория обыкновенных дифференциальных уравнений не богата сколько-нибудь эффективными общими методами, которые позволили бы находить решения более или менее широких классов таких уравнений; отчасти это легко и пред- предвидеть, так как ведь даже обычное интегрирование, приме- применённое к элементарным функциям, во многих случаях приво- приводит, как мы" знаем, к функциям неэлементарным; тем более этого следует ожидать от задачи более общей и сложной. Однако, если мы даже станем на ту обычную для теории дифференциальных уравнений точку зрения, что, сведя реше- решение задачи к простым интеграциям, мы можем считать эту задачу решённой, — даже принимая эту точку зрения, мы получаем возможность продвинуться вперёд лишь очень неда- недалеко, ибо такая редукция к «квадратурам» удаётся лишь для немногих простейших (правда, с чисто практической точки зрения наиболее важных) типов дифференциальных уравнений. Мы здесь не будем не только исследовать, но даже и пере- перечислять этих типов, — по этому вопросу вы найдёте сколько угодно материала в любом даже самом элементарном, учебном руководстве. Нас же, естественно, должны занять проблемы более принципиального характера. Существование решения. Мы уже говорили о том, что основная задача интегрального исчисления может рассматри- рассматриваться как простейший частный случай решения дифферен- дифференциального уравнения; именно, если в уравнении правая часть не зависит от у, мы получаем уравнение вида решение которого, очевидно, эквивалентно интегрированию функции f(x). По поводу этой задачи мы имели случай убе- убедиться в том, что даже если функция f(x) непрерывна, суще- существование интеграла (т. е. решения уравнения C')) доказывается специальным рассуждением (опирающимся на равномерную непрерывность функции f(x)): если же функция f(x) ограни-
238 лекция восьмая чена, но имеет точки разрыва, то интеграла, вообще говоря, не существует. Из всего этого заранее ясно, что вопрос о существовании решений уравнения C) должен быть тем более в достаточной мере сложным, и во всяком случае требует специального исследования; в ещё большей степени это относится, конечно, к тем более общим типам уравнений и систем уравнений, ко- которые мы приводили выше. Чтобы идейная сторона'рассмотре- сторона'рассмотрения этой основной для теории дифференциальных уравнений проблемы могла выступить перед вами достаточно рельефно, мы должны по возможности разгрузить наше изложение от сложностей чисто технической природы; поэтому мы в даль нейшем ограничимся рассмотрением уравнений типа C), т. е. уравнений первого порядка, разрешённых относительно произ- производной неизвестной функции. • Пусть функция f(x,y) непрерывна в некоторой обла- области D плоскости ху; мы покажем, что в таком случае для каждой точки (лг0, у0) этой области существует функ- функция у = ц>(х), удовлетворяющая уравнению C) в некоторой окрестности точки х0, и притом такая, что Уо = ц>(хо). Очевидно, область D можно считать замкнутой и ограни- ограниченной. Для доказательства нам потребуется одно вспомогательное предложение, представляющее, впрочем, и самостоятельный интерес. Пусть мы имеем любое бесконечное множество функ- функций S={F(x)\, определённых на некотором отрезке [а, Ь]. Условимся называть множество 5 ограниченным на этом от- отрезке, если существует такое положительное число М, что | F (х) | <^ М для любого х отрезка [а, Ь] и для любой функ- функции F(x) множества S; будем, далее, называть множество 5 равностепенно непрерывным на отрезке [а, Ь], если для любого ?^>0 найдётся такое положительное число ё, что для любой функции F(х) семейства 5 и для любой пары точек xv x2 отрезка [а, Ь], удовлетворяющих неравенству |jc, — je2|<^fi, имеет место неравенство ^(-к,) — F(x2)\<^e. Очевидно, что если множество 5 ограничено (равностепенно непрерывно) на отрезке [а, Ь], то и каждая из входящих в него функций ограничена (непрерывна) на этом отрезке; обратное, конечно, вообще говоря, неверно: ограниченность и равностепенная непрерывность множества 5 требуют,
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 2391 сверх наличия соответствующего свойства у каждой функции- этого множества, ещё и равномерности этого свойства отно- относительно всей совокупности функций данного множества. Условимся, наконец, называть шириной множества 5 на отрезке [а, Ь] верхнюю грань всех величин \F^(x)— F2(x)\> где х — любая точка отрезка [a, b], a Z7, и F2—две произ- произвольные функции множества 5. Лемма. Всякое ограниченное и равностепенно непрерыв- непрерывное на отрезке [а, Ь] бесконечное множество функций S содержит равномерно сходящуюся на этом отрезке функ- функциональную последовательность. Доказательство проведём несколькими последовательными этапами. 1) Докажем прежде всего, что, как бы мало ни было поло- положительное число е, существует такое другое положительное число ё, что для любого отрезка [а, р] cz [a, b], длина кото- которого <^ё, множество .S содержит бесконечную часть S', ширина которой на отрезке [а, р] меньше, чем е. В силу равностепенной непрерывности множества .S на отрезке [а, Ь] для любого натурального числа п найдётся такое положитель- положительное число ё, что колебание любой функции множества 5 на любом отрезке длины <^ Ь будет меньше, чем —; отсюда следует, что все значения любой из этих функций на отрезке [а, р] будут помещаться в некотором отрезке длины — ; пусть, на один момент, ?, ij (г( — ? =— J означают концы одного из таких отрезков; очевидно, мы можем определить целое число k так, что М ^ ? <С — М: в таком случае л ^ л J и так как отрезок [?, 7]] принадлежит отрезку [ — М, М], то —(л—1)^А^л—1; мы видим, таким образом, что все значения, принимаемые любой из функций множества 5 на утрезке [a, j$], принадлежат некоторому отрезку вида — 1л—!)*?*<«—1);
240 ЛЕКЦИЯ ВОСЬМАЯ так как этих отрезков конечное число, а множество 5 содер- содержит бесконечное число функций, то по меньшей мере один из -этих отрезков будет содержать все значения некоторого бес- бесконечного подмножества S' функций множества S; очевидно, что ширина множества 5" на отрезке [а, В] не превосходит 2Л1 , - — и будет меньше, чем г, если мы выберем число и так, чтобы — <Г е. 2) Теперь убедимся, что множество 5 содержит и такую •бесконечную часть 5", ширина которой на всём отрезке [а, Ь\ меньше, чем е. С этой целью выберем натуральное число т •столь большим, чтобы было <Г§; тогда в силу доказан- ного в пункте 1) множество 5 содержит бесконечную часть Slt ширина которой меньше, чем е, на отрезке \а, а-\ ; гна том же основании, множество 5, содержит бесконечную ¦часть 5г, ширина которой меньше, чем е, на отрезке а -] , а-\- 2 , и т. д. В конечном счёте мы при- приходим к бесконечной части Sm = S' множества S, ширина которой меньше, чем е, на отрезке a-j-(/n—1) , b\ , .а также и на каждом из предшествующих отрезков, так как Sm d 5m_, с ... с 58 с S,; но это значит, что ширина мно- множества S' меньше, чем е, на всём отрезке [а, Ь], т. е. наше ¦утверждение доказано. 3) Теперь доказательство леммы завершается уже совсем просто. Обозначим через 5, бесконечную часть множества S, ¦ширина которой на [а, Ь] меньше, чем 1; через 52 — беско- бесконечную часть множества S,, ширина которой на [а, Ь] мень- меньше, чем -^ ; и вообще через Sn — такую бесконечную часть множества ?„_,, ширина которой на [а, Ь] меньше, чем — ,(все эти части существуют в силу доказанного в пункте 2). Пусть F, (х) — любая функция из множества Sv F^(x)—лю- •бая функция из множества S^, отличная от Fj (x), воббще Fn(x) — любая функция из множества Sn, отличная от Fn_,(jc), ,Fn_z(x) F^x). Так как при любом /з>0 Sn+pcSn,
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 241 то Fn (х) ?Sn и Fn+e (х> € Sn, вследствие чего для любой точки х отрезка [а, о\ ~ (P = 0, 1, 2, ,..). Но в силу критерия Коши отсюда следует, что последователь- последовательность функций f", (x), F2 (х), ..., Fn (x), ... сходится равно- равномерно на отрезке [а, Ь], что и завершает доказательство леммы. Теперь мы можем перейти к доказательству основной тео- теоремы, формулированной выше. Но так как это доказательство будет основано на идее, которую* проще всего усвоить в её геометрическом истолкова- истолковании, то нам будет очень полезно, прежде чем к нему при- приступить, посмотреть, какой вид получает в геометрической интерпретации самая задача отыскания решений данного урав- уравнения C). Графические изображения решений у = ц(х) этого уравне- уравнения обычно называют его интегральными кривыми. Уравнение C) относит каждой точке [х, у) области D некоторое опре- определённое направление, характеризуемое угловым коэффи- коэффициентом -р = f(x, у); совокупность точек области D, с отне- отнесённым каждой из них определённым направлением, образует так называемое поле направлений; именно это поле и задаётся уравнением C). Интегральная кривая этого уравнения есть такая кривая, направление касательной в каждой точке кото- которой совпадает с направлением поля в этой точке. Задача отыскания такого решения у = ц(х) уравнения C), которое обращается в у0 при л: = л:0, с геометрической точки зрения есть, таким образом, задача отыскания интегральной кривой данного уравнения, проходящей через точку (х0, у0); доказать существование этого решения означает поэтому: показать, что через эту точку проходит по меньшей мере одна интегральная кривая. Метод, которым мы сейчас воспользуемся для этой цели, будет состоять, как Вы увидите, в построении вспомогатель- вспомогательных кривых, по своим свойствам всё более и более прибли- приближающихся к интегральной кривой, которую нам удастся полу- получить из них с помощью предельного перехода. 16 А. Я. Хинчин. Восемь лекций
242 ЛЕКЦИЯ ВОСЬМАЯ Пусть (х0, у0) — внутренняя точка замкнутой ограниченной области D, в которой функция f(x, у) непрерывна, и пусть М—верхняя грань функции |/(лг, ^)| в этой области. Если число а^>0 достаточно мало, то при х0 — а^х^хо-|-а, у0 — Ма^у^уо-\-Ма точка (х, у) также будет принадле- принадлежать области D; мы покажем, что существует функция у = <р(х), которая для всех л: отрезка [х0 — а, хо-\-а] У У.., Черт. 34. удовлетворяет уравнению C), причём <p(xo)=yo. Доказатель- Доказательство мы снова для более лёгкой обозримости разобьём на отдельные этапы. 1) Положим xk = xn-\ а @ «?&«?«), так что точки х,, х2, ..., хп_] делят отрезок [л:0, хо-|-а] на п равных частей. Построим теперь (черт. 34) на участке [х0, хо-\-а] лома- ломаную линию _У = Ф„(-*:) с вершинами, имеющими абсциссы ., хп, так, чтобы угловой коэффициент каждого х0, ,, звена совпадал с направлением поля в его левом конце. Оче- Очевидно, это можно сделать рекуррентно, переходом от xft_, к xk, причём ордината .У* = *рп (¦**) будет определяться рекур- рекуррентной формулой .У* =.У*_1 а уравнение ломаной на участке задаётся
ДИФФРРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 243 формулой Чтобы убедиться, что ломаная _у=ап(х) на Есём протя- протяжении от х = х0 до х = хо-\-а принадлежит области D, достаточно, очевидно, показать, что \Ун—Уо\<Ма 0«? *«?«); нам будет удобнее установить более сильное неравенство \У\^Ма (l очевидно, оно выполнено для k = 0; если оно верно для неко- некоторого k<^n, то точка (xk, yk) принадлежит области D, и потому \f(xk, yk)\^M; но в таком случае рекуррентная формула E) даёт: так что наше неравенство справедливо и для числа k-\~l. Таким образом, I'-?„(*) — У0\^Ма (xos^x<xo-\-a); G) вся ломаная у=у.п{х) лежит в области D; так как это имеет место для любого л, то, в частности, отсюда следует, что множество функций срп (х) (л=1, 2, ...) огр.шичено в отрезке ["+] [о,о+] 2) Пусть х' и х" — две точки отрезка [х0, х0 -f- а] и пусть для определённости хк_г ^ х' < xk < ... < х,_, ^ х" <х7; тогда ,]+ [? «)] 4- • • • ¦+ J {/(*!-.. л-«)+• • • + /(**. л)} 4- + (х, — x')/(xft_,, ук_г). (8) Из этого основного соотношения мы получим теперь ряд выводов. 17 А. Я. Хин чин. Восемь лекций
244 лекция восьмая Убедимся, прежде всего, что множество функций юп [х) (л=1, 2, .. .) равностепенно непрерывно на отрезке [х0, хо~\~а]- ^ самом деле, соотношение (8) даёт = М \х" — *,_, -|- (х,_, — хк) + xk — х'} = х'), (9) откуда непосредственно видно, что при достаточно малом \х" — х'\ мы имеем | ъп (х") — срп(лг')|<^е, где бы ни были расположены точки Л"' и х" и каково бы ни было п. 3) Так как множество функций tfn(x) ограничено и равно- равностепенно непрерывно на отрезке [х0, х0, -J-ot], то в силу доказанной леммы оно должно содержать равномерно сходя- сходящуюся на этом отрезке последовательность функций; так как в дальнейшем мы будем иметь дело только с этой последова- последовательностью, то мы можем без всяких опасений обозначить её по- прежнему через ш, (х), <f2 (-*•)• • • • ¦ ?п (¦*)• • • • I таким образом, Ф„ (х) —»- 'х/ (х) при п —у оо равномерно для xv sS х ^ х0 -\- а. По- Покажем теперь, что определённая, таким образом, функция 'о(х) удовлетворяет всем требованиям доказываемой теоремы. Так как ^п(х0)=у0 при любом п, то прежде всего ъ (хо) = уо. 4) Убедимся, что функция ср (х) при х0 ^ х ^ х0 -\- а удовлетворяет дифференциальному уравнению C). Пусть задано произвольное е ^> 0. В силу непрерывности функции f(x, у) и ограниченности и замкнутости области D существует такое 8^>0, что для любых точек (?,, rh) и (S2, rl2) области D, связанных неравенствами |$2 — Sj | <^ d, \ri2 — г^\<^2Мд, вы- выполняется и неравенство I/&. 4s)—/(?„ 4,)|<е. В силу неравенства (9) мы имеем при х' ?^xi^x", полагая, как прежде, 4>n{xi)=yi: IЛ — 'ft, (*') I ^ М{х, — х')^М(х" - х'); а так как при достаточно большом п | ?„(*') — и(х')\^М(х"-х'), то
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 245 поэтому, если | х" — х' \ ^ Ь, то при достаточно большом я и х' ^ xt ==: х" мы имеем: где положено у = cf (х'). Отсюда по определению числа В мы получаем при х' ^х1^ х" и достаточно большом п: f(*n Л) —Я*". ИЛИ /(х', У) — е =s? f(xt, yt) *=: /(х\ у') -f e; если мы применим эту оценку к каждому члену правой части формулы (8), то мы, очевидно, получим, что при 0<^х" — — х' <^ 8 и достаточно большом п: [f(x\ у) —е](х» —jO< ^<вя (х") — Vn (х') ^ [f(x', У) + s] (х" — х'), а так как левая и правая части этих неравенств от я не за- зависят, то в пределе мы получаем, что при единственном усло- условии | х" — х' | <^ Ь [/(*', У) — е](х'— х')<:?(х")— с?( или, что то же, I ?(*") — | х« — х' J ул ' J Но это и значит, что ш' (х) = /(х, ^;) (х0 ^ х < ха -\- а) (причём tp'(х) при х = хп означает, конечно, правую произ- производную). 5) Так как, наконец, мы, очевидно, можем совершенно аналогично получить тот же результат для отрезка [х0 — а, х0], то щ(х) удовлетворяет всем требованиям теоремы, которая, таким образом, доказана. Определённые нами функции у=цп(х) имеют своими гра- графиками ломаные линии; направление каждого звена такой ло- ломаной совпадает с направлением поля в его левом конце; длины звеньев с ростом я безгранично уменьшаются; таким образом, чем больше я, тем в более густой сети точек на- 17*
246 ЛЕКЦИЯ ВОСЬМАЯ правление ломаной совпадает с направлением поля; мы поэтому совершенно естественно ожидаем, что если эти ломаные имеют предельную кривую (при п —>¦ ос), то направление этой кри- кривой будет совпадать с направлением поля уже в каждой её точке, т. е. это будет интегральная кривая. Существование предельной функции (если не для всей последовательности функций уп(х), то по меньшей мере для некоторой её под- подпоследовательности, что для нашей цели безразлично) уста- устанавливается в предварительной лемме. В дальнейшем нам оставалось только строгим и точным рассуждением подтвер- подтвердить правильность нашего ожидания, что нами и было сделано. Единственность решения. Важность этой теоремы, гаран- гарантирующей при известных условиях существование решения для уравнения C), сама собой очевидна. Когда перед нами практически встаёт необходимость решить какое-нибудь диф- дифференциальное уравнение, мы тратим на это некоторые, иногда весьма значительные, усилия: мы пытаемся свести его реше- решение к «квадратурам» (простым интеграциям), а если это не удаётся, то применяем обычно те или другие приёмы прибли- приближённого вычисления; однако, для того чтобы эта наша актив- активность стала разумной, надо, конечно, иметь уверенность, что искомый нами предмет действительно существует; наши ста- старания являли бы собой жалкую картину, если бы наше урав- уравнение вовсе не имело решений. Не менее важен, конечно, и вопрос о единственности иско- искомого решения. Если, положим, поставленная нами задача при- привела к заключению, что искомая функция у=ц(х) должна удовлетворять уравнению C) и обращаться в yQ при х = х0 и если мы такое решение уравнения C) нашли, то мы можем считать нашу задачу решённой только в том случае, если мы уверены, что не существует никакого другого решения уравне- уравнения C), удовлетворяющего тому же «начальному» условию cf(xo) = _yo; ибо если бы таких решений существовало несколь- несколько, то мы не могли бы иметь уверенности, что нашей задаче отвечает как раз то, которое мы нашли; и если бы даже мы нашли все такие решения уравнения C), мы всё же, вообще говоря, не имели бы оснований для суждения о том, какое из них отвечает на поставленный вопрос. Весьма замечательно, что при гех условиях, выполнение которых позволило нам выше доказать ¦ существование иско-
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 247 мого решения (т. е. при постулировании одной только непре- непрерывности функции f(x, у) в данной области), мы не можем ещё гарантировать единственности этого решения; бывают случаи, когда функция f(x, у) непрерывна в области D и тем не менее существует несколько решений уравнения C), обра- обращающихся в _у0 при х=х0. Можно, однако, добиться един- единственности решения, требуя от функции f(x, у) несколько более того, что даёт простая непрерывность; одна из наибо- наиболее удобных форм такого усиленного требования гласит: существует такое постоянное положительное число k, что l/(*. .Vi)—/(*. Л) 1^*1 Уг—У*\ (А) для любых точек (х, _у,) и (х, у2) области D; это требо- требование, не будучи, правда, самым широким из возможных, выполняется в большинстве практически встречающихся слу- случаев и по своей простоте очень удобно для применений. Итак, нужно доказать, что если функция f(x, у) в обла- области D непрерывна и удовлетворяет условию (А), то реше- решение y = w(x) уравнения C), обращающееся в у0 при лг = лг0, является единственным. Допустим, что каждая из двух функций «j (x) и ш2 (х) удовлетворяет уравнению C) при х0 — а ^ х ^ х0 -f- а, и что cpj (xo) = w2(xo) = yo. Положим у2(х)— а, (лг) = ш(лг), так что ш(хо) = О. Тогда, при х0 — а\ \dw df2 dv, I . , . , / w i \Tx = dx-?\ = \f(X> %(*»-/(*• <Pi(*))l^ s? A | щ2 (x) — cpj (л:) | = k | ш (x) |. A0) Обозначим через д наибольшее значение функции | со (х) | на том из двух отрезков Гл:0 — ± , jc0 -f- ^ 1 и [х0 — а, хп -f- а], ко- который меньше другого (пусть это будет отрезок [х0 — л, х0 -\-г], где, следовательно, г означает меньшее из чисел а и ). В силу непрерывности функции |w(x)J такое наибольшее значе- значение существует при некотором определённом х = Х-1: , ш (jc, ) |^=ц. Применяя соотношение A0) и первую теорему о среднем зна-
248 ЛЕКЦИЯ ВОСЬМАЯ чении, мы находим: iL=\@(X1)\=\l0(Xt) — (D(X0)| = |Jg = 0. Это значит, что ш(х) = 0 при Если г = а, теорема доказана; если же то во всяком случае со (л:0—-) = мы можем поэтому повторить наше рассуждение, принимая вместо х = х0 за исходную точку последовательно точки х0—2ь и хо~\~пг'г это позволит утверждать, что со(х)^О уже на отрезке \х0 — 2-^, ^о + З-^! или [х0—а,хо-\-а\; продолжая этот процесс достаточное число раз, мы, очевидно, расширим отрезок, в котором ш(х)^0, до пределов [хо — а, хо-|-а], чем теорема и будет окончательно доказана. Зависимость решений от параметров. Если в основании дифференциального уравнения лежит какая-либо конкретная задача, то это уравнение всегда содержит известное число па- параметров, представляющих значения тех постоянных величин, которые определяют специфические условия изучаемого явле- явления. Так, в задаче, приведённой в качестве примера в на- начале этой лекции, такими величинами служат: вместимость со- сосудов а, скорость истечения жидкости b и первоначальный запас соли в первом сосуде с; все эти три величины естественно входят в составленное нами уравнение; точно так же, конечно, и всякое решение этого уравнения будет зависеть от всех этих параметров. Таким образом, желая подчеркнуть эту зависи- зависимость, мы должны писать уравнение C) в виде ^. = f(x,y,pvp2, ... ,рг), и решение его в виде ') Мы берём абсолютное значение интеграла, учитывая возмож- возможность х1 < лг0.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 249 где рл, р2, ... , рг — параметры, о которых мы только что говорили. Нетрудно понять, что для прикладных задач характер зави- зависимости решений полученного дифференциального уравнения от такого рода параметров имеет весьма существенное значе- значение и что в особенности важно установить непрерывность этой зависимости. В самом деле, значения параметров обычно полу- получаются как результаты тех или других измерений и потому, как правило, задаются нам не с абсолютной точностью, а лишь приближённо, с некоторой, хотя бы и малой погрешностью. Поэтому, если бы при ничтожных изменениях параметров значения функции у (х, /?,, рг, ... , рг) могли значительно ме- меняться, то такого рода решения задачи были бы практически совершенно бесполезными; для практических целей пригодны лишь такие решения, которые при малых изменениях парамет- параметров сами претерпевают лишь малые изменения, так что, прибли- приближённо зная значения параметров, мы можем приближённо найти и значения этих решений; но точным математическим выраже- выражением этого свойства, очевидно, и является непрерывность функ- функций у(х, р,, р2, .. . , рг) относительно параметров р^,р2, ... , рг. Мы покажем теперь, что если функция f{x, у, /?,, р2,... , рг) непрерывна относительно какого-либо из параметров pi и при- притом равномерно относительно положения точки (л:, у) в об- области D, то при соблюдении тех условий, в которых мы дока- доказали выше существование и единственность решений уравнения C), эти решения также будут непрерывными функциями пара- параметра рг\ так как при этом речь идёт о каждом параметре в отдельности, то мы нисколько не ограничим общности дока- доказательства, если для сокращения записей допустим, что функ- функция / (а значит, и функция ш) зависит только от одного параметра р. Итак, допустим, что функция f(x, у, р) непрерывна отно- относительно всех трёх своих аргументов, когда точка (х, у) на- находится в замкнутой области D, а параметр р принадлежит некоторому отрезку й, и что, кроме того, I fix, ylt P) — f(x, у2, р) | =? k I у, —у21, (А') если {x,y^)?D,(x, y2)?D и p?d. Мы утверждаем, что в таком случае то единственное решение у = ц(х, р)
250 ЛЕКЦИЯ ВОСЬМАЯ уравнения C") которое обращается в у0 при х^х0, непрерывно относительно р на отрезке d. Для доказательства нам придётся вернуться к той конструк- конструкции, с помощью которой мы выше доказали существование решения уравнения C), и исследовать характер зависимости от параметра р построенных нами там функций уп (х), которые мы теперь будем, конечно, писать в виде Цп(х, р). Величины^., определяемые с помощью рекуррентного соотношения E), также, очевидно, зависят от р, yt^^yi(p), и формула E) принимает вид Л (F) = Л-1 (Р) + /(*/-i. Л-i (Р)» />)¦?•• (!!) В силу предположенной нами непрерывности функции ч f(x, у, р) относительно параметра р для любого е ^> 0 суще- существует такое 8 ^> 0, что A2) при |А |<^8, /?€ d, p-\-h ?d, (x, y)?D. В силу формулы A1) Л (/> + А) — Л (Р) = Л-1 (Р + А) — Л_1 (Р) + + J {/(*i-i. Л-1 (Р + Л)/? + А), —/(*,_„ л_, (Я), /7)} ( 1 < / «? Л). Положим для краткости: так что Д/ = А/-1 + ~ {/(*,-, • Л-1 (Р Н- А), р + А) - — /(*,_,, Л-1 (Р)» Я)! A =^ / ^ я). A3 Выражение, стоящее в фигурной скобке, можно представить в виде /(¦*/_!. Л-1 (Р +А), Р +Л) —/(*,_„ Л-1(Р).РН-А) +
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 251 В силу (А') первая из этих разностей по абсолютному значению не превосходит k A;_j |, а в силу A2) вторая разность по абсо- абсолютному значению меньше, чем е; таким образом, мы получаем: A sg: / s^ n). Применяя эту же оценку к стоящей в правой части величине | Д/_] | и повторяя этот процесс, мы придём к соотношению Таким образом, при мы имеем: +(e* —1) или, что то же, (л=1, 2, ... ; но на каждом отрезке [х(_л, x,J функции :sn (x, р) и wn (x, p-\-h) линейны; поэтому неравенство ) —'¦?„(¦*.)!< выполняющееся, как мы только что видели, при ^ в концах каждого такого отрезка, по необходимости должно выполняться и на всём этом отрезке, ? значит, на всём от- отрезке [х0 — а, д:0-|-я]. Ввиду произвольности числа е это означает, что множество функций <рп (jc, p) равностепенно не- непрерывно относительно параметра р на отрезке d. Обозначим через S это множество; как мы видели прежде, множество (последовательность) 5 содержит подпоследовательность S', сходящуюся равномерно относительно х на отрезке [лгс — а, хо-\-а\ к функции »(х, р), которая и является искомым ре- решением уравнения C"). Но последовательность S', будучи
252 лекция восьмая частью множества 5, очевидно, также есть множество, равно- равностепенно непрерывное относительно параметра; поэтому в силу прежде доказанной леммы она должна содержать подпоследо- подпоследовательность S", сходящуюся (конечно, к той же функции №п(дг, р)) равномерно относительно р на отрезке d; а так как все функ- функции <р„(х, р) непрерывны относительно р, то отсюда следует, что и функция ъ(х, р) непрерывна относительно р на отрезке d, что и требовалось доказать. Как мы знаем, каждое решение <р(х) уравнения C) в на- наших условиях однозначно определяется тем значением у0, которое оно принимает при х = х0; функция <р(х) меняется при изменении чисел х0 и у0, так что по сути дела она является функцией w (x, хп, у0) трёх независимых переменных; по тем же причинам, о которых мы говорили выше, харак- характер зависимости решения w{x, x0, у0) от этих «начальных данных» лг0 и у0 имеет существенное значение, и притом не только теоретическое, но и практическое. На первый взгляд может показаться, что это — новая задача, которая не сводится к только что рассмотренному нами вопросу о зависимости решений от параметров, ибо числа х0 и у0 явно не входят в качестве аргументов в функцию f(x, у). На самом деле, однако, такая редукция вполне возможна. В самом деле, если мы преобразуем в уравнении C) как независимую пере- переменную, так и искомую функцию с помощью соотношений х = хо-]-х*, у = где х* и у* — новые независимая переменная и искомая функ- функция, то уравнение C) получит вид g I C'") причём требуется найти решение этого уравнения, обращаю- обращающееся в нуль при х* = 0. Здесь уже х0 и _у0 явно фигури- фигурируют в качестве параметров в правой части уравнения; пусть у*=Ф*(х*,хо,уо) A4) есть искомое решение уравнения C"'). Оно непрерывно от- относительно х0 и у0 в силу только что доказанной нами теоремы, так как функция f(xv-\-x*, yo4-y*), будучи непрерывной относительно каждого из своих двух аргументов, тем самым
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 253 автоматически непрерывна относительно х0 и у0. Но чтобы получить искомое решение уравнения C), мы, очевидно, должны только перейти в выражении A4) от новых переменных к ста- старым, что даёт у=ъ (х, х0, у0) =уо-\- 'f* (х — х„, х(„ з'о), откуда непосредственно вытекает, что это решение непрерывно зависит от начальных значений х0 и уп. Преобразование переменных. Вы знаете, что при инте- интегрировании функций одним из самых мощных приёмов упроще- упрощения задачи, иногда приводящим и к полному её разрешению, служит преобразование переменной интеграции (так называемый «метод подстановки»). При решении дифференциальных урав- уравнений этот метод также является одним из наиболее сильных орудий; гибкость его здесь ещё значительно увеличивается тем обстоятельством, что преобразованию может быть подверг- подвергнута как независимая переменная, так и искомая функция. Как мы видели в начале нашей лекции, решение дифференциаль- дифференциального уравнения легко приводится к квадратурам, если пере- переменные могут быть «разделены» (это означает, что посредством умножений и делений уравнение приводится к виду Al(y)dy -\- -}- N (х) dx = О, где в каждом из двух слагаемых левой части фигурирует только одна из переменных х, у); именно этой цели и служит обычно преобразование переменных; пре- преобразуя либо независимую переменную х, либо искомую функ- функцию у, либо ту и другую одновременно, нам часто удаётся заменить уравнение, в котором переменные не разделялись, новым, в котором они уже могут быть разделены. Хотя класс дифференциальных уравнений, которые этим путём могут быть сведены к квадратурам, и очень ограничен, всё же он содержит целый ряд простейших, а потому и наиболее часто встречаю- встречающихся на практике типов, вследствие чего метод преобразо- преобразования переменных получает большое практическое значение. Сюда относятся прежде всего, среди уравнений первого порядка, все линейные уравнения, т. е. уравнения, в которых как неизвестная функция у, так и её производная у' фигу- фигурируют лишь в первой степени; общий вид такого уравнения *) = °. A5)
254 лекция восьмая где /х (лг) и /2(лг)—данные непрерывные функции от х. Все уравнения этого типа могут быть с помощью одного и того же приёма приведены к виду, в котором переменные допускают разделение. Чтобы в этом убедиться, рассмотрим сначала уравнение z'-{-f,(x)z=--0, A6) где через z обозначена искомая функция; это уравнение — того же типа, что уравнение A5), но только без «свободного члена» /2 (х); переменные в нём немедленно разделяются: dj-\-f,(x)dx = 0, и интеграция дает In- для наших целей достаточно иметь какое-нибудь одно решение уравнения A6); поэтому мы положим го^1, так что откуда X *» A7) таким образом, решение уравнения A6) находится с помощью одной квадратуры. Чтобы свести к квадратурам и общее уравнение A5), пре- преобразуем в нём искомую функцию у с помощью соотношения где у* — новая искомая функция, а ъ (х) — определяемое фор- формулой A7) решение уравнения A6); тогда уравнение A5) принимает вид: ¦f МУ* + Y W v* + /, {x) ? (x) v* + /2 (x) = 0 или
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 255 так как в силу уравнения A6) отсюда X f (X) f ft(u)du и следовательно, * f f, (U) dtt где С—постоянная интеграции; наконец, V - f /, (в) <*",;? .f Л («) Это — общее решение уравнения A5), из которого надлежа- надлежащим выбором постоянной С можно получить все его частные решения; если мы хотим, например, иметь у = j>n при х^х0, то из общего решения находим: _уо = —С, и искомое частное решение получает вид: X V - f U («1 Ли * f /, («) rfu \A^ ) A8) Мы видим, таким образом, что решение уравнения A5) с помощью надлежаще выбранного преобразования искомой функции сводится к двум последовательным квадратурам. В качестве примера доведём до конца решение задачи, рас- рассмотренной в начале этой лекции. Мы пришли там к уравнению *™ ь dy . Ъ be — — ' п dt ' а •* а которое, очевидно, есть уравнение типа A5); здесь f1(t) = — и /2 (t) = е а ; кроме того, /0 = 0 и ji, = 0, так как
256 ЛЕКЦИЯ ВОСЬМАЯ в момент t = 0 второй сосуд вовсе не содержит соли. Мы имеем: /, (и) du= — t, и формула A8) дает: о ь п ь ь . ь t I [hr V — V ч ЬС t y=e \ ~T~)~ae e dv>= a te . A9) о Эта формула полностью решает поставленную задачу. Иссле- Исследуя найденную функцию, мы легко находим, что количество соли во втором сосуде сначала возрастает, а затем с момента t=-r- начинает убывать и стремится к нулю при t—.-со; в момент t = -r , когда количество соли в этом сосуде на- наибольшее, это количество равно — ; замечательно, что это максимальное количество не зависит ни от а, ни от Ь; наобо- наоборот, промежуток времени, необходимый для максимального на- насыщения солью второго сосуда, зависит, как мы видим, от а и ft, но не зависит от с. Все эти и многие другие инте- интегральные черты рассматриваемого явления даёт нам изучение функции A9); мы видим, что решение дифференциального уравнения в данном случае действительно позволяет нам по- получить все необходимые сведения о течении процесса в целом, в то время как само дифференциальное уравнение даёт нам лишь мгновенные (локальные) соотношения между участвую- участвующими в этом процессе величинами. Другой часто встречающийся тип уравнений, простым пре- преобразованием неизвестной функции приводящихся к уравне- уравнениям с разделяющимися переменными, представляют собой так называемые однородные уравнения, общий вид которых: dy__ dx в частности, к этому типу принадлежат часто встречающиеся уравнения вида Р (х, у) dy = Q (х, у) dx, где Р (х, у) и Q (х, у) — однородные многочлены одной и той же степени п. В самом деле, такой однородный многочлен,
, ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 257 как легко видеть, после деления на х" становится многочле- многочленом относительно переменной ^— , вследствие чего в правой части соотношения rfy Q (х, у) Р(х, у):х" ах Р(х, у) Q(x, yy.xn числитель и знаменатель — целые рациональные функции отно- отношения — , а значит, и вся правая часть — рациональная функ- функция этого отношения. Преобразуя в уравнении B0) неизвестную функцию с по- помощью соотношения у = ху*, мы приводим его к виду у*-(- -|- ху'* ^ f(y*), откуда -?—=;— =—, или fly* rtx /(у*)-у* — IF'' переменные разделены; интегрируя, легко находим выраже- выражение х через у*; если это соотношение однозначно разрешимо- относительно у*, то из него мы получаем, обратно, выраже- выражение у*, а значит, и у — через х; в общем случае это соот- соотношение определяет у*, а следовательно, и у, как «неявную»- функцию от х. Системы уравнений и уравнения высших порядков.. В заключение коснёмся ещё кратко вопросов о системах диф- дифференциальных уравнений первого порядка и об уравнениях высших порядков. Пусть мы имеем систему и дифференциальных уравнений первого порядка, содержащую п неизвестных функций _у,, у2 уп от одной независимой переменной х; само собой разумеется, что решением такой системы мы назовём любую систему функций yi = ф/(дг) (ls^/s^/г), удовлетворяющих всем данным уравне- уравнениям. Мы допустим, что данная система уравнений разрешена относительно производных -~ A ^ i ^ п) и, следовательно, имеет вид ,77=/И*..У1>.У2> ••- ,Уп) (К/<л). BЦ
258 лекция восьмая Совокупность значений переменных х, yv . . . , уп нам удобно и здесь называть «точкой»; это, конечно, точка в пространстве я-{-1 измерений; мы будем во всём дальнейшем предполагать все функции /, непрерывными в некоторой области D этого пространства. Всякая система функций y[ = wl(x) A^/^я) имеет своим геометрическим образом в этом пространстве не- коюрую кривую; если данные функции образуют собой реше- решение системы B1), то изображающую их кривую мы будем называть интегральной кривой системы B1). Эта геометриче- геометрическая терминология чрезвычайно полезна здесь не только своей наглядностью, но и, главным образом, тем, что с её помощью многие формулировки и рассуждения могут быть проведены и изложены для системы уравнений в тех же схемах и терминах, как и в случае одного уравнения. Так, основную теорему существования решений мы можем формулировать совсем кратко, говоря, что через каждую точку области D проходит по меньшей мере одна интегральная кри- кривая; аналитически это означает, конечно, что какова бы ни была система п -f-1 чисел дг0, yf\ yf\ . . . , у<°\ принадле- принадлежащих области D, существует система функций у. = ъ. (х) A <:/<?:«), удовлетворяющих системе уравнений B1) на неко- некотором отрезке х0— a s?: x sg: х0 -j- а, причём ф. (лг0) = _yj.o) A s^/sg:«). Доказательство этой теоремы для системы урав- уравнений только в чисто техническом отношении сложнее, чем для случая одного уравнения. В основании его лежит лемма, в точности аналогичная той, которой мы пользовались прежде; эта лемма может быть либо доказана непосредственно, либо выведена как следствие нашей прежней леммы. Последний способ особенно прост; элементом множества здесь является не отдельная функция, а система из п функций {Fl (x), F2(x), ... , Fn (x)} =S, и надо доказать, что в предположении ограниченности и равностепенной непрерывности множества всех функций, входящих во все системы данной совокупности, мы можем выбрать последовательность систем 5Л, 58, . . . , Sk,... , равномерно сходящуюся на данном отрезке. Это означает, что, .полагая А1Ы получаем п функциональных последовательностей fmM (ft=l, 2, . . .) (l^i^n),
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 259 каждая из которых сходится равномерно на данном отрезке. Доказательство строится так: сначала в силу нашей прежней леммы мы находим такую последовательность систем Sk, чтобы последовательность Fuk(x) равномерно сходилась на данном отрезке; из этой последовательности систем мы в силу той же леммы можем выбрать такую подпоследовательность, в которой равномерно сходилась бы на данном отрезке и последователь- последовательность вторых функций Fzit(x); повторяя этот процесс я раз, мы, очевидно, приходим к такой последовательности систем, в которой уже все л последовательностей Ft к (х) A ^ / sg; я) равномерно сходятся на данном отрезке, чем и завершается доказательство новой, расширенной леммы. Дальнейшее доказательство основной теоремы существования проводится в тесной аналогии с нашим прежним рассуждением; в качестве руководящей нити здесь удобнее всего принять нашу геометрическую иллюстрацию; здесь, как и прежде, мы строим некоторое множество ломаных линий со сколь угодно малыми длинами звеньев и из этого множества в силу дока- доказанной леммы выбираем последовательность, равномерно схо- сходящуюся к некоторой кривой, относительно которой может быть доказано прежним методом (с небольшими и самоочевид- самоочевидными усложнениями чисто технического характера), что она есть интегральная кривая системы B1); эта кривая проходит через данную точку (лг0, у<°>, . . . , у^), так как через неё проходят все построенные ломаные. Единственность проходящей через данную точку интеграль- интегральной кривой может быть, как и прежде, доказана лишь при наложении на функции /, некоторых дополнительных условий; простейшая форма этих условий вполне аналогична условию (А) и сводится к требованию, чтобы во всей области D выполня- выполнялись неравенства I// I*. /Л >?>. • • • . fi>) — fi (*. yf\ yf 1=1 где k — некоторое постоянное положительное число. У нас не осталось времени для уравнений порядка выше первого; покажем лишь, что решение всякого уравнения У. У. У" . У">) = 0 B2)
260 ЛЕКЦИЯ ВОСЬМАЯ порядка п может быть сведено к решению системы уравнений первого порядка. В самом деле, рассмотрим систему п урав- уравнений первого порядка, с неизвестными функциями ул, у2, . .., уп, следующего вида: yv yv ,у„_1г у„, Уа) = B3) и допустим, что мы нашли решение этой системы; в силу уравнений B3) тогда $ 3 ъ я ф'"' (х) = w'3[x) = V'3(x)=ztfi{x)= поэтому первое из уравнении B3) даёт: F(x, (р, (х), w\ (х) , <р т. е. функция у^У](х) есть решение уравнения B2). Обратно, пусть функция у = у(х) удовлетворяет уравне- уравнению B2). Полагая у1 = tf, (х), у2 = (р' (X), ... , уп = фУа~' 1 (х), мы непосредственно видим, 4TOCHcTeMajJ)yHKuHft(y,, _у2, . . . , _у ) образует решение системы B3). Таким образом, задачи оты- отыскания совокупности решений уравнения B2) и системы B3) ^действительно полностью сводятся друг к другу.