/
Текст
А. Я. ХИНЧИН
КРАТКИЙ КУРС
МАТЕМАТИЧЕСКОГО
АНАЛИЗА
Допущено Главным управлением высшего образования
Министерства культуры СССР в качестве учебника
для механико-математических и физико-математических
факультетов государственных университетов
и педагогических институтов
ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО
ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1953
11-5-2
Редактор О. Н. Головин,
Техн, редактор С. С. Гаврилов, Корректор С. Н. Емельянова,
Подписано к печати 1/Х 1953 г. Бумага 60 X 92i/ie. 19,5 бум. л. 39 печ. л. 38,73 уч.-изд. л.
39 723 тип. зн. в печ. л. Тираж 25 000 экз. Цена книги 11 р. 60 к. Переплет 1 р. 50 к.
_________________________________Т-06877. Заказ Xs 776._______________________________
2-й типография «Печатный Двор» имени А. М. Горького Союзполиграфпрома Главиздата '
Министерства культуры СССР. Ленинград, Гатчинская, 26.
ОГЛАВЛЕНИЕ
Предисловие .............................................
РАЗДЕЛ ПЕРВЫЙ
7
ВВЕДЕНИЕ В АНАЛИЗ
Глава 1. Функции.............................................. И
§ 1. Переменные величины......}......................... 11
§ 2. Функции..................................,......... 13
§ 3. Область определения функции........................ 16
§ 4. Функция и формула.................................. 17
1 § 5. Геометрическое изображение функций................. 21
§ 6. Элементарные функции............................... 23
Глава 2. Элементарная теория пределов........................ 28
§ 7. Бесконечно малые величины............................... 28
§ 8. Операции над бесконечно малыми величинами............... 32
§ 9. Бесконечно большие величины............................. 36
§ Ю. Величины, стремящиеся к пределам........................ 38
§ И. Операции над величинами, стремящимися к пределам....... 42
§ 12. Бесконечно малые и бесконечно большие различных порядков 47
Глава 3. Уточнение и расширение идеи предельного перехода ... 53
§ 13. Математическое описание процесса..................... 53
§ 14. Уточнение понятия предела........................... 55
§ 15. Расширение идеи предельного перехода................. 60
Глава 4. Вещественные числа.................................... 64
§ 1Q. Необходимость создания общей теории вещественных чисел 64
§ 17. Построение континуума................................ 67
§ 18. Основные леммы....................................... 76
§ 19. Завершение теории пределов........................... 80
Г л а в а 5. Непрерывность функций............................. 85
§ 20. Определение непрерывности............................ 85
§ 21. Операции над непрерывными функциями.................. 89
§ 22. Непрерывность сложной функции........................ 90
§ 23. Важнейшие свойства непрерывных функций............... 93
§ 24. Непрерывность элементарных функций................... 99
РАЗДЕЛ ВТОРОЙ
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
Глава 6. Производная............................................ 103
§ 25. Равномерное и неравномерное изменение функций . ..... 103
§ 26. Мгновенная скорость неравномерного движения. . . ..... 106
§ 27. Локальная плотность неоднородного стержня.............. ПО
§ 28. Определение производной............................... 112
§ 29. Правила дифференцирования............................. 114
§ 30. Вопросы существования и геометрическая иллюстрация .... 126
4
ОГЛАВЛЕНИЕ
Глава 7. Дифференциал......................................... 131
§ 31. Определение и связь с производной................... 131
§ 32. Геометрическая иллюстрация и правила вычисления..... 135
§ 33. Инвариантный характер связи производной с дифферен-
циалами ................................................. 137
Глава 8. Производные и дифференциалы высших порядков.......... 139
§ 34. Производные высших порядков......................... 139
§ 35. Дифференциалы высших порядков и их связь с производными 142
Глава 9. Теоремы о средних значениях.......................... 144
§ 36. Теорема о конечном приращении....................... 144
§ 37. Вычисление пределов отношений бесконечно малых и беско-
нечно больших............................................ 149
§ 38. Формула Тэйлора..................................... 154
§ 39. Остаточный член формулы Тэйлора..................... 158
Глава 10. Применение дифференциального исчисления к исследо-
ванию функций................................................ 164
§ 40. Возрастание и убывание функций...................... 164
§ 41. Экстремальные значения.............................. 167
РАЗДЕЛ ТРЕТИЙ
ЭЛЕМЕНТЫ ИНТЕГРАЛЬНОГО ИСЧИСЛЕНИЯ
Глава 11. Обращение операции дифференцирования................ 174
§ 42. Понятие примитивной функции......................... 174
§ 43. Простейшие общие приемы интегрирования.............. 181
Глава 12. Интеграл............................................ 191
§ 44. Площадь криволинейной трапеции...................... 191
§ 45. Работа переменной силы.............................. 196
§ 46. Общее понятие интеграла............................. 199
§ 47. Верхние и нижние суммы.............................. 201
§ 48. Интегрируемость функций............................ 203
Глава 13. Связь интеграла с примитивной функцией...............209
§ 49. Простейшие свойства интеграла....................... 209
§ 50. Связь интеграла с примитивной функцией.............. 213
§ 51. Дальнейшие свойства интегралов...................... 218
Глава 14. Геометрические и механические приложения интеграла 224
§ 52. Длина дуги плоской кривой........................... 224
§ 53. Длина дуги пространственной кривой.................. 233
§ 54. Масса, центр тяжести и моменты инерции материализованной
плоской кривой .......................................... 235
§ 55. Объемы геометрических тел........................... 239
Глава 15. Приближенное вычисление интегралов.................. 246
§ 56. Постановка задачи................................... 246
§ 57. Способ трапеций..................................... 249
§ 58. Способ парабол...................................... 253
Глава 16. Интегрирование рациональных функций................. 256
§ 59. Алгебраическое введение............................. 256
§ 60. Интегрирование простых дробей....................... 264
§ 61. Прием Остро граде ко го............................. 267
ОГЛАВЛЕНИЕ
5
Глава 17. Интегрирование простейших иррациональных и трансцен-
дентных функций............................................ 271
§ 62. Интеграция функций вида /? ^х, ............. 271
§ 63. Интеграция функций вида R (х, У ах2-\-Ьх^с)...... 273
§ 64. Примитивные биномиальных дифференциалов.......... 276
§ 65. Интегрирование тригонометрических дифференциалов. 278
§ 66. Интегрирование дифференциалов, содержащих показательные
функции................................................ 282
РАЗДЕЛ ЧЕТВЕРТЫЙ
БЕСКОНЕЧНЫЕ РЯДЫ
Глава 18. Бесконечные ряды чисел...............................285
§ 67. Основные понятия.................................... 285
§ 68. 'Знакопостоянные ряды............................... 293
§ 69. Знакопеременные ряды................................ 302
§ 70. Операции над рядами................................. 306
§ 71. Бесконечные произведения............................ 311
Глава 19. Бесконечные ряды функций............................ 317
§ 72. Область сходимости функционального ряда............. 317
§ 73. Равномерная сходимость.............................. 319
§ 74. Непрерывность суммы функционального ряда............ 323
§ 75. Почленное интегрирование и дифференцирование рядов .... 327
Глава 20. Степенные ряды и ряды многочленов................... 333
§ 76. Область сходимости степенного ряда.................. 333
§ 77. Равномерная сходимость и ее следствия............... 338
§ 78. Разложение функций в степенные ряды................. 342
§ 79. Ряды многочленов.................................... 349
§ 80. Теорема Вейерштрасса................................ 352
Глава 21. Тригонометрические ряды............................. 357
§ 81. Коэффициенты Фурье.................................. 357
§ 82. Приближение в среднем .............................. 363
§ 83. Теорема Дирихле — Ляпунова о замкнутости тригонометриче-
ской системы.............................................. 367
§ 84. Сходимость рядов Фурье.............................. 373
§ 85. Обобщенные тригонометрические ряды.................. 374
РАЗДЕЛ ПЯТЫЙ
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
Глава 22. Дифференцирование функций нескольких переменных. . 377
§ 86. Непрерывность функции нескольких независимых переменных 377
§ 87. Двумерный континуум................................ 380
§ 88. Свойства непрерывных функций....................... 384
§ 89. Частные производные ............................... 387
§ 90. Дифференциал....................................... 390
§ 91. Производная по любому направлению.................. 395
§ 92. Дифференцирование сложных и неявных функций........ 398
§ 93. Однородные функции и теорема Эйлера................ 402
§ 94. Частные производные высших порядков................ 404
§ 95. Формула Тэйдора для функций двух переменных........ 407
§ 96. Экстремальные значения............................. 412
6
ОГЛАВЛЕНИЕ
Глава 23. Простейшие геометрические приложения дифферен-
циального исчисления............................................. 417
§ 97 ? Уравнения касательной и нормали к плоской кривой.... 417
§ 98. Касательная прямая и нормальная плоскость к пространствен-
ной кривой.................................................. 419
§ 99. Касательная плоскость и нормаль к поверхности......... 421
§ 100. Направление выпуклости и вогнутости кривой............ 425
§ 101 </Кривизна плоской кривой............................. 426
§ 102. Соприкасающийся круг................................. 430
Глава 24. Неявные функции........................................ 434
§ 103. Простейшая задача..................................... 434
§ 104. Общая задача.......................................... 440
§ 105. Определители Остроградского........................... 446
§ 106. Условный экстремум.................................... 453
РАЗДЕЛ шестой
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ИНТЕГРАЛЬНОГО ИСЧИСЛЕНИЯ
Глава 25. Обобщенные интегралы............................... 460
§ 107. Интегралы с бесконечными пределами................ 460
§ 108. Интегралы неограниченных функций.................. 472
Глава 26. Интегралы как функции параметров..................... 480
§ 109. Интегралы с конечными пределами..................... 480
§ ПО. Интегралы с бесконечными пределами.................. 490
§ 111. Примеры............................................. 499
§ 112. Интегралы Эйлера. .................................. 505
§ 113. Формула Стирлинга................................... 511
Глава 27. Двойные и тройные интегралы.......................... 518
§ 114. Измеримые плоские фигуры............................ 518
§ 115. Объемы цилиндрических тел........................... 527
§ 116. Двойной интеграл.................................... 531
§ 117. Вычисление двойных интегралов с помощью двукратного
простого интегрирования.................................... 536
§ 118. Замена переменных в двойном интеграле............... 543
§ 119. Тройные интегралы................................... 548
§ 120. Приложения.......................................... 551
Глава 28. Криволинейные интегралы.............................. 560
§ 121. Определение плоского криволинейного интеграла....... 560
§ 122. Работа плоского силового поля....................... 567
§ 123. Формула Грина....................................... 569
§ 124. Применение к дифференциалам функций двух переменных. . 574
§ 125. Пространственные криволинейные интегралы............ 578
Глава 29. Поверхностные интегралы.............................. 582
§ 126. Простейший случай................................... 582
§ 127. Общее определение поверхностного интеграла.......... 586
§ 128. Формула Остроградского.............................. 593
§ 129. Формула Стокса...................................... 598
§ 130. Элементы теории поля..........................•..... 602
Заключение. Краткий исторический очерк......................... 610
Предметный указатель........................................... 622
ПРЕДИСЛОВИЕ
«Краткий курс математического анализа» должен, по замыслу
автора, служить студентам механико-математических и физико-мате-
матических факультетов наших университетов (а в известной мере
и пединститутов) основным руководством при изучении той научной
дисциплины, которая в учебных планах именуется «математическим
анализом» и содержит в себе теорию пределов и бесконечных рядов,
элементы дифференциального и интегрального исчислений и простей-
шие приложения этих учений. Надобность в таком руководстве вы-
звана тем, что существующие у нас теперь уже в довольно большом
числе учебники математического анализа не могут в полной мере
отвечать вышеуказанному назначению. Те из них, которые доступны
рядовому студенту по краткости и простоте изложения, обычно либо
устарёли, либо построены на недостаточной для специалистов-мате-
матиков научной базе; те же, которые стоят на вполне современном
научном уровне, обычно столь громоздки и по своему содержанию
так далеко выходят за пределы действующих программ, что рядовой
студент I—II курса не в состоянии в них ориентироваться. Задача
состояла, таким образом, в том, чтобы создать учебник, по мате-
риалу строго ограниченный обязательными для каждого изучающего
рамками программы и в то же время построенный на вполне совре-
менном научном уровне.
Стремясь сделать предлагаемое руководство возможно более крат-
ким, я шел к этой цели исключительно путем отбора минимального
материала, но нигде не стремился к лаконизму изложения. Все рас-
суждения в курсе доведены до мельчайших деталей, чтобы по воз-
можности облегчить труд читателя. В особенности я не жалел слов
на то, чтобы читателю в каждый момент была ясна закономерность
того пути, по которому он идет. Связи между различными понятиями,
теоремами, задачами и целыми теориями, их роль и методы их при-
менения в прикладных науках и в технике, а также многие другие
идейно-принципиальные моменты математического анализа во многих
случаях освещены в курсе полнее и последовательнее, чем это обычно
делается даже в более пространных руководствах. Я стремился к тому,
чтобы при введении новых понятий и построении новых теорий уча-
щийся по возможности заранее был подготовлен воспринять эти
8
ПРЕДИСЛОВИЕ
нововведения как естественные и даже неизбежные. Я полагаю, что
только этим путем можно добиться со стороны учащегося подлинного
интереса к предмету и неформального его усвоения.
Из отдельных разделов курса наиболее дискуссионным опытному
читателю покажется, вероятно, изложение теории пределов (главы 2,
3, 4). По существующей традиции, средняя школа преподносит это
учение своим воспитанникам на уровне XVIII столетия; университет-
ские же руководства по математическому анализу сразу дают совре-
менную трактовку теории пределов, со всеми е и 8, часто еще пред-
посылая ей целую главу, посвященную общей теории вещественных
чисел и как по сути дела, так и по своему стилю принадлежащую
не анализу, а теории чисел и теории множеств. Следствием всего
этого является то, что учащиеся, во-первых, воспринимают новое «уни-
верситетское» понимание предельного перехода как не имеющее ни-
чего общего с теми пределами, с которыми их знакомила школа. Во-
вторых — и это еще тяжелее — этот путь способен полностью лишить
в представлении учащихся элементы математического анализа того
живого, динамического, диалектического духа, под знаменем кото-
рого они вошли в историю науки и с которым и до сих пор тесней-
шим образом связаны все многоразличные применения их к миру
действительности. Эти тяжелые последствия указанного разрыва,
которые мне многократно приходилось наблюдать в процессе пре-,
подавания, побудили меня предложить в настоящем курсе (совсем
новую систему изложения теории пределов. Сущность этой Системы
состоит в следующем. Сначала (гл. 2) теория пределов во всем
основном строится на элементарной, не до конца формализованной
базе, с систематическим использованием таких понятий, как «про-
цесс» и его «моменты», нигде формально не определяемы^. Лишь
позднее указывается на необходимость формализации и определяются
основные математические типы процессов (гл. 3). И только после
этого внимание учащегося привлекается к необходимости построения
общей теории вещественных чисел, и действительно создается такая
теория (гл. 4). Эта система изложения, которую я уже трижды
с успехом провел на практике, выгодно отличается от обычной тем,
что делает в сознании учащегося переход от «школьцЬй» теории
пределов к «университетской» не только постепенным, но и пол-
ностью обоснованным на всех своих этапах. Вместе с тем она
позволяет сделать с самого начала и сохранить на протяже-
нии всего курса основные представления математического анализа
живыми и динамичными, отводя формально-логическому усовер-
шенствованию теории лишь ту роль, которая ему принадлежит по
праву.
Что касается общей теории вещественных чисел, то я считал
нужным со всей убедительностью показать читателю необходимость
ее построения и привести один из возможных принципов порожде-
ния иррациональных чисел (предел монотонной ограниченной после*-
ПРЕДИСЛОВИЕ
9
довательности). После этого я лишь перечисляю основные встающие
перед новой теорией задачи (упорядочение континуума, определение
и правила алгебраических операций) и привожу отдельные немногие
примеры их решения, кратко указав, что теория чисел благополучно
справляется с этими задачами, мы же в дальнейшем будем неогра^
ниченно пользоваться добытыми ею результатами. О том, как тео-
рия чисел решает все эти задачи, будущие математики более подробно
узнают из других, более специальных курсов; для будущих же меха-
ников, физиков и астрономов этот вопрос вряд ли может представлять
существенный интерес. Во всяком случае, ни в своих лекциях, ни
в предлагаемом курсе я не считаю возможным отвлекать внимание
разнородной по своим интересам аудитории на изучение большой
главы, ни по содержанию, ни по стилю своему непосредственно не
связанной с математическим анализом.
Дальнейшее изложение в основных чертах следует тем или другим
известным образцам. Я должен с сожалением отметить, что в редакции
трех последних глав (кратные, криволинейные и поверхностные инте-
гралы) мои усилия сделать изложение одновременно вполне строгим
и легко доступным, насколько я могу судить, не увенчались успехом.
Мне не удалось избежать компромиссов, частично жертвуя то стро-
гостью, то краткостью и доступностью рассуждений. Если курс
в целом будет принят благосклонно, то над этими главами несомненно
придется еще поработать для последующих изданий.
Помещенные в курсе весьма немногочисленные примеры могут
иметь, разумеется, лишь иллюстративное, но никак не тренировочное
значение. Количество и характер этих примеров соответствуют тому,
что может быть дано лектором в его лекциях; я не имел в виду
включать в мой «Краткий курс анализа» материала (групповых)
практических занятий. Разумеется, всякий, работающий над этой
книгой, должен одновременно пользоваться хорошим задачником.
Особенно подходит для этой цели недавно появившийся «Сборник
задач и упражнений по математическому анализу» Б. П. Демидо-
вича (Гостехиздат, 1952). Для удобства некоторых категорий чита-
телей я указываю в большинстве параграфов книги небольшое число
особо рекомендуемых мною задач этого сборника. Я должен, однако,
предупредить, что этих задач для приобретения необходимых навы-
ков в большинстве случаев недостаточно; дальнейший выбор при-
меров должен производиться по указанию преподавателя, ведущего
практические занятия.
Компетентный читатель легко заметит, что принятый в книге
порядок изложения отдельных тем отнюдь не является обязатель-
ным и, вероятно, во многих случаях может быть изменен с пользой
для дела; в качестве примеров можно указать, что 1) некоторые из
геометрических приложений дифференциального исчисления (гл. 23)
могут быть даны (и фактически обычно даются) значительно раньше
и 2) интегральный признак сходимости рядов нет необходимости
10 ПРЕДИСЛОВИЕ
откладывать до теории обобщенных интегралов (гл. 25), а можно
дать уже в теории знакопостоянных рядов (гл. 18, § 68).
Мой приятный долг—выразить искреннюю и глубокую благо-
дарность моим товарищам — работникам кафедр математического
анализа Московского, Ленинградского и Киевского университетов —
за ценную помощь, выразившуюся в ознакомлении с рукописью (или
ее отдельными главами) и сообщении мне своих замечаний и сове-
тов, многие из которых несомненно способствовали значительному
улучшению изложения. Особой благодарностью в этом отношении
я обязан проф. Л. А. Тумаркину (Москва) и проф. Г. Е. Шилову
(Киев). Наконец, я должен отметить огромный труд, проделанный
компетентным и вдумчивым редактором моей книги О. Н. Голови-
ным, многочисленные ценные предложения которого также во мно-
гом улучшили ее изложение.
Москва, 24 февраля 1953 г.
А. Хинчин
РАЗДЕЛ ПЕРВЫЙ
ВВЕДЕНИЕ В АНАЛИЗ
ГЛАВА I
ФУНКЦИИ
§ 1. Переменные величины
Поворотным пунктом в математике была декартова
переменная величина. Благодаря этому в математику
вошли движение и диалектика...
Ф. Энгельс, Диалектика природы, Госполитиздат,
1948, стр. 208.
Элементарная математика, математика постоянных
величин, движется, по крайней мере в общем и целом,
внутри границ формальной логики; математика пере-
менных величин, самый значительный отдел которой
составляет исчисление бесконечно-малых, есть по своей
сущности не что иное, как применение диалектики к
математическим отношениям.
Ф. Энгельс, Анти-Дюринг, Госполитиздат, 1948,
стр. 127.
Когда мы наблюдаем какое-либо явление природы или следим за
ходом технического процесса, мы всякий раз замечаем, что вели-
чины, участвующие в этом явлении или процессе, обнаруживают
весьма различное поведение. Одни из них с течением процесса не
меняются, сохраняют, как говорят, «постоянные значения», в то время
как другие претерпевают более или менее значительные изменения,
становятся то больше, то меньше, или, как говорят, «принимают
различные значения». Если мы будем подогревать газ, заключенный
в плотно закрытый сосуд, то объем его будет сохранять постоян-
ное значение; постоянным будет оставаться и число молекул газа;
напротив, температура газа и его упругость будут при этом расти,
принимая все ббльшие и ббльшие значения. Картина станет более много-
образной, если от простого лабораторного опыта мы перейдем к слож-
ному техническому процессу. Рассмотрим, например, полет самолета.
В этом явлении участвует очень много различных величин. Некото-
рые из них в течение полета сохраняют постоянное значение; таковы
12 функции * [гл. 1
число пассажиров, вес их багажа, размах крыльев самолета и многие
другие. Однако с этим полетом связано еще больше таких величин,
которые с течением процесса изменяются, становясь то больше, то
меньше. Таковы, например, расстояния самолета от места вылета и
от цели полета, высота его над землей, запас горючего, температура,
давление и влажность окружающего воздуха и многие другие. Уже
этот перечень показывает, что для наших практических целей, для
технического и экономического расчета данного явления именно эти
изменяющиеся величины имеют важнейшее значение. Это и понятно.
Жизнь природы состоит в непрестанном изменении, а практическая
деятельность человека направлена на изменение окружающего мира.
Явления и процессы, в которых ничего или почти ничего не изме-
няется, поэтому мало поучительны в научном отношении и не пред-
ставляют практического интереса. Диалектические принципы изучения
природы диктуют нам изучение ее явлений не столько в мгновенном
их разрезе, сколько в самом их течении; диалектический метод
в естествознании ставит вопрос не только о том, какова картина
явления в данный момент, но в первую очередь о том, каково общее
течение явления, что и как в этом явлении изменяется. Математика,
поскольку она хочет быть действенным орудием точного естество-
знания и техники, должна поэтому создать аппарат, позволяющий
систематически изучать происходящие в природе и в технических
процессах изменения величин.
Таким аппаратом и является математический анализ, который
можно в широком смысле назвать математическим учением об изме-
няющихся величинах.
Отсюда следует, что первым основным понятием математического
анализа должно быть понятие изменяющейся или, как принято гово-
рить в математике, переменной величины. Так мы называем
величину, которая в течение данного процесса принимает различ-
ные, то ббльшие, то меньшие значения; в различные .моменты дан-
ного процесса значения этой величины, вообще говоря, различны.
Еще до всякого исследования, на основе нашего каждодневного
опыта, мы знаем, что характеры, типы изменения величин очень
многообразны: одни величины непрестанно растут; другие, напротив,
непрестанно убывают; третьи изменяются колеблющимся образом, то
возрастая, то убывая (расстояние Земли от Солнца, отклонение
маятника от вертикального положения); если данная величина, ска-
жем, непрестанно возрастает, то она может возрастать очень быстро
или очень медленно, или так, что темп ее возрастания становится
то быстрее, то медленнее. Изучить систематически все эти и многие
другие черты в изменении окружающих нас величин, внести порядок
в это огромное множество различных типов изменения, найти те
общие закономерности, которым подчиняются изменения того или
другого типа, — в этом и состоит понимаемая в широком плане задача
математического анализа.
ФУНКЦИИ
13
§ 2]
Всякая величина, участвующая в том или другом явлении, будет
ли она постоянной или переменной, в математике всегда обозна-
чается какой-либо одной буквой. Таким образом, если, например,
какая-либо величина обозначена через х или через а, то самб по
себе это обозначение не дает еще никаких указаний на то, будет ли
эта величина постоянной или переменной; характер ее изменения
всегда должен быть поэтому особо оговорен. Далее, очень важно
иметь в виду, что без указания на то, с каким процессом {явле-
нием) мы имеем дело, мы, вообще говоря, не можем знать, будет ли
та или другая величина постоянной или переменной. Одна и та же
величина может быть постоянной в одном процессе и переменной —
в друго^; так, если круг радиуса г катить по прямой линии, не меняя
его радиуса (первый процесс), то площадь тсг3 этого круга будет
величиной постоянной; если же *мы будем, оставляя центр круга
неподвижным, увеличивать его радиус (второй процесс), то площадь
круга будет расти, и значит, будет величиной переменной.
В математическом анализе широко используется хорошо изве-
стное геометрическое изображение чисел с помощью точек прямой
линии (так называемой «числовой прямой»). Установив на прямой
линии начало отсчета О и единицу длины, мы изображаем любое
число а с помощью точки, отстоящей от О на расстоянии | а | *)
в направлении, которое определяется знаком числа а (обычно если
числовая прямая горизонтальна, положительные числа помещают
вправо, а отрицательные — влево от О). Каждое значение величины х
есть число и изображается некоторой точкой на числовой прямой.
Если величина х в данном процессе постоянна, то значение ее
в течение всего процесса изображается одной и той же точкой
числовой прямой. Можно сказать поэтому, что постоянная величина
имеет своим изображением на числовой прямой некоторую непо-
движную точку. Если же величина х в данном процессе переменна,
то значения ее в различные моменты процесса изображаются различ-
ными точками числовой прямой; с течением процесса точка, изобра-
жающая величину х, меняет свое место, и мы можем поэтому сказать,
что переменная величина имеет своим изображением на числовой
прямой некоторую движущуюся точку.
§ 2. Функции
Величины, участвующие в одном и том же явлении, как правило,
изменяются не независимо друг от друга; обычно такие величины
стоят в более или менее тесной связи друг с другом, так что изме-
нение одних из них влечет за собою соответствующее изменение
других. Так, увеличивая радиус круга, мы тем самым обязательно
увеличиваем и его площадь; сжимая заключенный в сосуде газ
♦) Символ j х | означает: «абсолютная величина числа х*.
14
ФУНКЦИЙ
[гл. 1
(т. е. уменьшая занимаемый этим газом объем), мы (при сохранении
постоянной температуры) тем самым обязательно увеличиваем упру-
гость газа; увеличивая количество удобрений в почве, мы тем самым
вызываем увеличение урожая посеянной культуры, и т. д. Однако, .
как показывают уже эти примеры, зависимость между участвующими
в одном и том же явлении величинами может иметь различный
характер в смысле тесноты существующей между ними связи. Наи-
более точна эта связь в первом примере: зная радиус г круга, мы
определяем площадь s этого круга однозначно и с абсолютной точ-
ностью по формуле $ = гсг2. Во втором примере мы видим перед
собой уже несколько иную картину; зная занимаемый газом объем v
и его абсолютную температуру Т, мы можем, правда, однозначно
определить его упругость р по хорошо известной формуле *
сТ
Р v > *
где с — известная из физики постоянная величина; однако сама эта
формула верна лишь с некоторым (иногда довольно грубым) при-
ближением, и для более точных расчетов приходится пользоваться
более сложными формулами, показывающими, что в реальных усло-
виях для точного определения упругости газа недостаточно зйать
его объем и температуру, а приходится учитывать еще и значения
некоторых других величин. Эта же картина еще гораздо рельефнее
вырисовывается в нашем последнем примере: хотя количество удоб-
рений несомненно влияет на размер урожая, но в то же время ясно,
что, точно зная количество заложенных в почву удобрений, мы тем
не менее не можем еще предсказать размеры урожая с полной точ-
ностью, так как эти размеры, кроме количества удобрений, зависят
еще от целого ряда других факторов (например, метеорологических
и агротехнических показателей различного рода).
Естественно, что математический анализ в первую очередь инте-
ресуется точными зависимостями между величинами, т. е. такими,
когда, зная значения одной группы величин, мы имеем возможность '
однозначно и с полной точностью определить значения некоторой
другой группы величин. Примеры такой точной зависимости Аают
нам приведенные выше формулы
s = nr*,
сТ
где с — известная нам постоянная величина. Значением радиуса г
круга однозначно и с полной точностью определяется его площадь
Если нам известны величины Т и v, то вторая из приведенных фор-
мул позволяет однозначно и с полной точностью определить соответ-
ствующее значение величины р. В первом примере величина s зави-
§ 2]
ФУНКЦИИ
15
сит от значения только одной величины г; каждому значению вели-
чины г соответствует определенное значение величины $, и каждое
изменение величины г влечет за собой совершенно определенное
изменение величины $. Во втором примере дело обстоит несколько
сложнее: чтобы узнать значение величины р, недостаточно задать
значение только одной величины Т или только одной величины v;
величина р зависит от значений двух величин — Т и и; оба значения
должны быть нам известны, если мы хотим определить по нашей
формуле значение величины р\ каждой паре значений Т, v соответ-
ствует определенное значение величины р, и изменения величины р
зависят от изменений обеих величин Т и v. Что касается самих
величин Т и v, то их значения и их изменения друг от друга не
зависят и могут быть выбраны как нам угодно. Физически этому
соответствует то, что данной массе газа мы можем придать произ-
вольный (в известных границах) объем v и произвольную (также
в известных границах) абсолютную температуру Т. Но коль скоро v
и Т нами выбраны, упругость р данной массы газа уже не зависит
от нашего произвола, а однозначно и вполне точно определяется
по нашей формуле (мы здесь,- конечно, отвлекаемся от того, что
сама эта формула для реальных газов требует поправки).
; Приведенные нами примеры, очевидно, являются частными слу-
. чаями следующей общей схемы. Участвующая в некотором процессе
величина у зависит от величин хп х2, ..., xk> участвующих в том же
процессе, таким образом, что каждой определенной системе значений
величин хь х2, ... , xk соответствует единственное определенное
значение величины у; при этом сами величины хп х2,... , xk между
собой независимы, т. е., задав значения некоторых из них, мы можем
значения остальных выбирать произвольно (обычно в известных
границах). Такую зависимость величины у от величин хпх2,... ,xft
называют функциональной зависимостью, а самую вели-
чину у — функцией от величин хь х2, ... , xk\ величины же
хп х2, ... , xk называют в этом случае независимыми пере-
менными. В наших примерах величина s есть, таким образом,
функций от одной ♦) независимой переменной г, а величина р — функ-
ция от двух независимых переменных Т и v. Простейшим случаем,
на котором мы на первых порах, естественно, сосредоточим наше
внимание, является, разумеется, случай 6=1, т. е. случай, когда
величина у есть функция только одной независимой переменной х.
Тот факт, что величина у есть функция независимой переменной х,
принято записывать соотношением вида j=/(x), или у = а(х),
или у = А(х), и т. д. Буква, стоящая перед скобкой и как раз ука-
зывающая на существование функциональной зависимости у от х,
может быть выбрана произвольно — смысл записи от этого выбора
♦) Часто вместо <от одной», «от двух» и т. д., говорят просто «одной»,
«двух» и т. д.
16 ФУНКЦИИ (гл. I
не меняется. Так, тот факт, что площадь круг'а однозначно опреде-
ляется его радиусом, может быть записан в виде s=f(r)9 или $=$(г),
или $ = Д(г), и т. д. Подобным же образом тот факт, что вели-
чина у есть функция нескольких независимых переменных х19 х2,...
..., xk9 записывается соотношением вида y=f(xl9 х2, ... , xk)9
или y=y(xi9 xi9 ... , xk)9 или y = F(x19 х2, ... , xk)9 и т. д.
Так, например, то, что упругость р данной массы газа однозначно
определяется значениями ее объема v и ее абсолютной температуры Т9
может быть записано в виде p=f(v9 Т)у или р—р(у9 Г), или
p = F(y9 Т)9 и т. д. Таким образом, буква, выбираемая для обозна-
чения функциональной зависимости, еще ничего не говорит нам
о природе этой зависимости; запись y=f(x) может в разных слу-
чаях означать и у = 3х8, и j = lgx, и j/=sinx и т. д. Важно
только, во избежание смешений, следить за тем, чтобы в одном и
том же рассуждении одна и та же буква не символизировала раз-
личных видов функциональной зависимости. Так, если в некотором
процессе у = х* и z — xz9 то нельзя, конечно, писать y=f (x)9
*=/(*)•
Напротив, иногда одной и той же буквой обозначают некоторую
величину и вид функциональной зависимости ее от других величин
($ = $(г) и у=у(х19 *.. , xk) в вышеприведенных примерах].
Диалектический метод изучения явлений природы и процессов
техники требует, чтобы величины, участвующие и изменяющиеся
в некотором процессе, изучались не порознь, не в отрыве друг от
друга, а в их взаимной связи, в той взаимной зависимости, которой
связывает их между собой в действительности. Математическим выра-
жением такой взаимной связи реальных величин в простейших слу-
чаях является идея функциональной зависимости. Нам ясно поэтому,
что если первым основным понятием математического анализа должно
было стать, как мы видели в § 1, понятие переменной величины, то
вторым таким понятием в развитии учения об изменении величин,
естественно, стало понятие функции. Более того, дикту{ем^я как
научными, так и практическими соображениями необходимость по-
стоянно рассматривать переменные величины в их взаимной зависи-
мости сделала функцию центральным объектом исследований мате-
матического анализа, так что с полным правом можно называть это
учение и общей теорией функций.
§ 3. Область определения функции
Мы условились называть величину у функцией величины х9
если заданием значения величины х однозначно определяется и
значение величины у. Однако при этом нет необходимости, чтобы
величина у была определена для любого значения величины х; от
реального смысла величин х и у и от содержания стоящей перед
нами задачи в каждом случае зависит, какие значения величины х
§ 4] ФУНКЦИЯ И ФОРМУЛА 17
должны входить в рассмотрение. Так, например, если у означает
площадь правильного х-угольника, вписанного в круг радиуса 1,
то, очевидно, у есть функция от х; однако по самому смыслу
этих величин нас могут интересовать в качестве значений вели-
чины х только целые числа 3, 4, 5,... Подобным же образом л!
есть функция от л, по своему определению имеющая смысл только
для целых л^>0. Функцию j = lgx мы определяем обычно лишь
для положительных значений х. Если в качестве независимой пере-
менной выступает абсолютная температура Т какого-либо тела,
выраженная в градусах Цельсия, то, по всей вероятности, интере-
сующая нас задача не потребует исследования значений Т, мень-
ших, чем —273. Напротив, заданная чисто математически функция
у=& или j/=sinx может вполне разумно определяться для
каких угодно значений величины х, и мы встречаем много таких
задач, для решения которых действительно необходимо уметь опре-
делять значение такой функции для любого значения величины х.
Приведенные примеры с достаточной ясностью показывают, что
множество тех значений независимой переменной х, для которых
разумно и целесообразно определять соответствующие им значения
функции у, полностью зависит от содержания стоящей перед нами
задачи» При выборе этого множества мы руководимся иногда прак-
тическими, а иногда и математическими соображениями. Как бы то
ни <)ыло, всякий раз, когда мы имеем дело с какой-либо функцией
j/==/(x), мы должны иметь ясно в виду множество ©< тех значе-
ний независимой переменной х> для которых эта функция опреде-
леиа, и там, где могут возникнуть малейшие сомнения, ясно ука-
зывать это множество; для значений величины х, не входящих
в это множество, функция у никаких значений не получает и счи-
тается неопределенной. Множество называют поэтому областью
определения данной функции.
В свете этих замечаний ясно, что точное определение самого
.. понятия функции должно содержать упоминание об этом множе-
стве
Величина у называется функцией величины х, определенной
. на множестве если каждому значению величины х, принадле-
жащему множеству соответствует единственное определенное
значение величины у.
§ 4. Функция я формула
* Таким образом, для математического задания какой-либо опрр-
деленной функции необходимо установить соответствие, опреде-
ляющее для каждого числа х, принадлежащего некоторому множе-
ству соответствующее-ему значение величины у. Какими сред-
ствами устанавливается это соответствие,— этот вопрос имеет,
кодачдо, большое практическое значение; однако с принципиальной
а А. Я. Хяган
18
ФУНКЦИЙ
[гл. 1
точки зрения он является вопросом второстепенным, техническим.
Наиболее удобным способом задания функции y=f(x) будет,
конечно, такое ее определение, в котором прямо указывается,
какие алгебраические действия и в каком порядке надо произвести
над числом х, чтобы получить соответствующее значение вели-
чины у, типическими примерами такого рсда заданий могут служить
простые формулы вида j = 3x2, у =
и т. п., позволяю-
щие легко вычислить значение величины у для любого значения
величины х; такого же рода заданием может служить и формула
п\— 1 • 2 ... л,
определяющая значение функции п\ для всех целых положительных
значений числа п.
Однако столь простое задание функции далеко не всегда воз-
можно; а если оно возможно, то практически оно не во всех слу-
чаях является наиболее целесообразным. Уже такие элементарные
функции, как 1g х, sinx, cosx и т. п., мы задаем формулами, не
дающими прямого ответа на вопрос о том, как по данному значению
величины х найти соответствующее ему значение функции. Функция
j = sinx определяется, например, хорошо известными геометриче-
скими соображениями; эти соображения дают нам уверенность в
существовании и однозначной определенности функции sin х, но
не содержат в себе никаких непосредственных указаний на то, как
вычислять значения этой функции. Эту задачу приходится решать
специальными исследованиями; о том, что решение ее далеко не
просто, свидетельствует широко распространенное пользование та-
блицами таких функций, как sinx, cosx, Igx и т. п.; такие та-
блицы представляют собой именно результаты вычисления значений
той или другой функции для различных значений величины х;
будучи однажды добыты ценою значительной затрать! труда, эти
результаты публикуются в виде таблиц, чтобы освободить работ-
ников науки и практики от ненужного повторения тех же вычи-
слений. I
Мы приведем теперь несколько поучительных примеров опреде-
ления функций.
Пример 1. Пусть у означает наибольшее целое число, Не
превосходящее числа х; очевидно, что этим величина у однозначно
определяется для любого значения величины х, т. е. определяется
как функция от х. Эту функцию обычно обозначают символом [х],
так что, например,
[2,5] = 2, [5] = 5, [к] = 3, [—к]= —4
м т. д- Функция жу=[х] играет важную роль в теории чисел и в
других разделах математики. Мы видим, что определение ее очень
просто* но не содержит никаких формул, которые указывали бы на
ФУНКЦИЯ И ФОРМУЛА
19
§ 4Т
последовательность действий, приводящих от данного значения ве-
личины х к соответствующему значению величины _у = [х]. Впрочем,
можно было бы выразить функцию _у=[х] через х и с помощью
«формулы», т. е. с помощью ряда употребительных в элементарной
математике символов; однако такая формула, как правило, ничем не
облегчила бы нам исследования функции [х], которое естественнее
всего базировать на данном нами бесформульном ее определении.
Величина х — [х], называемая дробной долей числа*х,
также есть функция от х, играющая значительную роль во многих
вопросах теории чисел; очевидно, эта функция — периодическая
с периодом 1, и мы всегда имеем:
О^х—[х] < 1,
Пример 2 («функция Дирихле»). Положим D (х) = 1, если
число х—рациональное (т. е. целое или дробное), и £)(х) = 0,
если число х — иррациональное (например, х=^2 или х = те).
Функция D(x) определена для всех х (область определения — вся
числовая прямая). Определение ее, как мы видим, очень просто.
Чтобы найти значение D (х) при данном значении величины х,
надо только каким-либо способом установить, рационально или
иррационально число х; никакой общей рецептуры для этого дать
нельзя — способ решения этой задачи диктуется тем, каким путем
нам задано число х; в частности, математика знает и такие числа х,
которые определяются с полной точностью, но для которых до сих
пор никому не удалось узнать, рациональны они или иррациональны;
это значит, что некоторых значений функции D(x) математика до
сих пор вычислять не умеет; тем не менее, конечно, данное нами
определение функции D(x) является полноценным. Можно написать
для функции О(х) и «формулу», т. е. опять-таки выразить ее
через общеупотребительную в математике символику. Однако эта
формула практически почти бесполезна, так как важнейшие свой-
ства функции Дирихле в большинстве случаев проще выводятся из
данного нами «бесформульногр» ее определения, в то время как
с помощью формулы установить их либо совсем не удается, либо
удается лишь с большим трудом.
Приведенные нами примеры ясно показывают роль формулы,
аналитического выражения в определении функциональной зависи-
мости. Такая формула, если она проста и удобна для вычислений
и для исследования, может служить неоценимым орудием изучения
и практического использования данной функции. Однако там, где
мы такой формулы найти не можем или где такая формула хотя
и существует, но сложна, мало обозрима и непоучительна, нет
оснований к тому, чтобы во что бы то ни стало добиваться делать
именно формулу центральным орудием исследования функции;
во многих случаях «бесформульное» исследование оказывается и.
проще, и продуктивнее. ,
го
ФУНКЦИЯ
[гл. 1
В течение долгого времени (все XVIII и начало XIX столетия)
понятие функции неразрывно связывалось с определенным аналити-
ческим выражением, которое из полезного орудия изучения функции
превращалось в ее полновластного господина. Эта тенденция, фор-
малистическая по своему характеру (так как форма — аналитиче-
ское выражение — в ней диктует свои законы реальному содержа-
нию функциональной зависимости), держалась очень упорно в
течение столетий и даже в наши дни еще не изжита полностью,
особенно в прикладных науках. Победу данного нами в § 3 содержа-
тельного, независимого от каких бы то ни было внешних выражений
определения понятия функциональной зависимости обычно относят
к середине XIX столетия и связывают с именем немецкого матема-
тика Дирихле. Однако за несколько лет до Дирихле на этом опре-
делении с исчерпывающей ясностью настаивал наш великий ученый
Н. И. Лобачевский *). Чтобы сделать различие между формальным
и содержательным подходами к определению понятия функции еще
более ясным, мы приведем теперь еще один пример.
Пример 3% Положим
y—f(x)=
— 1 — х’
О
14-х’
(*<0)>
(х=0),
(х>0).
Это означает, что для отрицательных значений х величина у
должна вычисляться по формуле у =—1—х2, для положитель-
ных— по формуле j=l-|-xa, а для
х = 0 мы имеем j/ = 0. С точки зре-
ния нашего определения мы, очевид-
но, имеем здесь одну функцию, опре-
делённую для всех значений х (об-
ласть определения—вся числовая пря-
1 мая). Вот графическое Изображение
этой функции (черт. 1). 1
На разных участках изменения ве-
личины х значения нашей функции
вычисляются пр различным формулам;
это обстоятельство не имеет, однако,
с точкизрения нашего определения
функции никакого существенного зна-
чения; оно не мешает тому, что,
каково бы - ми было число х, наше
соглашение ставит ему в соответствие‘единственное определенное
значение величины у; а этого достаточно для уверенности в том»
- ♦) Еще несколько ранее ту же идею. можно йросяеяить у чешского ма-
тематика Больцано. J .
§ 5] ГЕОМЕТРИЧЕСКОЕ ИЗОБРАЖЕНИЕ ФУНКЦИЙ 21
что мы имеем дело с единственной определенной функцией. Фор-
малист же, неразрывно связывающий каждую функцию с определен-
ным аналитическим выражением, склонен будет сказать, что вели-
чина у выражается «разными функциями» на разных участках изме-
нения величины х.
Вся история развития учения о функциях, а также и практи-
ческие приложения этого учения с несомненностью показали
преимущество содержательной' точки зрения, освободившей поня-
тие функции от гнета формулы, над формалистической концеп-
цией, стремящейся подчинить функцию определенному внешнему
выражению.
Это преимущество обусловлено, кроме общих методологических
соображений, еще и тем, что функции, подобные только что нами
определенной (т. е, выражающиеся различными формулами на раз-
личных участках изменения независимой переменной), довольно
часто встречаются в естествознании и технике (в частности —
в физике, химии, теплотехнике и т. д.).
§ 5. Геометрическое изображение функций
Основные принципы геометрического изображения функций (по-
строения графиков) изучаются в средней школе, и мы можем
ограничиться здесь несколькими краткими замечаниями по этому
вопросу.
Графиком данной функции /(х) мы называем геометрическое
место точек плоскости, прямоугольные координаты х и у которых
связаны соотношением у=/(х)ь Если функция f(x) не слишком
сложна, то ее график представляет, собой обычно более или менее
простую линию на плоскости. Тот факт, что каждому значению х
(принадлежащему области определения данной функции) соответ-
ствует единственное значение j/=/(x), имеет простую геометриче-
скую иллюстрацию: каждая прямая, параллельная оси OY, пересекает
график функции /(х) не более чем в одной точке. Линии, не обла-
дающие этим свойством, вообще не могут, следовательно, служить
графиками каких-либо функций переменной х; напротив, всякая
линия, обладающая этим характером^ очевидно, является графиком
такой функции, так как всякая однозначная зависимость у от х по
самому определению понятия: функции представляет собой некото-
рую функциональную зависимость.
Геометрическое изображение функций имеет важнейшее значение
для их изучения и потому служит очень полезным орудием матема-
тического анализа и его приложений. На графике функции мы
часто непосредственно видим* такие черты в ее поведении^ которые
лишь ценой длительных подсчетов можно было бы установить,
исследуя ее аналитическое выражение или составленные для нее
таблицы.
22
ФУНКЦИИ
[гл. I
Так, черт. 2 показывает, что изображенная на нем функция f(x)
возрастает (с ростом х) на участках а2а8 и а4а5 и убывает на
участках и а3а4; если мы хотим получить более детальную
информацию, например, о характере убывания функции на участке
ахаъ то и тут чертеж нам непосредственно показывает, что вначале
(вблизи х = а1) это убывание происходит медленно, а затем зна-
чительно ускоряется (крутой спуск); еще быстрее, очевидно, убы-
вает функция на участке а3а4; возрастание же данной функции
протекает сравнительно быстро на участке а2а3 и значительно
медленнее на участке а4а5. Функция принимает наибольшее (на
исследуемом участке) значение в точке х = а3, а наименьшее —
в точке х = а4. Мы ясно видим, на каких участках функция поло-
жительна и на каких отрицательна и т. д. Все эти сведения о по-
ведении данной функции было бы по большей части получить
труднее, если бы.мы вместо графика пользовались таблицами или
аналитическим выражением этой функции.
То тесное взаимоотношение, которое создается с помощью гео-
метрического изображения функций между объектами изучения ана-
лиза (функциями) и объектами изучения геометрии (линйями), поз-
воляет не только пользоваться наглядным представлением для изу-
чения свойств той или другой функции, но и, обратно, использовать
весь арсенал средств математического анализа для изучения геоме-
трических свойств той или другой линии, и более того — для
установления целого ряда общих геометрических предложений.
В дальнейшем мы встретимся с большим числом примеров
этого рода. Связь анализа с геометрией, первым шагом которой
является принцип геометрического изображения функций, оказы-
вается таким образом в высшей степени плодотворной для обеих
математических дисциплин.
Прочное овладение методами геометрического изображения
функций требует большого числа упражнений. Много поучитель-
ных примеров читатель найдет в задачнике Б. П. Демидовича,
отдел I, § 4. Выбор подлежащих решению задач должен быть
произведен по указанию преподавателя.
ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
23
§ 6]
§ 6. Элементарные функций
Среди огромного многообразия типов функциональной зависи-
мости в ходе развития науки исторически выделилась небольшая
группа функций, особенно часто встречавшихся в самых разно-
образных задачах и потому подвергшихся в первую очередь осо-
бенно тщательному изучению. Это — так называемые элементар-
ные функции. И хотя дальнейшее развитие анализа познако-
мило ученых с целым рядом других, более сложных функций,
которые потребовали столь же детального исследования, все же и
в настоящее время элементарные функции составляют собой первую
основу подавляющего большинства конкретных приложений анализа;
более того, при самом изучении других, более сложных функцио-
нальных зависимостей мы, как правило, широко пользуемся хорошо
известными свойствами этой классической группы элементарных
функций* Группа эта в основном совпадает с совокупностью тех
функций, которые обычно изучаются в средней школе; поэтому
нам нет необходимости останавливаться здесь подробно на свой-
ствах отдельных элементарных функций; мы можем ограничиться
простым перечислением их, сопровождая это перечисление лишь
немногими примечаниями. Впрочем, некоторые более тонкие черты
в поведении этих функций будут нами рассмотрены в дальней-
шем (§ 24). Отметим еще, что вся группа элементарных функций
вряд ли может быть выделена каким-либо признаком принципиаль-
ного характера; как мы уже сказали в самом начале, эта неболь-
шая группа просто исторически выделилась в ходе развития науки
в качестве естественной основы как для изучения других, более
сложных функциональных зависимостей внутри самого анализа, так
и для большинства его конкретных приложений.
1. Многочлены. Простейший, наиболее легко поддающийся изу-
чению тип функциональной зависимости осуществляет произволь-
ный многочлен
у = аохп 4- OiX"-1 + + ... + an_tx -|- ап,
где х — независимая переменная, п — любое натуральное число,
а0, ап ...,ал — постоянные («коэффициенты» многочлена). Для
получения значения величины у при даннОхМ значении величины х
мы должны произвести над х и данными постоянными числами ряд
арифметических операций (сложений, вычитаний, умножений и воз?
ведений в целую положительную степень). Обратно, результат любой
серии таких операций, произведенных над х и любыми постоянными
числами, может быть представлен в виде многочлена. Поэтому мно?
гочлены называют также целыми рациональными функ-
циями;- целыми — потому, что среди перечисленных нами опера?
ций отсутствует деление, и рациональными — потому, что среди
них отсутствует извлечение корня. Многочлены осуществляют про?
24
ФУНКЦИИ
[гл. I7
стейшие типы функциональной зависимости именно потому, что
значения их могут быть найдены с помощью простейших арифме-
тических операций; по этой же причине для изучения поведения
других, более сложных функций часто стараются представить их,
хотя бы приближенно, в виде многочленов, о чем мы много и под-
робно будем говорить в дальнейшем.
2. Рациональные функции. Если к тем арифметическим опера-
циям над х и произвольными постоянными числами, о которых мы
говорили выше, добавить еще действие деления, то результат такой
операции будет уже произвольной рациональной (вообще го-
воря, не целой) функцией от х; простыми примерами могут служить
функции
и т. д. Элементарная алгебра доказывает, что всякая рациональная
функция может быть представлена в виде отношения двух многочле-
нов, т. е. в виде
где Р(х) и Q(x)—многочлены. Рациональные функции, подобно
многочленам, обладают тем свойством, что значения их легко могут
быть вычислены для любых значений независимой переменной х,
за исключением тех, для которых в формуле (1) Q(x) = O; при
таких значениях х рациональная функция, заданная формулой (1),
остается неопределенной; такие значения х просто не принадлежат
«области определения» функции j, как мы определили эту область
в § 3; так, если задать у формулой
то областью ее определения будет служить вся числовая прямая
за исключением точек х=1 и х =—1. '
3. Общая степенная функция. Так называют функцию
где а — любое постоянное число. Природа такой функции сущест-
венно зависит от арифметической природы числа а. Если число
а — целое, то у—рациональная функция (целая при а^О). Если
число a — рациональная дробь, (где Р и ? — целые числа,
причем всегда можно считать ?^>0), то .
§6]
ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
2Ь
есть,как говорят, иррацйанаЛьнМя алгебраическая функ-
ция от х (так как к операциям, производимым над х, здесь при-
соединяется извлечение корня произвольной степени q). Значения
такой функций уже не поддаются столь простому вычислению,
как Значения рациональных функций. Тем более это относится
к случаю, когда число а иррационально (т. е., например, к фуйк-
циям у=х или иу = хтс); строго говоря, мы даже не знаем еще,
как определяется такая функция; к этому вопросу мы вернемся в
§§ 17 и 24.
Область определения функции, заданной формулой вида у = х®,
также существенно зависит от природы числа а. Если а — целое
положительное число, то областью определения служит вся число-
вая прямая; но пци целом а^0 из этой прямой мы должны ис-
ключить точку х = 0. Если а = ~, где q— целое положитель-
ное число, то функция определена для всех х при нечетном q
и лишь длй х^О при четном ^. Читатель без труда разберется
самостоятельно в том, какова область определения функции Xе
при а = ~-, где р и q — целые числа. В случае иррационально-
го а, как мы узнаем в § 17, областью определения служит полу-
прямая х>0.
4» Показательная функция. Так называют функцию
У—ах,
где а — постоянное положительное число. В § 17 мы узнаем, что
областью определения такой функции всегда служит вся числовая
прямая. Позднее мы ознакомимся с другими важнейшими свойст-
вами этой функции. Значение у для данного значения х здесь не
может быть получено никакой конечной последовательностью алге-
браических операций (если исключить тривиальный случай я=1);
функция ах — не алгебраическая, или, как говорят, транс-
цендентная*).
*> Более точно дело обстоит следующим образом. Если функция у =/(х)
независимой переменной х получается из нес^ конечным числом алгебраиче-
ских операций, то, как доказывается в алгебре, существует такой многочлен
Р(х, у) от двух переменных, что тождественно (т. е. при любом х)
Р [х,/(х)] = 0. Обратное утверждение неверно: может случиться, что много-
член Р существует, но функция f(x) не может быть выражена через х ни-
каким конечным числом алгебраических операций. Принято называть функ-
цию у =±/(х) алгебраической, если для нее существует многочлен Р,
обладаюп^ий указанными свойствами. Таким образом, класс алгебраических
функций шире класса функций, выражаемых конечным числом алгебраиче-
ских операций. Всякая не алгебраическая функция называется т р а н с ц е н-.;
де нт ной. Функция ах, (при любом а>0, a^l), sinx, cosx, arcsiiix,
arccos x и т. д. — трансцендентные.
26 функций [гл. 1
5. Логарифмическая функция* Функция
У=^а*>
где а — постоянное положительное число, отличное от единицы,
определяется как обратная по отношению к показательной функции.
Это значит, что из j/ = lgex следует х = аЛ Подробнее: для лю-
бого х^>0 существует единственное число у, удовлетворяющее
соотношению ау — х; это число у называется логарифмом числа х
при основании (или по основанию) а и обозначается* через lgax.
Подобно показательной функции, логарифмическая функция транс-
цендентна. Помимо своего большого теоретического значения, она
играет также важнейшую роль в вычислительной технике; роль
эта основана главным образом на известном свойстве этой функции:
(°Ф) = Iga а + ?• Областью определения логарифмической
функции при любом основан^ служит полупрямая х^>0.
в. Простейшие тригонометрические функции. Так называются
хорошо известные из школьного курса тригонометрии функции
_y = sinx, J/=COSX, y = tgx,
y=ctgxt y = secx, у = cosec x.
Важной чертой этих функций является их периодичность', tgx и
ctgx имеют период тс, а остальные четыре функции — период 2тс.
Областью определения для функций sin х и cosx служит вся число-
вая прямая; функции tgx и secx определены всюду, кроме точек
вида
У = (* + §)«•
а функции ctgx и cosec х—всюду, кроме точек вида
у=Атс,
где k в обоих случаях означает произвольное целое число.
7. Обратные тригонометрические функции. Мы называем вообще
функцию ф(х) обратной по отношению к данной функции /(х),
если из j/ = 9(x) следует x=f(y). Мы уже видели, что функ-
ция lgax обратна по отношению к функции а*. В данном случае
эта обратная функция — единственная. Однако вполне возможен слу-
чай, когда данная функция имеет несколько обратных; так, функ-
ция х3, очевидно, имеет обратные функции -f- ]/х и — j/х, так как
из = + ]/х и из у = — х одинаково следует x=j/2. Изве-
стно, что каждая из простейших тригонометрических функций имеет
бесконечное множество обратных; эти функции’называются обрат-
ными тригонометрическими функциями. Рассмотрим
в качестве примера семейство функций, обратных синусу. Если а—
дюбое число, заключенное между — 1 и 1, то существует бес;-
§ в]
ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
27
численное множество значений х, для которых sinx = a; в част-
ности, одно такое значение х найдется между — у и его мы
обозначаем через arcsina, так что
— arcsin а у, sin (arcsin а) = а;
очевидно, функция arcsinх обратна по отношению к функции sinx;
arcsina есть одна из дуг, синусы которых равны а; но в таком
случае, как учит тригонометрия, общий вид дуги, синус которой
равен а, есть
(— 1 )k arcsin а -|- Лк,
где k — любое целое число. Таким образом, каждая из функций
(— Г)* arcsin х 4~ Лк,
где k — любое целое число, есть функция, обратная по отношению
к функции siiix. Областью определения всех этих функций служит
отрезок —l^x^l. Аналогичным образом определяются и иссле-
дуются функции, обратные другим простейшим тригонометрическим
функциям.
Функции, рассмотренные нами в пунктах 1—7, исчерпывают
собою класс простейших элементарных функций. Другие эле-
ментарные функции получаются из простейших с помощью либо
алгебраических операций I у = т-г— , у = 2*(cos х — 2 sin х)1, либо
L 1 ~г J
«наложения» функциональных операций [j=lgcosx, ey=z=tg(14~2x8)],
состоящего в том, что берется некоторая функция независимой пе-
ременной, Затем некоторая функция от этой функции и т. д. Ре-
зультаты операций такого рода, произведенных в любом числе и
любой последовательности, исходя от простейших элементарных
функций, и составляют собою класс всех элементарных функций.
Как мы уже заметили^ целый ряд свойств элементарных функций
мы еще будем изучать в дальнейшем. Здесь же перечень простей-
ших из этих функций приведен нами лишь в целях предваритель-
ного обзора.
ГЛАВА 2
I
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ
§ 7. Бесконечно малые величины
Переменные величины, с которыми мы встречаемся в явлениях
природы и технических процессах, изменяются весьма различным
образом. Если бы мы стали изучать эти различные характеры изме-
нения один за другим в той последовательности, как они попадаются
нам в нашей практической деятельности или нашем изучении при-
роды, то это было бы ненаучным подходом к делу. Подобно тому
как, например, ботаник не подвергает изучению по очереди все
попавшие ему на глаза экземпляры растений, а сначала классифици-
рует свой материал, разбивая его на группы более или менее сход-
ных между собою, чтобы затем изучать свойства целого класса
своих растений, так и математик должен стремиться разделить все
возможные типы изменения величин на более или менее обширные
классы с тем, чтобы затем в систематическом порядке исследовать
свойства, общие всем величинам такого обширного класса. При этом
он всегда начинает с изучения простейших объектов, так как, во<
первых, опыт учйт его, что простейшее в его науке по большей
части является вместе с тем и важнейшим для приложений, а во-
вторых, в математике очень часто случается, что после того, как
простейшие случаи изучены, изучение других, более слджиых слу-
чаев удается быстро и легко свести к этим простейшими. Так,
в алгебре, в учении об уравнениях, мы начинаем с простейшего слу-
чая— уравнения первой степени с одним неизвестным, который
вместе с тем и в приложениях встречается чаще всего и к кото-
рому потом удается свести и ряд других, более сложных задач.
История развития нашей науки показала, что простейшим и важ-
нейшим типом переменных величин, к которым удается потом све-
сти изучение очень многих других, более сложных характеров изме-
нения, являются так называемые бесконечно малые величины.
Ведущая роль величин этого типа как в математической теории,
так и в ее практических применениях настолько велика, что все
учение об изменении величин до сих пор часто называют «анализом
бесконечно малых» или «исчислением бесконечно малых». Поэтому
§ 7] БЕСКОНЕЧНО МАЛЫЕ ВЕЛИЧИНЫ 2Й
мы, естественно, начнем наше исследование переменных величин
именно с этого типа изменения.
Представьте себе какое-либо явление природы или технический
процесс, в котором участвует некоторая переменная величина х.
Вообще Говоря, с течением процесса х будет то увеличиваться, то
уменьшаться. Допустим теперь, что по абсолютному значению вели-
чина х при достаточном продвижении процесса становится и
остается сколь угодно малой. Поясним точнее, что это означает.
Пусть нам задано любое, сколь угодно малое положительное число,
например 0,001. Тогда в нашем процессе наступит такой момент,
после которого мы уже все время будем иметь | х | < 0,0(11. Пусть
мы, не довольствуясь этой степенью малости, хотим иметь
|х |< 0,000001. Для этого нам, вообще говоря, придется продви-
нуть наш процесс несколько дальше. Но обязательно наступит и
такой момент, после которого уже всегда будет |х|<0,000001.
Вообще, какое бы постоянное положительное число е мы ни выби-
рали, в нашем процессе рано или поздно наступит такой момент,
после которого уже все время будет |х|<е.
Величину х, изменение которой (в данном процессе) обнаружи-
вает только что описанную нами черту, мы и называем беско-
нечно малой (в данном процессе). Таким образом, мы приходим
к следующему определению:
Величина х называется бесконечно малой (а данном про-
цессе), если, каково бы ни было постоянное положительное ^число е,
наступит в этом процессе такой момент, после которого уже
всегда будет | х | < е.
Пример 1. При постоянной температуре упругость р данной
массы газа обратно пропорциональна его объему о, т. е.
. р=~, (О
где с — положительная постоянная. Если мы будем безгранично уве-
личивать объем газа, то упругость его будет уменьшаться; при
этом, если процесс продвинут достаточно далеко, т. е. если объем
газа сделан достаточно большим, то упругость'газа, как показывает
формула (1), становится (и при дальнейшем расширении газа
остается) сколь угодно малой. Это означает, что в процессе безгра-
ничного расширения данной массы газа упругость его есть величина
бесконечно малая.
Пример 2. Согласно закону всемирного тяготения солнце S
притягивает огибающую его комету К (черт. 3) с силой Д, где
k — положительная постоянная, а г — расстояние между центрами
обоих небесных тел. Допустим, что речь идет о комете, только
один раз появляющейся в Пределах солнечной системы (гиперболи-
ческая орбита) и затем безгранично .удаляющейся от нее, так что
30
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ
[гл. 2
расстояние г, после того как комета обогнула солнце, непрестанно
и неограниченно возрастает. Очевидно тогда, что сила притяжения
k *
безгранично уменьшается; сколь бы малое положительное число е
мы ни выбрали, если процесс продвинут достаточно далеко (т. е.
если комета удалилась от солнца на достаточно большое расстоя-
✓ / ние), эта <ила притяжения станет (и уже
// навсегда останется) меньше, чем е. Это
/ / значит, что сила, с которой солнце
// притягивает комету, в процессе безгра-
- / ничного удаления кометы есть величина
// бесконечно малая.
Примерз. В геометрической про-
I Is гРессии
1111
2 ’ 4 ’ 8 ’ ” * ’ 2я ’ * * *
Черт. 3.
я-й член будет как угодно мал, если п
достаточно велико. Это значит, что в процессе безграничного уве-
1 личения числа п величина есть бесконечно малая.
Вообще, если 0<а<Ч, то величина (1—а)л бесконечно мала
при безграничном увеличении числа п. В самом деле, из
(1— а)(14-а)=1— а«<1
следует
1 —а
1
1+а’
и, значит, при я^>0
(1—а)я<(1+а)Л;
но (1 -|-а)л> 1 как легко видеть, разлагая по фор-
муле бинома (или прямо доказать методом полной индукции); по-
этому величина (1-|-а)Л становится как угодно большой при доста-
точно большом п. Наше неравенство показывает, что величина
(1—а)я, напротив, становится при достаточно большом п как
угодно малой, что и надо было доказать.
П р и м е р 4. На черт. 4 изображена часть обычного, тригоно-
метрического круга радиуса 1, так что
AD = DC=|sinx|, АВ = ^ ВС=\х\.
Прямая ADC короче дуги АВС, т. е. 21 sin х | < 21 х\, откуда
| sin х J < | х j. Поэтому, делая угол х все меньше и меньше по
^абсолютной величине, мы можем сделать и его синус сколь угодно
§ 7]
БЕСКОНЕЧНО МАЛЫЕ ВЕЛИЧИНЫ
31
малым по абсолютному значению. Это значит, что в процессе без-
граничного уменьшения абсолютной величины угла синус его есть
бесконечно малая величина. Этот пример отличается от предше-
ствующих тем, что величина sin х может быть Kail положительной,
так и отрицательной; независимо от этого она бесконечно мала,
так как по определению бесконечно ма-
лой величины этот тип изменения свя-
зывается только с абсолютным значе-
нием величины.
Пример 5. Отклонение маятника от
вертикального положения (черт. 5) изме-
ряется углом 6, который удобно считать
положительным при отклонении в одну
сторону (например, вправо) и отрица-
тельным при отклонении в другую (влево).
Если предоставить маятник самому себе
(не поддерживая его движения пружиной %
или гирей), то вследствие трения механизма и сопротивления воздуха
размах колебаний будет непрестанно уменьшаться. Величина 6 в этом
процессе становится то положительной, то отрицательной, проходя
при этом всякий раз через нуль при перемене знака. График зави-
симости угла 6 от времени t схематически изображен на черт. 6
(кривая затухающих колебаний). С течением времени высоты волн
непрестанно падают — это означает постепенное уменьшение размаха
колебаний. Как бы мало ни было положительное
Черт. 5.
число е, рано или поздно наступит такой момент
времени, после которого всегда уже будет 16 | <^ е.
Это значит, что в рассматриваемом нами явлении
угол 6 есть величина бесконечно малая. Мы имеем
здесь пример такой бесконечно малой, которая из-
меняется, принимая попеременно то положительные,
то отрицательные значения.
Если размах колебаний маятника поддерживать
постоянным посредством затраты какого-либо вида
энергии (пользуясь раскручивающейся пружиной
или опускающейся гирей), то зависимость угла 6
от времени получит вид, графически изображенный на черт. 7
(кривая незатухающих колебаний). В этом случае угол 6 уже
не будет бесконечно малой величиной; правда, с течением вре-
мени |в| становится иногда сколь угодно малым (и даже нулем);
однако, сколько бы мы ни ждали, никогда не наступит такого мо-
мента, прсле которого мы уже всегда имели бы ]6|<^“а, если а—
размах (незатухающих) колебаний маятника;
Сравнивая между собою приведенные нами примеры, мы видим,
что бесконечно малые величины могут иметь весьма различный
32 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ [ГЛ.2
. характер изменения; тем не менее объединение их в один класс со-
ставляет собою, как мы много раз будем видеть дальше, очень
, удобный прием исследования.
Примечание. Термин «бесконечно малая. величина» историче-
ски настолько утвердился, что трудно заменить его другим, не внося
разлада с принятой на всех языках научной терминологией. Однако
термин этот весьма неудачен и с педагогической стороны таит
в себе опасность, о которой учащийся должен быть предупрежден.
Слова «бесконечно малая» звучат как указание на размеры изучае-
мой величины, и часто начинающий приучается связывать с терми-
ном «бесконечно малая» представление о величине «очень малой»,
«ничтожно малой»; такое представление неправильно:: термин «бес-
конечно малая» по своему определению описывает не размеры вели-
чины, а характер ее изменения. Было бы, конечно, правильнее
называть этого рода величины не «бесконечно малыми», а «безгра-
нично убывающими».
§ 8. Операции лад бесконечно малыми величинами
Широкое применение бесконечно малых величин к исследованию ,
происходящих в мире изменений в значительной степени облегчается
тем их свойством, что результаты простейших алгебраических опе-
раций над бесконечно малыми снова приводят к бесконечно малым.
гЭто свойство мы теперь закрепим в виде нескольких небольших
‘'Ь .. . ..........l
§ 8J ОПЕРАЦИИ <НДД БЕСКОНЕЧНО МАЛЫМИ ВЕЛИЧИНАМИ 3?
Теорема 1. Алгебраическая сумма постоянного числа беско-
нечно малых величин есть величина бесконечно малая.
Доказательство. Пусть s = X! ±хл, где вели-
чины х2, хп — бесконечно малые, а число п постоянно.
Требуется доказать, что величина бесконечно мала.
Пусть е — любое постоянное положительное число; тогда
число ~ тоже положительное и постоянное. Так как величина хг
бесконечно мала, то в нашем процессе наступит такой момент, после
которого уже всегда '
подобным же образом и для величины х2, которая также беско-
нечно мала, наступит в процессе такой момент, после которого уже
всегда
•. • ...
так же будет обстоять дело и для каждой из величин х3, х4, ..., хп.
Таким образом, каждое из слагаемых суммы s рано или поздно ста-
новился по абсолютному значению навсегда меньше, чем однако
моменты, начиная с которых наступает и сохраняется это неравен-
ство, будут, вообще грворя, различны для,различных слагаемых. Но
числр> этих, моментов равно числу слагаемых п и среди них най-
дется позднейший; с этого позднейшего, момента будут всегда уже
выполняться все п неравенств
а потому будет выполняться и получаемое их почленным сложением
неравенство *
••• +1*п|<«-^ = е,
откуда и подавно*) ч ...
п п
м=| 2 21 **i <е-
Л=1 Л = 1
*) Здесь и во всем дальнейшем мы пользуемся общепринятым в мате-
матике сокращенным обозначением сумм:
п
atn + am+i+ ••• + 2 °*’ * .
Л=Я1
3 А. Я. Хинчин \
34 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ [ГЛ. 2
Мы показали, таким образом, что, каково бы ни было положи-
тельное число е, наступит такой момент процесса, после которого
всегда |$ |<Ч Но это и означает, что величина s — бесконечно
малая. Теорема 1 доказана.
Для установления дальнейших предложений нам понадобится
ввести одно новое понятие, которому и вообще в дальнейшем будет
принадлежать значительная роль. Условимся называть участвующую
в некотором процессе величину у ограниченной (в этом про-
цессе), если существует такое постоянное положительное число С и
такой момент в нашем процессе, после которого всегда |,у| <^С.
Это определение несколько напоминает собой определение беско-
нечно малой величины; имеется, однако, существенное различие:
бесконечно малая величина должна с течением процесса становиться
и оставаться (по абсолютному значению) меньше любого положи-
тельного числа, а ограниченная — только меньше хотя бы одного
положительного числа. Отсюда следует, конечно, что всякая беско-
нечно малая величина есть вместе с тем величина ограниченная. Но
обратное утверждение было бы неверно. Так, меняющееся с течением
времени расстояние земли (или любой другой планеты) от солнца
есть, очевидно, величина ограниченная, но не бесконечно малая.
, Другой пример: если число х безгранично возрастает, то sinx
есть величина ограниченная (потому что всегда | sin х | 2), но не
бесконечно малая (потому что, как £ы велико ни было х, мы все
вновь и вновь будем иметь |sinx| = l). Таким образом, понятие
ограниченной величины должно быть признано более общим (широ-
ким), чем понятие величины бесконечно малой.
Теорема 2. Произведение бесконечно малой величины на ве-
личину ограниченную есть величина бесконечно малая.
Доказательство. Пусть в некотором процессе величина х
бесконечно мала, а величина .у ограничена и пусть е — любое постоян-
ное положительное число. В силу ограниченности величины у суще-
ствует такое положительное число Q что с некоторого момента нашего
процесса мы всегда имрем |j|<^C. С другой стороны, с некоторого
где т и п (т<п) — любые целые числа, ak (т k л) — произвольные
числа; так, например,
означает сумму
з» т 4« Т 5» Т -f- р Т g» •
Неравенство в тексте основано на известном из элементарной алгебры пра-
виле: абсолютная величина алгебраической суммы не превосходит суммы
абсолютных величин слагаемых.
§8] ОПЕРАЦИИ НАД БЕСКОНЕЧНО МАЛЫМИ ВЕЛИЧИНАМИ 35
другого момента мы (в силу бесконечной малости величины х)
имеем Таким образом, после наступления позднейшего из
упомянутых двух моментов будут выполнены оба неравенства
И<С и |х|< , а значит, и получаемое их почленным перемно-
жением неравенство
Так как число е может быть выбрано произвольно, то это озна-
чает, что произведение ху есть величина бесконечно малая, чем
теорема 2 и доказана.
Так как всякая постоянная величина, очевидно, ограничена, то
мы получаем
Следствие 1. Произведение бесконечно малой величины на
постоянную есть величина бесконечно малая.
Так как, далее, мы видели, что всякая бесконечно малая в то
же время и ограничена, то мы находим
Следствие 2. Произведение двух бесконечно малых деличин
есть величина бесконечно малая.
Это предложение методом индукции немедленно распространяется
на произведение любого числа сомножителей. Если величины хи
>*8 бесконечно малы, то в силу следствия 2 бесконечно мало и
произведение х^х%\ отсюда же в силу того же следствия 2 выте-
кает, ; что и (Х1Х9)х8 = х1хйх3 должно быть бесконечно малой вели-
чиной. От трех множителей мы таким же путем переходим к четы-
рем и т. д.
Таким образом, мы получаем
Следствие 3. Произведение любого постоянного числа беско-
нечно малых величин есть величина бесконечно малая.
В частности,
Следствие 4. Любая целая положительная степень беско-
нечно малой величины есть величина бесконечно малая.
Мы видим, таким образом, что операции сложения, вычитания,
умножения и возведения в целую положительную степень, произве-
денные в любом числе и в любой последовательности над беско-
нечно малыми величинами, снова приводят к бесконечно малым
величинам. Не случайно среди этих операций отсутствует деление.
Частное двух бесконечно малых может и не быть бесконечно ма-
лой величиной. В самом деле, пусть величина х в некотором про-
цессе бесконечно мала, В силу следствия 4 и йеличина № будет
бесконечно малой в том же процессе. Допустим для простоты, что
величина х никогда не обращается в нуль; тогда каждая из трех
дробей
36 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ. [ГЛ. 2
представляет собой частное двух бесконечно малых. Первая дробь
равна х и, следовательно, бесконечно мала; вторая дробь равна
единице и, следовательно, ограйичена, но не бесконечно мала; нако-
нец, третья дробь равна ~; так как в нашем процессе | х | стано-
I 1 I 1
вится сколь угодно малым, то — =-—г становится сколь угодно
I X I |
к 1
большим, и значит, величина —, т. е. наша третья дробь, не только
не бесконечно мала, но даже не ограничена.
Если величина х, участвующая в некотором процессе, в течение
всего этого процесса равна нулю, то | х I в любой момент процесса
меньше любого положительного числа е. В силу определения беско-
нечно малой величины мы должны поэтому считать величину х
бесконечно малой:
Величина, которая равна нулю в течение всего данного про-
цесса, есть бесконечно малая в этом процессе.
§ 9. Бесконечно большие величины
Теперь нам предстоит ознакомиться с другим характером изме-
нения величины, который в некотором смысле противоположен бес-
конечной малости.
Величина х называется бесконечно большой в данном процессе,
если, как бы велико ни было положительное число А, наступит
в этом процессе такой момент, после которого уже всегда
|х|>А
Бесконечная великость, подобно бесконечной малости, целиком
определяется, таким образом, поведением абсолютного значения дан-
ной величины, совершенно не завися от ее знака, так что вместе
с х и величина | х | обязательно будет бесконечно большой. В связи
с понятием бесконечно большой величины необходимо! сделать то
же предостережение, каким мы закончили § 7: бесконечная йели-
кость говорит нам не о размерах, а о характере изменения изучае-
мой величины; неправильно поэтому связывать с термином «беско-
нечно большая» представление о величине, размеры которой чрезвы-
чайно велики.
Пример 1. Расстояние г от солнца до кометы в примере 2
§ 7 есть величина бесконечно большая в процессе движения кометы.
Пример 2. Если острый угол х приближается к прямому, то
tgx в этом процессе есть величина бесконечно большая. То же
самое будет и тогда, если тупой угол х приближается к прямому
(в этом случае tgx отрицателен). .
Пример 3. Если число п безгранично возрастает, то (—1)Л2Л
есть величина бесконечно большая (так как |(—1)Л2Л| = 2Л). Этот
пример показывает, что бесконечно большая величина, подобно бес-
§ 9]
БЕСКОНЕЧНО БОЛЬШИЕ ВЕЛИЧИНЫ
37>
конечно малой, может в течение данного процесса бесконечное
множество раз менять свой знак.
Пример 4. В примере 3 § 7 мы убедились, что при любом
постоянном а 0 величина (1 а)л — бесконечно большая при
/г—>оо.
Обратимся теперь к операциям над бесконечно большими вели-
чинами. Сумма двух бесконечно больших может и не быть беско-
нечно большой, как показывает следующий простой пример: если
х — бесконечно большая величина, то, как мы видели, и —*х также
будет бесконечно большой «величиной; сумма же этих двух величин
всегда равна нулю, т. е. величине бесконечно малой. . ..
Но зато имеет место следующая важная
Теорема 1. Сумма двух величин, из которых одна беско-
нечно большая, д другая — ограниченная, есть величина бесконечно
большая.
Доказательство. Пусть в данном процессе х — бесконечно
большая, а у — ограниченная величина. Тогда существует такое по-
ложительное число С, что после некоторого момента нашего про-
цесса всегда |j|<^C; пусть А — любое положительное число; так
как х — бесконечно большая, то наступит в нашем процессе такой
другой момент, после которого всегд^ А-|-С. Значит, выби-
рая позднейший из двух упомянутых моментов, мы после него всегда
будем иметь:
|х|>А4-С,
откуда ♦) ' 1 ;
|J|>A + C- С—А. ;
Так как число А произвольно велико, то^ этим доказано, что
x-pj/— бесконечно большая величина.
Если, как мы видели, сложение бесконечно больших величин не
всегда приводит к бесконечно большим, то, напротив, с умноже?
нием бесконечно больших дело обстоит так же, как с умножением
бесконечно малых:
Теорема 2. Произведение двух бесконечно больших величин
есть величина бесконечно большая.
Доказательство. Читатель уже достаточно привык ж той.
схеме рассуждений, с помощью которой доказываются такого рода
теоремы; мы можем поэтому изложить доказательство бодее кратко.
Если величины xt и х2 бесконечно велики в данном процессе и
А—> Любое положительное число, то, начиная с некоторого момент#
процесса, | xj | А, а Начиная с некоторого другого момента,
, *) Мы пользуемся здесь известным ж элементарной алг$бры‘ правилом;
абсолютная величина суммы ke меньше, чем разность абсолютных вели-
чин слагаемых. . г. ч ~ ...-• ...
38
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ
[гл. 2
| у/А; но тогда, начиная с позднейшего из этих двух момен-
тов, | | = I xt | • | 1 А, чем теорема 2 и доказана.
Отсюда, подобно тому как мы это проделали для бесконечно
малых, мы с помощью индукции получаем
Следствие. Произведение любого постоянного числа беско-
нечно больших величин есть величина бесконечно большая.
Отметим еще следующее предложение, связующее между собою
понятия бесконечно большой и бесконечно малой:
Теорема 3. Если х — бесконечно малая величина, никогда
не обращающаяся в нуль, то ~ — величина бесконечно боль-
шая*, обратно, если х — бесконечно большая, не обращающаяся
в нуль, то — величина бесконечно малая.
Для доказательства достаточно заметить, что неравенство
| х К е равносильно неравенству | ~ | L> у и что если числ0 6
сколь угодно мало, то число ~ сколь угодно велико.
§ 10. Величины, стремящиеся к пределам
Мы изучили некоторые простейшие типы изменения величин — ве-
личины безгранично убывающие и безгранично возрастающие, которые
принято называть соответственно бесконечно малыми и бесконечно
большими. Следуя намеченному общему плану, мы перейдем теперь
к следующему, более широкому классу характеров изменения,
причем уже изученные нами бесконечно малые величины сослужат
нам хорошую службу.
В нашей практике и в наблюдаемых нами явлениях природы
часто бывает, что переменная величина х неограниченно прибли-
жается к некоторой постоянной величине а — так, что разность
между ними при достаточном продвижении процесса становится и
остается как угодно малой по абсолютному значению; в таких слу-
чаях говорят, что величина х в данном процессе имеет предел а
или стремится к а. Записывается это так: 11шх = а, или
х~*а. Обе записи совершенно равнозначны. Знак «Нт» состав-
ляет собой первые три буквы латинского слова limes — предел,
граница; но читать lim следует по-русски: «предел».
Само собой разумеется, что величина х в данном процессе не
может иметь двух различных пределов; в самом деле, если
и х-*а8, то величины х—at и х — обе становятся и остаются
в данном процессе сколь угодно малыми по абсолютному значению;
поэтому и разность их, т. е. постоянная величина — ах, с тече-
нием процесса должна становиться и оставаться как угодно малой
по абсолютному значению, что возможно только при as = av
§ 10] ВЕЛИЧИНЫ, СТРЕМЯЩИЕСЯ К ПРЕДЕЛАМ 30
Как мы только что определили, соотношение \1тх=а (цли
х->а), где а обязательно есть Постоянная величина, означает, что
разность х — а с течением данного процесса становится и остается
по абсолютному значению как угодно малой, т. е. меньше любого
постоянного положительного числа. Но величину, имеющую такой
характер изменения, мы условились называть бесконечно малой.
Можно поэтому сказать, что
Величина х стремится в данном процессе к постоянной
величине а (или, что то же, имеет пределом постоян-
ную величину а), если разность х — а в этом процессе есть
величина бесконечно малая.
Пример 1. Нагретое тело (температуры 7\) погружается в
сосуд с водой (температуры Т9 < 7^). Постепенно тело охлаждается
(1\ убывает), а окружающая вода нагревается (Т2 возрастает); обе
величины Tt и Г2 при этом безгранично приближаются к некоторой
средней температуре Т(7\<^ Т<^ 7\), так что с течением процесса
разности 7\ — Т и Т9 — Т бесконечно малы. Мы имеем:
lim7\ = 7', ИтТ2=Т,
или
Л Т, Т2 Т.
Пример 2. Монета бросается наудачу п раз подряд, причем
каждый раз регистрируют, какая из двух сторон брошенной монеты
оказалась обращенной кверху. Допустим, что при п бросаниях m
раз выпадает герб; с увеличением п будет увеличиваться и т. Опыт
показывает, что если монета геометрически правильна и физически
однородна, то при большом числе бросаний герб выпадает примерно
в половине всех случаев, т. е. отношение бывает близким к
мы можем считать экспериментально установленным, что разность
т____
п 2
при безграничном возрастании п (становясь то положительной, то
отрицательной) по абсолютному значению в конце концов становится
и остается сколь угодно малой, т. е. что эта разность в процессе
безграничного увеличения числа бросаний есть бесконечно малая
величина. Поэтому в нашем процессе
,, m 1 ml
11m—или —
П л» П
Пример 3. Если величина х в некотором процессе бесконечно
мала, то величина у—а-\-Ьх-\-сх\ где а, Ь, с — постоянные»
имеет в этом процессе предел а. В самом деле, у—а = Ъх-\-сх\
40 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ [ГЛ. 2
и если х бесконечно мала, то теоремы § 8 позволяют легко уста-
новить, что и величина Ьх-\-сх*—: бесконечно малая.
Пример 4. Если в некотором процессе величина х бесконечно
мала, то величина cOsx имеет пределом 1' В самом деле, начиная
с некоторого момента процесса |х]<^, т. е. угол х острый, и
cosx^>0. Из соотношения 1 — cos2x = siti^x следует поэтому
м < sin2 х ~ . о ’
0^ 1 —cosx==T-i——<Tsin2x,
• 1 + cos X ’
а так как вместе с х бесконечно мала и величина sin х (пример 4 § 7),
а следовательно, и величина sirPx (следствие 4 теоремы 2 § 8), то
величина 1 — cos х, заключенная между нулем и бесконечно малой
sin2x, бесконечно мала; но это означает, что в нашем процессе
COSX—>1.
Пример 5. Убедимся, что при любом постоянном вели-
чина у^а имеет пределом 1, если п безгранично возрастает. В самом
деле, пусть е 0 задано произвольно; мы знаем (пример 3 § 7), что
при безграничном возрастании п величина (1—е)я — бесконечно
малая, а величина (1s)n —бесконечно большая; поэтому при
достаточно большом п ' (,
(1_е)»<а<(1+е)п .
откуда
Пу— -
.... 1—£<С у а<^ 1 +е> <
или \
. Л/—
| уа-*1 |О
что и доказывает наше утверждение.
Приведенные примеры показываю^ что приближение переменной
величины к ее пределу может носить различный характер. Так,
в примере 1 величина Т, стремится к своему пределу Г/ непре-
станно убывая; напротив,-величина 7, (вРтом же примере) стремится
к тому же пределу Т, непрестанно возрастая. В примере 2 {опыт
с бросанием монеты) теория и опыт, одинаково' показывают, что при
увеличении числа бросаний п «доля гербов» -^-становится то больше,
то меньше (а иногда и равна) ±; мы имеем здесь дело с такой
величиной, которая в своем стремлений ~к пределу то возрастает,
то убывает с течением рассматриваемого процессу Л
с Несмотря на возможность столь значительных различий в Пове-
дении величин, стремящихся к пределам, все эти величины обла-
дают щелымрядом общих важных свойств, что и делает целесо-
§10] ВЕЛИЧИНЫ, СТРЕМЯЩИЕСЯ К ПРЕДЕЛАМ 4Р
образным объединение их в один класс. Мы переходим теперь
к изучению некоторых из этих свойств.
Теорема 1. Величина, стремящаяся к пределу в некотором
процессе, ограничена в этом процессе.
Доказательство. Пусть в некотором процессе а. Тогда
разность а бесконечно мала, и следовательно, начиная с неко-
торого момента процесса, | х — а I < 1, откуда ввиду х = а 4~ (х—а)
находим:
х—аК|аЦ-1/
Это неравенство, правая часть которого есть некоторое постоян-
ное положительное число, выполняется начиная с некоторого момента
нашего процесса; но это и означает, что величина х в данном
процессе, ограничена.
Теорем* 2. Если в некотором процессе х-+а и а^>0, то,
начиная с некоторого момента процесса, всегда и х>0.
Другими словами, если величина имеет положительный предел,
то сама она с некоторого момента процесса должна оставаться
положительной.
Доказательство. Пусть -любое положительное число,
меньшее, чем a(0s<£<^a). Так как разность х — а бесконечно
мала, то с некоторого момента процесса
— a\<ZJ>',
так как x = a-^(x-^d), то с этого момента
х^а — |jt — а|^>а —
что и требовалось доказать.
Следствие 1. Если в некотором процессе х-+а и а<^0,
то, начиная с некоторого момента процесса, всегда х 0.
Следствие 2. Если х-+а и, начиная с некоторого момента
процесса, х^ О, то и а^ б. Если, начиная с некоторого момента
процесса, x^Q, то и а ^0.
Доказательства обоих следствий настолько очевидны, что мы
можем не приводить их здесь. . _
Пусть теперь в некотором процессе х->0. Это, как мы знаем,
равносильно тому, что х — 0 = х есть величина бесконечно малая,
и мы приходим к" следующему предложению:
•• Теорем аз 3; Всякая бесконечно. малая. величина * имеет пре»
делам нуль,и^обратноувсякая величина, стремящаяся к нулю,
бесконечно мала.
Эта террема, имеет большое принципиальное значение. Она
показывает, Что бёсконечно малые величины; ко!орые мы изучали
раньше, являются частным случаем величин, стремящихся к пределами
Напротив, бесконечно большая величина не может стремиться ни
к какому пределу; это следует из теоремы С так как бесконечно
большая величина, очевидно, не может быть ограйичёнкой7 л
42
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ
[ГЛ. 2
Наконец, имеет место
Теорема 4. Всякая постоянная величина а служит своим
собственным пределом.
Для доказательства достаточно заметить, что утверждаемое
соотношение а->а равносильно требованию, чтобы разность а — а
была бесконечно малой величиной; но а — а = 0, а постоянный нуль,
как мы знаем (см. конец § 8), всегда есть величина бесконечно малая.
Дальнейшие свойства величин, стремящихся к пределам, «связаны
с операциями над этими величинами; мы рассмотрим их в следующем
параграфе.
§11. Операции над величинами, стремящимися к пределам
Теорема 1. Если в некотором процессе X}-+ai, ха->а2, ...
... , хп-+ап, то
Xi ~ь х2 ~ь ... ~ь~ хп —> ах -ь а4 -+- .. . н- ал.
Эту теорему часто формулируют так: предел алгебраической
суммы (постоянного числа величин) равен алгебраической сумме
пределов; эта формулировка становится еще более естественной,
если записать утверждение теоремы в равнозначном виде:
lim(Xj±х2zt ±хл) = limxi ±limxg± ... +Птхя.’
Необходимо только отчетливо представлять себе, что существование
предела у каждого слагаемого является обязательной предпосылкой
теоремы; напротив, существование предела всей алгебраической
суммы тогда уже не предполагается, а утверждается (и, конечно,
доказывается). Наиболее полная (хотя и несколько длинная) сло-
весная формулировка теоремы 1 гласила бы: если в некотором
процессе каждая из величин xz(l^/^«) имеет предел, то и
алгебраическая сумма этих величин имеет предел, и этот предел
алгебраической суммы равен алгебраической сумме пределов сла-
гаемых. Это же замечание относится и ко всем последующим тео-
ремам подобного рода. I
Доказательство. Из предпосылок теоремы следуем, что в
данном процессе все разности
Xi— 01 = 0.1, ха —ag = dg,... , хл — ап = ап
•— величины бесконечно малые. В силу теоремы 1 § 8 и алгебраи-
ческая сумма их cq zt а2 ± • st ал бесконечно мала; но эта алге-
браическая сумма, очевидно, равна
(*!± ... ±*„)—(а, ± . ±ЯЖ);
отсюда непосредственно вытекает, что
*1 ±х2 zt.. • ±хл ->ах zt ag zfc ... ;±:йл,
Й теорема 1 доказана.
$11] ОПЕРАЦИИ НАД ВЕЛИЧИНАМИ, СТРЕМЯЩИМИСЯ К ПРЕДЕЛАМ 43>
Теорема 2. Если в некотором процессе х^-^а^ х9->а9, .. .
, хл->ал, то
х^ ... хп^а^а9 ... ап.
Доказательство. Докажем теорему 2 сначала для случая
двух сомножителей (л = 2). Положим хх—ах = аи х9— =
так что а, и <ц — бесконечно малые. Отсюда
*i=at + «i. х9 = а9-(-а9(
х1х9=а1а9-|”а1а«4“'а«а1
х,х9 — + °Ч°Ч*
В правой части этого равенства все три слагаемых бесконечно малы
(первые два в силу следствия 1, а последнее — в силу следствия 2
теоремы 2 § 8); в силу теоремы 1 § 8 поэтому вся правая,
а значит, и левая часть последнего равенства бесконечно малы. Но
бесконечная малость разности х^х* — аха9 и означает, что х^х* -> аха9,
таким образом, для л = 2 теорема 2 доказана. Переход к л = 3,;
затем к л = 4 и т. д. не вызывает никаких трудностей; так, например,
если х8->а3 и теорема уже доказана для л = 2, то
lim = lim [(XiX9) х9] = Hm (х^) Нт х9 = lim Xi Нт х9 Нт х8,
что доказывает теорему 2 для л = 3.
Теорема 3. Если в некотором процессе х-+а и k — посто-
янная величина, то kx-+ka.
Так как k-+k в Силу теоремы 4 §10, то теорема 3 является
непосредственным следствием теоремы 2. Утверждение теоремы 3
может быть записано и в виде
Нт(Лх) = А Нтх,
вследствие чего эта теорема может быть формулирована еще так;
постоянный множитель можно вынести за знак предела.
Теорема 4. Если в некотором процессе х-+а и п — любое
постоянное натуральное число, то Xя-^ап.
Эта теорема является, очевидно, частным случаем теоремы 2.
Ив теорем 4, 3 и Г вытекает
Теорема б. Если Р(х) = а^х* 4“ -f- • • • + + ап
есть произвольный многочлен относительно х и если в некотором
процессе х-+а> то в том эре процессе Р(х)->Р(а).
Пример. Пусть Р(х) = 2х3— 4х14_бх—12. Если в неко-
тором процессе х -> 2, то
Р(х)-*Р(2) = — 2.
До сих пор мы исследовали применительно к величинам, стре-
мящимся к пределам, только действия сложения, вычитания, умно-
жения и возведения в степень с постоянным натуральным показа-
44 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ [ГЛ. 2
телем. Теперь мы переходим к теоремам, связанным с действием
деления.
Теорема 6. Если в некотором процессе х-+а и а 0, то
в том же процессе -> -i-.
Доказательство. Прежде всего, из а ф 0 в силу теоремы 2
§10 (или ее следствия 1) вытекает, что с некоторого момента
процесса х 0, так что ~ имеет определенный смысл. Далее, так
как величина х — а бесконечно мала, то, начиная с некоторого
момента, | х — а | | а | и, следовательно,
Iх I = Iа + — а) I Iа I — Iх — а I > I а 1 — у1 а | = у | а |,
откуда
1 2
|х| |а| ’
и значит,
< ' • 1 2
| ах | а3 *
Это неравенство показывает, что величина ограничена в нашем
процессе. Поэтому величина
х а ах' 7
в силу теоремы 2 § 8 бесконечно мала, а это и означает, что
Теорема 6 таким образом доказана.
Теорема 7. Если в некотором процессе хх -> ait х* -> а2 и
если си^Ъ,то—-+ — .
«“Xg а%
Доказательство непосредственно вытекает из теорем би 2 (л=±=2).
Следствие. Если Р(х) и Q(x) — два любых многочлена
относительно х, если в некотором процессе х-+а и если Q(a) ^6 0,
то
Р(х) Р(а) ' '
Q(x) Q(a}
Так как йз х-+а в силу теоремы 5 следует Р(х)-^Р(а),
Q(x)->Q(a), то доказываемое соотношение вытекает как частный
случай из теоремы 7.
Теорема 7 позволяет нам выразить предел дроби через пределы
числителя и знаменателя, этой дроби во' всех случаях, когда пределы
эти существуют и предел знаменателя отличен от нуля. Если
а^=0, то эта теорема не дает нам ничего для исследования дроби
Лерко видеть, чтр « случае а2 = 0 дробь ~ может иметь предел
§ 11] ОПЕРАЦИЙ НАД ВЕЛИЧИНАМИ, СТРЕМЯЩИМИСЯ К ПРЕДЕЛАМ 45
лишь при том условии, что и аг=0; в самом деле, так как
Xi = ^x2, то, если limx2 = 0 и существует lim — = b9 мы имеем
•*1 . X# .
в силу теоремы 2 (п = 2):
а, = lim xt — lim — lim х, = b • 0 = 0.
Таким образом, мы приходим к следующему выводу..
Теорема 8. Если знаменатель дроби бесконечно мал, то
дробь может иметь предел лишь при условии, что и числитель
ее бесконечно мал.
В этом случае данная дробь представляет собой частное двух
бесконечно малых. Такое частное может обладать, как мы видели
в § 8, весьма различными характерами изменения; > поэтому здесь
каждый случай требует особого исследования. Заметим только, что
исследование характера изменения, свойственного тому или другому
отношению двух бесконечно малых, составляет собой, как мы
увидим дальше, одну из важнейших задач всего математического
анализа. В конце настоящего параграфа мы рассмотрим конкретный
пример задачи этого рода.
Но прежде установим еще два предложения, очень важных для
оценки и фактического вычисления пределов переменных величин.
Теорема 9. Если х->а9 у-+Ь и, начинал с некбторого мо-
мента процесса, х^у9.то а^Ь.
Для доказательства этой теоремы достаточно применить к раз-
ности Х'—у следствие 2 теоремы 2 § 10.
Теорема 10. Если, начиная с некоторого момента процесса,
мы всегда имеем:
xt^x^x2, (1)
и если величины хг и х* стремятся в этом процессе к одному и
тому же пределу а, то и величина х имеет пределом а.
Доказательство. Из (1) следует
О^х— хд ^х2— хп
откуда
|x ——х,|; : . (2)
но lim(x2 —x1) = limx2 —limxj = а — а = 0, так что х2—xt —
бесконечно малая; в сиду (2) величина х —xt также бесконечно
мала, х — Xj-^О; но
x=Xi + (x — Xi);
так как х4->а и х—xt-> 0, то х-+а-]-0 = а, что и требовалось
доказать.
46
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ
[ГЛ. 2
Значение теоремы 10 обусловлено 1ем, что в конкретных слу-
чаях величина х, предел которой мы хотим найти, имеет иногда
сложное, трудно анализируемое выражение, сильно затрудняющее
нашу задачу, и в то же время удается установить, что х всегда
заключено между двумя другими ве-
личинами х, и х2, имеющими значи-
тельно более простое строение; если
тогда удается показать, что величины
xt и х8 стремятся к одному и тому же
пределу а, то в силу теоремы 10 и
х-+а; таким образом, мы получаем
возможность найти предел величшш х,
не исследуя непосредственно ее слож-
ного выражения. Мы теперь рассмот-
рим конкретную задачу этого рода,
которая будет вместе с тем служить и одним из. важнейших при-
меров вычисления предела отношения двух бесконечно малых.
Задача. Пусть х — бесконечно малая величина в некотором
процессе; доказать, что отношение имеет предел, и найти
этот предел*).
Решение. На черт. 8 изображена часть обычного тригоно-
метрического круга радиуса 1. Площадь треугольника О АС, равная,
очевидно, у sin х cos х, меньше площади кругового сектора О АВ,
равной ух, а эта последняя меньше площади треугольника ODB,
равной.
tgx =
1 sinx
2 cosx ’
Таким образом,
. у sinx cosx <у
1 sinx
T cos x ’
2
откуда
cosx —-—
sin X COS X
Но при x->0 мы имеем (пример 4 § 10) cosx->l, а значит, по
теореме 6 и ~ 1» Таким образом, левая и правая части по-
следних неравенств при х-> 0 стремятся к 1. По теореме 40 мы
заключаем поэтому, что и
sinx ’
♦)Мы допустим ради простоты, что х не дбращаётся в нуль в данном
процессе.
§12] ПОРЯДКИ БЕСКОНЕЧНО МАЛЫХ И БЕСКОНЕЧНО БОЛЬШИХ 47
а следовательно (снова применяя тёорему 6),
- Нт^=1,
х.
когда х—>0. Ради простоты мы допускали при этом, что х^>0; но
так как отношение не меняется при замене х на —х, то
результат остается верным при каком угодно приближении вели-
чины х к нулю.
Полученный нами результат имеет основное значение для на-
хождения пределов таких величин, в выражении которых участвуют
'тригонометрические функции. Так, если’ величина х бесконечно мала,
числитель и знаменатель дроби
__1 — cos х
У х*
бесконечно малы; так как 1—cosxg Ystin——, то
1 + cosx
? 1 + COS X ’ X* 1 + COS X \ X J ’
но при х40 мы имеем:
COSX-1, ^*-1,
X
и значит,
• 4, 1 — cos х 1
У 2 '
§ 12. Бесконечно малые и бесконечно большие
различных порядков
Мы вернемся теперь ненадолго к бесконечно малым и бесконечно
большим величинам, чтобы несколько дополнить их теорию.
Пусть в некотором процессе участвуют две бесконечно малые
величины х и у. Мы хотим сравнить их между собою в отношении
быстроты убывания. Рассмотрим с этой целью отношение ~
(мкдопустим для простоты, что х в нашем процессе, по крайней
мере с некоторого его момента, не обращается в нуль; так1 что
величина у в любой момент имеет определенный смысл))» Может
случиться —и примеры этого рода мы видели уже в § 8, — что
отношение ~ само бесконё'рде мало; это, очевидно, означает, что в
нашем процессе величина у бесконечно мала не только сама но
себе, но й сравнительно с бесконечно малой х> так что, если
48 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ , (ГЛ. 2
процесс продвинут достаточно далеко, |j/| будет составлять лишь
ничтожную долю малой величины | х |; так будет, например, обстоять
дело, если у = х*. В этом случае мы будем называть величину у
бесконечно малой высшего порядка по сравнению с х.
Напротив, х имеет по сравнению с у низший порядок ма-
лости.
Пусть теперь отношение в данном процессе оказывается вели-
чиной бесконечно большой; в силу теоремы 3 § 9 тогда обратное
отношение у бесконечно мало и, значит, х имеет высший порядок
малости сравнительно с у (а значит, у — низший порядок сравни-
тельно с х).
Наконец, рассмотрим еще случай, когда отношение — двух
бесконечно малых в некотором процессе не может ни безгранично
убывать, ни безгранично возрастать, а остается заключенным по
абсолютному значению между двумя положительными, границами;
это значит: существуют два таких положительных постоянных числа
а и Ь, что, начиная с некоторого момента нашего процесса,
Очевидно, это означает, что в данном процессе ни одна из
величин | х | и | у | не может в своем убывании слишком значительно
опережать другую. В этом случае говорят, что величины х л у
имеют один и тот же порядок малости или что это —
бесконечно малые одинакового порядка. В частности,
этот случай всегда имеет место, если отношение стремится
в данной процессе к некоторому пределу а, отличному от нуля;
в самом деле, если это так, то, очевидно, как бы мало ни было
в 0, с некоторого момента ,
где при достаточно малом е числа |а| —ей | а | е положительны
и постоянны. . 7
Очевидно, бесконечно малые х и у в своем изменении особенно
близки друг к другу, если
в этом случае величины х и у ‘ называют равносильными
(эквивалентными) бесконечно малыми. Равносильность беско-
нечно малых х и у записывается так: х^у. В конце предыдущего
параграфа мы доказали, что бесконечно малые х nsinx взаимно
§ 12] ПОРЯДКИ БЕСКОНЕЧНО МАЛЫХ И БЕСКОНЕЧНО БОЛЬШИХ 49.
равносильны. Понятие равносильности бесконечно малых имеет
важное значение для вычисления пределов; значение это основы-
вается на следующем предложении.
Теорема 1. Если х и у—равносильные бесконечно малые,
a z —третья величина, участвующая в том же процессе, то из
xz-+a следует yz->a.
Другими словами, если какая-либо величина стремится к пределу
и если какой-нибудь бесконечно малый множитель этой величины
заменить любой равносильной ему бесконечно малой, то измененная
таким образом величина будет стремиться к тому же самому пре-
делу.
Для доказательства теоремы 1 достаточно заметить, что из
V
yz—— • xz
следует
lim(j/z) = lim lim (хг)= 1 -а=а,
Теорема 1 часто дает возможность при вычислении предела того
или другого выражения заменять отдельные бесконечно малые мно-
жители этого выражения равносильными им более простыми беско-
нечно малыми, и тем самым облегчать решение поставленной задачи.
Так, в решении заключительной задачи предыдущего параграфа мы
могли бы в выражении
:•< ’ * 2_ sin2 ж 1
? 1 +COSX ’ X*
прямо заменить, в силу sin х^х, sin® х через х®, т. е. писать сразу
,. 1 1
hm у = 11т-7—:----= -??.
1 + cos х 2
Это же соотношение sinxr^x дает возможность, например, сразу
найти для любой бесконечно малой величины х
sinx .. х ... 1 1
“ х’ + Зх — hmx (xsH-3) 1,mx’ + 3 3'
Выше мы рассмотрели случай, когда из двух бесконечно малых
х и у, участвующих в одном и том же ripdiiecce: 1) одна имеет
высший порядок малости по сравнению с другой и 2) обе имеют
один и тот же порядок майдсти (в частности, эквивалентны между
собой). Этими случаями, одйако, далеко не исчерпываются все воз-
можные взаимоотношения между порядками убывания двух беско-
нечно малых, участвующих в одном и том же процессе; напротив,,
те случаи, которые мы рассмотрели, являются лишь простейшими,
наиболее легкими для исследования; вообще же говоря, отношение
~ двух бесконечно малых может вести себя значительно более сложно;
4 А» Я. Хивчин
ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ [ГЛ. 2
величина | j с течением процесса может, например, становиться то
сколь угодно малой, то сколь угодно большой, причем оба явления
могут наблюдаться все вновь и вновь, сколь бы далеко ни продол-
жался процесс. В этом случае мы не можем приписать величине у
(по сравнению с х) ни высшего, ни низшего, ни того же самого
порядка малости, и вынуждены признать величины у и х несрав-
нимыми между собой в отношении быстроты убывания. Логи-
чески мы должны считать общим именно этот случай несравнимости;
однако практически мы чаще всего встречаемся с одним из частных
случаев, рассмотренных нами выше.
Все то, что мы до сих пор говорили в этом параграфе о беско-
нечно малых, переносится, с соответствующими очевидными измене-
ниями, и на бесконечно большие величины. Пусть величины х и у
бесконечно велики в некотором процессе. Если отношение у беско-
нечно велико, то х есть бесконечно большая высшего порядка отно-
сительно у, а у — бесконечно большая низшего порядка относи-
тельно х. Если | у | с некоторого момента остается заключенным
между двумя постоянными положительными числами, то х и у—
бесконечно большие одного и того же порядка; это будет всегда иметь
место, если в данном процессе lim ^yj существует и отличен ют
нуля; в частности, если у 1, бесконечно большие х и у называют
равносильными (эквивалентными), и пишут х<-^у. При вычислении
пределов бесконечно большие множители можно, подобно бесконечно
малым, заменять любыми равносильными им величинами.
Как в случае бесконечно малых, так и в случае бесконечно боль-
ших иногда бывает полезно оценивать порядки этих величин не
только качественно (выше, ниже, одинаково), но и количественно.
Это может быть сделано следующим образом. Какая-нибудь одна
бесконечно малая, например х, выбирается в качестве основной;
тогда все бесконечно малые, имеющие тот же порядок, что и х,
называют бесконечно малыми первого порядка*); в частности,
всякая бесконечно малая, равносильная х, будет бесконечно малой
первого порядка. Далее, величина х2 и все величины одинакового
с ней порядка мы называем величинами второго порядка.
Вообще всякая величина, порядок которой одинаков с порядком
величины х®, где а — любое постоянное положительное число, назы-
вается бесконечно малой порядка а. Совершенно аналогичное
♦’ ♦) Напоминаем: у имеет тот же порядок, что х, если с некоторого, мо-
мента данного процесса всегда а < | || < Ъ9 а и Ь — постоянные полог
Жительные числа.
$ 12] ПОРЯДКИ БЕСКОНЕЧНО МАЛЫХ И БЕСКОНЕЧНО БОЛЬШИХ 5 Г
определение порядка роста устанавливается и для величин бесконечно
больших.
Пример 1. Задача» решенная в конце предыдущего параграфа,
показывает» что если принять за основную бесконечно малую х, то
величина 1 — cos х будет бесконечно малой второго порядка.
Пример 2. Пусть
у = + а^х** -f- ♦ • ♦ + ***%
где постоянные а,, а9,..., ак отличны от нуля» а положительные
числа nk таковы, что л*. Тогда: 1) если
х — основная бесконечно малая» то у — бесконечно малая порядка пх\
2) если х — основная бесконечно большая, то у — бесконечно боль-
шая порядка nk. \
В заключение настоящего параграфа мы ознакомимся еще с одной
чрезвычайно удобной системой обозначений, все более распростра-
няющейся в современной математике, и которая окажет нам суще-
ственные услуги в дальнейшем. Пусть у и х — две величины, уча;
ствующие в некотором процессе, и пусть х всегда положительна
(по меньшей мере с некоторого момента данного процесса). Тогда:
1) если отношение — в данном процессе есть величина ограничен-
ная, то пишут
j=O(x);
2) если отношение ~ в данном процессе есть величина бесконечно
малая (т. е. имеет пределом нуль), то пишут
j = o(x).
Очевидно, что из у = о (х) следует у — О (х), но не обратно.
Само собой разумеется, что оба соотношения предполагают совер-
шенно определенный процесс, в котором участвуют величины х и у,
и что в другом процессе они уже, вообще говоря» не будут иметь
места.
Пример 3. Если х — бесконечно малая, то
х« = о(х),
5х+Зх’=:ОХх),
2 sin х = О (х),
1 — cos х — о (х).
Пример 4. Если х — бесконечно большая, то
х=о(х8),
6x4-3x« = O(xs).
52 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ПРЕДЕЛОВ [ГЛ, 2
Пример 5. При любом характере изменения величины х из
у = о(х) следует х-\-у^х\ обратно, из х^>0 и х-\-у~х сле-
дует у = о(х).
Пример 6. То, что величина х в данном процессе бесконечно
мала, может быть записано в виде
jf = o(l);
аналогичным образом, соотношение
1=о(х)
равносильно утверждению, что х есть в данном процессе положи-
тельная бесконечно большая величина, а соотношение
х=О(1)
— утверждению, что величина х в данном процессе ограничена; мы
видим, таким образом, что символы Ойо позволяют нам в неко-
торых случаях очень кратко записывать характер изменения той или
другой величины.
ГЛАВА 3
УТОЧНЕНИЕ И РАСШИРЕНИЕ ИДЕИ
ПРЕДЕЛЬНОГО ПЕРЕХОДА
§ 13. Математическое описание процесса
Все величины, с которыми мы имели дело в предшествующих
параграфах, мыслились участвующими в некотором определенном
процессе (явлении), и предметом нашего изучения был характер
изменения их в этом процессе. Мы говорили о различных моментах
данного процесса и различали моменты более ранние и более позд-
ние. Весь этот способ выражения нагляден, прост и удобен; он спо-
собствует созданию правильных представлений о возникновении важ-
нейших понятий математического анализа (переменная величина,
функция, предел) из наблюдения и изучения внешнего мира. Однако
в математической теории весь этот способ выражения требует
существенного уточнения, потому что лежащие в его основе поня-
тия процесса и различных его моментов не получили у нас полно-
ценного математического определения. Пользуясь этими понятиями,
мы имели в виду не какие-либо строго определенные математические
объекты, а лишь известные наглядные представления, связанные
с нашим каждодневным опытом. Между тем, для того чтобы стать
полноценным предметом математического исследования, каждый про-
цесс должен получить точное математическое описание, свободное
от понятий, не получивших четкого определения; такое описание
должно служить его абстрактно-формальной характеристикой, без
которой не может работать никакая математическая теория.
Рассматривая те реальные или абстрактно-математические про-
цессы, с которыми мы имели дело в предшествующих параграфах,
мы легко замечаем, ито эта математическая характеристика, эта фор-
мальная структура процесса 1яожет быть весьма различной для раз-
личных процессов. Есть, однако, одна черта, свойственная всем рас-
смотренным нами до сих пор процессам, и эту черту нам важно
выявить в первую очередь. Черта эта состоит в том, что различные
моменты любого процесса всегда представляются нам рядом после-
довательных значений некоторой переменной величины, изменение
которой и составляет собой сущность данного процесса и которую
54 УТОЧНЕНИЕ И РАСШИРЕНИЕ ИДЕИ ПРЕДЕЛЬНОГО ПЕРЕХОДА [ГЛ. 3
естественно называть поэтому основной переменной этого процесса.
Поясним это на примерах.
Пример 1. В примере 3 § 7 ^геометрическая прогрессия с л-м
членом процесс состоит в том, что номер п члена прогрессии
последовательно пробегает весь ряд натуральных чисел (п = 1, 2,...).
Различными «моментами» процесса мы называем различные значения
числа л, причем меньшие значения л соответствуют «более ранним»,
а ббльшие — «более поздним» моментам. Величиной, «участвующей»
в этом процессе, мы называем любую функцию от л; в частности,
такой функцией является величина ±, которую мы рассматривали
в этом примере. «Основной» переменной в этом примере служит
число л.
Пример 2. В примере 1 § 7 (расширение газа при постоянной
температуре) основной переменной служит объем v данной массы
газа; процесс состоит в том, что величина v безгранично возрастает.
Различные моменты процесса — это различные значения величины v.
Как и в предыдущем примере, меньшие значения v означают «более
ранние», а ббльшие — «более поздние» моменты. Однако в отличие
от предыдущего примера, где число л принимало только целые зна-
чения, величина v, безгранично возрастая, изменяется непрерывно,
проходя между двумя своими значениями через все промежуточные.
Величиной, «участвующей» в данном процессе, мы снова считаем
любую функцию от v; в частности, такой функцией является вели-
чина р=-^, которую мы рассматривали в примере 1 § 7.
Пример 3. Рассмотрим процесс, состоящий в безграничном
уменьшении положительного числа х; это число мы и будем счи-
тать основной переменной данного процесса. «Более ранними» мо-
ментами будут служить ббльшие, а «более поздними^ — меньшие
значения х. Величина, участвующая в данном процессе,! есть любая
функция от х, например 1 -р х -|- х*> cosx ит. д. В этом процессе
основная переменная ведет себя иначе, чем в двух рассмотренных
Выше: она не возрастает, а убывает, стремясь к нулю. В примере 4
§ 10 мы рассматривали поведение величины cosx, участвующей
В этом процессе;
Перейдем к Выводам. Мы видим,' что с Математической точки
зрения каждый Процесс должен рассматриваться как ряд последова-
тельных значений некоторой «основной» для этого процесса пере-
менной величины. Отдельные значения этой переменной представляют
собой моменты данного процесса, причем либо меньшему значению
всегда соответствует более ранний, а ббльшему значению — более
поздний момент процесса, либо наоборот (иначе говоря, основная
переменная в данном процессе либо непрестанно возрастает* либо
§14] УТОЧНЕНИЕ ПОНЯТИЯ ПРЕДЕЛА 59
непрестанно убывает). Участвующей в данном процессе величиной
мы называем любую функцию основной переменной.
Таковы общие черты всех процессов, с которыми мы до сих пор
встречались. Чем же эти процессы, с формально математической
точки зрения, могут отличаться друг от друга? Если отвлечься от
реального содержания этих процессов и говорить только об их ма-
тематической структуре, то, как мы видим, они могут различаться
между собою лишь поведением основной переменной. Именно харак-
тером изменения этой переменной определяется и описывается мате-
матическая природа процесса, которая, как мы видели, может быть
весьма различной. Кроме тех трех типов процессов, которые мы
привели выше в качестве примеров, возможно еще много других,
более сложных структур; так, например, мы можем представить себе
процессы «смешанного» типа, где основная переменная меняется то
скачкообразно (как в нашем первом примере), то непрерывно (как
в двух других примерах); однако для математического анализа рас-
смотренные нами структуры являются основными и важнейшими,
так что мы вполне можем ограничиться изучением вышеприведенных
типов процессов. Мы можем, следовательно, рассматривать всякий
процесс как ряд последовательных значений некоторой «основной»
переменной величины; эта величина либо имеет своими значениями
натуральные числа (т. е. меняется скачкообразно и непрестанно воз-
растает), либо изменяется непрерывно, проходя через промежуточные
значения; в последнем случае она может либо непрестанно возра-
стать, либо непрестанно убывать; если, например, она непрестанно
возрастает, то она может либо возрастать безгранично, либо оста-
ваться ограниченной; аналогичные возможности имеются, конечно, и
для величины непрестанно убывающей. Во всех случаях характер
изменения основной переменной полностью определяет собою мате-
матический тип процесса. Эти типы могут быть весьма разнообразны;
однако для целей матемдтического анализа, как уже было сказано
выше, вполне достаточно рассматривать те немногие простейшие
типы процессов, которые мы только что перечислили.
§ 14. Уточненйе понятия предела
В главе 2 мы условились говорить, что участвующая в некотором
процессе величина у имеет пределом постоянное число 6, если раз-
ность у — Ь есть в данном процессе величина бесконечно малая;
таким образом, понятие предела во всех случаях точно определяется
через понятие бесконечно малой величины. Но какие величины мы
называли бесконечно малыми? Разность у — Ь бесконечно мала, гово-
рили мы, если, сколь бы мало ни было положительное число я,
начинай с некоторого момента нашего процесса, всегда выполняется
неравенство — ^|<С8- Как мы уже отметили в предыдущем па-
раграфе, такая формулировка, оперирующая с понятиями процесса и
56
УТОЧНЕНИЕ И РАСШИРЕНИЕ ИДЕЙ ПРЕДЕЛЬНОГО ПЕРЕХОДА [ГЛ. 3
его моментов, не получившими точного определения, нас удовле-
творить не может. Однако мы теперь знаем, в чем* состоит точное
математическое описание процессов; поэтому, вводя вместо расплыв-
чатых, обращенных к наглядному представлению терминов «процесс»
и «моменты» соответствующие четко определенные математические
понятия, мы имеем теперь полную возможность сделать и понятие
бесконечно малой величины (а значит, и понятие предела) совер-
шенно точным. Это уточнение понятия предела, являющееся целью
настоящего параграфа, приводит, как легко предвидеть, к различным
формулировкам для процессов различного типа; мы должны будем
поэтому провести его в отдельности для каждого из основных типов
процессов, перечисленных нами в предыдущем параграфе. Следует
отметить, что наше прежнее, не вполне точное определение предела,
как раз вследствие этой своей неточности, могло быть одинаково
формулировано для процессов любого типа; именно благодаря этому
мы в главе 2 имели возможность, опираясь на это определение,
построить всю теорию пределов сразу для процессов любой матема-
тической структуры.
1. Предел последовательности. Рассмотрим процессов котором
основная переменная п последовательно пробегает ряд натуральных
чисел (/1=1, 2, ...). Величиной, участвующей в таком процессе,
будет, как мы знаем, любая функция натурального числа л, напри-
мер 2я> периметр рп правильного, вписанного в круг радиуса 1»
л-угольника, и т. д. Пусть ап — любая такая функция. В данном
процессе эта величина последовательно принимает ряд значений
#1» • • • > Ял, * . • (1)
Попытаемся теперь с полной точностью раскрыть смысл утверждения
«величина ап в данном процессе стремится к пределу а».
Мы знаем, что первоначальный смысл этого утверждения сле-
дующий: как бы мало ни было е^> 0, начиная с-некоторого момента
процесса,будет иметь место неравенство \ап— a|<^s. Hd ч^о озна-
чает «начиная с некоторого момента процесса»? Моментами нашего
процесса являются различные значения основной переменной ' л; чем
больше л, с тем более поздним моментом мы имеем дело. Поэтому
слова «начиная с некоторого момента процесса» в точности означают
«начиная с некоторого значения л0 числа л, и для всех больших его
значений». Все утверждение, точного смысла которого мы ищем,
получает, таким образом, следующую формулировку: величина ап
стремится к пределу а, если, как бы мало Ни было положитель-
ное число в, существует такое натуральное число л0, что для
любого п^п9 будет | ап — а | <^ s. Разумеется, эта формулировка
значительно сложнее нашего прежнего определения; зато она пол-
ностью свободна, как мы видим, от недостаточно четко определен-
ных терминов («процесс» и его «моменты») и содержит лишь поня-
$ 14] УТОЧНЕНИЕ ПОНЯТИЯ ПРЕДЕЛА 57
тия, смысл которых ясен с полной точностью. Поэтому так опреде-
ленное понятие предела уже вполне пригодно для построения строгой
математической теории.
В процессах рассматриваемого нами типа чаще говорят не о «функ-
ции ал», а о «последовательности чисел» (1). В случае, когда ал->а,
последовательность (1) называют сходящейся, а число а — ее
пределом. Если ап в данном процессе предела не имеет, то говорят,
что последовательность (1) расходится.
Тот факт, что основная переменная п в ходе процесса безгра-
нично возрастает, часто символически выражают записью л—>оо,
или, точнее, п —> оо; надо только иметь в виду, что в этой сим-
волике знак не означает, как обычно, стремления к какому-либо
пределу, так как безгранично возрастающая величина предела иметь
не может. Вся фраза «последовательность (1) имеет пределом число а»
(точный смысл которой теперь раскрыт нами полностью) получает
поэтому простое символическое выражение
lim ап = а,
Л-ЮО
или
ап —> а (п -> оо);
в обеих формах записи находят себе полное выражение как непо-
средственно интересующий нас факт (lim ал = а или ал->а), так и
указание на тот процесс (л->оо), в котором этот факт имеет
место.
Пример. Обозначая через ап сумму первых п членов геоме-
трической прогрессии
1111
2 » 4 > 8 ’ •••’ 2я’ ’
мы имеем:
_ 1 , 1 . । 1 _ 1 1
ап — 2 ' 4 г • • • “Г 2я — 1 2я ’
и последовательность (1) получает вид
1___L 1____L 1_______L . 1_L
1 2 ’ 2а ’ 28 ’ ’ 2я ’
Очевидно, мы имеем ап 1 (п —> оо). В самом деле, так как
|а„-1|=1 (« = 1, 2, ...),
то, как бы мало ни было 8>0, мы, выбирая число л0 столь боль-
шим, чтобы было 2^<С®> будем для любого иметь:
к— ио
•68 УТОЧНЕНИЕ И РАСШИРЕНИЕ ИДЕИ ПРЕДЕЛЬНОГО ПЕРЕХОДА [ГЛ. 3
2. Односторонний предел функции. Перейдем теперь к рассмо-
трению второго основного типа процессов — к процессам, в которых
основная переменная х изменяется непрерывно, т. е.«, проходя через
все промежуточные значения; она может либо непрестанно возрастать,
либо непрестанно убывать и при этом либо оставаться ограниченной,
либо быть бесконечно большой, т. е. безгранично возрастать по
абсолютному значению. Все эти различные случаи требуют отдель-
ного рассмотрения; однако в трактовке их имеется много общего,
что позволит нам значительно сократить изложение. Во всех слу-
чаях величина у, участвующая в данном процессе, мыслится как
произвольная функция y=f(x) основной переменной х, и нашей
задачей является раскрытие точного смысла утверждения «величина
у в данном процессе имеет пределом число />».
Остановимся сначала на том случае, когда основная переменная х
безгранично возрастает, будучи положительной (х°°) *)• Этот
случай очень близок к тому, который мы только что рассматривали;
все различие заключается в том, что здесь х, возрастая, проходит
через все промежуточные значения, тогда как там основная перемен-
ная п могла иметь своими значениями только целые числа. Как и там,
слова «начиная с некоторого момента процесса* здесь означают «на-
чиная с некоторого значения А величины х, и для всех ббльших
ее значений*. Точный смысл утверждения
lim у = Ь или у-+Ь (х->оо)
X -* оо
и здесь состоит поэтому в следующем: как бы мало ни было по-
ложительное число е, существует такое положительное число А,
что для любого х^А будет — 6|<^s.
В случае, когда основная переменная х есть отрицательная
бесконечно большая (х—> —оо), т. е., будучи отрицательной, без-
гранично возрастает по абсолютному значению, соотношение у-*Ь
получает, разумеется, совершенно аналогичное определение: соотно-
шение
lim у — Ь или у-+Ь (х->— оо)
X -+ — оо (
означает, что, как бы мало ни было е^>0, существует такое
положительное число А, что для любого х^ — А будет
|Д,_ $|<е.
Обратимся теперь к случаю, когда основная переменная х, изме-
няясь непрерывно и либо непрерывно возрастая, либо непрерывно
убывая, в то же время остается ограниченной. В главе 4 мы узнаем,
♦) Запись х—>оо или х—>-|-оо употребляется для обозначения безгра-
ничного возрастания величины х как в случае непрерывного, так и в случае
скачкообразного ее изменения; соответственный характер изменения должен
поэтому всякий раз особо оговариваться в.тексте;
§ 14] УТОЧНЕНИЕ ПОНЯТИЯ ПРЕДЕЛА 5$
что в этом случае величина х всегда безгранично приближается к
некоторому постоянному числу а, как к своему пределу. Если вели-
чина х непрестанно возрастает, то она приближается к а со стороны
меньших значений («слева»), что обычно записывают так: х-+а— 0.
Если же она непрестанно убывает, то она всегда остается больше
числа а, приближаясь к нему со стороны ббльших значений
(«справа»), что записывают в виде х->а-|-0. Остановимся сначала
на первом случае (х<^а, х->а— 0). Слова «начиная с некоторого
момента процесса» здесь означают, очевидно, «начиная с некоторого
значения а — 8<^а величины х, и для всех его значений, более
близких к а» (и, конечно, меньших чем а); короче: «для всех зна-
чений х, удовлетворяющих неравенствам а — 8^х<^а». Точный
смысл утверждения
Нт у = Ь или у-+Ь (х->а— 0)
—О
состоит поэтому в следующем: как бы мало ни было в^>0, су-
ществует такое положительное число 8, что для любого значе-
ния х, удовлетворяющего неравенствам а — 8^х<^а, будет
|J —^1<е-
Совершенно аналогично мы устанавливаем, что точный смысл
утверждения
Нт у = Ь или y^+b (x-*>a-J- 0)
получает - ту же самую формулировку, в которой надо только за-
менить неравенства а —8^х<^а неравенствами
Таким образом, мы ' установили точные формулировки понятия
предела для процессов всех основных типов, употребительных в
математическом анализе. Отметим еще раз, что все рассуждения и
результаты главы 2, проведенные там единообразно для процессов
любого типа, остаются, разумеется, в полной силе и для наших но-
вых, более точных формулировок предельного перехода, так как
эти новые формулировки, ни в чем не противореча нашему ста-
рому определению, во всех случаях укладываются в его рамки,
давая лишь его уточненные спецификации для различных возмож-
ных случаев.
Сделаем еще одно дополнительное замечание. Пусть участвую-
щая в некотором процессе величина у не стремится ни к какому
пределу, а безгранично возрастает. Если, например, речь идет о
процессе типа х->а — 0, то йы, естественно, пишем
(*->«— 0).
Какой точный смысл целесообразно придать этой записи? В свете
всего изложенного мы отвечаем на этот вопрос без всяких затруд-
нений: как бы велико ни было А^>0, найдется такое 8^>0>
60 УТОЧНЕНИЕ И РАСШИРЕНИЕ ИДЕИ ПРЕДЕЛЬНОГО ПЕРЕХОДА [ГЛ. 3
что для всех значений х, удовлетворяющих, неравенствам
а —будет У^>А.
Руководствуясь теми же образцами, читатель легко установит
самостоятельно тот точный смысл, который надлежит придавать
соотношениям и у-+— оо в процессах любого из рас-
смотренных нами типов. Это будет для него очень хорошим упра-
жнением *).
§ 15. Расширение идеи предельного перехода
Те два типа предельного перехода (предел последовательности
и односторонний предел функции), которые мы во всей подробности
рассмотрели в предшествующем параграфе, являются, как мы уже
отмечали, основоположными для математического анализа, так как
все другие, более сложные типы, которые мы встретим в дальней-
шем, нам удастся свести к этим двум простейшим. Однако, для
того чтобы такая редукция стала возможной во всех случаях, мы
должны теперь несколько расширить самое понятие величины,
стремящейся к пределу в данном процессе.
Мы начнем с рассмотрения простого примера, который покажет
нам как необходимость, так и естественное направление такого
расширения. Пусть интересующий нас процесс состоит в безгранич-
ном уменьшении периметра р («основная* переменная!) некоторого
прямоугольника, причем форма прямоугольника может в ходе про-
цесса изменяться произвольным образом. Так как в прямоугольнике
р
периметра р каждая сторона меньше, чем , то площадь $ прямо-
д’
угольника, периметр которого равен р, всегда меньше, чем .
«2
А так как при р —> 0 мы, очевидно, имеем и 0, то площадь 5
в нашем процессе (т. е. при р -> -р 0) есть величина бесконечно
малая, и мы можем написать
s -> 0 (р-+ 4- 0).
Точный смысл этого соотношения определяется обычным образом:
сколь бы мало ни было е^>0, существует такое Ъ>Ъ,что пло-
щадь любого прямоугольника, периметр которого меньше, чем 8,
будет меньше, чем е.
Однако этот пример существенно отличается от всех, рассмо-
тренных нами до сих пор. Отличие это заключается в том, что при
данном периметре р площадь s прямоугольника может принимать
бесчисленное множество различных значений, так что а не есть
функция от р. Так как мы приняли р в качестве основной вели-
*) См. задачи 349—352, отд. I указанного в предисловии задачника
Б. П. Демидовича.
$15] РАСШИРЕНИЙ ИДЕИ ПРЕДЕЛЬНОГО ПЕРЕХОДА, / 6>
чины нашего процесса, и так как величина, участвующая в данном
процессе, до сих пор понималась нами как функция основной пере*
менной, то, строго следуя нашим определениям, мы не можем счи-
тать а величиной, участвующей в нашем процессе, и тем более не
можем говорить о ее стремлении к какому-либо пределу. Это —
величина, значение которой в каждый данный момент процесса
(т, е. при каждом значении величины р) остается неопределенным,
Тем не менее остается верным тот .факт, что если периметр р
прямоугольника выбрать достаточно малым, то площадь а этого
прямоугольника, какое бы из бесчисленного множества возмож-
ных для нее значений она ни получила, будет сколь угодно ма-
лой. Говоря точнее: как бы мало ни было e>Q, найдется такое
8^>0, что для любого прямоугольника с периметром р<^$ мы
будем иметь з<^е, где а — любое возможное значение площади
прямоугольника с периметром р.
Таким образом, обычно понимаемый точный смысл соотноше-
ния
^0 (/>->Н-0)
сохраняет силу в нашем примере, хотя а и не есть функция от р.
К пределам подобного рода поэтому могут быть применены все
положения общей теории, изложенной в главе 2. Мы должны
только расширить наше математическое истолкование «величины,
участвующей в данном процессе», й определить понятие стремле-
ний к пределу для этого расширенного класса величин. Рассмотрен-
ный Ками пример с полной ясностью показывает, как это должно
быть сделано. Прежде всего, величиной, участвующей в данном
процессе, мы будем теперь называть всякую величину у, в отно-
шении Которой известно, какие значения она может прини-
мать при любом данном значении основной переменной х (т. е.
в любой данный момент процесса); очевидно, что наше прежнее
соглашение считать всегда у функцией от х есть частный случай
принимаемого нами теперь более широкого соглашения; мы при-
ходим к этому частному случаю, допуская, что множество тех зна-
чений, которые величина у может принимать при данном значении
основной переменной х, всегда состоит из одного-едйнственного
числа. Пусть теперь для определенности наш процесс описывается
соотношением Тогда точный смысл утверждения, что в
данцом процессе limj = 6 (Где у есть участвующая в этом про-
цессе величина в смысле нашего расширенного понимания), состоит
в следующем: как бы мало ни было е О, найдется такое 8 О,
что при любом значении х, заключенном между а и а-|- 8, и при
любом значении у, возможном при данном значении х, мы будем
иметь:
|j —^|<е.
Й2 УТОЧНЕНИЕ ЯГ РАСШИРЕНИЕ ИДЕИ ПРЕДЕЛЬНОГО ПЕРЕХОДА [ГЛ. 3
Если это требование выполнено, то мы пишем
у -> Ь (х -> а 4- О).
Двусторонний предел функции. Мы остановимся теперь на
важном примере применения только что введенного нами расшире-
ния идеи предельного перехода. Этот пример показывает, что наше
расширенное понимание оказывается полезным уже на первых ша-
гах математического анализа.
Пусть величина y=f(x) есть функция некоторой другой вели-
чины х и пусть значение величины у становится сколь угодно
близким к числу i, если значение величины х достаточно близко
к некоторому другому числу а (и в то же время отлично от а).
Мы теперь уже хорошо знаем точный смысл утверждений подоб-
ного рода: как бы мало ни было е^>0, существует такое 8^>0,
что всякий раз, как 0<|х— а| ^8, мы будем иметь
Символически,
У~*Ь (|х —a|-*-f-O). (1)
Согласно принятой нами системе обозначений эта запись означает,
что величина | х — а | есть основная переменная рассматриваемого
процесса, и что величина у имеет в этом процессе пределом
число Ь. Но каждому данному значению — а| = а основной пе-
ременной 1х — а| соответствуют два различных значения величины
х9 x=a-f-a и х=а— а, а значит, и два, вообще годоря, раз-
личных значения величины у, y=f(a-j-a) и y=f(a — а). Таким
образом, величина у может принимать при любом значении а основ-
ной переменной два различных значения и, следовательно, не есть
функция этой основной переменной. Наше расширенное понимание
предельного перехода позволяет нам, тем не менее, напирать соот-
ношение (1) и утверждать, что у имеет пределом число b При
|х— а|-*4-0.
Впрочем, процесс |х — чаще записывай? в виде
х-*а, так что вместо соотношения (1) пишут -
*(*-**)• (2)
Запись х->а, в отличие от прежних. а — 0 и х->а-|-0,
имеет целью показать, что в данном случае величина х прибли-
жается к числу а, не . обязательно непрестанно возрастая или не-
престанно убывая: она может менять направление своего изменения
и, в частности, становиться то больше, тр меньше, чем а. Поэтому
описанный нами предел величины у при х-+а обычно называют
двусторонним пределом функций.
Напомним еще раз, что точный смысл предельного соотноше-
ния (2) состоит в следующем: как бы мало ни было е>0, суще-
ствует такое 8>0, что при любом значении х, для которого
0<|х— а|^8, мы имеем
§г 16] РАСШИРЕНИЕ ИДЕИ ПРЕДЕЛЬНОГО ПЕРЕХОДА
63
Сделаем еще следующее важное замечание: для того чтобы
число Ь было двусторонним пределом величины у при х-^а* необхо-
димо и достаточно, чтобы оба односторонних предела lim у
s ж->а+О
и lim у существовали и равнялись Ь. В самом деле, пусть
О
е^>0 задано произвольно. Если
lim у=Ь,
х-*а
то при достаточно малом 8 О из 0 < | х — а | sC 8 будет следо-
вать Но ёслй то и подавно |х —
8, а значит, и | у *— Ъ | < е. Это показывает, что у-*Ь (х -> а 0);
подобным же образом мы докажем, что у-+Ь (х->а — 0). Пусть
теперь, обратно, известно, что у-^Ь при х->а-|-0 и при
х-*а—0. Тогда, сколь бы мало ни было е^>0, найдется такое 81э
что |.у —£|<е ПРИ и такое 8в, .что \у —
<^е при а — если обозначить через 8 наименьшее из
чисел 8, и 82, то при а — 8^х ^а-}-Ъ(х^а) мы будем иметь
|j — ^|<е; это показывает, что у^Ь (х->а), что и надо было
установить.
МЫ.видим, таким образом, что процесс двустороннего прибли-
жения переменной х к пределу а целиком сводится к процессам
одностороннего приближения и х->а — 0. Это:—пер-
вый пример, иллюстрирующий высказанное нами в § 14 общее за-
мечаййё/ согласно которому все рассматриваемые в анализе типы
процессов taoryr бЫть сведены к изученным нами там двум основ-
ным типам.
ГЛАВА 4
ВЕЩЕСТВЕННЫЕ ЧИСЛА
§ 16. Необходимость создания общей теории
вещественных чисел
Для всякой переменной величины характерно то, что с течением
данного процесса она принимает различные значения, каждое такое
значение есть некоторое число. Если, например, температура воз-
духа повышается от 5 до 10° С, то .мы, естественно, считаем, что
в течение этого процесса она постепенно проходит через все числа
от 5 до 10. Но что значит* «все числа»? Какие числа мы при этом
имеем в виду? Ясно, что не только целые: ведь будет, например,
момент, когда эта температура равна 6,5° С. Может быть, можно
сказать «все целые и все дробные числа»?
Совокупность всех целых и всех дробных чисел (йоложитель-
ных, отрицательных и числа нуль) образует так называемое мно-
жество рациональных чисел; изучением этих чисел и действий
над ними подробно занимаются арифметика и алгебра. Вопрос о
том, достаточно ли этих чисел для измерения всех величин, с ко-
торыми мы можем встретиться при изучении окружающего мира,
имеет очень большое значение и для математики, и для точного
естествознания. Уже в древней Греции (повидимому, в пифагорей-
ской школе) было сделано замечательное открытие, что! очень про-
стые геометрические построения легко и с необходимостью приво-
дят к величинам, которые не могут быть точно измерены ,с по-
мощью рациональных чисел. Простейший случай такого рода хорошо
известен: если каждый из катетов прямоугольного треугольника
равен единице длины, то гипотенуза этого треугольника по теореме
Пифагора должна иметь длину, квадрат которой равен 2. Но легко
доказать, что рационального числа, квадрат которого равнялся бы 2,
не существует*). Таким образом, если мы хотим ограничиться ра-
♦) Если бы мы имели =2, то мы нашли бы ра = 2^а; пусть р=»
= 2rp't q = 2ty', где р' и q' — уже нечетные числа. Тогда
р« = 2arp'a, 2q* = 28S+1tf'a,
§ 16] НЕОБХОДИМОСТЬ СОЗДАНИЯ ОБЩЕЙ ТЕОРИИ КОНТИНУУМА 65
циональными числами, то мы вынуждены признать, что гипотенуза
описанного нами треугольника не имеет длины; само собою разу-
меется, что на такой вывод мы пойти не можем, потому что ника-
кая измерительная геометрия не может быть построена на такой
основе; поэтому мы вынуждены признать, что свойства самой внеш-
ней действительности не позволяют нам ограничиться множеством
рациональных чисел, а заставляют добавить к ним числа нового
рода, которые мы называем иррациональными. В качестве
первого такого числа мы вводим — число, квадрат которого по
определению равен числу 2. Однако провозгласить введение нового
числа — дело нетрудное, но само по себе еще ничего не дающее;
если мы хотим, чтобы введенное нами новое число действительно
стало полноправным членом семейства чисел, мы должны прежде
всего определить его место в этом семействе, т. е. определить,
какие рациональные числа меньше, а какие — больше, чем ]/2.
Далее мы должны определить все действия над этим новым чйслом
(ведь мы совершенно не знаем, например, что следует понимать
под такими выражениями, как |^2-|- 1, 3 у/2, и доказать,
что эти действия подчиняются тем же правилам, что и действия
над рациональными числами (например, что др! -|- 1 = 1 |/2).
Все это может быть проделано, хотя и требует затраты довольно
значительного труда; мало того, поставленная нами цель доста-
точно важна, чтобы оправдать собою эти трудовые усилия. Но до-
пустим, что все это нами сделано. В следующий раз другая задача
геометрии или физики поставит нас перед необходимостью ввести
новое число, квадрат которого равен числу 3 или 5 и т. д. Про-
делывать при этом каждый раз всю ту цепь рассуждений, с помощью
которой мы сделали у/ 2 полноправным числом, — задача уже явно
неразрешимая. Но пусть нам удалось найти путь, позволяющий
единым рассуждением полноправно ввести в числовую семью квад-
ратные корни из всех натуральных чисел (это, несомненно, воз-
можно); интересы приложений этим еще далеко не будут исчер-
паны. Если мы хотим найти ребро кубаг объем которого равен
2 лг3, то мы должны ввести число у^2. И если даже мы введем в
семейство чисел корни любой степени из любых рациональных чи-
сел, то и этого будет недостаточно. С одной стороны, число, ко-
торое мы ищем, часто определяется как корень некоторого данного
уравнения; практические соображения говорят нам, что такой ко-
рень обязательно должен существовать; теория же позволяет убе-
диться, что среди всех построенных нами рациональных и иррацио-
нальных чисел такого корня быть не может; и нам приходится
и равенство р2 = 2^2 приводит к противоречию, так как левая часть его со-
держит двойку в четной, а правая — в нечетной степени.
б А» Я. Хгшчиа
66
ВЕЩЕСТВЕННЫЕ ЧИСЛА
[ГЛ. 4
вводить новое число, определив его прямо как корень нашего ура-
внения, и проделывать для него все то, что мы перечислили выше
по поводу числа С другой стороны, к трудностям такого же
рода непосредственно приводят и самые элементарные задачи гео-
метрии. Очень поучительна в этом отношении задача определения
площади круга радиуса 1. Известно, что мы определяем эту пло-
щадь как предел площадей вписанных (или описанных) правильных
многоугольников, при безграничном увеличении числа сторон этих
многоугольников. Наше наглядное представление и наши практиче-
ские нужды заставляют нас считать существование этого предела
несомненным; в самом деле, можем ли мы примириться с тем, что
такая простая фигура, как круг, вовсе не имеет никакой опреде-
ленной площади? И какую пользу может принести геометрия, ко-
торая не способна измерить площадь такой каждодневно встречаю-
щейся фигуры, как круг? А между тем современная математика не-
опровержимо доказывает, что среди всех чисел, о которых мы го-
ворили до сих пор, включая и корни всех алгебраических уравне-
ний, такого предела не существует. И у нас нет другого пути, как
создать для измерения площади нашего круга совершенно новое
число, и затем, снова проделывая всю уже несколько раз упомяну-
тую цепь рассуждений, ввести это число в качестве полноправного
члена в наше уже очень расширенное числовое семейство. Это но-
вое число есть не что иное, как хорошо известное число w.
Этих примеров совершенно достаточно, чтобы понять теорети-
ческую антинаучность и практическую неосуществимость такого
пути, когда мы по поводу каждой новой задачи, для решения кото-
рой уже имеющийся запас чисел оказывается недостаточным, вводим
новые числа, находим их место в ряду уже имевшихся чисел, опре-
деляем и исследуем действия над ними, одним словом — проделы*
ваем все необходимое для того, чтобы действительно сделать их
полноправными числами. С полной убедительностью выясняется
необходимость создания общей теории иррациональных
чис-ел; необходимо установить единый общий принципI порожде-
ния иррациональных чисел, частными случаями которого! были бы
все рассмотренные нами до сих пор, который охватывал бы собой
все исторически известные примеры такого рода и вместе1 с тем
нес бы с собой известные гарантии того, что введения каких-либо
новых иррациональных чисел нам уже не понадобится. Для чисел,
порождаемых этим общим приемом, необходимо затем в общей
форме провести все рассуждения, позволяющие в дальнейшем опе-
рировать с ними так же, как в элементах арифметики и алгеб-
ры оперируют с рациональными числами. Только такая постановка
задачи знаменует собой научный подход к интересующему нас
вопросу.
Вся эта работа составляет собой, конечно, задачу не математи-
ческого анализа — учения об изменении величин, — а теории чисел;
§17] ПОСТРОЕНИЕ КОНТИНУУМА 67
однако пока эта задача не решена, математический анализ не может
получить твердой логической базы; в самом деле, как мы уже го-
ворили в начале настоящего параграфа, значениями всякой перемен-
ной величины являются числа; мы не можем поэтому даже присту-
пить к изучению переменных величин, не узнав сначала, каким за-
пасом чисел располагает современная математика и каковы свойства
этого числового множества. Краткий очерк современной теории
этого множества чисел и будет изложен в последующих парагра-
фах настоящей главы.
§ 17. Построение континуума
1. Когда мы обычным способом приближенно вычисляем ^2, мы
получаем для этого числа последовательно приближенные значения
ав=1; 01 = 1,4; а2=1,41; а3=1,414;...
Каждое из этих значений — рациональное число (конечная десятичная
дробь), и каждое — больше предыдущего (или в крайнем случае
равно ему). Квадраты этих чисел стремятся к числу 2 *):
л 0л->2 (л->оо).
Но сами числа ап ни к какому рациональному пределу стремиться
не могут: если бы существовал такой предел г, то из 0л->г вы-
текало бы, как мы знаем, а так как aj~>2, то г2 = 2; но
это означало бы, что существует рациональное число г, квадрат
которого равен 2, что, как мы знаем, неверно.
Таким образом, мы стоим перед последовательностью
0Q, 0j, 0$, • • • , 0Я, ... (1)
хорошо известных нам чисел; эта последовательность — возрастаю-
щая, т. е. всегда an^^an} вместе с тем эта последовательность
не имеет рационального предела. Когда мы вводим новое (иррацио-
нальное) число }/2, квадрат которого по определению равен 2, то
мы как бы заполняем имевший место в области рациональных чисел
пробел: наше повое число призвано играть роль не существовавшего
в множестве рациональных чисел предела возрастающей последова-
тельности (1).
*) В самом деле, каждое из чисел ап таково, что если взять в нем по-
следний десятичный знак на одну единицу больше, то мы получим уже число,
квадрат которого > 2; таким образом,
а* < 2 < [ап -|- j ,
°ТКуда / 1 \i 2а , 1 V
0<2-в> = io^+(ios) -° («-«>)•
6»
68
ВЕЩЕСТВЕННЫЕ ЧИСЛА
[гл. 4
Положение, создающееся при введении иррационального числа тс,
очень похоже на то, которое мы только что описали. Пусть пло-
щадь правильного л-угольника, вписанного в круг радиуса 1, равна sn;
тогда числа
^8» $4» Sg, • • • , •• • (2)
образуют возрастающую последовательность, и число я определяют
в геометрии как предел этой последовательности. Здесь дело не-
сколько осложняется тем, что площади sn выражаются, вообще го-
воря, не рациональными, а иррациональными числами; однако эти
числа принадлежат к числу простейших иррациональных, легко вы-
ражаемых через корни из натуральных чисел; мы можем поэтому
считать площади sn хорошо известными нам числами. И вот оказы-
вается, что последовательность (2) не имеет предела не только среди
рациональных чисел, но даже и среди того более широкого класса
чисел, которому принадлежат площади sn. Снова вводя наше новое
число я, мы как бы заполняем некоторый пробел в совокупности
всех известных нам до этих пор чисел, приписывая этому числу роль
предела возрастающей последовательности (2) — предела, которого
заведомо не существует среди прежде известных нам чисел.
Пусть нам теперь задана произвольная возрастающая последова-
тельность
rt, .... гп, ... (гя+1 гп) (3),
рациональных чисел. Прежде всего мы должны различать два слу-
чая. Либо с ростом п число гп возрастает безгранично, либо суще-
ствует такое положительное число С, что для любого п мы имеем
гп<^С. В первом случае величина гп есть бесконечно большая при
п -► оо и, значит, ни к какому пределу стремиться не может. Поэтому
мы сосредоточим наше внимание на втором случае, причем будем
помнить, что никакими другими числами, кроме рациональных, мы
в данный момент не располагаем. В рассматриваемом нами случае
последовательность (3) ограничена* может случиться, что она имеет
рациональный предел г; так, последовательность
г, = 1 р г2=1 у,..., гл=1
— возрастающая, ограниченная и имеет пределом число 1:
г„=1 —(л->оо).
Но может случиться и так, что ограниченная возрастающая по-
следовательность не имеет никакого рационального предела; так,
последовательность (1) приближенных значений числа у/2, очевидно,
возрастающая и ограниченная (все ая<^2) ив то же время, как
мы видели, рационального предела не имеет.
§ 17]
ПОСТРОЕНИЕ КОНТИНУУМА
69
Условимся теперь (подобно тому как мы это сделали при вве-
дении иррационального числа 2) всякий раз, когда мы имеем перед
собою ограниченную возрастающую последовательность (3) рацио-
нальных чисел, у которой нет рационального предела, приписы-
вать ей в качестве предела некоторое новое, иррациональное число *).
Этим мы и устанавливаем некоторый общий принцип порожде-
ния иррациональных чисел. Принявши это соглашение, мы тем самым
сразу определяем всю совокупность иррациональных чисел. Мы уви-
дим дальше, что определенная таким образом совокупность действи-
тельно обладает некоторой законченностью, и никаких иных новых
чисел, кроме определяемых нашим соглашением, мы уже в дальней-
шем вводить не будем.
/ 1 \Л
2. Пример. Положим ап=[ 1 -|-----) (л = 1, 2,...), так что
( 9 П 9 64 \ п
вцсе числа ап рациональны (at = 2, а2 = -^, а3 = ^ и т. д. I . По-
кажем, что последовательность чисел ап — возрастающая и ограни-
ченная сверху. По формуле бинома мы имеем:
Аналогично,
/ 1 \n+I
«п+1 = —
»+1
k — 1
«+1
(5)
Сравнивая между собою правые части формул (4) и (5), мы за-
мечаем, что в сумме формулы (5) каждый член больше, чем соот-
ветствующий член суммы в формуле (4), так как при замене п на
л-|-1 каждая круглая скобка формулы (4), очевидно, увеличивается;
кроме того, в формуле (5) добавляется еще член, соответствующий
k — n-\-1, которого нет в формуле (4). Поэтому
«»+!>«« (Я=1, 2, ...),
*) В конце настоящего параграфа будет показано, что это число действие
тельно удовлетворяет определению понятия предела»
70
ВЕЩЕСТВЕННЫЕ ЧИСЛА
[гл. 4
т. е. последовательность чисел ап — возрастающая. Далее, из фор-
мулы (4) следует при любом п
а так как при очевидно, то
п п оо
ап^1 + 2 2^!=1+2 2 12 ^=3;
Л = 1 fe«=l k=l
это показывает, что последовательность чисел ап ограничена сверху.
В силу принятого нами принципа порождения мы должны поэтому
допустить, что эта последовательность имеет (рациональный или
иррациональный) предел
lim ап = г.
П -♦ оо
Дальнейший анализ, которого мы здесь не можем воспроизвести,
показывает, что число е иррационально *). Это число е есть, как мы
увидим дальше, наряду с числом тс одно из важнейших чисел мате-
матического анализа; мы будем встречаться с ним во многих разде-
лах нашего курса. Начальные десятичные знаки числа е таковы:
е = 2,71828...
Само собою разумеется, что наше соглашение является лишь
первым шагом в деле построения общей теории иррациональных
чисел. Все рациональные и все вводимые нашим принципом поро-
ждения иррациональные числа называются вещественными
числами. Множество всех вещественных чисел называют контину-
умом. Этот континуум и составляет собой совокупность тех «зна-
чений:», какие может принимать «непрерывно» изменяющаяся вели-
чина. Основные задачи теории континуума рисуются следующим об-
разом: 1) «упорядочить» множество вещественных чисел, т. е. опре-
делить, при каких условиях из двух вещественных чисел первое
больше второго, равно ему или меньше его; 2) определить все ал-
гебраические действия над любыми вещественными числами и 3) уста-
новить законы этих действий. Все эти задачи современная теория
чисел решает вполне удовлетворительно—все действия в нашей
расширенной области подчиняются в точности тем же законам, что
и в области рациональных чисел. Более того, возможности этих
действий здесь становятся шире: в области вещественных чисел мы
*) To-есть что последовательность чисел ап не имеет рационального
предела.
§ 17] построение континуума 71
можем, например, извлечь корень любой натуральной степени из
любого числа (за исключением корней четной степени из отрица-
тельных чисел, представляющих собой уже не вещественные, а мни-
мые числа, которые мы здесь полностью оставляем в стороне).
В курсе математического анализа мы не можем уделить места пол-
ному развитию этой теории, а должны принять ее выводы в каче-
стве готовой базы для наших дальнейших исследований. Поэтому мы
ограничимся лишь несколькими краткими замечаниями по этому
вопросу. Читатель, не заинтересованный в детальном обосновании
теории континуума, может пропустить пункты 3, 4 и 5 настоящего
параграфа и перейти прямо к пункту 6.
3. Пусть мы имеем две возрастающие и ограниченные последо-
вательности рациональных чисел
rU rt, ... , гп, ... , (г)
sl> ••• > sn> ($)
Каждая из них порождает, как мы знаем, некоторое вещественное
число, которое может быть как рациональным, так и иррациональ-
ным. Пусть эти числа будут а [для последовательности (г)] и £
[для последовательности ($)]. Мы должны решить вопрос о том,
какое из трех возможных соотношений а<^р, а^>р, а = р имеет
место.
Условимся говорить, что последовательность ($) мажорирует
(превышает) последовательность (г), если для каждого числа гп по-
следовательности (г) найдется такое число sm последовательности ($),
что sm^rn (смысл этого неравенства ясен, так как числа гп и sm
рациональны). Мы должны различать четыре случая:
1) ($) мажорирует (г) и (г) мажорирует (5);
2) ($) мажорирует (г), но (г) не мажорирует ($);
3) (г) мажорирует ($), но ($) не мажорирует (г);
4) (s) не мажорирует (г) и (г) не мажорирует ($),
Но легко видеть, что случай 4) невозможен. В самом деле, есЛН
($) не мажорирует (г), то найдется такое гп, что при любом т мы
будем иметь но тогда, очевидно, (г) мажорирует ($). Таким
образом, нам остается рассмотреть лишь три первых случая. В слу-
чае 1) мы полагаем а = р, в случае 2) полагаем а<^р и в случае
3) полагаем Этими соглашениями однозначно определяется,
какое из трех соотношений имеет место для любой пары веществен^
ных чисел. Легко убедиться, что в случае, когда оба числа а и р
рациональны, принятые нами определения равенства и неравенства
совпадают с обычными, как оно, разумеется, и должно обязатель-
но быть.
Далее, необходимо убедиться, что принятые нами определения
равенства и неравенства вещественных чисел обладают всеми нуж-
ными свойствами, известными для чисел рациональных. Рассмотрим,
72
ВЕЩЕСТВЕННЫЕ ЧИСЛА
[гл. 4
например, свойство транзитивности, состоящее в том, что из
и следует а^у. Для рациональных чисел оно хорошо
известно, но для любых вещественных чисел его необходимо дока-
зать, опираясь на установленные нами определения равенства и не-
равенства. Сделать это очень легко: надо только сперва установить
транзитивность мажорирования, т. е. следующее правило: если ($)
мажорирует (г), а (/) мажорирует ($), то (/) мажорирует (г).
4. После- того как установлены все необходимые свойства соот-
ношений равенства и неравенства, теория континуума должна пе-
рейти к определению действий над вещественными числами. Как
определить, например, сумму а-|-р двух вещественных чисел?
Пусть а определяется последовательностью (г), а р— последователь-
ностью ($); тогда
+ ••• > Гп~Н/1> ••• > (О
очевидно, есть возрастающая и ограниченная последовательность
рациональных чисел; порождаемое ею вещественное число у мы есте-
ственным образом и называем суммой а-|-? чисел аир. Очень
легко убедиться, что в случае, когда числа! а и р рациональны, это
определение суммы совпадает с обычным. Столь же легко показать,
что при установленном определении сложения сохраняются все пра-
вила этого действия, известные для рациональных чисел; так, напри-
мер, переместительность сложения (т. е. правило <х —р = р<х)
вытекает непосредственно из его определения, так как, меняя местами
последовательности (г) и ($), мы, очевидно, оставляем неизменной
последовательность (/).
Аналогичным образом определяются и другие действия над ве-
щественными числами и доказываются свойства этих действий, изве-
стные для случая чисел рациональных. Мы не будем останавливаться
на вычитании, умножении и делении вещественных чисел, а также
на возведении их в целую положительную степень и извлечении из
них корня целой положительной степени. Остановимся еще немного
на определении выражения а*, где а^>0, ах— любое вещественное
число (определение показательной функции). Пусть для определен-
ности а^> 1; тогда для х рациональных ах может считаться опре-
деленным и есть возрастающая функция от х; в самом деле, если
г = £- и f=-------рациональные числа и если г<^г” (р<^р')> то
и потому
( 1\р ( L\pt
аг=\ач) <^\ач = аг.
Пусть теперь вещественное число а определяется возрастающей
и ограниченной последовательностью (г) рациональных чисел. Тогда
последовательность
arS д'*2, ... , дгл, • • • >
§ 17]
ПОСТРОЕНИЕ КОНТИНУУМА
73
очевидно, также ограниченная и по только что доказанному — воз-
растающая. Следовательно, она определяет собой некоторое веще-
ственное число, которое мы и называем, естественно, аа. Этим путем
показательная функция а* определяется для любого вещественного х;
попутно мы, очевидно, устанавливаем и то, что эта функция — воз-
растающая (при а^>1, и убывающая при а<4). Аналогичным об-
разом определяется и логарифмическая функция.
Из этих определений легко вытекает, далее, что известные для
случая рациональных значений аргумента свойства этих функций*
сохраняют силу и для любых вещественных его значений; так, мы
имеем во всех случаях:
lge(xv) = lgax + lgav,
И т. п.
Останавливаться в нашем курсе более подробно на всех этих
вопросах мы возможности не имеем.
5. Есть, однако, еще один пункт, требующий разъяснения. Фор-
мулируя выще наш общий принцип порождения вещественных чисел,
мы всегда указывали, что число а,
ниченной последовательностью
порождаемое возрастающей огра-
П, г2, ... , гя, ...
(Г)
рациональных чисел, мыслится нами как предел этой последователь-
ности. Чтобы из простого образного описания сделать это указание
действенным орудием исследования, мы, очевидно, должны доказать
его, что после построения арифметики вещественных чисел стано-
вится. принципиально возможным (и необходимым). Доказать, оче-
видно, надо, что, сколь бы мало ни было е^>0, для всех доста-
точно больших п мы будем иметь:
* — rn
8.
В первую очередь докажем следующее вспомогательное предло-
жение о последовательностях рациональных чисел.
Лемма. Пусть (г) — возрастающая ограниченная последова-
тельность рациональных чисел. Тогда, сколь бы мало ни было
8>0, существует такой индекс nQ, что при m^>nQ, п^>п9 мы
всегда имеем гп — гт<^е.
Доказательство. Пусть утверждение леммы неверно, т. е.
существует такое 8^>0, что неравенство
гп — гт^
имеет место при сколь угодно больших пит. Тогда, очевидно,
сколь бы велико ни было натуральное число k> существует k пар
74
ВЕЩЕСТВЕННЫЕ ЧИСЛА
[гл. 4
индексов таких, что
<Сni<Сщ<С<с •••
и
гп — Гт1 6 с1 1
но в таком случае
так как первая, третья, пятая и т. д. скобки не меньше, чем е, а
вторая, четвертая, и т. д. неотрицательны. Отсюда
Так как k сколь угодно велико, то среди членов последователь-
ности (г) будут сколь угодно большие, что противоречит ее ограни-
ченности. Этим наша лемма доказана.
Пусть теперь е — любое положительное рациональное число; так
как в силу доказанной леммы при достаточно большом k и любом п
мы имеем гп — то последовательность
е, 6, ... , е, ... (е)
мажорирует последовательность
G— rk> Ъ — гк, ... , rn — rk, ... ,
порождающую, очевидно, вещественное число а — rk; а так как по-
следовательность (е) порождает число е, то по определению нера-
венства вещественных чисел мы имеем, если k достаточно велико:
a —rfe<s.
Этим требуемое доказано для рационального е; но так;как для
любого вещественного е О найдется рациональное е' 0, Меньшее,
чем 8, то требуемое тем самым установлено и для любого веще-
ственного е 0. 1
Заметим еще, что принятый нами общий принцип порождения
иррациональных чисел отнюдь не является единственным возможным;
во второй половине прошлого столетия, когда настойчиво назрела
необходимость построения общей теории вещественных чисел, было
почти одновременно создано несколько таких теорий, причем каждая
из них имела свой принцип порождения; позднее выяснилось, что
все эти теории в основном логически равносильны между собой,
так что выбор между ними должен диктоваться не столько прин-
ципиальными соображениями, сколько вопросами удобства изложения
и применения.
§ 17] ПОСТРОЕНИЕ КОНТИНУУМА 75
6. То расширение числового множества, которое нами сейчас
предпринято, является, как известно, далеко не первым в истории
развития понятия числа. Все мы, обучаясь арифметике, знакомимся
сначала с натуральными числами, потом присоединяем к ним число
нуль, отрицательные числа и дробные числа. Таким образом, в ре-
зультате ряда последовательных расширений создается множество
рациональных чисел. Наш принцип порождения присоединяет к нему
сразу все иррациональные числа и тем самым расширяет его до
множества всех вещественных чисел — до континуума. Хорошо из-
вестно, что все прежние расширения в значительной степени стиму-
лировались желанием сделать неограниченно выполнимым какое-либо
действие, которое в старой области не всегда могло быть выпол-
нено. Так, введение нуля и отрицательных целых чисел позволило
сделать неограниченно выполнимым действие вычитания; введение
дробей сделало то же самое по отношению к делению (за исклю-
чением деления на нуль, которое, кстати сказать, и в нашей новой
области вещественных чисел остается невозможным); первые попытки
введения иррациональных чисел были продиктованы стремлением
сделать всегда выполнимым извлечение корней. Эта тенденция —
добиваться возможно широкой выполнимости таких действий, кото-
рые в данной числовой области оказываются не всегда выполни-
мыми,— обусловлена в математике, разумеется, не абстрактным вле-
чением к формальной законченности (как это иногда думают), а
настоятельными запросами практики; лучше всего нас убеждают
в этом примеры, подобные приведенным в начале этой главы: именно
практическая деятельность наша не может удовлетвориться таким
запасом чисел, где длина диагонали квадрата со стороной 1 или
площадь круга радиуса 1 не находят себе числового выражения.
Внимательно вглядываясь в наш принцип порождения, мы легко
убеждаемся, что и наше новое расширение обусловлено стремлением
сделать всегда выполнимой некоторую операцию, далеко не всегда
выполнимую в области рациональных чи^ел. Эта операция заклю-
чается в формировании предела ограниченной возрастающей после-
довательности чисел. Эта операция — уже не арифметической при-
роды. Для арифметических операций характерно в первую очередь
то, что они всегда производятся над конечной группой чисел; наша
же операция требует задания бесконечной последовательности чисел
и с помощью всех этих чисел образует новое число, называемое
пределом данной последовательности.. Это уже аналитическая опе-
рация, первая и простейшая операция математического анализа.
Расширение числовой области, предпринятое ради обеспечения
неограниченной выполнимости какой-либо числовой операции, дости-
гает. своей цели, разумеется, лишь в том случае, если в новой, рас-
ширенной области операция эта всегда выполнима. В нашем случае
мы должны, следовательно, прежде всего убедиться, что в области
вещественных чисел всякая ограниченная возрастающая последовав
76 ВЕЩЕСТВЕННЫЕ ЧИСЛА [ГЛ. 4
тельность имеет предел. Но это легко доказать. В самом деле,
пусть
а„ ... , а„, ... (6)
— такая последовательность, т. е. ая+1^ая для любого п9 и суще-
ствует такое число С, что ая<^С для любого п\ все ая здесь —
любые вещественные числа.
Если, начиная с некоторого места, все числа последовательно-
сти (6) равны между собою, то общее значение этих чисел и будет,
очевидно, пределом последовательности (6); поэтому мы можем
с самого начала отбросить этот случай и допустить, что среди чисел
последовательности (6) встречается бесконечное множество различ-
ных между собою. Пусть эти различные между собою числа после-
довательности (6) будут в порядке возрастания
.....₽„.••• (!U>₽n)-
Обозначим через гя- любое рациональное число, заключенное
между ря и ря+1 *), так что
Pi < ri < Рз Рп < гп Р/1+i • • •
Последовательность рациональных чисел гя, очевидно, возрастающая
и ограниченная сверху, и значит, в силу принятого нами принципа
порождения имеет (рациональный или иррациональный) предел а;
а так как гп_х < ря < гп> то в силу теоремы 10 § 11 и (Зя->а
(л->оо). Но последовательность (6) состоит из тех же чисел £я,
только каждое из них повторяется там, вообще говоря, несколько
раз; поэтому и ая—(л->оо).
Таким образом, цель, которую мы поставили себе, создавая
область вещественных чисел (континуум) путем расширения области
рациональных чисел, может считаться достигнутой: новая операция,
принятая нами в качестве основной операции математического анализа
и состоящая в переходе от возрастающей ограниченной последова-
тельности к ее пределу, неограниченно выполнима в расширенной
числовой области. !
Это свойство континуума имеет основоположное значение для
строгого логического построения математического анализа, как мы
убедимся уже в ближайших параграфах.
§ 18. Основные леммы
Из только что установленного нами основного свойства конти-
нуума можно сделать далеко идущие выводы, все полнее и деталь-
нее описывающие множество вещественных чисел, его структуру и
*) Арифметическая теория вещественных чисел доказывает, что между
двумя любыми вещественными числами всегда лежит бесконечное множество
рациональных чисел.
§ 18]
ОСНОВНЫЕ ЛЕММЫ
77
господствующие в нем закономерности. Для нас представляют инте-
рес те из этих выводов, которые имеют наибольшее применение
в построении математического анализа. Несколько таких теорем мы
установим в настоящем параграфе; мы называем их «основными лем-
мами», так как каждая из них в сущности имеет своим содержанием
какую-либо из наиболее часто встречающихся схем применения
свойств континуума к построению анализа. Твердое усвоение этих
вспомогательных предложений, на которые мы в дальнейшем часто
будем ссылаться, позволяет поэтому значительно упростить и сокра-
тить многое в последующем изложении.
Условимся называть о т р е з к о м совокупность всех вещественных
чисел х, подчиненных неравенствам а^х^Ь, где а и b(a<^b) —
два любых вещественных числа; таким образом, всякий отрезок
мы будем считать содержащим оба «конца» а и Ъ\ точнее, иногда
в этом случае говорят о «закрытом» отрезке, противополагая ему
«открытый» отрезок, определяемый неравенствами а<^х<^Ь (не
содержащий своих концов). Назовем последовательность отрезков
Дп Д„ ... , Д„, ... (1)
стягивающейся, если 1) для любого п отрезок Дл+1 всеми
своими точками принадлежит отрезку Дл (символически Дл+1 cz Дл)
и 2) Дл —> О (л->оо), где Дл означает длину отрезка того же на-
именования.
Лемма 1 (о стягивающейся последовательности отрезков). Если
(1) — стягивающаяся последовательность отрезков, то существует
единственное число а, принадлежащее всем отрезкам
Доказательство. Обозначим через ап левый и через Ьп—
правый конец отрезка Дл; тогда, очевидно, а, а2 ап ...,
и cin<Zbx для любого п\ таким образом, последовательность чисел
ап — возрастающая и ограниченная сверху, и значит, существует
1ппал==а. Пусть теперь k — любое натуральное число; если n^>k,
п-*оо
то отрезок Дл целиком принадлежит отрезку Д*, так что ak^an^bk‘,
пусть теперь п оо, a k остается постоянным; так как при этом
ал->а, то в силу теоремы 9 § 11 последние неравенства дают
т. е. число а принадлежит отрезку Дл; а так как k произвольно, то
число а принадлежит всем отрезкам данной последовательности.
Чтобы доказать единственность такого числа, допустим, что имеется
ещё второе число р^>а, также принадлежащее всем отрезкам Дл;
тогда длина каждого из этих отрезков должна быть не меньше, чем
р —а, что противоречит требованию Дл->0 (£->со). Таким обра-
зом, лемма 1 доказана.
Пусть нам дана (конечная или бесконечная) система отрезков (S).
Условимся говорить, что система (5) покрывает некоторый отре-
78 вещественные числа [гл. 4
зок Д, если каждое число отрезка Д лежит внутри по меньшей мере
одного из отрезков системы (S)*).
Лемма 2 (о конечном покрытии). Если система (S) покрывает
отрезок Д, то из нее можно выбрать конечную систему отрезков,
также покрывающую отрезок Д.
Доказательство. Будем для краткости говорить, что какой-
либо отрезок 8 допускает конечное покрытие, если он может быть
покрыт конечной группой отрезков, выбранной из системы (8). Мы
докажем лемму 2 от противного, т. е. допустим, что отрезок Д не
допускает конечного покрытия, и постараемся прийти к противоре-
чию. Разделим отрезок Д пополам; если бы обе половины допу-
скали конечное покрытие, то, оче-
видно, такое покрытие допускал бы
""" * и весь отрезок Д; а так как он та-
кого покрытия не допускает, то и
Черт. 9. по меньшей мере одна из двух по-
ловин его не допускает конечного
покрытия; обозначим эту половину через Ai (если конечного покры-
тия не допускают обе половины, то за Aj мы принимаем любую из
них). Отрезок Дп не допускающий конечного покрытия, мы снова
делим пополам и обозначаем через Д9 его половину, не допускаю-
щую конечного покрытия. Очевидно, этот процесс мы можем про-
должать безгранично, получая, таким образом, последовательность
отрезков Д, Дь Д9,..., Дя,..., ни один из которых не допускает
конечного покрытия; отрезки эти, очевидно, образуют стягивающуюся
последовательность; поэтому в силу леммы 1 существует число а,
принадлежащее всем этим отрезкам. Так как а принадлежит отрезку Д,
который покрывается системой (S), то а лежит внутри по меньшей
мере одного отрезка Д* системы (S). Но каждый из отрезков Дя
содержит число а; а так как длина отрезка Дя стремится к нулю
с ростом п, то при достаточно большом п отрезок Дя целиком
содержится в отрезке Д* (черт. 9). Это и создает искомое .проти-
воречие: с одной стороны, отрезок Дя по своему определению не
допускает конечного покрытия, а с другой — он покрывается одним
отрезком Д* системы (8). Лемма 2 доказана.
Теперь мы введем очень важное новое понятие граней данного
множества чисел. Множество ©< вещественных чисел называется
ограниченным сверху, если существует такое число С, что
все числа множества ©-< меньше, чем С; так, множество всех отри-
цательных чисел ограничено сверху (в качестве С можно взять О
или любое положительное число), множество же всех положитель-
ных чисел сверху не ограничено. Подобным же образом, множество
♦) Необходимо подчеркнуть важность требования, чтобы каждое число
отрезка А лежало строго внутри одного из отрезков системы (8), а не просто
принадлежало ему; в последнем случае лемма 2 была бы неверна.
ОСНОВНЫЕ ЛЕММЫ
79
§ 18]
называется ограниченным снизу, если существует такое
число С, что все числа множества больше, чем С. Множество,
ограниченное и сверху, и снизу, называется просто ограни-
ченным.
Будем теперь называть число £ верхней гранью множества©<,
если в этом множестве нет чисел, больших, чем р, но найдется,
как бы мало ни было е^>0, число, ббльшее, чем р — е. Аналогич-
ным образом, назовем число а нижней гранью множества
если в этом множестве нет чисел, меньших, чем а, но найдется,
как бы мало ни было е^>0, число, меньшее, чем а-}-е. Очевидно,
верхняя грань есть наименьшее из чисел, которых не превосходит
ни одно число множества аналогично обстоит дело и для ниж-
ней грани.
Пример. Множество положительных рациональных чисел, квад-
раты которых меньше 2, имеет нижнюю грань 0 и верхнюю грань у42.
В общем случае как верхняя, так и нижняя грань множества
может как принадлежать этому множеству, так и не принадлежать
ему. Верхняя и нижняя грани отрезка совпадают, очевидно, с его
концами и всегда принадлежат ему; напротив, в только что приве-
денном нами примере рассматриваемое множество не содержит ни
своей нижней грани (так как она не положительна), ни своей верх-
ней грани (так как она не рациональна).
Множество, не ограниченное сверху, очевидно, не может иметь
верхней грани, так как не существует числа [J, меньше которого
оставались бы все числа данного множества. Для анализа имеет,
однако, очень большое значение тот факт, что, напротив, множество,
ограниченное сверху, всегда имеет верхнюю грань (и притом един-
ственную); подобным же образом множество, ограниченное снизу,
всегда имеет единственную нижнюю грань. Эта теорема о существо-
вании граней у ограниченных множеств (отнюдь не самоочевидная)
представляет собой одно из самых важных свойств континуума.
Легко убедиться, что, например, совокупность рациональных чисел
этим свойством не обладает; так, множество, о котором шла речь
в нашем последнем примере, ограничено сверху; но в области
рациональных чисел оно верхней грани не имеет.
Теорема доказывается, разумеется, одинаково для верхней и для
нижней грани, так что мы проведем рассуждения только для одного
из этих двух случаев.
Лемма 3 (о существовании граней ограниченных множеств).
Множество <Ж, ограниченное сверху, имеет единственную верхнюю
грань.
До к а з а т е л ь с т в о. Условимся называть нормальным вся-
кий отрезок, который содержит хотя бы одну точку множества ©<,
но вправо от которого ни одной точки этого множества уже не имеется.
Легко убедиться, что из двух половин нормального отрезка одна
будет всегда нормальной; в самом деле, если правая половина
ВЕЩЕСТВЕННЫЕ ЧИСЛА
[гл. 4
АО
содержит хотя бы одну точку множества е^, то эта правая половина,
очевидно, будет нормальным отрезком; если же правая половина
точек множества не содержит, то нормальным отрезком будет
левая половина.
Пусть теперь а — любое число множества е^, а Ь — любое число,
превосходящее все числа множества е^. Отрезок (а, Ь) = Дь очевидно,
нормален; пусть Д2— та из его половин, которая нормальна; Д3 —
та из половин отрезка Д2, которая нормальна, и вообще Дл+1— нор-
мальная половина 'отрезка Дл (п= 1, 2,...). Отрезки Дп Д2,...
... , Дл,... образуют стягивающуюся последовательность и, значит,
согласно лемме 1 имеют единственную общую точку р. Мы утвер-
ждаем теперь, что р есть верхняя грань множества <^. В самом
деле, покажем в первую очередь, что вправо от Р нет точек мно-
жества оЖ; пусть точка ?^>Р принадлежит множеству каж-
дый из отрезков Дл содержит точку Р; но он должен содержать
и т, так как, если бы он кончался левее ?, то вправо от него
лежала бы точка у множества и он не был бы нормальным.
Значит, каждый отрезок Дл содержит р и у и, следовательно,
имеет длину, не меньшую, чем у — р; это же невозможно, так как
Дл -> 0 (п -> оо). Таким образом, вправо от р точек множества
быть не может.
Во вторую очередь, пусть е — любое положительное число; при
достаточно большом п Дл<^е; а так как Дл содержит Р, то все
точки отрезка Дл лежат правее Р — е; но в силу нормальности
отрезка Дл он содержит хотя бц одну точку множества <^, которая,
следовательно, лежит правее р — е. Таким образом, как бы мало
ни было е 0, найдется точка множества е^, лежащая правее р — s;
это значит, что Р обладает и вторым свойством верхней грани и, следова-
тельно, действительно есть верхняя грань множества <^, существование
которой таким образом доказано. Но невозможность существования
двух различных верхних граней одного и того же множества почти
очевидна: если бы такие грани pt и ра (Р, р2) существовали, то
по первому свойству грани Pj не могло бы существовать чисел
множества <^, лежащих между pt и р2, тогда как по вторрму свой-
ству грани р2 такие числа обязательно должны были бы ёуйество-
вать, что и создает требуемое противоречие. Лемма 3, таким обра-
зом, доказана.
§ 19. Завершение теории пределов
Основания теории пределов построены нами в главе 2. Однако
несколько важнейших предложений этой теорий могут быть обосно-
ваны только на той более точной базе, которой мы обладаем теперь,
после построения континуума и изучения его основных свойств.
В настоящем параграфе мы поэтому несколько дополним учение
о пределах.
$19] ЗАВЕРШЕНИЕ ТЕОРИИ ПРЕДЕЛОВ 81
1. В первую очередь мы рассмотрим изменение возрастающих
ограниченных величин в более широком охвате,. Если величина ап
есть член возрастающей и ограниченной сверху последовательности
вещественных чисел, то lima* существует в силу заключительной
п-*оо
теоремы § 17. Но числовая последовательность является, как мы
знаем, только одной из важнейших схем математического описания
процессов. Если мы имеем произвольный процесс, описываемый
любой схемой, то мы, естествённо, назовем участвующую в этом
процессе величину х возрастающей, если для двух любых мо-
ментов процесса значение ее в более поздний момент не меньше, чем
значение ее в более ранний момент. Мы назовем величину х огра-
ниченной сверху в данном процессе, если существует такое
постоянное число С, что, начиная с некоторого момента нашего
процесса, всегда х<^С. Очевидно, что рассмотренная нами в конце
§ 17 схема возрастающей и ограниченной сверху последовательности
представляет собой частный случай только что описанной общей
схемы возрастающей и ограниченной сверху величины. Мы убедимся
теперь, что теорема, доказанная нами в конце § 17 для этого част-
ного случая, остается верной и для общей схемы.
Теорема 1. Всякая возрастающая и ограниченная сверху
величина х имеет предел.
Доказательство. Так как величина х — возрастающая и
ограниченная сверху, то существует такое постоянное число С, что
всегда х<С; поэтому множество о< значений, принимаемых вели-
чиной л?, ограничено сверху и, значит, имеет согласно лемме 3 § 18
верхнюю грань р. Пусть е — сколь угодно малое положительное
число. По второму свойству верхней грани, в множестве ©>< найдется
такое число (т. е. х рано или поздно получит такое значение), кото-
рое больше, чем р— е; в силу же того, что величина х—возра-
стающая, и все последующие (более поздние) ее значения будут
больше, чем р— е. Но с другой стороны, в силу первого свойства
верхней грани все числа множества не превосходят р. Таким
образом, начиная с некоторого момента, мы имеем всегда:
Р — е<Х^Р,
откуда
I*—И<е;
но так как число е сколь угодно мало, то это и значит, что в дан-
ном процессе х—>р. Этим теорема 1 доказана.
Очевидно, то же утверждение остается справедливым и для вели-
чины убывающей и ограниченной снизу.
До' сих пор мы называли величину х возрастающей в данном
процессе, если ее значение х2 в более поздний момент процесса
всегда не меньше ее значения хх в более ранний момент: х*^Х\-
Таким образом, возрастающая величина с течением процесса либо.
в А. Я. Хин чин
82 вещественные числа [гл. 4
возрастает, либо сохраняет прежнее значение, но никогда не убывает;
поэтому естественно в общем случае называть такую величину
неубывающей, сохранив название «возрастающая» для величины, для
которой всегда x^^>xi9 без возможности знака равенства. Так мы
и будем поступать в дальнейшем. Так, например, с возрастанием
величины х величина 4х3 — возрастающая, а величина [х] (см. § 4,
пример 1) — только неубывающая. Разумеется, всякая возрастающая
величина есть в то же время величина неубывающая, но не обратно.
Совершенно аналогичным образом мы называем величину х убываю-
щей, если всегда x%<^xi9 и невозрастающей, если всегда х2^хР
Все неубывающие и все невозрастающие величины называются моно-
тонными (меняющимися всегда в одном и том же направлении).
Общая формулировка теоремы 1 гласит: монотонная величина,
ограниченная в направлении своего изменения, всегда имеет предел.
2. Теперь мы обратимся к совсем новой задаче. Мы только что
убедились, что для монотонно изменяющейся величины ограничен-
ность в соответствующем направлении служит необходимым и
достаточным признаком существования предела. В общем случае,
когда изменение изучаемой величины не монотонно, очень часто
также бывает важно узнать, имеет ли эта величина какой-либо предел
в данном процессе. И в общем случае такой необходимый и доста-
точный признак существует и имеет, как мы увидим дальше, очень
большое теоретическое значение. Мы теперь формулируем и дока-
жем этот признак в общем виде.
Теорема 2 (критерий существования предела). Для того
чтобы величина х стремилась в данном процессе к какому-либо
пределу, необходимо и достаточно, чтобы, как бы мало ни было
положительное число е, начиная с некоторого .момента, два любых
значения величины х отличались друг от друга меньше чем на е.
Доказательство. Мы разобьем доказательство достаточ-
ности на три этапа.
1. Согласно условиям теоремы в нашем процессе наступит такой
момент, начиная с которого два любых значения величины jx будут
отличаться друг от друга меньше чем на 1. Если в упбмйнутый
момент х = х0, то для всех последующих моментов
Х9---1 <X <х# 4- 1.
Таким образом, множество значений : величины х, принимаемых
ею, начиная с упомянутого момента, целиком заключено в отрезке Д
с концами х0— 1 и x0-J-l.
2. Условимся называть какой-либо отрезок 8 нормальным,
если, какой бы момент нашего процесса мы ни выбрали, величина х
после этого момента будет еще принимать значения, принадлежащие
отрезку 8 (короче это можно выразить, говоря, что нормальный
отрезок содержит «сколь угодно поздние» значения величины х).
§ 19] ЗАВЕРШЕНИЕ ТЕОРИИ ПРЕДЕЛОВ 83
Очевидно, что 1) отрезок Д — нормальный и 2) если данный отре-
зок— нормальный, то по меньшей мере одна из его половин также будет
нормальным отрезком. Последнее свойство позволяет нам привычным
уже путем построить, отправляясь от Д, стягивающуюся последова-
тельность отрезков
Д, Дп Да,..., дя,...,
каждый из которых представляет собой нормальную половину пре-
дыдущего. Существующую в силу леммы 1 § 18 общую точку всех
этих отрезков мы обозначим через а.
3. Докажем, наконец, что limx = a. Пусть е — любое положи-
тельное число. Пусть п настолько велико, что Дя < уе- Фиксируем
тот момент нашего процесса, начиная с которого два любых значе-
ния величины х отличаются друг от друга меньше чем на ~ е.
В силу нормальности отрезка Дя в Дя найдется значение хх вели-
чины х, принимаемое ею после фиксированного момента. Тогда для
любого значения х2, принимаемого после фиксированного момента,
мы имеем в силу выбора этого момента:
|*«—*1|<у.
Но с другой стороны, так как а и xt принадлежат отрезку Дя,
длина которого меньше чем ~, то
£
Из двух последних неравенств находим:
1*«—«К»;
здесь в — любое положительное число, а — любое достаточно
позднее (принимаемое после фиксированного нами момента) значение
величины х. Но это и означает, что 11m х = а.
Что касается необходимости нашего признака, то она доказы-
вается совсем просто: если 11m х=а, то для любых двух достаточно
поздних значений хх и х* величины х мы имеем*
1*1 —а|<|. I*»—«Ку.
откуда
1*1—*11 <8.
что и требовалось доказать.
в»
84
ВЕЩЕСТВЕННЫЕ ЧИСЛА
[гл. 4
Доказанный нами признак *), очень полезный для построения
теории, к установлению существования предела в отдельных конкрет-
ных случаях применяется, однако, сравнительно редко; причиной это-
го является то, что в большинстве конкретных задач бывает трудно
установить, выполняются ли в данном случае предпосылки признака.
Мы доказали наш критерий существования предела в самых общих
предположениях для процессов любого типа. Разумеется, конкрети-
зируя математическую структуру процесса, как мы это делали в § 14,
мы для каждого случая получаем из нашего общего критерия уже
вполне конкретный признак, соответствующий процессам данного
типа. Приведем формулировки нескольких важнейших специальных
признаков этого рода.
1. Для того чтобы последовательность вещественных чисел
alt а2,..., ап,... имела предел, необходимо и достаточно выпол-
нение следующего условия: каково бы ни было положительное
число е, существует такое натуральное число п§, что при п^>щ,
m~^>nQ всегда \ап — ат | <е. Короче говоря, два любых «достаточно
удаленных» члена последовательности должны как угодно мало
отличаться друг от друга.
2. Для того чтобы функция y=f(x) имела предел при х-+а,
необходимо и достаточно выполнение следующего условия: каково
бы ни было положительное число е, существует такое другое
положительное число 8, что при | хг — а | 8, | х2 — а | 8 (Xj 7^ а,
х^а) всегда \f{xx)—Короче говоря, значения функ-
ции f (х) в двух любых точках, достаточно близких к а, должны
как угодно мало отличаться друг от друга.
3. Для того чтобы функция y=f (x) имела предел при без-
граничном возрастании х (х —> оо), необходимо и достаточно
выполнение следующего условия: каково бы ни было положительное
число е, существует такое положительное число А, что при
хг^>А, х2^>А всегда |/(Xi)—/(.*«)|<Л- Короче говоря, значения
функции f (х) для двух любых достаточно больших значений х
должны как угодно мало отличаться друг от друга.
Заканчивая изложение учения о пределах, мы считаем ’нужным
указать, что для овладения практикой вычисления пределов необхо-
димо значительное количество упражнений. Задачник Б. П. Демидо-
вича содержит большое число поучительных задач этого рода, из
которых мы можем особенно рекомендовать примеры 38, 40, 41, 42,
48, 50—58, 60, 68, 76, 109—112, 357—365, 376—380 (отдел I).
♦) Этот признак часто называют критерием Коши; вообще кри-
териями принято называть признаки, являющиеся одновременно необхо-
димыми и достаточными.
ГЛАВА5
НЕПРЕРЫВНОСТЬ ФУНКЦИЙ
§ 20. Определение непрерывности
После проведенной нами подготовки мы, можем уже перейти
к основной задаче математического анализа — исследованию различ-
ных типов функциональной зависимости. Однако и здесь нам необ-
ходимо подойти к предмету систематически, выделив с самого начала
те классы функций, которые являются основоположными для теории
и вместе с тем важнейшими для практических приложений. История
развития нашей науки показала, что в этом плане целесообразно
остановиться прежде всего на классе непрерывных функций. Идея
непрерывности, непрерывного изменения величины, в наглядном пред-
ставлений ясна каждому, и мы уже неоднократно пользовались этим
термином, не вкладывая в него, однако, никакого точно определен-
ного содержания. Теперь нам необходимо дать понятию непрерывности
точное определение и подробно изучить свойства непрерывных функ-
ций— не только потому, что с такими функциями мы чаще всего
встречаемся в действительности, но и потому, что изучение других,
более широких классов функциональных связей в значительной,
степени удается свести к изучению непрерывных функций.
Пусть y=f(x)— функция, определенная в некотором отрезке
числовой прямой, и а — любая внутренняя точка этого отрезка-
В точке а функция f (х) имеет определенное значение f (а). Перей-
дем теперь от точки а к некоторой близлежащей точке где
h — некоторое малое по абсолютному значению, положительное или
отрицательное число. Такой переход принято описывать, говоря, что
величина х, вначале имевшая значение а, получила приращение
h и, следовательно, подучила новое значение аЦ-Л; при этом, как
уже сказано, приращение h может быть как положительным, так и
отрицательным. Новому значению a-\-h величины х соответствует
новое значение функции /(х); разность —/(а)
между новым и старым значениями у мы, естественно, называем
приращением величины J, которое она получает при переходе
величины х от старого значения а к новому значению 0*4* Ь разул
меетсяу это приращение может оказаться жк. положительным, так. и
86
НЕПРЕРЫВНОСТЬ ФУНКЦИЙ
[гл. 5
отрицательным (а иногда и равным нулю). В анализе принято
обозначать приращение, полученное какой-либо величиной и9 симво-
лом Ди. Мы можем, таким образом, сказать, что если вначале мы
имели х — а9 то приращению Дх=Л величины х соответствует
приращение Ду =/ (а Л) — f (а) величины у. Геометрическая
иллюстрация этого положения вещей дана на черт. 10.
Если мы, оставляя а неизменным, станем изменять приращение h
величины х9 то, очевидно, будет меняться и приращение Д_у =
=f (а -|- h) — f (а) величины у9 каждому значению Дх соответствует
некоторое определенное значение
Ду. Заставим, в частности, вели-
чину h стремиться к нулю, т. е. до-
пустим, что новое значение a-\-h
величины х стремится к ее старо-
му значению а; если тогда и при-
ращение by функции у— f(x) бу-
дет стремиться к нулю, то это озна-
чает, что при достаточно малом из-
менении величины х и величина у
будет меняться как угодно мало.
Именно это и является содержа-
нием нашего наглядного представ-
ления о непрерывности. Сущность
понятия непрерывности состоит, та-
ким образом, в том, что бесконечно малому приращению независи-
мой переменной соответствует бесконечно малое приращение
функции. А так как соотношение
Hy=f(a^h)—f(a)-+Q (bx=h-+W)
равносильно соотношению
+ *)->/(а) (А-0),
то определение непрерывности может быть формулировано; следую-
щим образом:
Функция f (х) называется непрерывной при х—а (или
«в точке а»), если
f(a^h)^f(a) (Л-0).
Таким образом, для непрерывности функции /(х) в точке а
необходимо и достаточно, чтобы при х — а значение функции f (х)
стремилось к определенному пределу и чтобы предел этот равнялся
значению f(a) этой функции в точке а. При этом важно требова-
ние, чтобы соотношение f(a -|-Л)—>/(а) имело место, каким бы
путем h ни приближалось к нулю: по положительным значениям
или по отрицательным, или все вновь и вновь меняя знак; другими
словами, мы должны иметь f (x)-+f (а) независимо рт того, при-
§ 20]
ОПРЕДЕЛЕНИЕ НЕПРЕРЫВНОСТИ
87
ближается ли х к точке а справа или слева, или все вновь и вновь
переходя справа налево и обратно (двусторонний предел функции,
см. § 15).
Уточнение понятия предельного перехода, подробно рассмотрен-
ное нами в § 14, позволяет дать определению непрерывности еще
следующую, во многих случаях очень удобную формулировку: функ-
ция f (х) называется непрерывной в точке а, если, сколь бы мало
ни было е^>0, существует такое 8^>0, что при любом h, по
абсолютной величине не превосходящем 8, мы будем иметь
1/(аЧ~^)—f (а) | <С £- Коротко говоря, фуйкция непрерывна в дан-
ной точке, если достаточно малому изменению аргумента соответ-
ствует сколь угодно малое изменение функции.
Большая часть случаев нарушения непрерывности функций в той
или иной точке происходит так (Мерт. 11), что f (х) стремится
к определенному пределу, когда х прибли-
жается к а справа (Л^>0), и к другому
определенному пределу, когда х прибли-
жается к а слева (Л<^0), но эти два пре-
дела не совпадают между собой. Единый
предел lim /(х) в этом случае отсутствует,
функция / (х) претерпевает разрыв в
точке а, как это наглядно показывает
черт. 11. То обстоятельство, что х стре-
мится к а справа (т. е. принимая лишь зна-
чения, большие чем а), принято, как мы уже Черт. 11.
знаем, символизировать записью х-^аЦ-0;
если в этом процессе /(х) стремится к некоторому пределу, то
этот ‘предел обозначают через f (a -J- 0), так что
/(а4-0)==: lim /(х).
Аналогичный смысл имеют символы х-+а— 0 и
/(а —0)= lim /(х).
ж-*а—-О
В рассмотренном на черт. 11 случае оба предела f (a -f- 0) и f (а — 0)
существуют, но различны между собой. Между тем, для того чтобы
функция /(х) в точке а быда ^непрерывной, необходимо не только
Совпадение этих пределов, но я совпадение каждого из них со зна-
чением / (а) функции f (х) в точке а (очевидно, числа f (a -f- 0) и
/,(л*—0) по своему определению не только не обязаны совпадать
но и никак не зависят от него). Таким образом, кроме при-
чины f (а + 0) ф f (а — б), обусловливающей собой нарушение
непрерывности в рассмотренном нами примере, то же явление может
наступа^ ц род действием других причин, а именно;
88
НЕПРЕРЫВНОСТЬ ФУНКЦИЙ
[гл. 5
1) f(a 4-0) или f (а — 0) может не существовать вовсе. Типич-
ными примерами этого рода могут служить следующие:
=)
о (х=0);
при х->4“0 f (х) безгранично возрастает; при х->— 0 f (х),
будучи отрицательной, безгранично возрастает по абсолютному зна-
чению; таким образом, не существует ни7/(4-0), ни /(—0); функ-
ция / (х) неогрантена в окрестности точки 0.
6) /W=(S1"T <**°>.
I 0 (х=0);
при х -> 4" 0 /(х), оставаясь на этот раз ограниченной (| sin 1 j,
не может стремиться ни к какому пределу, так как все вновь и
вновь становится равной то 4" Ь то — 1 (а также любому числу,
заключенному между 4-1 и —О; очевидно, подобным же образом
/(х) ведет себя и при х—>— 0; таким образом, и здесь не суще-
ствует ни /(-|-0), ни /(—0), хотя функция /(х) остается огра-
ниченной в окрестности точки 0.
2) Может случиться, что f (а 4~0) и f (а — 0) существуют и
равны между собой, но отличны от / (а); пример:
/(*) = {
х9
1
(х#0),
(х = 0);
при а = 0 здесь / (а 0) =/(а — 0) = 0, в то время как /(а) = 1.
Во всех перечисленных случаях функция / (х) разрывна (не
непрерывна) при х = а (в точке а).
Очень важно всегда иметь в виду, что так определенная непре-
рывность представляет собой локальное (т. е. «местное») двойство
функции: фУнкЦия, вообще говоря, обладает этим свойством в Одних
точках и не обладает им в других. Те значения переменной х, при
которых функция /(х) непрерывна, называются точками непре-
рывности этой функции, а те, при которых она разрывна, — ее
точками разрыва. В тех примерах разрывных функций, кото-
рые мы рассматривали до сих пор, функция всегда была непрерывна
всюду, за исключением одной единственной точки; Множество точек
разрыва такой функции состоит, очевидно/ из Одной этой точки.
Очень легко построить примеры функций, обладающих двумя, тремй
и т. д. точками разрыва, и даже таких, у которых точки разрыва
образуют бесконечное множество. Но существуют и такие функции
которые совсем не имеют точек непрерывности й у которых, сле-
довательно, точки разрыва заполняют всю числовую прямую. Пример
этого рода дает нам уже рассмотренная йами ваше в § 4 функция D (Xs),
§ 21] ОПЕРАЦИИ НАД НЕПРЕРЫВНЫМИ ФУНКЦИЯМИ 89
равная нулю или единице, смотря по тому, иррационально или
рационально число х. В самом деле, так как любой отрезок число-
вой прямой содержит бесчисленное множество как рациональных,
так и иррациональных чисел, то, каково бы ни было число а, как
угодно близко к нему найдутся как рациональные, так и иррациональ-
ные числа; значит, функция D (х) будет в точках, как угодно близких
к а, принимать и значение 0, и значение 1; отсюда следует, что
D (х) при ни к какому пределу стремиться не может и, сле-
довательно, претерпевает разрыв при х = а; а так как число а
произвольно, то функция D (х) всюду разрывна; более того, ни
D (х -|- 0), ни D (х — 0) не существует, очевидно, ни при одном
значении х.
Иногда бывает полезно различать одностороннюю непре-
рывность функции в данной точке. Функция /(х) в точке а непре-
рывна справа, если f (а 0) существует и f (а «р 0) —f (а); она
непрерывна слева, если f(a — 0) существует и f(a — 0) = /(а);
для того чтобы функция была непрерывна в точке а, Очевидно,
необходимо и достаточно, чтобы в этой точке она была непрерывной
как справа, так и слева.
Мы будем говорить, Что функция/(х) непрерывна в отрезке
(а, 6), если она непрерывна в каждой точке этого отрезка (не имеет
в нем ни одной точки разрыва). При этом в левом конце а отрезка
требуется только непрерывность справа, а в правом конце b — только
непрерывность слева; такое соглашение естественно потому, что
функция /(х) часто бывает определена только в точках отрезка (а, Ь),
так что вопрос о ее левосторонней непрерывности в точке а (или
правосторонней — в точке Ь) не имеет смысла. То обстоятельство,
чтб мы только Что определили понятие функции, непрерывной
в отрезке, конечно, ничего не меняет в нашем утверждении, что
непрерывность по существу является понятием локальным; ведь
понятие непрерывности в отрезке определено нами через понятие
непрерывности в точке, которое, таким образом, в теории непре-
рывных функций остается первичным и которое имеет ярко выра-
женную локальную природу.
§ 2Ь Операции над непрерывными функциями
Подобно тому как в главе 2 мы исследовали результаты арифт
метических операций над величинами бесконечно малыми, бесконечно
большими и стремящимися к пределам, мы теперь должны будем
установить, что непрерывность функций* лсак правило, сохраняется
при элементарных а^ифм&^ческих операциях, Важность этой задачи
очевидна-сама" собой, так как общее решение ее освободит нас от
необходимости каждый раз подвергать особому исследованию непре-
рывность той функций, Которая получается в результате таких one*
раций, произведенных над непрерывными функциями,
90
НЕПРЕРЫВНОСТЬ ФУНКЦИЙ
[ГЛ. б
Пусть мы имеем алгебраическую сумму
/(X) =А (X) ± А (X) ± . . . ±fn (X)
функций, каждая из которых непрерывна при х — а. По определе-
нию непрерывности это означает, что при х a j\ (х) -> ]\ (а),
А (х) А (а)> • • • , fn (а); но в таком случае теорема 1 § 11
позволяет нам утверждать, что при х->а
/(•*) =/1 {X) (х) ±... ± fn (X) -> A (a) (а) ±...
...±А(а)=/(а).
а это и означает, что функция /(х) непрерывна в точке а.
Столь же простым рассуждением (со ссылкой на теорему 2 § 11)
доказывается, очевидно, что произведение любого постоянного чйсла
функций, непрерывных в точке а, также непрерывно в этой точке;
в частности, если функция /(х) непрерывна при х = а, то этим же
свойством обладает и функция {/(х)}л, где п — любое натуральное
число. Небольшого дополнительного замечания требует, как обычно,
действие деления. Пусть А (х) и /2(х)— две функции, непрерывные
при х = а, и пусть /2 (а) 0.
Так как при х—в силу нашего допущения и
А(х)->А(а), то по теореме 7 § 11
Л « — Вт л W—<«) ’
х-*а
ж А (х)
это означает, что функция ~ ; непрерывна при х = а; это правило,
/а (х)
таким образом, имеет место при условии, что А (а) 0* Но если
/2(а) = 0, то выражение при х=а вообще теряет смысл» и
А (X)
потому в этом случае вопрос о непрерывности частного не имеет
никакого содержания.
Все установленные нами правила остаются справедливыми й в
том случае, когда речь идет о непрерывности функции не отдёль^
ной точке, а в целом отрезке; это непосредственно вытекает и!з того
определения непрерывности функции в отрезке, которое дано нами
в § 20. В случае частного результат должен, очевидно, формули-
роваться так: если функции А (х) и А (х) непрерывны в некотором
отрезке и если А(х) нигде в этом отрезке не обращается в нуль,
то и функция непрерывна в том же .отрезке.
§ 22. Непрерывность сложной функции
Пусть величина у есть функция от х, д/===/(х), определенная в
некотором отрезке (а, Ь). Обозначим через-*4^ множество значений,
которые принимает функция /(х), когда Л пробегает все числа
§ 22] НЕПРЕРЫВНОСТЬ СЛОЖНОЙ ФУНКЦИИ 91
отрезка (а, Ь). Пусть некоторая третья величина z есть в свою оче-
редь функция от _у, £ = 9(3/), определенная для всех значений ве-
личины у, принадлежащих множеству ©<. Когда х получает какое-
нибудь определенное числовое значение, принадлежащее отрезку (а, Ь)>
то y=f(x) получает также некоторое определенное значение, при-
надлежащее множеству но в таком случае величина z — y(y)
также получает определенное числовое значение. Таким образом,
каждому значению величины х в отрезке (а, Ь) в конечном счете
соответствует некоторое определенное значение величины г; другими
словами, z есть функция от х, определенная в отрезке (а, Ь). Оче-
видно, эту зависимость удобно записывать так:
или двойным равенством:
*=ф(.У)> y=f{x).
Величина z определяется через независимую переменную х не не-
посредственно, а через «промежуточную» функцию у, z определяется
как функция от у, а у — как функция от х, в результате чего и z
оказывается функцией от х. Функцию, задаваемую подобным обра-
зом, называют сложной функцией (или «функцией от функ-
ции»).
Пример. Пусть j/ = cosx, £ = lgj/; так как функция 1gу опре-
делена только для положительных значений, то мы ограничиваемся
рассмотрением таких значений х, для которых у = cosх^>0; пусть,
например, —-^^х^-|-~; тогда и 1gу имеет определен-
ный смысл. Мы можем написать
z = lgcos х (—
как известно, эта функция имеет большое значение при логарифми-
ческом решении тригонометрических задач, и для нее составлены
поэтому подробные таблицы. Другими простыми примерами могут
служить:
z=y*t _y = siix, £ = siiex,
= , y= j/l 4"X2, z =----------7-----
(обе функции определены для любых значений величины х).
Эти примеры (как, впрочем, и само определение сложной функ-
ции) показывают, что термин «сложная функция» имеет целью опи-
сать не какой-либо принципиально новый класс функциональных
зависимостей, а только некоторый особый способ задания функции;
самые простые функции, если это почему-либо желательно, могут
быть заданы в виде сложных функций; так, функция z==x* может
92 НЕПРЕРЫВНОСТЬ ФУНКЦИЙ [гл. 5
быть определена с помощью соотношений г=д/2, j/ = x2, и при та-
ком способе задания будет сложной функцией.
Непосредственно ясно, что способ задания функции может быть
выбран еще более сложным — содержать не одну, а две и более
промежуточных функций. Пример: функция zi = 1g (1 —|— у/' 1 -рх2) мо“
жет быть задана с помощью цепи соотношений z/ = lgn, м=1-|-
-г, z= V У* У — 1 4~х2, содержащей три промежуточных функ-
ции: и, z и у.
Пусть г = 9 £у), j/=/(x), и пусть функция f(x) определена и
непрерывна в отрезке (й, Ь), а функция 9 (.у) определена и непре-
рывна в некотором отрезке, содержащем в себе все значения функ-
ции f(x) при а х ^Ь. Докажем, что в таком случае сложная
функция г = ф[/(х)] также непрерывна в отрезке (а, Ь). Пусть а —
любая точка отрезка (а, 6), и пусть /(а) = ]3; в силу предположен-
ной нами непрерывности функции f(x) в отрезке (а, 6), мы имеем:
Ит/(х)=/(а) = ₽;
х-*а
с другой стороны, функция 9 (.у), по предположению, непрерывна
при у = $; поэтому из f(x) -р следует
9 [/(•*)] -*?(?) = Ф [/(«)] (х->а);
это и доказывает непрерывность сложной функции 9 [f (х)] в точке а;
а так как а — любая точка отрезка (а, 6), то функция 9 [/(х)] не-
прерывна во всем этом отрезке. Мы доказали, таким образом, сле-
дующее предложение.
Теорема 1. Если функция f (х) непрерывна в отрезке
а функция 9 (.У) непрерывна в некотором отрезке, содержащем
в себе все значения, принимаемые функцией f(x) в отрезке (а, Ь),
то сложная функция 9 [/(х)] непрерывна в отрезке (а, Ь).
Другими словами, если обе функциональные зависимости, из ко-
торых составляется данная сложная функция, непрерывны, to и сама
эта сложная функция непрерывна. Эта теорема простой индукцией
легко распространяется на случай сложных функций, определяемых
с помощью трех и более звеньев: если в каждом звене зависимость
непрерывна, то и получаемая сложная функция будет непрерывной.
В приложениях мы постоянно встречаемся со сложными функциями,
в которых каждое звено представляет собой некоторую элементар-
ную функцию (см. § 6). Было бы очень тяжелой задачей в каждом
таком случае особо доказывать непрерывность встретившейся нам
комбинации элементарных функций. Теорема 1 фаз навсегда освобо-
ждает нас от этой необходимости: если мы докажем непрерывность
небольшого числа простейших элементарных функций (а это будет
сделано в § 24), то из теоремы 1 и теорем §21 будет следовать
репрерывнфсть дербоЦ конечной комбинации этих простейших функ-
§ 23] ВАЖНЕЙШИЕ СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 9®
ций (т. е. любой такой комбинации, которая составлена из простей-
ших элементарных функций с помощью арифметических операций и
операции составления сложной функции, повторенных любое конечное
число раз и в любом порядке).
§ 23. Важнейшие свойства непрерывных функций
Непрерывные функции обладают целым рядом таких свойств,
которые делают их изучение и применение значительно более про-
стым, чем это имеет место в случае функций разрывных. Мы теперь
формулируем и докажем несколько важнейших свойств этого рода.
Но прежде всего установим одно вспомогательное предложение, ко-
торое много раз будет нам полезно в дальнейшем.
Лемма. Функция f(x), непрерывная и положительная при
х = а, положительна и в некотором отрезке, содержащем внутри
себя точку а.
Доказательство. В силу непрерывности данной функции в
точке а мы имеем:
(х-+а);
поэтому из /(а)^>0 в силу теоремы 2 § 10 следует, что /(х)^>0,
; если х достаточно близко к а; но в. этом и состоит утверждение
леммы.
Разумеется, тем же путем может быть доказано, что при f{a)<^d
мы имеем и /(х)<^0 для всех точек некоторого отрезка, содержа-
щего внутри себя точку а.
Условимся называть функцию /(х), определенную в отрезке (а, Ь),
ограниченной в этом отрезке, если значения, принимаемые ею
в отрезке (а, Ь), образуют ограниченное множество.
Теорема 1. Функция /(х), непрерывная в отрезке (а, Ь), ог-
раничена в этом отрезке.
Доказательство. Пусть а — любая точка отрезка (а, Ь).
Так как функция /(х) непрерывна в точке а, то |/(х)—/(а)|<4,
если х достаточно близко к а; следовательно, существует такой
отрезок 8а, имеющий точку а своей серединой, что для любой точ-
ки х отрезка 8а *) мы имеем |/(х)—/(а)|<^1, откуда
1/(*)1<1/(оО1 + 1.
Такой отрезок 8в мы можем построить для каждой точки а от-
резка (а, Ь). Система S всех построенных отрезков, очевидно, по-
♦) Предполагается, конечно, что х принадлежит отрезку (а, Ь)\ если точ-
ка а совпадает с одним из концов отрезка (а, Ь), то выполнение неравенства
|/(х) — /(а)|< 1 требуется, конечно, лишь для тех точек х отрезка 6а, кото-
рые принадлежат отрезку (а, Ь).
94 НЕПРЕРЫВНОСТЬ ФУНКЦИЙ [гл. 5
S
крывает отрезок (а, Ь). По теореме о конечном покрытии (лемма 2
§ 18), существует конечная группа Дп Д3,..., ДЛ отрезков системы S,
также покрывающая отрезок (а, Ь). Каждый такой отрезок Дл есть
один из построенных нами отрезков 8e*(£=l, 2,..., п); поэтому
для любой точки х отрезка ДЛ
1/(*)К1ЛМ1 +1;
если мы обозначим через наибольшее из п чисел |/(а1)|,
|/(°Ч) !>•••, |/(аЛ)| и учтем, что любая точка х отрезка (а, Ь)
принадлежит по крайней мере одному из отрезков ДЛ, то мы будем
иметь уже для любой точки х отрезка (а, Ь)
Этим и доказана ограниченность функции /(х) в отрезке (а, Ь).
Теорема 2. Функция /(х), непрерывная в отрезке (a, Ь),
принимает на этом отрезке некоторое наименьшее значение и
некоторое наибольшее значение.
Предварительное замечание. В силу предшествующей
теоремы функция /(х) ограничена в отрезке (а, Ь); в силу леммы 3
§ 18 множество значений, принимаемых функцией /(х) в отрез-
ке (а, Ь); имеет поэтому нижнюю грань а и верхнюю грань р. Одна-
ко мы знаем, что грани ограниченного множества могут и не при-
надлежать ему; в данном случае а и f могли бы поэтому и не
принадлежать множеству т. е. не быть значениями функ-
ции /(х) в отрезке (а, Ь). Для разрывных функций такое поло-
жение вполне возможно; положим, например,
ft X—I * (*<!)>
[ 0 (х=1),
если х<4 и достаточно близко к 1, то и/(х)=х сколь угодно
близко к 1; верхняя грань р=Г; однако ни в одной точк^ отрезка
(О, 1) мы не имеем /(х)=1, а всюду /(х)<4. Теорема' 21имеет
целью установить, что для непрерывной функции такое положение
невозможно: здесь верхняя и нижняя грани множества всегда
служат соответственно наибольшим и наименьшим значениями функ-
ции /(х) в отрезке (а, Ь); другими словами, всегда найдется в (а, Ь)
такая точка хп что /(х1) = а, и такая точка ха, что /(х2) = р.
Доказательство. Мы проведем рассуждение только для верх-
ней грани р, так как для нижней оно проводится совершенно ана-
логично. Допустим, что /(х)<р в любой точке х отрезка (а, Ь) и
постараемся прийти к противоречию. Так как функция р—/(х) в
отрезке (а, Ь) непрерывна и не обращается в нуль, то в силу по-
следнего результата § 21 функция непрерывна, а значит, в
Р —/ \х)
§ 23] ВАЖНЕЙШИЕ СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 95
силу теоремы 1 ограничена в этом отрезке. Существует, следова-
тельно, такое число С^>0, что
0=7(7)<С
откуда
/(*)<₽ — £ (а^х^Ь).
Так как число С—положительное и постоянное, то это проти-
воречит определению верхней грани, согласно которому, как бы
мало ни было е>0, в отрезке (а, Ь) должны найтись значения/(х),
превосходящие Р— е. Это противоречие и доказывает теорему 2.
Теорема 3. Если функция /(х) непрерывна в отрезке (а, Ь)
и если у означает любое число, заключенное^между f(a) и f(b),
то между а и Ь нацдется такая точка с, что f(c) = y.
Предварительное замечание. Теорема 3 выражает со-
бой то свойство непрерывных функций, которое в нашем наглядном
представлении составляет собой самую сущность непрерывного изме-
нения: переходя от одного значения к другому, непрерывно изменяю-
щаяся величина обязательно проходит через все промежуточные зна-
чения, не минуя ни одного из них.
Доказательство. Мы сначала рассмотрим тот частный слу-
чай, когда /(а) и f(b) имеют разные знаки, а 7 = 0 (т. е. покажем,
что. непрерывная функция, переходя от положительного значения к
отрицательному или наоборот, обязательно должна пройти через
нуль). Допустим, что /(х) ни в одной точке отрезка (а, Ь) не об-
ращается в нуль, и постараемся прийти к противоречию. Условимся
называть произвольный отрезок нормальным, если в концах его
функция /(х) имеет разные знаки; очевидно, что из двух половин
нормального отрезка всегда одна и только одна будет нормальной
(напомним, что согласно нашему допущению /(х) нигде не обращается
в нуль). Отрезок Д, = (а, Ь) нормален по условиям теоремы; пусть
Д2— нормальная половина Д1} Д3— нормальная половина Д2 и т. д.
Отрезки \Дп Д4,..., ДЛ,... образуют стягивающуюся последователь-
ность и, значит, имеют общую точку, которую мы обозначим через с.
Так как по нашему допущению /(с)^0, то либо /(с)>0, либо
/(с)<0. Пусть для определенности /(с)^>0. Тогда в силу уста-
новленной в начале настоящего параграфа леммы мы должны
иметь /(х)^>0 для всех х, достаточно близких к с; это же стоит
в противоречии с тем, что точка с принадлежит нормальному от-
резку ДЛ сколь угодно малой длины, и значит, в любой близости
точки с найдется точка (один из концов отрезка Дя), где /(х)<^0.
Этим доказан частный случай теоремы 3.
Переходя теперь к общему случаю, положим /(х) — 7 = 9 (х).
Так как 7 заключено по условиям теоремы между /(а) и f{b), то
ф(а) и ф(£) имеют разные знаки. А так как вместе с /(х) непре-
96* НЕПРЕРЫВНОСТЬ функций [гл. 5
рывна и функция ф(х), то по уже доказанному частному случаю
между а и b найдется такая точка с, что ср (с) — 0, или, что то же,
/(с) = 7. Этим теорема 3 доказана полностью.
Пусть теперь функция y=f(x)— непрерывная и возрастаю-
щая в отрезке (а, Ь); это значит, что при a.^x^<^xt^b мы
всегда имеем Пусть f(a) — а,/(6) = р(а<|3), и пусть
7 — любое число, лежащее между аир. Согласно теореме 3 суще-
ствует такое число с(а<^с<^Ъ), что f(c) = 7; а так как функция
f(x) возрастающая, то это число с, очевидно, единственное; таким
образом, каждому числу 7 отрезка (а, (3) соответствует определенное
число с отрезка (а, Ь); иначе говоря, каждому значению величины у
в отрезке (а, Р) соответствует единственное определенное значение
величины х в отрезке (а, &), для которого У—fix)', величина х
есть, таким образом, функция от у, определенная в отрезке (а, Р):
x=<f(y)
при этом, очевидно, 9(a) = а, 9 (р) = 6. Функцию х = 9 СУ) называют
обратной по отношению к функции y=f(x); эти две функции
выражают, в сущности, одну и ту же связь между величинами х и
у и отличаются друг от друга только тем, какая из этих двух величин
принимается за независимую переменную, а какая — за функцию.
Пример 1. у = х9 (— оо < х < 4” оо); обратная функция:
* = V У (— оо < У < + оо).
Пример 2. у = sin х ^0 х =£ обратная функция x=arcsinj?
(0 у 1).
Убедимся теперь, что функция, обратная по отношению к возра-
стающей непрерывной функции, также непрерывна в соответствующем
отрезке.
Теорема 4. Пусть функция у—f(x) — возрастающая и не-
прерывная в отрезке \а, Ь), и пусть f(a) = n, f(b) = $*9 тогда
обратная функция х = ср(у) также непрерывна в отрезке (а, Р).
Доказательство. Пусть сначала 7 — любая внутренняя точ-
ка отрезка (а, Р); положим 9(7)=?= с, так чтоа<с<^ и /(с) = 7.
Пусть е0 столь мало, что числа с — е и принадлежат от-
резку (а, 6). Положим
/(с — е) = Т1, f (с + е) = т9,
так что 71 7 <С 7«, и обозначим через 8 наименьшую из разностей
7 — 71, 72 — 7-
Пусть теперь |_у— 7|<С^ тогда, очевидно, 71<С-У<С72> и сле-
довательно,
<р(Т1)<фОО<?(ъ);
но 9(7,) = с — е, 9(72) = с4-е> и следовательно,
с--е ф (J/) < с _|_ е>
§ 23] ВАЖНЕЙШИЕ СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 97
или, что тоже, |ф (J/) — с| = |ф(»— ср (у) | < е. Мы доказали, таким
образом, что из |_у— т|<б следует | ср (у) — ф(т)|<Се» так как
е^>0 при этом сколь угодно мало, то функция ср (у) непрерывна
в точке у, что и надо было доказать.
В случае у —а или у = р тем же рассуждением устанавли-
вается непрерывность функции ср (.у) справа (в точке а) или слева
(в точке (3).
Само собой разумеется, что теорема справедлива и для убываю-
щей непрерывной функции /(х).
В § 20 мы неоднократно подчеркивали локальный характер вве-
денного нами определения непрерывности: свойство это мы опреде-
ляли применительно к каждой отдельной точке, так что функция,
вообще говоря, бывает непрерывной в одних точках и разрывной в
других. Непрерывность в отрезке мы определили позднее как не-
прерывность в каждой точке этого отрезка. Можно, однако, опреде-
лить непрерывность функции в отрезке и непосредственно, не опи-
раясь при этом на понятие непрерывности в точке. Мы будем при
этом исходить все из той же основной идеи, что сущность непре-
рывности состоит в малости изменений функции при малых измене-
ниях независимой переменной.
Назовем функцию /(х) равномерно непрерывной в от-
резке (а, Ь), если разность ее значений в двух любых достаточно
близких друг к другу точках этого отрезка будет сколь угодно
малой по абсолютному значению. Точнее: мы называем функцию /(х)
равномерно непрерывной^ отрезке (а, Ь), если выполнено следую-
щее условие: каково бы ни было е^>0, существует такое 8>0,
что для двух любых точек хр х2 отрезка (а, Ь) с расстоянием
|xt —х9| 8 мы будем иметь | /(xt) — /(х9) | < е. Мы называем
так определенную непрерывность равномерной именно потому, что
разность |/(xi)—/(х2)| здесь должна быть малой независимо от
того, где в отрезке (а, Ь) взяты точки хх и х2, лишь бы они были
достаточно близки друг к другу.
Понятие равномерной непрерывности имеет очень большое зна-
чение для математического анализа. Поэтому необходимо с самого
начала установить, в каком отношении это понятие стоит к опре-
деленному нами ранее понятию непрерывности функции в отрезке.
Прежде всего почти очевидно, что из равномерной непрерывности
функции в отрезке вытекает непрерывность ее в каждой точке этого
отрезка, а значит, и непрерывность ее в этом отрезке согласно на-
шему прежнему определению. В самом деле, если функция /(х) рав-
номерно непрерывна в некотором отрезке и если а—любая точка
этого отрезка, то, в частности, разность |/(х)—/(а) | будет сколь
угодно малой при х, достаточно близком к а, а это и означает не-
прерывность функции /(х) в точке а. Несравненно более глубоким
фактом является, однако, то, что имеет место и обратная теоре-
ма: непрерывность функции в каждой точке некоторого (закрытого)
7 А. Я. Хинчин
98
НЕПРЕРЫВНОСТЬ ФУНКЦИЙ
[гл. 5
отрезка достаточна для ее равномерной непрерывности в этом отрезке.
Таким образом/ наше новое определение непрерывности оказывается
*(для закрытых отрезков) в точности равносильным прежнему опре-
делению (локальной природы).
Теорема 5. Функция f(x), непрерывная в каждой точке от-
резка (а, Ь), равномерно непрерывна в этом отрезке.
Доказательство. Пусть а — произвольная точка отрезка
(а, Ь) и е—любое положительное число. Так как функция f(x) непре-
рывна в точке а, то при достаточно малом 8в^>0 мы будем иметь
для любой точки х ♦) отрезка (а — 8а, а 8а)
|/(х)-/(а)|<|;
поэтому, если хх и х* — две любые точки отрезка (а — 8а, a-j-M,
то
|/(^)“/(^)|<е. (1)
Эту конструкцию мы проведем для каждой точки а отрезка (а, Ь)
и условимся называть отрезок (а— y8e, a-J-y6ej,' составляющий
собой половину вышепостроенного отрезка (а — 8а, a-J-M, «соб-
ственным отрезком» точки а. Совокупность S всех таких собственных
отрезков, очевидно, покрывает весь отрезок (а, Ь)\ по лемме о ко-
нечном покрытии (лемма 2 § 18), из этих собственных отрезков
можно выбрать конечную группу Др Д^,, Дп, также покрывающую
отрезок (а, Ь). Обозначим через 8 половину длины наименьшего из
отрезков Дь Д2,..., Дл.
Пусть теперь хх и х3 —любые две точки отрезка (a, Ь), взаим-
ное расстояние которых меньше, чем 8. Точка xi9 как всякая точка
отрезка (а, Ь), принадлежит какому-нибудь отрезку Дл; но Д* есть
один из отрезков системы S и потому есть собственны!) отрезок
(а—а + некоторой точки а отрезка (а, Ь); поэтому
1
|jfj — alsS-K-Sa? но, с другой стороны,
&
где последнее неравенство вытекает из определения числа 8. Таким
образом, каждое из двух чисел а и х% отстоит от хх не более чем
на ~8в, а значит,
| х^ —— л | 8в.
♦) Разумеется, речь идет о точках х, принадлежащих отрезку (а, Ь\ так
как вне этого отрезка функция /(х) может и не быть определена.
§ 24] НЕПРЕРЫВНОСТЬ ЭЛЕМЕНТАРНЫХ ФУНКЦИЙ
99
Отсюда следует, что обе точки xt и х2 принадлежат отрезку
(а — 8а, а-|-8в)> и значит, имеет место неравенство (1); но xt и
х2— две любые точки, взаимное расстояние которых меньше, чем 8;
поэтому равномерная непрерывность функции /(х) в отрезке (а, Ь)
установлена.
Примечание. Отрезок (а, Ь), о котором идет речь в теореме 5,
мы, как всегда, предполагаем закрытым, т. е. содержащим свои концы.
Для открытых (не содержащих своих концов) отрезков теорема 5,
z вообще говоря, неверна. Так, функция /(х) = —, непрерывная в
каждой точке открытого отрезка (0,1), не будет в этом отрезке
равномерно непрерывной; в самом деле,, при малом 8^>0, полагая
Xj=8, ха = 28, мы имеем |xt— х2| = 8, |/(xf)—/(•*2)1 = 4-----
11 II
---= в то время как |xt—х2| сколь угодно мало,
l/C*i)—/(-*2)! может, таким образом, быть сколь угодно большим.
Аналогичным образом ведет себя функция /(x) = tgx в открытом
отрезке —у, В обоих примерах мы имеем дело с неогра-
ниченными функциями. Функция sin у, которую мы рассматривали
в § 20, непрерывна в каждой точке открытого отрезка (0,1) и,
очевидно, ограничена в этом отрезке; однако она не обладает рав-
номерной непрерывностью, так как существуют сколь угодно малые
(и значит, скрль угодно близкие друг к другу) числа хх и х2, для
которых sin —=1, sin —=—1.
§ 24. Непрерывность элементарных функций
В этом параграфе мы убедимся, что все простейшие элементар-
ные функции в основном (т. е. за исключением некоторых отдель-
ных, легко определяемых точек) непрерывны.
1. Теорема 5 § 11 имеет своим содержанием утверждение, что
всякий многочлен Р(х) непрерывен при любом значении х. Точно
так же следствие теоремы 7 того же параграфа утверждает, что
всякая рациональная дробь непрерывна при любом значении х,
при котором ее знаменатель не обращается в нуль. Таким образом,
все рациональные функции в основном непрерывны.
2. Рассмотрим показательную функцию у=ах, где для опреде-
ленности будем считать а^>1. Так как
ax+h — af=ax(ah — 1),
то для доказательства непрерывности функции а* при любом #
достаточно убедиться, что
100
НЕПРЕРЫВНОСТЬ ФУНКЦИЙ
[гл. 5
С этой целью заметим прежде всего, что формула бинома Ньютона
(i-H)n=i+»x + ... ,
где Х^>0 и п— любое натуральное число, дает*) при л^>1:
(1 + Х)л> 1 -|-лХ,
откуда
(1 +хг — 1
Допуская для определенности, что и полагая в этом нера-
венстве Х = аЛ—1, мы находим:
п 4
Выберем теперь число п так, чтобы было
(О
тогда nh^At а потому и алА^а, так как а^>1, и следовательно,
функция ах— возрастающая (см. § 17); поэтому из (1) следует
а так как, очевидно, п —> оо при h —> 0, то
ah—\ -^0 (Л->0),
что и требовалось доказать; таким образом, все показательные
функции ах непрерывны при любом значении х.
3. В § 17 мы видели, что при а^>0 функция ах во всех слу-
чаях — монотонная **): возрастающая при а 1 и убывающая при
а<^1. Так как непрерывность этой функции нами доказана, то су-
ществует единственная обратная по отношению к ах функция, и эта
обратная функция в силу теоремы 4 § 23 также непрерывн^ на по-
лупрямой х^>0. Эта обратная функция есть lgax. Таким образом,
все логарифмические функции непрерывны.
4. Из монотонности показательной функции, далее, легко сле-
дует непрерывность общей степеннбй функции ха при любом по-
стоянном а на полупрямой В самом деле, пусть для опреде-
ленности а^>0 и пусть п — любое целое число, превосходящее а.
Мы имеем:
(2)
* *) Мы уже видели это в примере 3 § 7.
**) Функция называется монотонной, если она либо неубывающая, либо
невозрастающая на данном отрезке (который может быть и всей числовой
осью).
§ 24]
НЕПРЕРЫВНОСТЬ ЭЛЕМЕНТАРНЫХ ФУНКЦИЙ
401
Пусть для определенности й^>0. В силу монотонности показатель-
ной функции тогда
><('+4Г<Н^
(мы предполагаем, разумеется, х^>0); так как есть мно-
гочлен относительно h и, очевидно, при h -> 0 стремится к единице,
то последние неравенства в силу теоремы 10 § 11 позволяют ут-
верждать, что при й->0
(+4F‘.
откуда в силу (2)
(x^-hy — ха-^0 (А->0),
что и надо было доказать. Итак, всякая степеннйя функция х*
непрерывна при х>0*).
5. Очень легко доказывается непрерывность функций sinx и
cosx на всей числовой прямой. В самом деле,
sin (х 4“ h) — sinx = 2 cos [х 4~ sin у,
где последний множитель, а значит, и вся правая часть стремится
к нулю при й->0; аналогично проводится доказательство и для
функции cosx. Наконец, функции tgx, ctgx, secx и cosecх выра-
жаются отношениями, членами которых служат величины 1, cosx
и sinx; поэтому все простейшие тригонометрические функции не-
прерывны во всех точках, в которых они определены.
6. Применение теоремы о непрерывности обратных функций
(теорема 4 § 23) непосредственно приводит отсюда к заключению,
что и все обратные тригонометрические функции непрерывны
в соответствующих областях. Рассмотрим для примера функцию
arcsin х; так как функция sinx в отрезке (—у, 4~у) монотон-
на, непрерывна и возрастает от —1 до +1, то обратная ей функ-
ция в отрезке (—1, 4“ О монотонна, непрерывна и возрастает от
— ~ до 4" у >’ н0 эта функция и есть arcsin х.
Этим завершается доказательство непрерывности всех простей-
ших элементарных функций. Мы знаем (§ 6), что все другие эле-
ментарные функции получаются из этих простейших посредством
конечного числа алгебраических операций и составления сложных
функций; а так как все эти операции, будучи предприняты над не-
♦) Впрочем, представляя функцию ха в виде е* Igex> мы легко видим, что
непрерывность ее непосредственно следует из непрерывности показательной
и логарифмической функций, если воспользоваться теоремой 1 § 22.
102
НЕПРЕРЫВНОСТЬ ФУНКЦИЙ
[гл. 3
прерывными функциями, по теоремам §§ 21—22 снова приводят к
непрерывным функциям, то тем самым установлено, что все элемен-
тарные функции непрерывны всюду, за исключением отдельных
точек, положение которых в каждом отдельном случае непосредст-
венно видно из аналитического выражения соответствующей функции.
Пример. Функция
непрерывна всюду, кроме 1) точки х—1 и 2) точек х, в которых
-^ = (2^+1)!,
где h — любое целое число, т. е. точек вида
(А=... , —2,-1,0, 1,2,...);
таким образом, нарушение непрерывности происходит лишь в тех
непосредственно видных точках, где аналитическое выражение дан-
ной функции теряет смысл.
Упражнения к главе 5 читатель найдет в задачнике Б. П. Деми-
довича, отдел I, § 7. Мы в первую очередь рекомендуем задачи
490—501, 515—518, 544, 546, 566, 568; дальнейший выбор следует
производить по указанию преподавателя.
РАЗДЕЛ ВТОРОЙ
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО
ИСЧИСЛЕНИЯ
ГЛАВА6
ПРОИЗВОДНАЯ
§ 25. Равномерное и неравномерное изменение функций
Когда на практике приходится изучать изменяющиеся величины,
то одним из важнейших возникающих при этом вопросов является
обычно вопрос о скорости, быстроте происходящего измене-
ния. Скорость, с которой движется самолет или железнодорожный
поезд, всегда служит важнейшим показателем его работы. Быстрота
прироста населения того или другого города является одной из
основных характеристик его жизни. Дорога, поднимающаяся от более
низких мест к более высоким, может быть более или менее крутой
в зависимости от того, с какой скоростью она поднимается на своем
протяжении.
Первоначальная идея скорости изменения ясна каждому. Однако
для решения большинства практических задач этой общей идеи не-
достаточно. Необходимо иметь точное количественное определение
той величины, которую мы называем скоростью данного изменения.
Для такого определения, однако, средства элементарной математики
оказываются достаточными только в немногих простейших случаях.
В общем случае задача эта может быть удовлетворительно решена
только с помощью тех математических понятий и методов, к изу-
чению которых мы теперь приступили. И исторически потребность
в общем и точном определении скорости изменения величин, в со-
здании единообразного метода, позволяющего вычислять эту скорость,
послужила одним из основных побудителей к созданию той научной
дисциплины, которую мы называем математическим анализом. Целый
большой раздел математического анализа посвящен решению этой
основной задачи и выводам из этого решения. Раздел этот назы-
вается обычно дифференциальным исчислением и к его
изучению мы теперь переходим.
Пусть величина у есть функция величины (независимой перемен-
ной) х;
^==/и-
104 ПРОИЗВОДНАЯ [гл. 6
Изменение (приращение) Дх величины х вызывает тогда совершенно
определенноеприращение
ДЗ/==7(х-4-Дх)— /(х) (1)
величины у. Это приращение может быть весьма различным в зави-
симости от того, каково первоначальное значение х независимой
переменной и какова функция /(х), выражающая изучаемую нами
функциональную зависимость; другими словами, приращение Ду, как
это и непосредственно видно из его начертания (1), кроме прираще-
ния Дх, зависит еще от величины х и от вида функции /(х). Мы,
естественно, считаем изменение величины у быстрым, если | by |
(при данном Дх) велико, и медленным, если оно мало; в частности,
если Д_у = 0, то у вообще не меняется при переходе независимой
переменной от значения х к значению х-{-Дх.
Рассмотрим теперь тот простейший случай, когда изменение
by величины у всегда пропорционально изменению Дх величины х,
т. е. Ау = аДх, где а — постоянное число, не зависящее ни от х,
ни от Дх. В частности, если Дх=1, то Ду = а, т. е. изменению х
на одну единицу (этой величины) всегда соответствует одно и то
же изменение by— а. величины у, каково бы ни было первоначаль-
ное значение х независимой переменной. Если х означает время,
то в этом случае величина у изменяется на одну и ту же вели-
чину а в любую единицу времени (например, в любую секунду),
в какой бы момент х ни начиналась эта секунда. Другими словами,
на всем протяжении процесса величина у претерпевает в единицу
времени одно и то же изменение а. Мы ясно ощущаем, что в этом
случае изменение величины у с течением процесса не ускоряется и
не замедляется, а происходит всегда с одинаковой быстротой, что
величина у, как мы будем говорить, изменяется равномерно.
Само собой разумеется, что такого рода изменение величины сле-
дует считать весьма частным случаем; однако этот частный случай —
важнейший; он имеет руководящее значение для всего последующего,
и мы должны поэтому остановиться на нем со всей подробностью.
Пусть величина >=/(х) изменяется равномерно и пуёть при
х = а y=f(d) = b; тогда при любом х
/(х) —/(а) = а (х — а),
и следовательно,
/(х) = ах + ftp) — аа — ах р,
где р=/(а) — аа — постоянная величина. Таким образом, всякая
равномерно изменяющаяся величина y=f(x) представляет собой
линейную функцию (двучлен первой степени) от х:
J = ax-J-£. (2)
§ 25] РАВНОМЕРНОЕ Я НЕРАВНОМЕРНОЕ ИЗМЕНЕНИЕ ФУНКЦИЙ
105
Обратно, если величина y=f(x) связана с независимой пере*
менной х соотношением (2), то
by =f(* + Дх) — f(x) = [а (х + Дх) 4- ₽] — [ах + р] = а Дх,
т. е. Ду пропорционально Дх, и величина у изменяется равно-
мерно. Таким образом, равномерно изменяются все линейные
функции и только они; это ощутительно показывает, насколько
узким частным случаем мы должны считать равномерное изменение
функции.
Если х означает время, протекшее от какого-либо начального
момента, а у — расстояние, отделяющее движущееся тело в момент х
от некоторого начального положения, то приращение Ду этого
расстояния при Дх= 1 означает, очевидно, путь, проходимый телом
в единицу времени (например, в секунду). Если у изменяется рав-
номерно, то тело в любую секунду проходит одно и то же рас-
стояние; если это расстояние есть а, то, как мы знаем, j/ = ах-]-₽>
где р — постоянная величина. Такое движение в физике называют
равномерным, а путь а, проходимый телом при равномерном
движении в единицу времени, называют скоростью этого равно-
мерного движения.
Подобным же образом и в общем случае, когда х и у пред-
ставляют собой величины какой угодно природы, равномерное изме-
нение функции y=f(x) означает, что при изменении величины х
на одну единицу величина у всегда изменяется на одно и то же
число а;, мы, естественно, считаем, что и здесь это число а изме-
ряет собой скорость изменения величины у (относительно ве-
личины х). Таким образом, определение скорости равномерно изме-
няющейся функции не вызывает никаких затруднений; если такая
функция записывается в виде у = ъх то число а является
(постоянной) скоростью ее изменения. При этом число а может быть
положительным, отрицательным или нулем. Если а<^0, то Ду<0
при Дх^>0, т. е. с ростом х величина у убывает. Разумеется, этот
случай вполне реален. Так, в рассмотренной уже нами картине рав-
номерного движения мы можем подразумевать под у расстояние
движущегося тела не от начального, а от конечного его положения,
к которому оно приближается. Тогда, очевидно, у будет умень-
шаться с течением времени, т. е. мы будем иметь ду<^0 при
Дх^>0. В случае а = 0 мы имеем _у = [3: величина у остается
постоянной в течение процесса; в нашей механической картине тело
находится в покое, скорость его движения равна нулю.
Непосредственно ясно, что. в случае неравномерного изменения
функции, когда приращение функции, приходящееся на единицу при-
ращения независимой переменной, различно в различные моменты
процесса, мы не можем иметь столь простого определения скорости
изменения функции. И прежде всего мы можем предвидеть, что здесь
106 ПРОИЗВОДНАЯ [гл. 6
скорость изменения функции при любом разумном ее определении
окажется различной в различные моменты процесса, т. е. что она
будет локальным понятием в том смысле этого слова, какой мы
придавали ему в предшествующей главе.
§ 26. Мгновенная скорость неравномерного движения
Пусть нас интересует вопрос о том, с какой скоростью в дан-
ный момент движется некоторая автомашина. На этот вопрос часто
отвечают: «со скоростью 40 км в час». Что это значит? Может
быть, этим хотят сказать, что машина проходит в час 40 км? Но
есть ли это ответ на поставленный нами вопрос? Ведь мы хотим
знать, какова скорость машины в данный момент, а в течение часа
машина, вероятно, много раз изменит скорость, то убыстряя, то за-
медляя ход; и если мы знаем, что за весь час она пройдет 40 км,
то это еще ничего не говорит нам о том, как быстро она движется
вот сейчас, в данной момент.
Могут сказать, что вопрос о мгновенной скорости неважен, что
важен лишь итог — какое расстояние машина пройдет за час. Но
это неверно. Вот машина проезжает по мосту, и дорожный знак
показывает, что здесь не разрешается скорость свыше 10 км в час.
Милиционер останавливает водителя и налагает на него взыскание за
превышение дозволенной скорости: оказывается, машина шла со
скоростью 20 км в час. Но откуда это известно? Кто знает, какое
расстояние машина прошла за предшествующий час и сколько ки-
лометров она пройдет за последующий час? Ясно, что в этом слу-
чае как раз совершенно не важно знать, какое расстояние машина
прошла или пройдет за тот или другой большой промежуток вре-
мени; важно знать только, как быстро движется она сейчас, в дан-
ный момент.
Если бы движение машины было равномерно, если бы она шла
всегда одинаково быстро, то оценка «40 км в час» полностью ха-
рактеризовала бы ее скорость — одну и ту же в любой момент дви-
жения. Но машина движется неравномерно; за час скорость ее много
раз резко меняется, и когда нам говорят, что машина прошла в час
40 км, то это дает нам представление лишь о некоторой средней
скорости машины за этот час и ничего не говорит о скорости ее
в тот или другой определенный момент, в том или другом опреде-
ленном месте ее пути. Час — это слишком большой промежуток
времени, за который скорость движения машины может меняться
много раз.
Это, естественно, наводит нас на мысль выбрать вместо часа
меньшую единицу времени, например секунду. Если, допустим, в те-
чение секунды наша машина прошла 20 М> то не может ли этот
факт характеризовать нам скорость ее движения, скажем, в началь-
ный момент этой секунды? Очевидно, здесь дело обстоит уже гр-
§ 26] МГНОВЕННАЯ СКОРОСТЬ НЕРАВНОМЕРНОГО ДВИЖЕНИЯ 107
раздо лучше: за секунду машина, как правило, уже не будет изме-
нять своей скорости сколько-нибудь значительно, будет двигаться
в различные моменты этой секунды примерно одинаково быстро;
и, вероятно, мы сможем считать среднюю скорость за одну секунду
хорошей приблизительной оценкой «мгновенной» скорости движе-
ния машины в любой момент этой секунды.
Так обстоит дело с грубым объектом — автомашиной. Но физика
и техника постоянно имеют дело со случаями гораздо более тон-
кими, когда движущееся тело на протяжении одной секунды меняет
свою скорость значительно чаще и в значительно более широких
границах, чем автомашина в течение часа. Представьте себе только
одну из мельчайших частиц материи — атом или электрон, — в те-
чение секунды претерпевающую миллиарды столкновений, радикально
меняющих ее скорость. Ясно, что для такой частицы секунда будет
огромной исторической эпохой в ее жизни и что путь, пройденный
частицей в течение этой секунды, не даст нам никакого представле-
ния о том, с какой скоростью частица двигалась в тот или другой
определенный момент.
Нам необходимо поэтому перейти теперь к общему изучению
вопроса, к которому мы достаточно подготовлены рассмотренными
примерами. Будем обозначать через t время, отсчитываемое от не-
которого определенного, раз навсегда выбранного момента, и через
s —путь, пройденный движущимся телом за время от начального
момента до момента Z*). Каждому значению t соответствует опре-
деленное значение $, так что $ есть функция от t\
Это соотношение называют законом движения данного тела;
мы будем считать, что этот закон движения нам известен.
Вопрос, который мы хотим решить, состоит в следующем: как,
зная закон движения, найти скорость движущегося тела в любой
момент времени /? Прежде чем перейти к решению этого вопроса,
мы должны, однако, сделать одно очень важное методологическое
замечание, которое необходимо для правильного понимания создаю-
щейся здесь ситуации и которое в одинаковой степени будет отно-
ситься и к значительному большинству тех прикладных задач, какие
нам предстоит рассмотреть в дальнейшем.
В большинстве привычных нам задач, когда требуется вычислить
ту или другую величину (корень квадратного уравнения, длину катета
прямоугольного треугольника и т. п.), нам хорошо известно, чтб
представляет собой искомая величина, т. е. известно ее общее опре-
деление; найти же требуется лишь ее числовое значение или буквен-
ное выражение, смотря по характеру поставленной задачи.
*) Ради простоты полезно допустить, что тело движется по прямой ли-
нии; однако все последующее остается верным и при значительно более ши-
роких предположениях,
108
ПРОИЗВОДНАЯ
[гл. 6
Сейчас же у нас положение совершенно иное: что такое скорость
движущегося тела в данный момент t,— этого мы не знаем, у нас
это понятие не было нигде определено; и на первый взгляд стоящая
перед нами задача представляется принципиально неразрешимой: как
же, в самом деле, можно найти способ вычисления такой величины,
о которой мы даже не знаем, что она собой представляет, опреде-
ление которой нам неизвестно? Чтобы сделать нашу задачу разум-
ной и разрешимой, мы должны понимать ее как двойное задание:
1) установить целесообразное общее определение мгновенной ско-
рости и 2) найти прием конкретного вычисления этой скорости. Так
мы и поступим, причем обе задачи, как мы увидим, мы сможем
решить единым рассуждением, дающим ответ на оба поставленных
вопроса.
Как мы увидим дальше, этот своеобразный логический характер
присущ значительному большинству задач геометрии и механики,
решаемых методами математического анализа.
Перейдем теперь к решению задачи. Наряду с тем моментом
для которого мы хотим определить мгновенную скорость движуще-
гося тела, рассмотрим еще некоторый позднейший момент /-f-Д/.
За промежуток времени Д/ между этими двумя моментами тело про-
ходит, очевидно, путь As =/(/-]- А/)—/(/), равный приращению
функции /(/), которое соответствует приращению А/ независимой
переменной. Мы можем г^оэтому сказать, что в течение промежутка
времени А/ между моментами t и /-|- А/ тело в среднем проходит
в каждую единицу времени (например, секунду) путь
Д/— Д/ * ш
Это отношение мы можем Назвать средней скоростью тела
между моментами t и t~\- №. Дает ли оно нам представление о мгно-
венной скорости тела в момент /? Если А/ велико, то за этот про-
межуток времени скорость тела может многократно и значительно
меняться, и потому по средней скорости за этот промежуток мы
ничего не можем заключить о мгновенной скорости тела в момент t.
Но если № мало, то можно рассчитывать, что за этот промежуток
времени скорость тела не успеет сколько-нибудь значительно изме-
ниться, что тело будет двигаться примерно одинаково быстро в любой
момент этого промежутка и что поэтому средняя скорость за этот про-
межуток с хорошим приближением может характеризовать нам мгно-
венную скорость тела в момент t. Говоря точнее, мы можем счи-
тать, что величина (1) тем ближе к интересующей нас скорости тела в
момент /, чем меньше приращение А/; еще точнее: величину (1) можно
сделать сколь угодно близкой к искомой скорости тела в момент
если взять промежуток времени № достаточно малым. Если обо-
значить искомую скорость через v (/), то это означает: К? — v (/)
§ 26] МГНОВЕННАЯ СКОРОСТЬ НЕРАВНОМЕРНОГО ДВИЖЕНИЯ 109
сколь угодно мало при достаточно малом Lt. А это в свою очередь
на языке теории пределов можно формулировать так: величина v (/)
есть предел отношения (1) при Д/->0:
v(0 = lim =lim /« + *0-/(0, (2)
Таким образом, мгновенная скорость движущегося тела есть
предел, к которому стремится отношение пройденного пути к про-
текшему времени при условии, что это последнее стремится
к нулю. Тем самым мы установили определение мгновенной скорости
и указали путь ее вычисления, т. е. решили оба вопроса, из кото-
рых состояла наша первоначальная задача.
Примечание 1. В формуле (2) мы должны рассматривать t
(момент, в который мы хотим определить скорость) как величину
постоянную; процесс, лежащий в основе предельного перехода, состоит
в том, что промежуток времени Lt безгранично убывает, в то время
как начальный момент t этого промежутка остается неизменным.
Разумеется, этот момент t может быть выбран произвольно, но раз
мы его выбрали, он должен уже оставаться постоянным в течение
всего вычисления скорости.
Примечание 2. Предел, о котором идет речь в соотноше-
нии (2), может существовать или не существовать в зависимости
от выбранного момента t и вида функции f (t). Если он не сущест-
вует, то в соответствующий момент времени скорость движущегося
тела указанным нами приемом определена быть не может. В этом
случае предпочитают не искать для мгновенной скорости другого
определения, а просто считать, что в такой момент этой мгновенной
скорости не существует.
Пример 1 (равноускоренное движение — свободное падение
О-/2
тел в пустоте). $=/(/) = ^, где g — постоянная (так называемое
«ускорение свободного падения»):
Д5 =/(/ + Д0 -/(0 = = gt Д/ -|- ;
As ._/(< +AQ-/(Q_ , . gAf.
Af— AT g ' 2 *
Таким образом, скорость свободно падающего в пустоте тела
с течением времени возрастает пропорционально протекшему времени.
Пример 2 (простое гармоническое колебание). s—f(t) = a sin<s>t
(где а и со — положительные постоянные).
Здесь под s надо понимать расстояние движущегося тела
от выбранного начала отсчета, считаемое положительным в одном
110
Производная
[гл. 6
направлении (например, вправо) и отрицательным в другом (влево).
Д s =У (£ —|— Д/) — /(/) = a sin а> (t At) — a sin wt =
о . । ДЛ . юД/
= 2а cos со (t у ) sin >2";
. <оД£
As . АЛ 8Ю"2*
Г/ = ашсо8ш(/ + у)-^-;
2
v(t) — a& coscot
В этом примере движущееся тело (если допустить, что движе-
ние происходит по прямой линии), очевидно, непрестанно колеблется
между s = a и s =— а (незатухающие колебания, постоянный раз-
мах). При нашем соглашении относительно знака величины $ мы,
естественно, получаем положительную скорость, когда тело движется
слева направо, и отрицательную — при движении в обратном напра-
влении. В точках ^ = -ьд мы должны иметь sinco/==±l и, значит,
cosatf = 0; следовательно, в этих точках мгновенная скорость обра-
щается в нуль; это и понятно, так как в этих точках меняется
направление движения, а следовательно, и знак скорости. Наиболь-
шую скорость | v (f) | = aw тело имеет при cos о>^ = н- 1; в эти моменты
s== a sin <»/=(), т. е. тело как раз проходит через начало отсчета.
§ 27. Локальная плотность неоднородного стержня
Стержнем называют такое физическое тело, которое по своей
форме приближается к отрезку прямой линии; поперечное сечение
его мало и одинаково на всем протяжении стержня. Стержень назы-
вается однородным, если любые два его участка одинаковой
длины имеют одинаковую массу (или, что то же, одинаковый вес);
для однородного стержня массы любых его участков пропорциональны
их длинам, так что отношение d массы какого-либо участка к его
длине есть величина постоянная, одна и та же для всех участков.
Эту величину d можно рассматривать как массу, приходящуюся на
единицу длины стержня; ее называют плотностью однородного
стержня.
Если стержень неоднороден, т. е. вещество расположено в нем
местами плотнее, а местами менее плотно, то на два участка одина-
ковой длины будут приходиться, вообще говоря, различные массы.
Отношение массы участка к его длине будет различным для различ-
ных участков; это отношение естественно называть средней плот-
ностью данного участка: стержня. Так как на протяжении данного
участка плотность вещества может много раз и значительно меняться,
то средняя плотность этого участка, вообще говоря, ничего не поз-
воляет нам узнать о том, сколь плотно вещество в ближайшем сосед-
§ 27] локальная плотность неоднородного стержня 111
стве той или другой отдельной точки этого участка, подобно тому
как в предыдущем параграфе средняя скорость автомашины за час
не позволяла нам сделать никаких заключений о том, как быстро
машина движется в данный момент.
Таким образом, желая охарактеризовать плотность вещества
в ближайшем соседстве какой-либо определенной точки стержня, мы
встречаемся с затруднением в точности того же рода, какое мы имели
перед собой в § 26, когда пытались оценить мгновенную скорость
движущегося тела. А если новое затруднение во всем подобно ста-
рому, то мы, естественно, можем рассчитывать, что и преодоление
его нам удастся теми же приемами.
Примем за начало отсчета О один из концов стержня и будем
обозначать через х абсциссу какой-либо точки стержня относительно
этого начала отсчета. Масса вещества, расположенного на участке
(О, х), есть функция от х, возрастающая с возрастанием х; обо-
значим ее через m=f(x). На участке между х и x-f-A^ (где Дх—
любое положительное число) расположена, очевидно, масса
Дт =/(х + Дх) —/(х);
средняя плотность вещества на этом участке равна поэтому
Ат___/(x-f-Дх) — /(х)
Дх Дх
Если число Дх велико, то на протяжении участка (х, х Дх) плот-
ность может значительно меняться, и у нас нет оснований считать,
что полученная нами средняя плотность окажется подходящей для
характеризации плотности вещества в ближайшем соседстве точки х
стержня. Напротив, если Дх очень мало, то мы можем рассчиты-
вать, что на протяжении участка длины Дх плотность вещества не
успеет измениться сколько-нибудь значительно, так что средняя
плотность на этом участке будет близка к тому искомому нами
числу, которое должно характеризовать плотность вещества в бли-
жайшем соседстве точки х. Это соображение становится тем более
убедительным, чем меньше число Дх; отсюда, как и в предыдущем
параграфе, мы обоснованно заключаем, что в качестве меры плотности
вещества в ближайшем соседстве точки х стержня нам естественно
принять величину
Д* —О
(при условии, разумеется, что написанный предел существует). Опре-
деленную таким образом величину d (х) называют л о к а л ь н ой (т. е.
местной) плотностью стержня в точке х *). Очевидно, мы
*) Термин «локальный» (местный) нам уже знаком из предшествующих
глав; им всегда отмечается такая характеристика, которая может быть раз-
личной в различных точках.
112 ПРОИЗВОДНАЯ [гл. 6
можем рассматривать эту локальную плотность как меру той
быстроты, с которой изменяется масса стержня при увеличении его
длины; такая точка зрения еще больше сближает задачу настоящего
параграфа с той, которую мы решали в § 26; остающееся между ними
различие состоит в первую очередь в том, что в нашей новой задаче
полностью отсутствует время; если раньше мы искали мгновенную
скорость изменения пройденного расстояния с течением времени, то
здесь предметом нашего исследования служит локальная скорость
изменения массы стержня с увеличением его длины. Время в этом
процессе не играет никакой роли. Мы видим, таким образом, воз-
можность говорить о скорости изменения функции относительно
независимой переменной, какое бы реальное значение ни имели эти
две величины. Такое обобщение идеи скорости имеет для математи-
ческой теории решающее зь^чение; мы рассмотрим его во всей по-
дробности в следующем параграфе.
§ 28. Определение производной
Пусть y=f(x)— произвольная функция от независимой перемен-
ной х. Если при изменении х у изменяется равномерно (для этого,
как мы знаем, надо, чтобы/(х) была линейной функцией, /(х)=ах4-?)>
то скорость изменения величины у относительно х есть постоянное
число а, равное отношению приращения величины у к соответст-
вующему приращению величины х(а=^1, причем это отношение
будет всегда одно и то же, каковы бы ни были начальное значение
величины х и ее приращение Дх. Все это мы видели в § 25 и там
же мы указали, что в общем случае, когда у изменяется неравно-
мерно, вопрос о скорости изменения величины у относительно х не
можЛ* решаться так просто. Если мы от некоторого значения х
независимой переменной перейдем к новому ее значению х-\-кх,
то величина у при этом получит приращение by=f(x-\- Дх)—/(х);
отношение будет различным для различных участков, т. e.J будет,
вообще говоря, зависеть от выбора как начального значения х, так
и приращения Дх независимой переменной. Это отношение описы-
вает нам среднюю скорость изменения у относительно х на участке
(х, х-]-Дх). Если же мы хотим найти локальную скорость этого
изменения, т. е. ту быстроту, с которой изменяется у относительно х
в соседстве данного значения х независимой переменной, то, повто-
ряя буквально рассуждения двух рассмотренных нами примеров, мы,
очевидно, приходим к выводу, что эту скорость мы должны опреде-
лять как предел
lim = + (1)
д^->оДх Дх-*0
отношения приращения функции к приращению независимой перемен-
§ 28f ОПРЕДЕЛЕНИЕ ПРОИЗВОДНОЙ f f3
ной, когда это последнее стремится к нулю. При этом и в общем5
случае сохраняют силу все замечания, сделанные нами по поводу
рассмотренных примеров. О локальной скорости можно говорить
лишь в том случае, когда написанный предел существует; в против-
ном случае не существует и скорости. Локальная скорость, вообще
говоря, различна в различных точках (т. е. для различных значений х
независимой переменной); в выражении (1} мы должны рассматри-
вать значение х как постоянное при совершении предельного пере-
хода (меняется при этом только Дх); однако это постоянное значе-
ние может быть выбрано произвольно, и при различных его выборах
получаемая скорость будет различной (поэтому мы и называем ее
«локальной»).
Локальная скорость, определяемая предельным переходом (1),
может оказаться либо положительной, либо отрицательной, либо
нулем. Очень легко установить реальное значение знака ско-
та
рости. В самом деле, если, например, предел отношения при
Дх—>0 положителен, то, как мы знаем (теорема 2 § 10), и само это
отношение положительно при достаточно малом Дх; это означает,
что мы должны иметь Ду^>0 при Дх^>0 и Ду<^0 при Дх<^0;
короче говоря, приращения функции и независимой переменной во
всех случаях имеют одинаковый знак. Это же в свою очередь озна-
чает, что у возрастает с возрастанием х (и, следовательно, убывает
с убыванием х). Наоборот, если скорость оказывается отрицатель-
ной; то аналогичное рассуждение показывает, что с возрастанием х
величина у должна убывать, и обратно. Таким образом, знак ско-
рости определяет собой направление изменения функции (т. е. воз-
растание или убывание ее); быстрота же этого изменения во всех
случаях определяется, конечно, абсолютным значением скорости.
Заметим, наконец, что в наших примерах мы ограничивались слу-
чаем положительных приращений Дх (хотя в конкретных задачах
в конце § 26 все расчеты остаются верными и приводят, как легко
проверить, к тем же результатам и при отрицательных Дх). Но
в выражениях (1) мы всегда будем понимать предельный переход
в его обычном смысле, т. е. требовать, чтобы предел существовал как
при Дх 0, так и при Дх -> — 0 и чтобы эти два предела сов-
падали между собой; только при этом условии мы будем считать
локальную скорость изменения функции у относительно х суще-
ствующей.
Мы видим, таким образом, что с чисто математической точки зре-
ния вычисление скорости изменения функции всегда приводится к неко-
торому определенному предельному переходу. Когда дана функция
y=f(x) и выбрано значение х независимой переменной, то речь
всегда идет о вычислений предела
Um /(^ + М—/W ,
11111 A v » 8
8 А. Я. Хинчин
ПРОИЗВОДНАЯ
[гл. 6
Ш
предел этот в тех случаях, когда он существует, имеет, вообще
говоря, различное значение для различных х; он есть, таким образом,
функция от х, которую обычно обозначают через у' или f (х) и назы-
вают производной функции y=f{x) по независимой перемен-
ной х. Итак,
у =/ (х) = 11m /<•* + **)-/<£> .
‘Дх —0
Производной функции у =/(х) по независимой перемен-
ной х называется предел отношения приращения функции к при-
ращению независимой переменной при условии, что это последнее
стремится к нулю.
Операция отыскания производной f (х) данной функции /(х)
называется дифференцированием этой функции. Чтобы уметь
вычислять скорость изменений, происходящих в природе и в техни-
ческих процессах, мы должны научиться дифференцировать возможно
более широкий класс функций.
Дифференцирование функций есть одна из важнейших операций
математического анализа, которую мы должны поэтому тщательно
изучить. Учение о правилах дифференцирования и о свойствах произ-
водных называется дифференциальным исчислением и
составляет собой один из основных разделов математического анализа.
В первую очередь мы должны овладеть рядом как общих правил,
так и специальных приемов дифференцирования, которые в конечном
счете позволят нам находить производные весьма широкого, класса
функций, в том числе — всех элементарных функций. Это мы сделаем
в следующем параграфе.
§ 29. Правила дифференцирования
В этом параграфе мы, чередуя установление общих приемов диф-
ференцирования с отысканием производных отдельных функций,
постепенно научимся находить производные весьма широкой класса
функций.
1. Производная постоянной. Производная постоянной величины
равна нулю.
Точнее это означает: если функция y=f{x) постоянна в неко-
тором отрезке, заключающем внутри себя точку х, то у =/г(х) = 0.
В самом деле, при достаточно малом |Дх| мы имеем f(x-\- Дх)=/(х),
Ду
и значит, Ду = 0; отсюда при Дх^О будет и т~ = 0, а значит, и
= lim ~ = 0.
Дх-*0Д*
2. Производная степени. Если у=хп {где п — целое положи-
тельное число), то у = пхп~1.
§ 29] ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 116
В самом деле, формула бинома Ньютона дает:
Ду = (х 4~ Дх)" — х" = nxn~lLx + п(п-Х) х"-« (Дх)’ + ... 4- (Дх)я,
откуда при Дх О
g=их'1'14- Хп-2ДХ 4- ... 4- (Дх)я-‘.
В правой части этого равенства все слагаемые, начиная со вто-
рого, содержат множителем Дх и, следовательно, стремятся к нулю
при Дх->0. Поэтому в пределе
У = Нт ^ = лхп“1.
д^оДх
3. Производная алгебраической суммы. Если
y = Ui±U%± ... ±ип, (1)
где ui9 ... , ип— функции от х, имеющие производную в точке х,
то функция у также имеет производную в точке х, и
y = <±<zt ... ±и'п.
Короче: производная алгебраической суммы равна алгебраической
суммё производных. В самом деле, пусть, когда х получает прира-
щение Дх, функции ... , ип, у получают соответственно при-
ращения Дйр Д«в, ... , Д«л, Ьу. При новом значении х-\-Ьх неза-
висимой переменной мы в силу (1) имеем:
Д' 4- Ду = («! 4- Д«!) ± («а 4- Диа) ± ... ± (и„ 4~ Ди„). (2)
Вычитая (1) из (2), находим:
Ду = Д^ ± Ди2 ± ... ± Дил,
откуда при Дх О
Дх Дх — Дх — * ” — Дх ’
наконец, переходя к пределу при Дх—>0, убеждаемся, что У суще-
ствует и
У = <±<± ... ±Ил.
4. Постоянный множитель может быть вынесен за знак диф-
ференцирования. Точнее: если у = аи, где а — постоянная, а и —
функция от х, и если и в некоторой точке имеет производную,
то в этой точке существует и У и У = ati. В самом деле, пусть,
когда х возрастает на Дх, и и у получают соответственно прира-
щения Дк и Ду. Тогда
у 4» Ьу == а (и Ди);
ПРОИЗВОДНАЯ
[гл. б
Мб
вычитая отсюда почленно равенство y = atf, находим:
Ну = а Да,
и значит, при Дх О
Ду______________________________ Да
Дх а Дх *
Наконец, переходя к пределу при Дх->0, мы видим, что У суще-
ствует и y = aii.
5. Производная многочлена. Установленные нами до сих пор
четыре правила приводят уже к очень важному результату: они пока-
зывают, что всякий многочлен у — а^-^-а^х^ 4" ••• имеет
производную при любом значении х, и позволяют сразу написать
выражение этой производной. В самом деле, применяя установленные
правила, мы легко находим:
У = паохп-1-^(п— ••• +ал-р
Таким образом, производная многочлена всегда есть также
многочлен и притом степени, на единицу менымей, чем данный.
6. Производная произведения. Пусть у = uv, где и и v — функ-
ции от х, имеющие производные в точке х. В наших уже привыч-
ных обозначениях мы тогда имеем:
у Ну = (и Д и) (у Дг0>
откуда вычитанием получаем:
Ну = и Hv -|- -|- Ни Н v,
и значит, при Дх Ф О
Ду Дц . Да • А Да
-г- = и 7—Н а—г Дм л~ •
Дх Дх * Дх * Дх
При Дх—>0 в правой части и и v мы должны считать постоянными
(они зависят от х, но не от Дх), а Ни и Hv стремятся- к нулю (это
_ _ . . Дц Д^
следует из теоремы 8 § 11, так как отношения и д-^, по нашему
предположению, имеют пределы). Поэтому предел последнего сла-
гаемого правой части равен 0«т/ = 0 и предельный переход дает:
у = uv’ -\-vii*.
производная произведения двух функций равна произведению пер-
вого множителя на производную второго,, сложенному с произве-
дением второго множителя на производную первого.
Примечание. Существование производной У здесь не пред-
полагается заранее, а доказывается в процессе вывода в точности
так, как это имело место при выводе правил 3 и 4. Полная форму-
лировка доказанного правила поэтому гласила бы: если функции и
и v имеют производные в некоторой точке, то и функция y — uv
§ 29]
ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ
117
имеет производную в этой точке и У = utf + vtf. Это же замечание
относится и ко всем последующим правилам рассматриваемого типа.
Простая индукция, которую мы можем предоставить читателю,
позволяет распространить предыдущее правило на случай произве-
дения любого числа сомножителей:
Если y = UiU9 ... ип, то (при существовании производных функ-
ций и19 ... , ип)
У = ... и„4-И1< ... «„ + ... + «!«, ... «4:
чтобы составить производную произведения любого числа сомно-
жителей, надо продифференцировать какой-либо один из сомно-
жителей и умножить^ полученную производную на произведение
всех остальных сомножителей*, проделать это всеми возможными
способами и сложить между собой все полученные произведения.
Мы предоставляем также читателю доказать в виде упражнения,
что из этого правила как частные случаи могут быть получены пра-
вила 2 и 4; такого рода обоснование старых результатов на новой,
более широкой базе всегда поучительно и часто служит хорошим
контролем взаимной согласованности полученных результатов.
7. Производная частного. Пусть у=^, где и и v — функции
от х, имеющие производные в точке х, причем в этой точке v ф 0.
В ндших обычных обозначениях мы имеем тогда:
__и + Да
v + Av *
откуда вычитанием получаем:
А ___а + Да а_____v Да — а Av
v + A v v v (v + Av) ’
Отсюда при Дх О
Да Av
а ---и т~
Ду___ Дх Дх.
Дх v (v + Av) ’
здесь, как и в предыдущем выводе, при Дх->0 и и v постоянны,
a Av -> 0; поэтому предельный переход доказывает существование У
и дает для этой производной выражение
В частности, если функции и и v — многочлены, то отношение
~ представляет собой рациональную дробь; формула (3) показывает
тогда, что производная рациональной дроби всегда есть также рацио-
нальная дробь.
118
ПРОИЗВОДНАЯ
[гл. 6
8. Производные тригонометрических функций, а) Пусть у—sinx.
Тогда
у Ду = sin (х 4-
Ду = sin (х Дх) — sin х=2 cos (х -|- ^sin ,
. Ьх . Дх
а х / а \ sin Л f а \ sin
Ly / । Ах\ 2 / । Дх\ 2
-У---------------------- = 2 CDS X + -FT —7-= COS X 4- -FT ~A—;
Дх г \ •’ 2 / Дх \ 1 2/ Дх ’
2
при Дх->0 последний множитель имеет пределом единицу; с дру-
гой стороны, в силу непрерывности функции cos х (см. § 24)
cos (х-|--g-jcosx (Дх->0),
поэтому предельный переход доказывает существование предела
,1'?»(й)=у " шет:
у = cosx.
б) Пусть теперь .у —cosx; совершенно аналогичный расчет, кото-
рый мы можем предоставить читателю, дает:
У — — sinx.
\ т-г .sinx
в) Пусть у — tg х = ; мы имеем дело с отношением двух
функций, производные которых мы уже умеем находить: полагая
sinx = «, cosx = tf, мы находим поэтому по формуле (3):
. cos х cos х— sin х (— sin x) 1
COS2X. COS2 X*
г) Если ey = ctgx = ^j, тЬ совершенно аналогичный расчет
дает:
у =_______!_
У sin2 х •
Читатель без труда найдет самостоятельно производные функций
v = secx = —— и у = cosecх = -Д— .
cos х sin х
9. Прежде чем итти дальше, нам необходимо вывести одно очень
важное предельное соотношение. В § 17 мы доказали, что выраже-
ние (1 -|-1 , когда п пробегает последовательно ряд натуральных
чисел, стремится к некоторому пределу, и обозначили этот предел
через е; допустим теперь, что в выражении (1 + у) переменнаях
§ 29] ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 119
безгранично возрастает (х -> 4” °°)> проходя через все промежуточ-
ные значения, и убедимся, что и в этом случае мы имеем:
нт(1+^Г=е- <4>
В самом деле, обозначим для любого значения х через п наиболь-
шее целое число, не превосходящее х, так что
п^х<п-{-1.
Тогда для х^1, очевидно,
или
при х->4-°°, очевидно, и в левой части последних не-
равенств поэтому числитель имеет пределом е, а знаменатель —
едйницу, а в правой части первый множитель стремится к е, а вто-
рой— к единице. Таким образом, левая и правая части имеют при
х—►4“°° один и тот же предел е; к этому же пределу стремится,
следовательно, и средняя часть неравенств, чем и доказано соотно-
шение (4).
Допустим теперь, что — оо, и положим у =— х, так что
^->4-0° и
при у->4-00 в правой части первый множитель имеет по доказан-
ному пределом число е (так как у — 1 4“ °°)> а второй, очевидно,
стремится к единице; это показывает, что
(1+4)*->е (х->—оо),
т. е. что соотношение (4) имеет место всякий раз, когда | х | ->4”°°>
независимо от того, какой знак при этом будет иметь величина х.
Пусть теперь в выражении
(14-аЯ
величина а стремится к нулю любым способом (мы допускаем только
420 производная [гл. 6
что а Ф 0, так как при а = 0 написанное выражение теряет смысл);
полагая -~ = х, мы имеем:
при ач-0 мы имеем а следовательно, по доказанному
выше U+*) последнее равенство показывает поэтому, что
lim(l 4~°0а = е* (б)
а -+ 0
Вывод этого соотношения и был нашей целью; нам предстоит сейчас
же им воспользоваться.
10. Производная логарифма. Пусть y = lgaxt где —по-
стоянное положительное число, и х^>0. Тогда
.? +Ay = lgo(x +Дх),
ДУ=1?О(* + Д*) —Iga*=lgo(l +^)>
X
Положим — = а, тогда при Дх->0 мы будем иметь а->0, а
потому в силу соотношения (5)
х
/ д *»\ А.
П + т) =0+«)’-**;
а так как функция lgax непрерывна, то отсюда
X
Iga {(1 + тП lgae (Д* * 0);
таким образом, lim существует и
Дх-+0
y = ^lgee.
Этот результат особенно замечателен тем, что производная транс-
цендентной функции lgax оказывается очень простой рациональной
функцией вида £, где с — постоянная. Особенно простой вид полу-
чает эта производная, если выбрать число е в качестве основания
системы логарифмов, так как тогда lgae = lgee = 1 и
$ 29} ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 12Т
В дальнейшем мы увидим, что и многие другие формулы анализа
получают особенно простой вид, если логарифмы берутся при осно-
вании е. Поэтому в анализе почти всегда за основание системы лога-
рифмов принимают число е; логарифмы при основании е называют
«натуральными»; натуральный логарифм числа х обозначается через
1пх; таким образом, если <у = 1пх, то у = --*> если же J' = lgex,
то, как мы видели,
y=-|igoe;
но из а = е1па мы, логарифмируя при основании а, получаем:
lgea=l=lnalgoe, lgee=^,
так что мы можем записать предыдущее равенство в виде
у =___L_
J х In а ’
11. Производная сложной функции. Пусть у есть сложная функ-
ция от х, т. е. у задается как функция некоторой промежуточной
переменной и, у ==f(tt)9 а и задается как функция от х, ц = ф(х),
так что
(6)
наша задача состоит в том, чтобы, зная производные функций /(и)
и (х) (т. е. умея дифференцировать у по и и и по х), найти про-
изводную функции (6) (т. е. продифференцировать у по х).
Пусть мы даем величине х приращение Дх; тогда величина и
получает определенное приращение Ди, а следовательно, и у полу-
чает приращение &у\ при этом если Дх->0, то и Ди->0, Ду—>0;
положим:
— f (и), если Ди О,
а___ Ди j \ » -7-
О, если Ди = 0.
Д V
Так как при Ди->0 мы ^меем -*/(«)> то, очевидно, а-► О
при Дх 0; далее, при Ди 0 из определения числа а следует:
Ду = f (и) Ди —|— а Ди;
но непосредственно ясно, что это соотношение имеет место и при
Ди —0 и, следовательно, всегда; деля обе части этого соотноше-
ния на Дх, мы находим:
Ду л / ч । Ди
ш
ПРОИЗВОДНАЯ
[гл. 6
но при Дх 0 мы имеем у (х) и а 0; поэтому предельный
переход доказывает существование lim №-\=у и дает:
. w Дж-*0'
У =Г («) ф' (*) [ф С*)] ф' (*)• (7)
Мы видим, что производная сложной функции равна произве-
дению производной данной функции по промежуточной переменной
на производную промежуточной переменной по независимой пере-
менной. Таким образом, чтобы найти производную сложной функции,
заданной двухзвенной цепью y=f(u), u = q>(x)9 надо просто про-
дифференцировать каждое звено цепи в отдельности и перемножить
между собой полученные производные.
Пример 1. у = sin Ах, где k — постоянная; положим kx = u9
так что
y = sin«, u = kx*9
формула (7) дает:
У — cos и • k = k cos kx.
Пример 2. y = lncosx, cosx = «, j==ln«; по формуле (7)
. 1 , . x sinx ,
У = — (— sin x) =--------= — tg x.
и v 7 cosx &
Простой индукцией найденное нами правило дифференцирования
сложной функции распространяется и на сложные функции, задавае-
мые с помощью цепи из трех и более звеньев; так, если
>=/(«), «=?(*»), Т»==ф(х),
то для производной у по х мы находим выражение
у =/' («) У (у) Ц (X) =f {9 [ф (х)]} у [ф (х)] Ц (х).
12. Производная обратной функции. Мы знаем, что соотноше-
ние, определяющее у как функцию от х, в некоторых случаях по-
зволяет определить и, обратно, х как функцию от у. Пусть y—f(x)
и пусть обратная функция есть х = (у). Пусть в некоторой точке
х — у(у) производная f (х) существует и отлична от нуля; прира-
щению Ду величины у соответствует приращение Дх величины х;
так как Ду=/(х-[-Дх)—/(х), то при Ду ф 0 мы обязательно
имеем и Дх Ф 0; поэтому при Ду 0
Дх__J_
Ду Ду ’
Дх
Пусть теперь Д_у —> 0; если функция х = (.у) непрерывна в точке у9
то мы будем иметь и Дх—>0, а следовательно,
(8)
§ 29]
ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ
123
соотношение (8) показывает поэтому, что при Д_у->0 отношение
Aj стремится к ; другими словами, производная ф 0/) суще-
ствует и равна до . Мы приходим, таким образом, к следующему
правилу дифференцирования обратной функции:
Если функция у = f (х) имеет в точке х отличную от нуля
производную и если обратная функция х = ср(у) непрерывна
в точке у, то У (j) существует и равна ууу.
13. Производные показательных функций. Пусть у = ах, где
а — постоянное положительное число; тогда х = производная х
по у равна согласно 10
У=_
у Ina ’
в силу только что доказанного правила дифференцирования обратной
функции мы имеем поэтому:
уг = -±- =у In а = ах In а;
в частности, если у — е\ то у — ех, т. е. «простейшая» показа-
тельная функция инвариантна относительно операции дифферен-
цирования*. производная этой функции равна ей самой.
Если у — еах, где а — постоянное число, то мы можем, полагая
ах = и, принять у за сложную функцию от х, и правило (7) легко
дает:
у = аеах = ау.
В приложениях часто находят себе применение так называемые
«гиперболические функции» •— «гиперболический косинус»
chx==^+£±
и «гиперболический синус»
читатель легко проверит, что из этих двух функций каждая служит
производною другой.
14. Производная степенной функции. Пусть у=ха, где а —
любое постоянное число. В пункте 2 мы видели, что если а — нату-
ральное число, то
у = оха“1;
теперь мы покажем, что эта формула остается верной для любого о.
ПРОИЗВОДНАЯ
[гл. 6
Мы можем написать
у = Xя = еа 1п *;
полагая а1пх = и, мы имеем:
у = еи, a = alnx,
и следовательно, по правилу дифференцирования сложной функции,
У = • — = х* • — = ах*-1,
X X
что мы и хотели доказать.
В частности, при а = ~ мы имеем:
У = У = —7=-.
2^х
При а = — 1, У = ^,У = — и т. д.
Этим же приемом легко находятся производные значительно более
широкого класса функций
где /(х) и ф(х) — дифференцируемые функции. В самом деле,
j/ —е? (*)1П/(•*) = и = ф (х) In f (х),
и следовательно, по правилу дифференцирования сложной функции,
у = е» {ф(х) 1п/(х)}' = {/(х)р₽ (*> (ф(х)^ + ф' (х) 1п/(х)}.
Пример. у — Xх, У = Xх {1 -|- In х}.
15. Производные обратных тригонометрических функций.
а) Пусть при — 1 < х < 1 у = arcsin х, так что у возрастает от
— ~ когда х пробегает отрезок (—1, 4~ О- Так как при
этом x = sinj, то на основании найденного в пункте 11 правила
y_.l_.J__ 1 __ J
X' COS J» ]/1— sins_y V1— Хг ’
причем квадратный корень должен быть взят положительным, так
как cosj^O при —Итак, если у = arcsin х, то
у= /=! (— 1<х<1).
> . : : К1 -•*’ ’
§: 29] ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ Г25
Совершенно аналогичным путем мы легко находим:
б) если _у=агссовх, то
У =-----г - - (— 1<*<О;
V\-x*
в) если у= arctg х, то
У = г+» (—со<х< + оо);
г) если j = arcctgx, то
У——j-q+ (—оо<х<4-оо).
Примечание 1. Интересно отметить, что обратные тригоно-
метрические функции, будучи трансцендентными, имеют своими про-
изводными очень простые алгебраические (в случае arctg хи arcctgx—
даже рациональные) функции (с аналогичным случаем мы встрети-
лись уже при дифференцировании логарифма).
Примечание 2. Обращает на себя внимание тот факт, что^
производные функций arcsin х и arccosx отличаются друг от друга
только знаком (и то же самое имеет место и для производных функ-
ций arctg х и arcctgx); это легко можно было предвидеть,
если продифференцировать хорошо известные тригонометрические
тождества
• arcsin хarccosх — у, arctg x-f-arccig х = у.
16. На протяжении этой главы мы научились дифференцировать
все простейшие элементарные функции; производные этих функций
мы сопоставляем й следующей таблице:
У У' У У' У У У У*
л 0 ах ax In a ‘g* 1 arctg x 1
и cos2 X 1+x2
«л in X 2 ctgx 1 arcctgx 1
X ctx I X sin2x 1+x8
2 1 1g X 1 arcsin x 1 shx chx
X X* xlna V1—Xs
]<х 1 sinx cos X arccosx 1 chx shx
У I — X»
е* COS X — sin x
Вместе с тем ряд доказанных нами общих правил дифференциро-
вания позволяет нам легко находить производные любых комбина-
ций из этих функций, получаемых из них алгебраическими операциями
или составлением сложных функций в любом числе. Чтобы читатель мог
126
ПРОИЗВОДНАЯ
[гл. 6
оценить, насколько широк класс тех функций, которые он теперь
умеет дифференцировать, мы рекомендуем ему в виде упражнения
попытаться найти такую функцию, для которой он сам не сумел бы
отыскать производной. Трудность этой задачи покажет ему, на-
сколько полно теперь его умение дифференцировать функции. Однако
этого принципиального умения еще недостаточно; каждый математик
должен научиться дифференцировать быстро и безошибочно, а для
этого необходимо проделать большое количество упражнений.
Упражнения на дифференцирование функций имеются в большом
числе в задачнике Б. П. Демидовича, отдел II, § 1. Кроме прора-
ботки всех примеров (задачи 14—68), мы очень рекомендуем про-
думать и решение некоторых задач (например, задачи 72, 73, 79, 90, 91).
§ 30. Вопросы существования и геометрическая иллюстрация
Данная функция y=f(x) имеет производную в точке х тогда
и только тогда, если существует предел
1Ы1 + = Пт
Дх 0 Дх -> 0
Прежде всего легко убедиться, что существование этого предела
требует, чтобы функция /(х) была непрерывна в точке х; в самом
деле, в силу теоремы 8 § 11 из существования предела отношения
~ при Дх->0 следует, что приращение Ly должно быть бесконечно
малым при Дх->0, а это и означает, что функция y=f(x) непре-
рывна в точке х. Таким образом, ни в одной точке разрыва функ-
ция /(х) не может иметь производной; в частности, функция, кото-
рая всюду разрывна, нигде не имеет производной (вспомним функ-
цию D(x), §§ 4, 20).
Может ли непрерывная функция не иметь производной? Легко
убедиться в возможности этого случая. В самом деле, прежде всего
может случиться (и это бывает нередко), что пределы
Нт
дх—4-о
Иш
Дх 0
(I)
Дх ’
Ьх
существуют, но не равны между собой; единый предел при Дх~>0
тогда не существует, а значит, нет и производной. Так обстоит дело,
например, с функцией у/ = |х| при х = 0: так как в этой точке
j/ = 0, то Ьу совпадает с у (а Дх совпадает с х); мы имеем:
Ду _ у _ I х | .
Дх х х *
это отношение равно 1 при любом х^>0 и —1 при
х<^0; поэтому
lim 4у_ 1 Пт Ау=______________i
Дх-»4-0 Дх * Дх-» — о Дх
любом
§ 30] ВОПРОСЫ СУЩЕСТВОВАНИЯ й ГЕОМЕТРИЧЕСКАЯ ИЛЛЮСТРАЦИЯ 127
Спрашивается, далее, может ли случиться, что для функции j/=/(x),
непрерывной в точке х, оба предела (1) отсутствуют, так что нет
ни правой, ни левой производной? Такой случай также возможен,
хотя построение примера здесь уже несколько сложнее. Рассмотрим
определенную для всех х функцию
J==/(x) =
х sin (х 0),
0 (х = 0).
Так как при х 0
|/(x)| = |xsin у |^|х|,
то /(х)->0 при х->0, а так как /(0) —0, то функция /(х) непре-
рывна при х = 0. Как и в предыдущем примере, здесь Дх=х, Ьу=у*>
поэтому при Дх 0
Ду у .1 .1
= sin — = sin —;
Дх х х Дх ’
если п — любое натуральное число, то при
<2)
мы имеем:
Д7 = 2к«+у, sin^=l,
а при
= <3>
i=2*"-T, sin-i=-L
Но при Дх—>-|-0 величина Дх бесчисленное множество раз будет
проходить через значения как вида (2), так и вида (3) со всё воз-
растающими поэтому отношение
Ду . 1 •
_rL = sin -v—
Дх Дх
будет бесчисленное множество раз колебаться между 1 и — 1
и, следовательно, ни к какому пределу стремиться не может. Это
значит, что первый из пределов (1) в данном случае не существует;
совершенно аналогично доказывается и отсутствие второго предела.
Во всех рассмотренных нами примерах данная функция была
лишена производной только в одной точке (при одном значении х),
во всех же других точках производная существовала. Легко, конечно,
на базе этих примеров построить непрерывную функцию, имеющую
две, три и вообще любое число точек без производной. Однако
в течение долгого времени полагали, что непрерывная функция все же,
128
ПРОИЗВОДНАЯ
[гл. 0
вообще говоря, т. е. всюду, кроме некоторых отдельных точек,
должна иметь производную; за это говорила в первую очередь на-
глядность геометрической картины, к рассмотрению которой мы
сейчас перейдем; и только во второй половине прошлого столетия
был опубликован пример такой непрерывной функции, которая ни
в одной точке не имеет производной. В настоящее время известно
много различных способов построения таких функций; однако все
они слишком сложны, чтобы мы могли привести здесь какое-либо
из этих построений.
Геометрическое изображение функций служит, как мы знаем,
чрезвычайно ценным орудием их исследования, прежде всего потому,
что многие черты в поведении функции,
которые трудно было бы прочитать при
ее задании с помощью формулы (а тем
более — таблицы), на графике выступают
с полной наглядностью и отчетливо видны
глазу. Любая особенности данной функ-
ции должна при ее графическом изобра-
жении выступать как некоторое геометри-
ческое свойство изображающей кривой.
Можно, в частности, заранее предвидеть,
что чертеж, изображающий функцию,
л х+Дя Л дает нам ВМесте с тем и наглядное пред-
Черт. 12. ставление о ее производной. Эту гео-
метрическую иллюстрацию производной,
«одинаково важную как для анализа, так и для геометрии, мы теперь
м должны рассмотреть.
Пусть мы изображаем функцию y=f(x) в декартовой системе
•координат (х, у) (черт. 12). Отметим на кривой точки М(х, у) и
N(х Дх, у Ду). Проведем прямую МР параллельно оси ОХ.
Очевидно, в прямоугольном треугольнике MNP катетами служат
МР = Дхи ЫР=Ду. Поэтому отношение равно тангенсу угла ф,
образуемого хордой MN с положительным направлением оси ОХ.
Заставим теперь Дх стремиться к нулю. При этом точка М будет
оставаться неподвижной, а точка Д7—неограниченно приближаться
к ней. Хорда MN будет изменять свое направление, причем в каждый
момент этого процесса угловой коэффициент этой хорды
. Ду
^ = 1Гх>
если данная функция имеет производную в точке х, т. е. если су-
ществует
11m ^=/'(х)=у,
Дх->0 Ax J v '
S' 30] ВОПРОСЫ СУЩЕСТВОВАНИЯ И ГЕОМЕТРИЧЕСКАЯ ИЛЛЮСТРАЦИЯ 129
то геометрически это означает, что направление хорды MN стре-»
мится при этом к некоторому предельному направлению МТ, обра-
зующему с положительным направлением оси ОХ угол а, причем
tga= lim, tg<p= lim т^=У. (4)
Дх О Дх -♦ 0 Л
Прямую МТ, которую чисто геометрически можно определить как
предельное положение секущей MN, соединяющей точку М с без-
гранично приближающейся к ней другой точкой N данной кривой,
называют касательной к данной кривой в точке М. Равенство (4)
показывает, что производная функции f(x) в точке х равна угло-
вому коэффициенту касательной к соответствующей кривой
ризует нам направление самой кривой в данной точке, то мы не-
посредственно видим, что если кривая (с возрастанием х, т. е. слева
направо) поднимается, то производная ее неотрицательна, и чем круче
подъем, тем больше величина производной; напротив, там, где кривая
(слева направо) опускается, производная неположительна, причем и
здесь абсолютная величина производной тем больше, чем круче спуск.
Эта геометрическая картина находится в полном согласии и с тем
пониманием производной как скорости изменения величины у отно-
сительно х, с которого мы начали эту главу; чем быстрее растет у
при возрастании х, тем круче при этом подъем кривой y=f(x) и
тем больше, следовательно, скорость у этого роста.
Найденный нами геометрический образ производной позволяет
наглядно разобраться и в тех примерах отсутствия производной,
которые мы рассматривали в начале настоящего параграфа. Черт. 13
дает нам график функции у = | х |, а черт. 14 — функции у = х sin ( .
В первом случае линия у = | х | при х = 0 имеет определенное на-
правление вправо и определенное направление влево, но эти два
9 А. Я. Хинчив
ПРОИЗВОДНАЯ
[гл. 6
гад
направления различны между собою; во втором случае кривая у —
= xsln в точке х = 0 ни вправо, ни влево никакого опреде-
ленного направления не имеет (отсутствие касательной): по мере
того как | х | становится все меньше и меньше, направление секущей
все вновь и вновь колеблется между прямыми у = х п у =— х и
потому не может стремиться ни к какому предельному направлению.
Наконец, с точки зрения геометрической интерпретации произ-
водной легко понять, почему так долго господствовала уверенность
в том, что всякая непрерывная функция должна иметь производную
(кроме, может быть, некоторых особых точек): действительно, очень
трудно представить себе непрерывную кривую, которая ни в одной
точке не имела бы касательной; и даже теперь, когда существование
таких кривых твердо установлено, мы лишь весьма приблизительно
можем представлять себе их течение; такая кривая в соседстве
каждой своей точки распложена примерно так, как кривая черт. 14
в соседстве точки О. Как бы то ни было, такие кривые существуют,
и открытие их было в истории математики одним из самых ярких
примеров того, как интуиция, господствовавшая целыми веками, может
все же оказаться ошибочной.
Заметим еще, что знание величины производной у в точке х,
очевидно, позволяет нам элементарными приемами построить каса-
тельную к кривой y=f(x) в точке Ж. Элементарная геометрия
учит нас строить касательные к окружностям, в аналитической гео-
метрии мы учимся находить касательные ко всем кривым второго
порядка, но только дифференциальное исчисление позволяет поста-
вить и решить общую задачу о проведении касательной к произ-
вольной кривой в любой данной ее точке.
ГЛАВА 7
ДИФФЕРЕНЦИАЛ
§ 31. Определение и связь с производной
Если функция _у=/(х) имеет производную в точке х,
У=/'(х)= lim
то величина
—У = а
Дх
бесконечно мала при Дх -> 0. Отсюда следует, что величина
Ду—У Дх = а Дх
есть бесконечно малая высшего порядка относительно Дх; пользуясь
символикой, введенной в § 12, мы можем обозначить эту величину
через о(Дх); таким образом,
Ду=у Дх-|-о(Д*)- (О
Так как у = f (х) зависит только от х и при Дх -> 0 остается по-
стоянной, то У Дх пропорционально Дх; поэтому соотношение (1)
показывает, что приращение функции, имеющей производную в точке х,
может быть представлено как сумма величины, пропорциональ-
ной &х, и величины бесконечно малой высшего порядка относи-
тельно &х.
Обратно: если приращение функции y=f(x) в данной точке х
может быть представлено в виде
Ьу = а Дх-|-о(Дх), (2)
где а не зависит от Ьх, то функция у дифференцируема в точке х
и f(x) = a. В самом деле, из (2) следует
Дх । \
и следовательно,
т. е. у—а.
132
ДИФФЕРЕНЦИАЛ
[ГЛ. 7
Пример 1. /(х) = 1п х-, в силу формулы (1)/(1 -j-_y)— /0)=
=f (ОУ + 0О') СУ-^О); но /(1)=0,/г(1)=1, и мы находим:
In (1+^) =^ + о СУ),
или, что то же,
ln(l-hy)~y (J->0);
этим важнейшим свойством обладают только натуральные лога-
рифмы, и именно х)но делает употребление натуральных логарифмов
особенно удобным в математическом анализе.
Пример 2. /(х) = е*; в силу формулы (1) /(х)—/(0) =
=/'(0)х4-о(х) (х->0); но /(0)==/'(0)=== 1, и мы находим
ех — 1 = х 4е о (х),
или, что то же,
ех—\^х (х->0).
Представление (1) приращения Ду чрезвычайно важно, так как
оно показывает, что приращение функции с точностью до бесконечно
малых высших порядков может быть представлено как линейная
функция приращения независимой переменной. Первое слагаемое У Дх
этого представления, пропорциональное Дх, называют диффе-
ренциалом функции у и обозначают через dy, так что
&у = dy о (Дх). (3)
Таким образом, дифференциалом функции называется произве-
дение производной этой функции на приращение независимой пере-
менной, так что, например,
d sin х = cos х Дх,
dlnx = —
и т. д. Отсюда, в частности, следует, что для определения диффе-
ренциала функции необходимо задать как начальное значение неза-
висимой переменной х, так и ее приращение Дх; только после этого
дифференциал функции становится вполне определенным и мойсет
быть вычислен.
Как мы видели выше, если приращение &у функции у может
быть представлено в виде (2), то первое слагаемое правой части
есть У &x = dy; поэтому дифференциал функции в данной точке
можно прямо определять как величину, пропорциональную Дх и отли-
чающуюся от &у на бесконечно малую высшего порядка сравни-
тельно с Дх. Такую величину часто называют главной линей-
ной частью приращения &у. Можно сказать, таким образом, что
дифференциалом функции (при данных х и Дх) называется глав-
ная линейная часть ее приращения. Вместе с тем мы видим: для
§31] ОПРЕДЕЛЕНИЕ И СВЯЗЬ С ПРОИЗВОДНОЙ 133
дифференцируемости функции в данной точке необходимо и доста-
точно, чтобы приращение ее имело главную линейную часть.
Это определение дифференциала как главной линейной части при-
ращения чрезвычайно важно, так как именно на нем основаны все
важнейшие применения дифференциала. Как мы увидим дальше, в слу-
чае функций нескольких переменных существование производных
и существование главной линейной части приращения не являются
уже равнозначными требованиями; и весьма замечательно, что наи-
более естественным определением дифференцируемости функции там
оказывается, как мы увидим, не существование производных, а именно
существование главной линейной части приращения.
Как теоретическое, так и непосредственно практическое (вычи-
слительное) значение дифференциала основано в первую очередь на
формуле (3). Зависимость Ду от Дх, вообще говоря, бывает сложной,
и вычислить точное значение by при данных х и Дх бывает трудно.
Соотношение (3) показывает, однако, что если Дх мало, то вычи-
сление by может быть с хорошим приближением заменено вычисле-
нием dy, так как разность между этими величинами (т. е. погреш-
ность, вводимая такой заменой) есть бесконечно малая высшего по-
рядка сравнительно с Дх и, следовательно, при малых Дх составляет
лишь ничтожную долю вычисляемой величины (если, конечно, У 0).
Вычислять же dy, как правило, несравненно проще, чем Ду, так
как dy зависит от Дх линейно.
Рассмотрим простой пример. Пусть мы хотим приближенно вы-
числить 1п(2-|-а), где а очень мало.
Дифференциал функции In х равен ; при х = 2 этот диффе-
ДХ А ,
ренциал равен -у; поэтому, полагая Дх == а, находим в силу фор-
мулы (3)
In (2а) — In 2 = у-|-о (а),
откуда
In (2 —а) = In 2 —]— у о (а);
таким образом, зная In 2, мы можем сразу с хорошим приближением
найти 1п(2-|-а) для достаточно малых а; так,
In 2,001 In 2 4-0,0005,
In 2,002 ««In 2-f-0,001,
In 2,003 In 2-f-0,0015
и т. д. Непосредственно ясно, какую пользу может принести этот
прием, например, при составлении таблиц логарифмов. Конечно, во
всех случаях требуется оценка той погрешности о(Дх), которую
мы допускаем, заменяя приращение функции Ьу ее дифференциалом dy.
134 ДИФФЕРЕНЦИАЛ [гл. 7
Такая оценка требует дальнейшего развития теории, и мы позже
узнаем, как она может быть произведена. Полезные упражнения
учащийся найдет в задачнике Б. П. Демидовича, отдел II, задачи
144, 145, 159, 160, 164. i
Так как производная функции у — х равна единице при любом
значении х, то дифференциал этой функции при любом значении х
равен просто Дх, так что для функции у = х приращение и диффе-
ренциал совпадаю? между собой *):
Дх = dx\
поэтому мы можем в выражении дифференциала произвольной функ-
ции ву=/(х) заменить Дх на dx\ это дает
dy =У dx,
откуда
го
производная равна отношению дифференциала функции к диффе-
ренциалу независимой переменной. Выражение (4) для производной
служит прежде всего очень удобным обозначением ее, столь же
употребительным, как обозначение У или /'(х); оно, правда, не-
сколько сложнее, но преимущество его состоит в том, что в нем
явно указана та переменная х, по которой производится дифферен-
цирование. Это особенно важно в тех случаях, когда в рассуждении
участвуют производные одной и той же функции по разным пере-
менным. Так, когда мы рассматривали дифференцирование сложной
функции, определяемой двухзвенной цепью y=f(u)> и —у (х) (§ 29),
в наше рассуждение входили производные величины у как по неза-
висимой переменной х, так и по промежуточной функции и; обозна-
чение У здесь менее удобно, так как непосредственно не видно,
какую из этих двух производных оно символизирует; напротив,
в обозначении (4) мы в этих двух случаях пишем соответственно
и и сразу видим, по какой переменной производится дифференци-
рование (правда, обозначение еще требует некоторого обоснова-
ния, которое будет дано в § 33).
Соотношение (4) и по существу имеет важнейшее значение для
дальнейшего развития дифференциального исчисления, как это вы-
яснится в ближайших параграфах.
♦) Очевидно, это имеет место для любой линейной функции у = ах4-0«
§ 32] ГЕОМЕТРИЧЕСКАЯ ИЛЛЮСТРАЦИЯ И ПРАВИЛА ВЫЧИСЛЕНИЯ 135
§ 32. Геометрическая иллюстрация и правила вычисления
Как всякая величина, определяемая течением функции у—/(х),
дифференциал этой функции при ее графическом изображении должен
получить определенную геометрическую иллюстрацию. Черт. 15 пред-
ставляет собой деталь черт. 12. Как и там, МТ представляет собой
здесь касательную к кривой y=f(x) в
точке М с координатами (х,у). В прямо-
угольном треугольнике МТР катет ТР
равен другому катету МР, умноженному
на тангенс угла а; но Л4Р=Дх, tga’=
=У =f (х); поэтому
ТР=У kx=f (х) Дх = <у;
таким образом, на нашем чертеже диф-
ференциал функции з/=/(х), соответ-
ствующий данным значениям х и Дх,
изображается отрезком ТР, представляю-
щим собой, очевидно, приращение орди-
наты касательной МТ на пути от х до
х —|— Дх (в то время как приращение
функции изображается приращением орди-
наты самой кривой y=f(x) на том же
участке). Так как Дх = б/х, то соотношение (4) § 31 между произ-
водной и дифференциалами на черт. 15 иллюстрируется элементарной
тригонометрической формулой
. ТР
^=МР’
связывающей катеты прямоугольного треугольника с одним из его
острых углов.
Не лишена интереса и механическая иллюстрация дифференциала.
Если s=f(t) есть закон движения какого-либо тела, то, как мы
знаем (см. § 26), s' = f (t) представляет собой мгновенную скорость
этого движения в момент t. Дифференциал пути
ds — s'
поэтому, очевидно, равен длине пути, который прошло бы тело,
если бы в течение промежутка времени Д/ оно двигалось с той ско-
ростью, какую оно имеет в момент t (т. е. если бы его скорость,
начиная с момента /, оставалась неизменной в течение промежутка
времени Д/). Когда мы говорим, что автомашина в данный момент
движется со скоростью 40 км в час, то мы хотим этим сказать, что
в течение ближайшего часа она прошла бы 40 км> если бы все время
сохраняла ту скорость, какую она имеет в данный момент. Значит,
это число (40 км) представляет собой для данного момента как раз
дифференциал проходимого машиной пути (когда М — 1 часу).
136
ДИФФЕРЕНЦИАЛ
[гл. 7
Отыскание дифференциала данной функции, так ясе как и отыска-
ние ее производной, называется дифференцированием этой
функциц. То, Чтоэтим двум операциям присваивается одной тоже
наименование, естественно и понятно: если производная У найдена,
то для получения дифференциала dy достаточно умножить ее на
данное число Дх, задаваемое совершенно отдельно и независимо
от х, что, очевидно, никаких новых аналитических расчетов уже не
требует. Каждое из правил дифференцирования (как общих, так и
специальных), установленных нами в § 29, простым умножением со-
ответствующего равенства на .Дх = dx преобразуется в правило вы-
числения дифференциалов. Так, например, при .у = sin х мы из
•y'=^=cosx
находим:
dy = CQ$ xdx;
i г dy 1
при у = \пх из у = -^ = -- таким же путем получаем:
и т. д. Если у=У1±Уъ± ... ±Уп> то из доказанного нами пра-
вила
У—У1±.у\±...±у’п,
или, что то же,
dx dx — dx — * ’ ’ — dx 9 *
мы умножением на dx находим:
dy = dyi±dyi± ... ±dyn
(правило нахождения дифференциала алгебраической суммы). Подоб-
ным же образом легко устанавливаем на основе соответствующих
правил для производной правила нахождения дифференциала произ-
ведения и дроби:
d (uv) = udv-\-v dut
d(ttxu^ ... un) = dux (и2 ... + du^(u3 ...
4- «1«2 dua (ut ... u„) + ... + ny, ... «„_! dun,
/jz \ vdu — udv
Дальнейшие полезные упражнения см. в задачнике Б, П, Демидовича,
отдел И, задачи 151—156.
§ 33] ИНВАРИАНТНОСТЬ ДИФФЕРЕНЦИАЛОВ 137
§ 33. Инвариантный характер связи производной
с дифференциалами
Мы видели, что для * независимой переменной дифференциал и
приращение совпадают между собой и что поэтому, если х есть
независимая переменная, первоначальное выражение
dy=f (х) Lx (1)
дифференциала функции y=f(x) может быть записано и в виде
dy=f(x)dx. (2)
Допустим теперь, что х не является независимой переменной, а
мыслится нами в свою очередь как произвольная (дифференцируемая)
функция новой независимой переменной t:
Так как дифференциал и приращение функции (в отличие от неза-
висимой переменной), вообще говоря, уже не равны между собой,
то теперь уже dx ф Lx, и потому соотношения (1) и (2) не могут
уже быть оба верными; в лучшем случае теперь верно какое-либо
одно из них. Мы покажем, что, какова бы ни была (дифференци-
руемая) функция ф (Z), соотношение (2) всегда остается справед-
ливым.
В самом деле, если y=f(x) и х = ф(/), где t — независимая
переменная, то мы можем рассматривать ву=/[ф(/)] как сложную
функцию от t. Производная этой функции равна, как мы знаем,
/г(х)фг(С> а значит, дифференциал ее равен
(3)
но, с другой стороны, мы имеем х = ф(/)> и следовательно,
dx = ф' (0 dt\
поэтому из (3) следует
dy=fr (x)dx,
что мы и имели в виду установить.
Таким образом, соотношение (2) или равносильное ему соотно-
шение
y = fW = £
имеет место во всех случаях, будет ли величина х независимой
переменной или любой функцией любой другой величины. Эта связь
производной с дифференциалами, как говорят, инвариантна (неиз-
менна) относительно любого преобразования независимой перемен*
ной.
138 ДИФФЕРЕНЦИАЛ [гл. 7
Интересно отметить, что в свете этой инвариантности правило
дифференцирования сложной функции
g=/'(*)V(O
может быть записано в виде
dy _ dy_ dx
dt ~ dx dt - w
^так как мы ведь сейчас доказали, что f (х) = ^0; в этом виде
это правилолредставляется, конечно, тривиальным; однако доказывать
это правило, опираясь на соотношение (4), было бы, разумеется,
неправильно, так как соотношение (4) само получено нами как след-
ствие инвариантности соотношения (2), в доказательстве которого
мы как раз рпирались на правило дифференцирования сложной
функции.
ГЛАВА 8
ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ
§ 34. Производные высших порядков
Производная yf=fr(x) функции y=f(x) есть функция той же
независимой переменной х, от которой зависит и у\ может поэтому
встать вопрос о дифференцировании функции yf. Если _yr =f (х) имеет
производную, то ее обозначают через y”=f'(x) и называют вто-
рой производной или производной второго порядка
функции y=f(x). Подобным же образом производная функции у",
если она существует, называется третьей производной первоначаль-
ной функции j/=/(x); вообще если определена и существует л-я
производная =/<л)(х) функции у и если функция у^ сама
дифференцируема, то ее производная обозначается через Ул+1)==
=/(л+1\х) и называется (п -|- 1)-й производной (или производной
порядка п-|-0 первоначальной функции y=f(x). у
Производные высших порядков получают вполне реальное истол-
кование во многих задачах точного естествознания, техники и дру-
гих областей науки и практики. Изучение их свойств и умение их
находить нужны поэтому не только математику, но и представителю
любой области знания, в которой находит себе применение аппарат
математического анализа. В § 26 мы видели, что если $=/(^)есть
закон движения какого-либо тела, то s' = f (f) выражает мгновенную
скорость v(t) этого движения в момент времени t. Вторая произ-
водная $" =/" (f) = т/(/), т. е. производная мгновенной скорости,
есть по смыслу своему «скорость изменения скорости»; эту вели-
чину в механике называют ускорением; значение ее очень велико
главным образом потому, что по известному закону Ньютона уско-
рение пропорционально действующей силе; большинство задач меха-
ники ставится так, что действующие силы являются данными, а
ищется движение, происходящее под действием этих сил; но задание
силы равносильно заданию ускорения, так что типической задачей
механики становится отыскание характера движения по заданному
его ускорению. Вторая производная имеет и много очень важных
геометрических приложений, с которыми мы ознакомимся впослед-
ствии.
140
производные и дифференциалы высших порядков [гл. 8
Очевидно, что отыскание производных высших порядков требует
лишь последовательного выполнения ряда обычных операций диф-
ференцирования и потому не нуждается в каких-либо новых приемах.
Мы здесь отметим только несколько отдельных интересных резуль-
татов для некоторых простейших элементарных функций.
1. В § 29 мы видели, что производная многочленд у = аохп-[-
4- а1хп~1 • • • + ап есть многочлен степени на единицу меньшей со
старшим членом лаохл"1; при каждом нобом дифференцировании сте-
пень понижается на единицу; в частности, производная порядка п
У=п\ а0
есть уже многочлен* степени 0, т. е. постоянное число; отсюда
ул+1) _у«+2) — —
т. е. для многочлена степени п производные всех порядков выше
п тождественно равны нулю.
2. Функция з/==е*,\как мы знаем, при дифференцировании не
меняется (у' —у). Поэтому, очевидно, и у^ =у = ех при любом п.
В более общем случае у = ах мы имеем yf = у а, и следовательно,
у{п} =ey(lna)/t = ах (1па)л при любом п.
3. Функция ey = sinx имеет производную у = cosx, а функция
г = cosx— производную гг =— sinx; отсюда
У = — sinx, уг =— cosx, y4) = sinx, ye) = cosx, ... ;
последовательные производные функции sinx образуют, как мы ви-
дим, периодический ряд с периодом 4, так что для любого п
уш) —sinx, y4/l+1) = cosx, У4л+«> = — sinx, У4Л+3> =— cosx;
аналогично для функции z — cosx мы имеем:
. У4») —cosx, г(4л+1)= — sinx, г(4л+2) = — cosx, ^4z,+3) = sinx;
это — тот же ряд, что и выше, но только сдвинутый на одно место.
4. Производные функций Inx, arctgx и arcctgx, как мь! знаем,
выражаются рациональными дробями; отсюда, очевидно, следует*, что
и производные любого порядка от этих функций представляют собой
рациональные дроби. Подобным же образом, производные любого
порядка от функций arcsin х и* arccosx являются алгебраическими
функциями.
5. Вообще, как мы знаем, первая производная любой элементар-
ной функции снова есть элементарная функция; отсюда, очевидно,
следует, что и производные любого порядка от элементарных функ-
ций также всегда будут элементарными функциями.
6. Правило дифференцирования алгебраической суммы, очевидно,
без всяких изменений переносится на производные любого порядка.
Но особого внимания заслуживает повторное дифференцирование
§ 34] ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ 141
произведения двух функций; если y—uv, где и и v— дифференци-
руемые функции от х, то, как мы знаем,
У=uv' -\-vu',
откуда легко находим:
У' = uv" 2и'®' -[- u"v,
У" = uv'" + Зя'®" 4- Зя"®' я"'®;
это заставляет предполагать, что для любого п
у™= ап0 я®(п) 4~ “nt «'®(п-1) 4- ал« н"®<п-4) 4-...
••• + »«,л-1 «(п-1)^ + алпя(лЧ (О
где ая0, ая1, аяя— постоянные числа, не зависящие от вида
функций и и это предположение, справедливость которого для
п = 1, 2 и 3 нами уже установлена, методом индукции легко может
быть доказано для любого п (доказательство предоставляем читателю).
Остается найти числа ая0, ая1, ..., аяя. Так как они не зависят от
вида функций и и v, то для их нахождения можно воспользоваться
любым специальным выбором этих функций. Положим
и = ех9 v = etx,
где t — произвольное постоянное число; тогда
11^ = ^, v^ = tretx,
j/ = e(/+1)* Уя) = (/4-l)neu+1)jf,
и формула (1) дает:
4-anae*/«-V*4-...4-a„neV* =
=(a„of 4- a,/-* 4- 4-... 4- a„„),
откуда
(/ -|- 1 )Я = аЛ0^ 4- 4“ + • • • 4" awi>
где число / произвольно; сравнивая ?ту формулу с разложением
по формуле бинома и замечая, что у двух многочленов,
тождественно равных между собой, соответственные коэффициенты
должны быть попарно равны, мы находим:
ая* = cj (k = 0, 1, ... , я),
и формула (1) дает:
у(п) = c*uv(n) + Cku'v^ 4-... 4- C}r^u(n^vf + (*uMv.
Это — так называемая формула Лейбница, выражающая
л-ю производную произведения двух функций через производные
сомножителей до порядка п включительно.
142
производные и дифференциалы высших порядков [гл. 8
§ 35. Дифференциалы высших порядков и их связь
с производными
Дифференциалы высших порядков определяются в полной анало-
гии с производными. Второй дифференциал d*y функции y=f(x)
есть дифференциал от первого дифференциала,
d*y — d(dy)*,
и вообще если дифференциал dny порядка п функции у уже опре-
делен, то
dn+'y = d(dny).
Так как dy есть, как мы знаем, по своему определению функция
двух независи\^ых переменных — хи Дх, то выражение d (dy), с по-
мощью которого определяется второй дифференциал d*y, требует
пояснения; при совершении операции d (dy) мы всегда рассматриваем
dy как функцию одного только х, считая Дх постоянной величиной;
это же замечание относится и ко всем последующим дифференциа-
лам, причем величина Дх предполагается в этом случае одной и той
же в дифференциалах всех порядков.
Чтобы связать дифференциалы высших порядков с соответствую-
щими производными, вспомним прежде всего, что
dy =у' Дх,
т. е. что формирование дифференциала данной функции у состоит
в том, что берется ее производная по х и умножается на прираще-
ние Дх независимой переменной, причем, как мы неоднократно под-
черкивали, величины х и Дх должны рассматриваться как независи-
мые друг от друга. Поэтому, чтобы найти второй дифференциал
d*y = d(dy) функции у, мы должны найти производную от dy по
х и помножить ее на Дх. Но dy=y'Ax, где второй множитель от
х не зависит и при дифференцировании • всего произведения по х
должен рассматриваться как постоянная; производная от dy=y’kx
по х равна поэтому У'Дх, а следовательно,
(Ру = d {dy) =у (Дх)’;
повторяя эту операцию, мы, очевидно, находим, что
d?y=yf"(kx)\
и вообще
</Лд,==У») (Дд.)»;
дифференциал порядка п равен производной того же порядка,
умноженной на п-ю степень приращения Ах. Отсюда, обратно,
у (Дх)" ’
или, если мы вспомним, что Дх = ^х,
v(«)_^y
? ~~ W
(1)
§ 35] ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 143
где знаменатель надо читать как (dx)n, но ради краткости записи
скобки всегда опускаются. Таким обозом, производная порядка п
равна дифференциалу того же порядка, разделенному на п-ю сте-
пень (первого) дифференциала независимой переменной.
Формула (1) представляет собой обобщение формулы У=^~г
и, подобно этой последней, во многих случаях может служить очень
удобным обозначением для производных высших порядков. Однако,
. t dv
в то время как формула у = ~^, как мы знаем, инвариантна отно-
сительно любого преобразования независимой переменной (т. е. со-
храняет справедливость и в том случае, когда х является не незави-
симой переменной, а функцией от некоторой новой переменной t), —
формула (1) при уже не обладает этой инвариантностью и
существенно обусловлена тем, что х мыслится как независимая пе-
ременная. В самом деле, покажем, что уже при л = 2 формула (1)
становится, вообще говоря, неверной, если x = qp(/)« Мы знаем, что
при этом (полагая y=f(x))
dy=f (х) dx=f [ф. (0] ф' (0 dt.
Переходя ко второму дифференциалу d*y — d (dy), мы должны про^
дифференцировать dy по t и помножить результат на di. Это дает
=\г [ф (01ф'2 (0+/' [ф (0] ф" (0} dP=
=Г [ф (ОНф' (0 dty+/' [ф (/)] ф" (0 =/" (х) dx* +/' (X) <Рх,
так как (t)dt=dx и <q"(t)df* = d?x. Мы получаем поэтому
g=/"«+/’Wg,
тогда как в случае, когда х было независимой переменной, мы имели:
добавочный член
появился вследствие того, что х стало теперь функцией независимой
переменной t; в самом деле, если х — независимая переменная, то
dx=&x, d*x — 0 и добавочный член отпадает.
Как, мы уже отметили, отыскание производных и дифференциалов
высших порядков не требует каких-либо принципиально новых мето-
дов, а потому не требует и большого количества упражнений. Уча-
щийся найдет много интересных задач в сборнике Б. П. Демидо-
вича-, отдел II, § 5.
ГЛАВА 9
ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ
§ 36. Теорема о конечном приращении
Предметом трех последних глав была практика дифференцирова-
ния. Мы учились преимущественно находить производные и диффе-
ренциалы и доказываемые нами чтри этом теоремы общего характера
имели своей целью главным образом способствовать этой практике,
облегчать ее. Теперь, когда в этом направлении сделано все необ-
ходимое, когда мы овладели техникой дифференцирования, мы должны
перейти к изучению более глубоких свойств производных и диффе-
ренциалов— свойств, составляющих собой теоретические основы
дифференциального исчисления. Среди тех общих закономерностей,
которые нам при этом предстоит установить, основную роль играет
ряд теорем, которые можно объединить под наименованием «теорем
о средних значениях»; так называют обычно предложения, в которых
при тех или других условиях утверждается существование в данном
отрезке (а, Ь) такой точки с (такого «среднего значения»), в кото-
рой изучаемая функция обладает тем или другим свойством. С одной
такой теоремой мы уже познакомились в главе 5 (теорема 3 § 23);
если функция /(х) непрерывна в отрезке (а, Ь) и в концах его
имеет разные знаки, то в отрезке (а, Ь) найдется такая точка с, что
/(с) = 0. Для всех теорем этого рода характерно то, что они не
дают никаких указаний на положение точки с внутри отрезка (а, 6),
доказывая лишь самый факт ее существования. Мы теперь установим
несколько таких теорем для функций /(х), дифференцируемых
в каждой точке отрезка (а, 6), при этом мы всегда будем подразу-
мевать, что в точке а требуется существование lim ~ лишь при
Дх-> + °, а в точке b— лишь при.Дх->— 0.
Прежде всего докажем одно вспомогательное предложение, кото-
рое нам сослужит хорошую службу и в дальнейшем.
Лемма. Если функция f(x) имеет производную в точке х и
если для всех достаточно малых /г^>0 имеют место неравенства
/(х4-й)^/(х), (1)
то f (х) = 0.
§ Зв] ТЕОРЕМА О КОНЕЧНОМ ПРИРАЩЕНИЙ
К5
Доказательство. Так как f (х),по предположению, существует,
то при мы должны иметь:
+ _>/>(*), Л-у ~Л)-/.W _»f (Х).
при достаточно малом h первая из этих дробей в силу предпосылок
леммы не может быть положительной, а потому (следствие 2 тео-
ремы 2 § 10) и ее предел /'(х)*^0; подобным же образом вторая
дробь при достаточно малом h не может быть отрицательной, вслед-
ствие чего и ее предел f (х) 0; следовательно, производная f (х)
не может быть ни отрицательной, ни положительной^ а потому
должна равняться нулю.
Доказанная лемма означает, что в точке, где функция прини-
мает наибольшее значение по сравнению с некоторым соседством,
производная, если она существует, должна равняться нулю. Оче-
видно, лемма остается справедливой и в том случае, когда значение
функции /(х) в точке х является наименьшим по сравнению с бли-
жайшим соседством, т. е. когда неравенства (1) заменяются обрат-
ными неравенствами. Эта лемма получает простую геометрическую
иллюстрацию при графическом изображении функции j=/(x)
(черт. 16): в точке, где кривая y=f(x) имеет наиболее высокое
или наиболее низкое положение сравнительно с ближайшим окру-
жением, касательная, если она существует, должна быть параллельна
оси ОХ; при этом не исключается и случай, когда функция в неко-
торых сколь угодно близких (или даже во всех достаточно близких)
к х точках получает то же значение, что и в точке х; так, для
функции, изображенной на черт. 17, утверждение леммы остается
верный в любой внутренней точке отрезка (а, Ь).
Теорема (Ролля). Если f(a)=f(b) и функция /(х) непре-
рывна в отрезке (а, Ь) и дифференцируема в каждой внутренней
точке этого отрезка, то найдется такая внутренняя точка с
отрезка (а, Ь), в которой f (с) = 0.
Доказательство. Положим /(а) =/(£)=у. Если /(х) = т
для всех точек х отрезка (а, Ь), т. е. функция /(х) постоянна
10 А. Я. Хшгши
146
ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ
[гл. 9
в этом отрезке, то /г(х) = 0 в любой точке х отрезка (а, Ь), и
теорема доказана. В противном случае либо отрезок (а, Ь) содержит
точки, где /(х)^>у, либо он содержит такие точки, где /(х)<д
(возможно, конечно, что имеются и те, и другие). Ради определен-
ности допустим существование точек, в которых /(х)^>у.
Так как функция /(х) непрерывна в отрезке (а, Ь), то она должна*
вой (черт. 18), лежащими
согласно теореме 2 § 23 принимать в некоторой точке с этого
отрезка наибольшее значение; очевидно, что /(0^>Т5 поэтому
/точкаQ с отлична от а и Ь, т. е.
должна быть внутренней точкой отрез-
ка (а, Ь); по определению точки с,
для всех точек отрезка (а, Ь) и в том
числе для всех достаточно близких к
с точек х мы имеем /(х)^/(с); по-
этому, применяя лемму,имеем/' (с) — О,
и теорема доказана.
Геометрическая иллюстрация тео-
ремы Ролля состоит, очевидно, в том,
что между двумя точками данной кри-
на одинаковой высоте, всегда найдется
точка, в которой касательная горизонтальна; при этом предпола-
гается существование касательной в каждой точке данного участка
кривой.
Теорема (Лагранжа, о конечном приращении). Если функция
f(x) непрерывна в отрезке (а, Ь) и дифференцируема в каждой
внутренней точке этого отрезка, то
найдется такая внутренняя точка с
этого отрезка, в которой
/'(с) = (2)
Так как — ^~д есть угловой
коэффициент хорды, соединяющей точ-
ки [а, /(а)] и [b, f(b)\ кривой y—f(x)
(черт. 19), то теорема Лагранжа с гео-
метрической точки зрения утверждает,
что у кривой, имеющей касательную
в каждой точке, между концами любой хорды найдется точка, в
которой касательная параллельна хорде. Очевидно, что теорема
Ролля есть частный случай теоремы Лагранжа, когда данная хорда
параллельна оси ОХ.
Геометрически ясно, что общий случай получается из частного
простым поворотом чертежа, вследствие чего и аналитическое дока-
зательство должно быть несложным, если опираться на доказанную
уже теорему Ролля.
§ 36] ТЕОРЕМА О КОНЕЧНОМ ПРИРАЩЕНИИ 147
Доказательство. Рассмотрим вспомогательную функцию
?(*)=/(*) — /(а)— /(^2д(а> (х—а),
геометрически представляющую собой разность между ординатой
кривой и ординатой хорды на черт. 19. Очевидно, ф (а) = ф (Z>) = 0;
с другой стороны, вместе с функцией /(х) и функция ф(х) непре-
рывна в отрезке (а, Ь) и дифференцируема в каждой внутренней
точке этого отрезка, причем
фЧ*) =/'(*)--^4^-.
На основании теоремы Ролля внутри отрезка (а, Ь) найдется такая
точка с, что
ф' (с) =/' (с) - =°’
что и доказывает теорему Лагранжа.
Это — одна из важнейших теорем дифференциального исчисления,
которую нам придется много раз применять в дальнейшем. Утвер-
ждаемое ею соотношение (2) часто бывает удобно записывать в виде
(с) (Ь- а). (3)
Смысл его остается при этом, конечно, тем же: если функция /(х)
имеет производную в каждой точке отрезка (а, 6), то между а и b
найдется такая точка с, для которой имеет место соотношение (3).
Перепишем, наконец, это же соотношение в других обозначениях.
Будем писать х вместо^а их^-А^ вместо Ь> так что b — а = Дх;
мы получим:
/ (х -|- Дх) — f (х) = f (с) Дх (х </ < х 4~ Дх).
Если величину /(х) обозначать через у, то левую часть этого
соотношения удобно, как мы это обычно делали, обозначить через
Ду. Далее, точку г, про которую известно только, что она заклю-
чена между х и х 4" Дх, очень удобно обозначать через х 4~ ® Дх,
если условиться, что 6 означает (точнее нам неизвестное) число,
заключенное между 0 и 1 (0<0<Ч). Тогда наше соотношение
получит вид
Ду =/(х 4- Дх) — /(х) =f (х 4- 0 Дх) Дх. (4)
Интересно сравнить это равенство с другим, которым мы неодно-
кратно пользовались в гл. 7:
ку=f (х) Дх 4- о (Дх);
это последнее соотношение показывает, что приращение Ly функции
j==/(x) равно произведению /'(х)Дх с точностью до бесконечно
малых высших порядков; равенство же (4) (т. е. теорема о конечном
$4$ ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ [ГЛ. 9
приращении) показывает, что в этом выражении слагаемое о(Дх)
может быть совсем отброшено, но зато в основном члене произ-
водную f (х) надо заменить производной в некоторой (неизвестной
нам точнее) точке заключенной между х и х-\-Ьх\ оба
соотношения очень полезны и имеют много применений.
Важным обобщением теоремы Лагранжа является следующая
Теорема (Коши). Если функции /(х) и ф(х) непрерывны
в отрезке (а, Ь) и дифференцируемы в каждой внутренней точке
этого отрезка, причем фг(х)^0 (а<^х<^Ь), то существует та-
кая точка с(а<^с<^Ь), что
?(*) — ?(«) <?(с) 1 }
(т. е. отношение приращений двух функций равно отношению их
производных в некоторой одной и той же внутренней точке дан-
ного отрезка).
Доказательство этой теоремы может быть проведено в точ-
ной аналогии с доказательством теоремы Лагранжа. В качестве вспо-
могательной функции надо только взять функцию
/(X)-/(<)-(х)-Т(а)]
[ф(6)— ф (а) так как иначе мы по теореме Ролля имели бы
ф'(с) = 0 для некоторого c(a<^c<^b)t что противоречит условиям
теоремы]; все дальнейшие рассуждения ведутся в точности так же,
как выше, и приводят к соотношению
из которого следует (5).
Очевидно, что теорема Коши переходит в теорему Лагранжа,
если выбрать ф(х) = х, и таким образом действительно служит
обобщением этой последней.
Как мы уже заметили, теоремы, доказанные в настоящем пара-
графе, имеют в анализе много приложений. Мы рассмотрим здесь
же один простой, но очень важный образец этого рода применений.
Мы знаем, что производная * постоянной величины равна нулю.
Верна ли обратная теорема, т. е. можно ли утверждать, что функция
/(х), производная которой равна нулю в каждой точке данного от-
резка, постоянна в этом отрезке? Чтобы ответить на этот вопрос,
возьмем две любые точки xf и х2 данного отрезка; в силу теоремы
Лагранжа мы можем утверждать, что
/OJ ~/О1) =/' (О Оз — Xi),
где с — некоторая точка, лежащая между хх и х2; но мы предполо-
жили, что в каждой точке х нашего отрезка f (х) = 0 в частности,
/г(£)=0, и следовательно, /(хя)=/(Х!); значения функции /(х)
§ 37] ВЫЧИСЛЕНИЕ ПРЕДЕЛОВ ОТНОШЕНИЙ ВЕСКОНЕЧНО МАЛЫХ 149
одинаковы в двух любых точках данного отрезка, а это и означает,
что функция /(х) постоянна в данном отрезке. Мы видим, таким
образом, что теорема о конечном приращении позволила нам очень
легко доказать следующее важное предложение, которым нам не раз
придется пользоваться в дальнейшем:
Теорема. Если f (х) = 0 в каждой точке отрезка (а, Ь), то
функция f(x) постоянна в этом отрезке.
В двух последующих параграфах мы рассмотрим другие важные
применения доказанных нами теорем о средних значениях.
§ 37. Вычисление пределов отношений бесконечно малых
и бесконечно больших
Уже когда мы занимались общей теорией пределов (гл. 2), мы
заметили, что отношение двух бесконечно малых (так же как и
отношение двух бесконечно больших) может иметь в данном про-
цессе весьма различный характер изменения в зависимости от при-
роды этих бесконечно малых (или бесконечно больших), так что
нельзя сделать никаких утверждений общего характера о поведении
такого рода отношений.^А между тем реальное значение этих отно-
шений очень велико: в частности, как мы теперь знаем, производ-
ная данной функции, являющаяся основным понятием всего диффе-
ренциального исчисления, определяется именно как предел отноше-
ния двух бесконечно малых. Поэтому ясно, насколько ценным нам
должен представляться всякий более или менее общий метод, позво-
ляющий вычислять пределы таких отношений в случае, когда они
существуют^ Такой чрезвычайно плодотворный, в одно и то же
время простой и мощный метод может быть развит на основе уста-
новлейных в предыдущем параграфе теорем о средних значениях.
К -его рассмотрению мы теперь и переходим.
Пусть точка а принадлежит (т. е. служит внутренней точкой
или одним из концов) отрезку Д, в котором функции /i (х) и /2 (х)
непрерывны; пусть j\ (а) = /8 (а) = 0, ив каждой точке х а от-
резка Д обе функции дифференцируемы и /'(х)^0. Тогда в от-
резке Д /2 (х) 0 (х =# а), так как иначе и /3 (х) по теореме Ролля
обращалась бы в нуль в некоторой точке отрезка Д, отличной от а.
Мы можем поэтому рассматривать отношение Аул двух бесконечно
A W
малых и ставить вопрос о его пределе при х->а. Так KaK /i(a)=
=Л(а) = 0, то
А(*)—A(x)-A(*)’
на основании доказанной в § 36 теоремы Коши, все предпосылки
которой здесь, очевидно, выполнены, поэтому
fl(x) _ Г1 (с)
Л (О
(О
ISO
ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ
(гл. 9
где с есть некоторая точка («среднее значение»), лежащая между а
и х. Пусть теперь известно, что при х->а отношение стре-
/. , /2 \Х)
мится к некоторому пределу /; так как с лежит между а и х, то
при х->а ис->а, а следовательно,
поэтому равенство (1) показывает, что и
Мы доказали таким образом теорему, известную под именем
правила Лопиталя:
Пусть (a) ==zf*(a) = Q и функции (х) и f% (х) непрерывны
в некотором отрезке Д, содержащем точку а\ если тогда для
всех точек х^а отрезка Д существуют (х) и f* (х), если
/а(х)^0 (х^а) и 777^при х->а, то и I прих ~+а.
Ценность этого правила обусловлена тем, что во многих слу-
чаях предел отношения производных находится значительно легче,
чем предел отношения самих данных функций; в частности, может
случиться, что та или другая из производных уже не бесконечно
мала при х~>а; а в таком случае мы уже не имеем дела с отно-
шением двух бесконечно малых и предел обычно находится совсем
просто.
гт 1 п t / л n v sin ах а cos ах а
Пример I. При Ь^О, х->0 lun^^hm.
—т----1
ГТ л гт л « tgx — X -. COS2X х
Пример 2. При х->0 lim ——:— = lim—:----.—- =
г г г х — sin х 1 — cos х
«. 1 —cos2x 14-cosx п
=lim —5—-=------r = lim —J—=-= 2. 1
cos2x(l — cos x) cos2x 1
Много других полезных упражнений учащийся найдет в задач-
нике Б. П. Демидовича, отдел II, § 10.
Если обе производные /' (х) и /' (х) бесконечно малы при
х а и в свою очередь дифференцируемы в некотором соседстве
точки а (причем f\(x) не обращается в нуль при х а), то ничто
не препятствует вторичному применению правила Лопиталя: если
при х->а мы имеем то по этому правилу и
а следовательно, и у-> I ПРИ х->а. Вообще, если в некоторой
окрестности точки а функции /, (х) и /4 (х) имеют производные
порядка п, если Д”) (х) 0 при х ф а и Д (а) =Д (а) = Д (а) =
=/»(а)= ••• =Дп~1,(а)=:Д"_1)(а) = 0» т0 повторным примене-
§ 37] ВЫЧИСЛЕНИЕ ПРЕДЕЛОВ ОТНОШЕНИЙ БЕСКОНЕЧНО МАЛЫХ
151
нием правила Лопиталя мы, очевидно, можем заключить, что если
существует
lim $№=!,
то предел отношения при х -* а также существует и равен I *).
J 2 \Х)
Пример 3. /1(х) = х— sinx, /2(х) = х3; мы находим
f’t (х) = 1 — cos х, f" (х) = sin х, f” (х) = cos х,
/;(х) = 3х«, Л(х) = 6х, Л'(х) = 6,
и следовательно,
Л(0)=/;(0)=Л(0)=0,
А(О)=Л(О)=Л(О)=о,
ДтМ-*4- (х —0),
Л (*) 6
Л"(0)=1,
/;"(о)=в,
а потому и
fi (х)_х — sin х 1
f,(x)— х3 ^б’
(х-0).
Правило Лопиталя остается в силе и для процессов, в которых
х->оо. Так, например, если при х->-{-оо функции /1(х) и /2(х)
бесконечно малы, причем для достаточно больших х обе функции
дифференцируемы и /' (х) 0, то из
/(*) u
Л(х)
(X — 4- оо)
(2)
следует, что и
В самом деле,
1
полагая х= —, мы имеем:
У 9
fl (X) _ (у) ?1 (у)
А(х) <р8(У)’
причем при у ->4“ 0
¥з(.У)->0.
♦) Требуемое для повторного применения правила Лопиталя соотноше-
ние (х)т^0 (1 х^а) при Л = л составляет одну из предпосы-
лок теоремы, а для меньших значений k легко устанавливается индукцией,
применяя теорему Ролля к функции (х) в отрезке (а, х)«
162
теоремы о средних значениях
[гл. 9
Так как
(j-> + 0):
. то из (2) следует
<?1 (У)
Ч'Лу)
на основании правила Лопиталя поэтому
«рИу)
Су-+о),
а это равносильно соотношению
(х^ + оо)
7s Vх/
Пример 4. При х—>—|-оо
те 1
/те \ “2 ~ arctg х -
lim х ( J — arctgх J = lim-1----= lim-----у— —
x
=Hm^+T= 1-
l
Перейдем теперь к случаю отношения двух бесконечно больших.
Мы увидим, что правило Лопиталя сохраняет силу и в этом случае,
хотя доказательство его здесь несколько сложнее. Пусть мы имеем:
1/1 (х)|-> + оо, IZaOOl—►-+-ОО (х->а),
и пусть, как прежде, в некоторой окрестности точки а для всех
х Ф а обе функции дифференцируемы и /' (х) ф 0. Возьмем в этой
окрестности две точки х и а, лежащие по одну и ту же сторону
точки а, так что, например, а<^х<^а. Теорема Коши дает нам:
Л(х)—/1 («)_/; (с) '
fi(x)— /s(«) f'i (с)’
где х<^с<^а. Но, с другой стороны,
1 />(а>
Л(х)-Л(а)_Л(х) /,(х) .
. /»(«) ’
Л(х)
сопоставление этих двух равенств дает:
. Л(«)
/lU)_/l(c) /,(х)
/»(•*)“Л(«) < AW w
§ 37] ВЫЧИСЛЕНИЕ ПРЕДЕЛОВ ОТНОШЕНИЙ БЕСКОНЕЧНО МАЛЫХ
153
Допустим теперь, что существует
lim
х-*а
f'Ax)
Гг(х)
=1.
Пусть e^>0 сколь угодно мало; выберем а столь близко к а,
чтобы при а<^г<^а всегда было
или, что то же,
I Л (г)
I Л (г)
<1 + *-,
I — е
f (г)
Л (2)
так как точка с лежит между а и а, то, в частности,
'—<£><'+ (4)
(при изменении х будет меняться и с, но так как с остается при
этом всегда заключенным между а и а, то неравенства (4) сохра-
няют силу). При неизменном а заставим теперь х стремиться к а;
в силу наших предпосылок тогда | (х) | -> -|- 00 и IА (х) I"► 4“ °°>
и следовательно, второй множитель правой части соотношения (3)
будет стремиться к единице; он может быть представлен в виде
1 8, где 8~>0 при Умножая все три части неравенств (4)
Йа этот множитель, мы в силу соотношения (3) получаем:
(1 +8) (Z_e)<A^_<(i +8) (Z-J-®)»
так как число е произвольно мало, а 8->0 при х—то отсюда,
очевидно, следует, что
что и надо было доказать.
Пример 5. При х->0 1пх—> — оо; непосредственно невидно
поэтому, каково при этом поведение произведения xlnx. С целью
его исследования заметим, что
, — 1п х
— X In X =--j—
X
может быть представлено как отношение двух бесконечно больших;
производные числителя и знаменателя соответственно равны--
1
и —а отношение их равно х и стремится к нулю; в силу пра-
вила Лопиталя поэтому
xlnx->0 (х~>0).
154
ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ
(ГЛ. 9
Подобно предыдущему легко было бы доказать, что правило Ло-
питаля для отношения двух бесконечно больших сохраняет силу и
в случае, когда х не стремится к конечному пределу, а безгранично
возрастает.
Пример 6. При х->4-°°
1пх х ,.2 л
lim —— = lim —=— = lim — = О
Ух 1 Ух
2Ух
и вообще (а^>0) при х->оо
1
1пх X 1. 1 л
lim----= 11ш--------— = 11П1----= 0.
X® ах®”1 ах®
Пример 7. Пусть а^>1, а^>0. Функции ха и ах обе безгра-
нично возрастают при х -> °°- Пусть п — наибольшее целое
число, меньшее, чем а, так что Легко видеть,
что все производные функции ха, до порядка п включительно, без-
гранично растут при х->оо, производная же порядка равная
а(а—1) ... (а — п)ха~п~'1, остается ограниченной. Так как для
функции ах производная порядка равная ах(1па)п+1, безгра-
нично возрастает при Xr-^-j-00, т0 п + 1 -кратное применение пра-
вила Лопиталя показывает, что
^-^--►0 (х->4-оо)
при любых а^>0 и а^>1.
§ 38. Формула Тэйлора
Мы будем исходить из хорошо известного нам соотношения,
установленного в § 31: если функция /(х) имеет производную
в точке а, то при h -> 0
/(а + Л)=/(а)+/(а)ЛН-о(й). (1)
Когда | h | мало, это соотношение позволяет приближенно выразить
величину вообще говоря, сложно зависящую от Л, в виде
простой линейной функции
/(а + Л)я«/(а)4-/(а)А,
причем погрешность этого приближенного равенства имеет форму
о (Л), т. е. при малых h ничтожно мала не только сама по себе,
но даже сравнительно с | h |. Мы уже видели, что этот факт имеет
прежде всего непосредственную практическую ценность, позволяя
ФОРМУЛА ТЭЙЛОРА
155
§ 38]
с большой легкостью находить хорошие приближенные значения ве-
личины (см. § 31). Этот же факт, естественно, служит, как
мы теперь увидим, отправной точкой для дальнейшего развития теории.
Про величину о (Л) в формуле (1) мы знаем только то, что при
h -> 0 она есть бесконечно малая высшего порядка сравнительно
с А; никаких более точных сведений о ней мы не имеем. Вопрос
о том, насколько формула (1) пригодна для приближенного вычи-
сления величины зависит поэтому целиком от того, какой
степенью точности мы можем удовлетвориться. Если требуемая точ-
ность такова, что величинами типа o(h) (т. е. малыми высшего по-
рядка сравнительно с h) мы можем пренебрегать, то формула (1)
решает нашу задачу; в противном случае она недостаточно точна.
Может случиться (и действительно часто случается), что мы, напри-
мер, обязаны учитывать бесконечно малые второго порядка относи-
тельно h (т. е. величины того же порядка, что Л2), но можем пре-
небрегать величинами порядка выше второго (т. е. величинами типа
о (Л2)). Тогда, по аналогии с формулой (1), мы будем искать выра-
жения в более точном виде
/(а Л) = «о + М + + ° (А’)>
где а0, оц, а2— постоянные (независимые от h) величины, т. е. при-
ближенного выражения* в виде трехчлена второй степени
f(a -|- h) а0
с погрешностью, которая представляет собой величину типа о (Л2),
т. е. бесконечно малую выше второго порядка относительно h. Ра-
зумеется, заранее мы ничего не знаем о существовании такого
многочлена и тем более мы не умеем находить его коэффициентов
а0, а1} а2; все сказанное нами по этому поводу может рассматри-
ваться лишь как постановка задачи.
Но, прежде чем перейти к решению этой задачи, естественно
придать ей значительно более общую форму. Реальное содержание
той проблемы, для которой мы хотим находить приближенные зна-
чения величины определяет необходимую при этом сте-
пень точности. В качестве допущения достаточно общего характера
мы можем при этом принять, что величины порядка hn (где п — не-
которое постоянное натуральное «число) мы должны еще учитывать,
но бесконечно малыми более высоких порядков (т. е. величинами
типа о(Лл)) можем пренебрегать. Спрашивается: 1) существует ли
такой многочлен степени п
рп (Л) = “о+ <*!* +а# + ••• 4-М'п
(с независимыми от h коэффициентами), что при Л—>0
/(а4-Л)-Ря(Л) = о(Лл), (2)
и 2) если он существует, то как найти его коэффициенты? Если
поставленная таким образом задача получит положительное решение,
£56 ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ [ГЛ. 9
то многочлен Pn(h) даст нам орудие для нахождения величины
f(a -J-Л) с требуемой степенью точности: для практических расчетов
(как, впрочем, и для теоретических исследований) мы, вообще
говоря, в качестве орудия не знаем ничего более простого и удоб-
ного, чем многочлен. Д
Можно, конечно, предвидеть, что ответ на поставленный нами
вопрос будет существенным образом зависеть от свойств функции
f(x) в соседстве точки а. Ведь уже в рассмотренном нами ранее
случае п—\ мы должны были ввести предпосылку о дифференци-
руемости функции /(х) в точке а. Если мы хотим приближенно
выразить f(a h) с помощью многочлена степени лис точностью
до величин типа о(ЛЛ), то нам придется допустить, что функция
f(x) в точке а имеет производйые всех порядков до л включительно
(короче говоря, предположить существование /(л\а)). Но это будет
и единственное допущение, которое мы сделаем.
Мы покажем теперь, что если (а) существует, то при h О
имеем:
/(а + Л)=/(а) Л + А-/" (а) Л’+ ...
+ *" + <’(*“); (Т)
другими словами, многочлен
Рп W—f(a) (а) h + А-/" (а) А» + . • • + f(n) (а) If (3)
при Л-^0 удовлетворяет соотношению (2) и тем самым решает по-
ставленную нами задачу. Полагая
/(а-|-А)-Ря(А)=ф(А),
мы должны, следовательно, показать, что
(А-0).
Но непосредственный подсчёт дает нам ♦):
Ф(Л)=/(а + й)-/(а)-ЛГ(в)-§Г(а)- •••
Ф'(Л) =/' (а + A) -f (а) - А/" (а) - ... -^/(п) (а),
ф"(Л) =/"(« + А)-/"(а)-hf"'(а)— ...
(А) == (а + А) —(а) — hf^ (а)—-^/(п) (а),
(А)=f™ {а + А) —/<»-» (а) — А/(п) (а),
♦) Очевидно, что из предположенного нами существования /(Л> (а) сле-
дует, что при достаточно малом I h 1 существует (а Л), а значит, и
ФОРМУЛА ТЭЙЛОРА
157
§ 38]
откуда
<р(О) = ф'(О) = ф"(О)= ... =?<я-”(0) = 0.
С другой стороны, функция hn также при h -> 0 обращается в нуль
вместе со своими производными до порядка п — 2 включительно;
производная же порядка п—1 от этой функции равна n\h. По-
этому применение правила Лопиталя дает:
lim
<?(*)_
hn
lim
л-о
<р (Л)
п\ h
(4)
если только предел в правой части этого равенства существует.
Но
(Л) _ 1 Г {а + h} _fn-v (а) |
n\h — nil h J WJ’ W
а так как по определению
Z(n) (а)= lim z—+4^- «о ,
Л-0 Л
то правая, а следовательно, и левая часть ра^нства (5) стремится
к нулю при h -> 0; в силу (4) отсюда
(Л->0),
что и доказывает нашё утверждение.
Установленную нами таким образом формулу (Т), предпосылкой
которой служит только существование (а), обычно называют
формулой Тэйлора. Это — одна из важнейших формул матема-
тического анализа, имеющая очень большое число теоретических и
практических применений. Часто бывает удобно записывать ее
в немного измененных обозначениях: условимся писать х вместо
а 4- Л; тогда h—x— а и формула (Т) получает вид
/О) =/(«) +/' (а) (* — а) (<*—«)’+•••
• • • + Аг21 (* ~ аУ+° к* - а)ль
В частности, если а = 0, мы получаем так называемую формулу
Маклорена
/(х)=/(0)+/'(0)х + ^х’+ ...
представляющую функцию /(х) для малых по абсолютной величине
значений х приближенно в виде многочлена, расположенного по
степеням х.
158 ТЕОРЕМЫ О СРЕДНИХ значениях [гл. 9
Мы установили, что многочлен Тэйлора (3) решает поставлен-
ную нами задачу о приближенном выражении величины f(a-\-h)
в виде многочлена степени я, т. е. удовлетворяет соотношению (2).
Убедимся теперь, что это решение задачи является единственным,
т, е. что не существует другого многочлена Qn (h) степени, не
превосходящей л, для которого мы также имели бы при h-+0
f(a-\-h) — Q„(h) — o(hn'). (6)
В самом деле, если бы такой другой многочлен Qn (h) существовал,
то из (2) и (6) мы имели бы при /г->0
P„(A)-Q„(A) = o(AB);
но Р„(Л)-<?л(Л) = ₽0^-М+ ••• +0» hn есть многочлен степени
не выше п\ пусть есть первое из чисел (30, ..., (Зя, отличное
от нуля; мы имеем тогда:
P„(/0-Q„W = M* + Pft+iAft+I+ ••• +Mn==o(A")=o(Afc),
так как k^n\ но это означает, что при Л->0
=₽.+*+... + р. - о,
что невозможно, так как предел левой части при Л~>0, очевидно,
равен 0. Этим и доказана единственность полученного нами
решения задачи.
§ 39. Остаточный член формулы Тэйлора
Формула Тэйлора дает для разности между функцией f(a-\-h)
и многочленом Pn(h) (т. е. для погрешности приближенного выра-
жения f(a-\-h) с помощью этого многочлена) выражение о(Ап); как
мы знаем, этим описывается характер изменения разности f(a 4- h) —
— Pn(h) ПРИ но ничего не говорится о величине этой раз-
ности, о том, как мала она при данном конкретном значении h.
Между тем ясно, что для любого конкретного расчета, в котором
мы заменяем выражение f(a-\-h) многочленом Pn(h), нам будет же-
лательно знать именно, как велика происходящая от этой замены
погрешность при тех определенных значениях а и Л, с которыми
нам фактически приходится иметь дело. Мы должны поэтому искать
способа оценки такой погрешности, не довольствуясь тем указанием
на характер ее изменения, какое дает нам формула Тэйлора. Короче
говоря: формула Тэйлора дает нам лишь характеристику предель-
ного поведения изучаемой погрешности, а мы хотим знать, как эта
погрешность может быть оценена при данных конкретных значе-
ниях а и h.
ОСТАТОЧНЫЙ ЧЛЕН ФОРМУЛЫ ТЭЙЛОРА
169
§ 39]
С этой целью мы напишем формулу (Т) в виде
/(а + h) =f(a) + hf (а) + f (а) + ...
(а)+ /?„(*), (О
где, следовательно, положено
Я„(/0 = ^/(л)(а) + о(Лп).
Величину Rn(Л) мы будем называть остаточным членом фор-
мулы Тэйлора.
Пусть q означает произвольное (не обязательно целое) положи-
тельное число. Обозначим для краткости a-\-h через Ь и рассмотрим
функцию
т м =/<*>+(»-х)/’ w + г м+...
До сих пор мы предполагали существование производной /(л) (х)
только при х = а\ теперь мы должны будем несколько усилить эту
предпосылку и допустить, что /(л) (х) существует и для всех внут-
ренних точек х отрезка (а, 6). Очевидно, что тогда функция ф(х)
будет дифференцируемой в каждой такой внутренней точке. Диф-
ференцируя ее, мы находим (а<^х<^&):
ф' (*)=/' (X) + [Ь-х)Г (X)-г (х) +
4 \ll к fl
- ’ w - ч О - »>•-' =
=Ч (» -
Далее, очевидно, что ф (&)=/(&), а в силу (1) легко видеть,
что и ф (а)=/(а-|-^) =/(£)• К функции ф(х) мы можем поэтому
применить теорему Ролля (в отрезке (а, &)): в некоторой точке с,
лежащей между а и b = a-\-h, ф'(с) = 0. Очевидно, мы можем по-
ложить c — a-\-bhh где 0<^6<^ 1; тогда
Ь — c = a-\-h— с = (1 —6)/г,
и мы находим:
<с>=<*> -q (i -£)’" =
откуда
(»+“)•
160 ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ ' [гл. 9
Это выражение остаточного члена формулы Тэйлора обладает боль-
шой общностью благодаря присутствию параметра у, которому мы
можем придать любое положительное значение. Разумеется, вопрос
о том, какое из этих значений придает выражению Rn(hj наиболее
удобную и выгодную форму, решается в зависимости от вида функ-
ции /(х). Однако в подавляющем большинстве случаев наиболее
целесообразно полагать q = n, что дает для Rn(h) выражение
Яп(А)=^7<п>(а + 0Л). (3)
Формула (1) получает при этом вид
/(а + А) =/(а) + hf (а)+ (а) +...
fcn-i IM
• + (^ТУ!/("”) + ^/(В) (а + Ой) (4)
и представляет собой типичную теорему о среднем значении; при
л=1 она обращается в теорему Лагранжа
/(a + A)=/(a) + A/(a4-0H
а в общем случае представляет собой обобщение этой теоремы.
Форма (3) остаточного члена формулы Тэйлора также была введена
Лагранжем и обычно носит его имя.
Из других употребительных видов остаточного члена отметим
еще тот, который получается из общей формулы при ф=1;
(й)= -"g-E рГ /fn) <а +
(так называемая форма Коши).
Имея то или другое выражение для остаточного члена формулы
Тэйлора, мы уже получаем возможность конкретно оценивать сте-
пень точности, даваемую этой формулой. Чтобы посмотреть, как это
происходит, мы теперь применим формулу Тэйлора к некоторым
простейшим элементарным функциям.
Пример 1. f(x) = ex, а = 0; удобно писать х вместо h; фор-
мула (4) дает ввиду /(fe) (х) = ел, /(*)(0) = 1, А=1, 2,...
. ''=1+* + 5 + - + (^й)!+ие- <0<e<D.
При O^x^l, например, остаточный член этой формулы не пре-
восходит
хпе е
п\
и с ростом п очень быстро убывает, даже при не очень малых х;
в частности, при х=1 мы получаем формулу
е=1 +1+• • •+(П21)! + i ев>
§ 39] ОСТАТОЧНЫЙ ЧЛЕН ФОРМУЛЫ ТЭЙЛОРА 161
позволяющую легко вычислять приближенные значения числа е с
большой степенью точности, так как остаточный член не превосхо-
дит и, как мы уже отметили выше, быстро убывает с возраста-
нием п.
Пример 2. /(x) = sinx, а = 0; легко видеть, что числа /(0),
Г (0)> f (0), • • • образуют периодическую последовательность 0, 1,
0, — 1, 0, 1, 0, — 1,... Поэтому формула (4) при а = 0, h = х и
при нечетном п — 2k 1 дает:
г3 Г5 «- Hfe-1 . r2k+l
sinX — X — 3j- + gf — .••+(— 1) (2ft_ 1)! + (— 1) (2*4-1)! cos6x>
так как/(afe+1) (x) = (—l)*cosx. Аналогичный расчет для /(x) =
= cosx дает:
Г2 И *. . r2fe-8
. COS№ 1 + J - ... + (- О*’'. рЬу +
. r2fe
(2*)TCOS0X‘
В обоих разложениях I cos Sxlsgl, и остаточный член, не превос-
| х 18*+1 I х 18*
ходящий по абсолютной величине ‘ или 7WT > очень быстро,
в особенности при малом | х |, убывает с ростом k.
Пример 3. /(х) = 1пх, а=1; в этом случае
7(х) = х’1, /г(х) = —х~2,..., /(л)(х) = (— I)*-1 (л— 1)!х"л,
и следовательно,
/(0 = 0, /(0=1. /"(1) = — 1,..., /(")(1) = (— 1)1.
так что формула (4) при а = 1, h = x дает:
У*3 ~ уИ~1
1п(1+х) = х-^4-^—... + (-1Г’^т +
+ (-1)п’1^(1+М-я.
При 0 <f х 1 остаточный член по абсолютной величине меньше
_ чем ~ и потому с ростом п стремится к нулю, хотя и не столь
быстро, как в предшествующих примерах. Но при — 1<^х<^0 мно-
житель (14-0х)"л бесконечно велик, и о порядке его роста мы не
можем судить, так как 0 нам неизвестно. В этом случае оказывается
более удобной форма Коши для остаточного члена:
я, w=(1+•»)=(- 0м TTR (ттк Г'
11 А. Я. Хивчия
162
ТЕОРЕМЫ О СРЕДНИХ ЗНАЧЕНИЯХ
[гл. 9
при --1
и стремится к нулю
I — 0
j , ц <Г 1; остаточный . член по
1 + tu 2*
абсолютной величине меньше чем
при^Лт>-Ор.________
Г Во всех рассмотренных примерах мы в согласии с задачей, по-
ставленной в начале настоящего параграфа, стремились оценить ве-
личину Rn(h) при данных а, А.и л, т. е. величину той погрешности,
которую мы делаем, заменяя /WA) многочленом степени п. На
практике часто приходится решать задачи в известном смысле обрат-
ного характера; так, допустимый предел погрешности Д часто зада-
ется заранее; спрашивается одно из двух: либо — в каких границах
изменения h можно при данном п гарантировать, что погрешность
|/?п(Л)| не превзойдет Д, либо, напротив, — сколь большим при за-
данных границах изменения h нужно взять число п для достижения
той же цели. Покажем, как примерно можно решать такие задачи,
базируясь на наиболее распространенной форме ’ (3) остаточного
члена.
Пусть нас интересуют значения функции /(х) в некотором от-
резке (а — Z^x^a~|-Z). Если мы обозначим через наиболь-
шее значение функции |/(п) (х)| в этом отрезке, то при |/z|^Z мы
ДД (П) \ и \п
в силу (3) будем иметь | Rn (h) | —L; поэтому, чтобы гаран-
тировать требуемую оценку | Rn (h) | Д, достаточно иметь:
Afw> \ h\n А
т~<д>
или
' Ъп\\п
Таким образом, если |/г[ меньше наименьшего из чисел Z и
т0 неравенство | /?П(Л)|<^Д может быть гарантировано.
Если предел погрешности Д и число Z, определяющее диапазон изме-
нений /г, являются, как это часто бывает, твердо предписанными для
практических целей данного расчета, то мы должны выбрать п столь
большим, чтобы иметь:
1
Тогда при |Л|<7 будет выполнено неравенство (*), а значит, и
требуемое неравенство | Rn (Л) | < Д.
Если, например, /(x) = sinx [или /(x) = cosx, см. выше, при-
мер 2], то для вычислительных целей проще и естественнее всего
положить а = 0, Z = -~, так как, зная sinx и cosx в отрезке ^0,
§ 39] ОСТАТОЧНЫЙ ЧЛЕН ФОРМУЛЫ ТЭЙЛОРА 163
мы уже без всяких вычислений находим значения этих функций
при любых значениях х. Так как при /(x) = sinx | (Ох) | —
= | cos Ох |^1, то мы можем положить Al(9fe+1) = 1. Пусть требуемая
точность Д = 0,0001. Тогда мы должны иметь:
0,0001 -(2k 4-1)! >(-J)
что, как легко подсчитать, выполняется уже при^^З. Таким обра-
зом, приближенная формула
. X8 I X5
дает в отрезке | х I ~ значения функции sin х с погрешностью, не
превышающей 0,0001. Аналогично проводится расчет и в случае
/(x) = cosx.
ГЛАВА 10
ПРИМЕНЕНИЕ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
К ИССЛЕДОВАНИЮ ФУНКЦИЙ
§ 40. Возрастание и убывание функций
Реальное значение производной, от которого мы пришли к ее
общему определению, состоит прежде всего в том, что абсолютная
величина |y| = |/F(x)| производной определяет собой быстроту из-
менения функции _у=/(х) относительно независимой переменной х;
поэтому, зная производную данной функции, мы в большинстве слу-
чаев можем непосредственно оценить скорость ее изменения на тех
или других участках. Чтобы понять ценность такого рода информа-
ции, рассмотрим следующий пример. Функции у = х* и z = In х при
х^>0 обе возрастают с ростом х. Чтобы оценить скорость этого
возрастания, рассмотрим производные
У = 2х, •г' = у
этих функций; мы видим, что с возрастанием х величина уг непре-
станно растет, а величина zr непрестанно убывает; это означает, что
с возрастанием х функция у = х* растет все быстрее, а функция
г = 1пх—все медленнее; таким образом, хотя обе функции с воз-
растанием х непрестанно растут, однако в законах их роста имеется
только что установленное нами глубокое различие; мы обнаружили
это различие с помощью одного только взгляда на выражения про-
изводных У и У этих двух функций. Конечно, это же различие
легко становится видным, если мы взглянем на графики этих двух
функций (черт. 20); но в том-то и состоит ценность информации,
даваемой нам величиной производной, что она освобождает нас от
необходимости строить графическое изображение данной функции,
чтобы оценить быстроту ее изменения.
С другой стороны, мы уже видели, что знак производной опре-
деляет собой направление изменения функции: положительная про-
изводная свидетельствует о возрастании, а отрицательная — об убы-
вании функции (то и другое при возрастании независимой перемен-
ной). Теперь нам надо внести в этот вопрос ббльшую точность.
§ 40]
ВОЗРАСТАНИЕ И УБЫВАНИЕ ФУНКЦИЙ
166
Условимся называть функцию y=f(x), определенную на отрез-
ке (а, Ь), неубывающей на этом участке, если при
мы всегда имеем /(x2)^/(Xi) (т. е. если на этом отрез-
ке у не может убывать, когда х возрастает); если же при а xt
<^х<ь^Ь всегда имеет место точное неравенство /(xs)^>/(x1), то
мы будем называть функцию /(х)
возрастающей на отрезке
(а, Ь). Подобным же образом, с
переменой только знаков нера-
венств для /(хО и /(х2), опре-
деляются функции н е в о з р а-
стающие и убывающие
на*' данном отрезке. Ясно, что
всякая возрастающая функция
есть в то же время функция
неубывающая, но не обратно;
подобным же образом всякая убывающая функция есть в то же
время функция невозрастающая, но не обратно.
Связь между знаком производной и направлением изменения
функции мы можем теперь выразить с помощью следующих пред-
ложений.
Теорема 1. Для того чтобы функция f(x), дифференцируе-
мая в каждой точке отрезка (а, Ь), была неубывающей на этом
отрезке, необходимо и достаточно, чтобы было
/'(х)^0 (а^х^Ь).
Доказательство. 1) Если функция /(х) — неубывающая на
’ (а, Ь), то при а^х<х-\-1г^Ь
/(х + Л)-/(х)^0,
а следовательно, и
f(x + h)-f(x)
h
отсюда же на основании следствия 2 теоремы 2 § 10 следует, что
и
f (х) = lim ——!0.
л-о Л
2) Если f (х)^О(а^х^б), то при а^х1<^ха^6 в силу
теоремы о конечном приращении
/(•»») —/(*i) =/' (с) (•*» — *1) S* 0
(с здесь некоторая точка, заключенная между Xj и х2 и, следова-
тельно, между а и Ь). Но это и означает, что функция /(х) —
неубывающая на отрезке (а, Ь). Теорема 1, таким образом, доказана.
166
ИССЛЕДОВАНИЕ ФУНКЦИЙ
[гл. 10
Очевидно, теорема 1 остается справедливой, если в ее формули-
ровке слово «неубывающей» заменить словом «невозрастающей»,
а вместо f(x)^Q писать /(х)^0. Чтобы в этом убедиться, до-
статочно применить прежнюю формулировку теоремы 1 к функ-
ции—/(х).
Теорема 2. Если /(х)^>0 (а^х^Ь), то функция f(x) —
возрастающая на отрезке (а, Ь).
Доказательство. Теорема о конечном приращении дает при
а xi <С
/(х2) -/(х,) =/ (с) (х2 - xt) > 0,
так как Xi^c^x^ и, следовательно, a<^c<^b, f (с)^>0.
Признак f (х)0 (а^х^Ь) является, таким образом, доста-
точным для возрастания функции /(х) в отрезке (а, 6), однако он
не необходим; утверждение, обратное теореме 2, было бы невер-
ным; из /(х2)^>/(х1)(а^х1 <^х2=С/>) можно извлечь (в силу тео-
ремы 1) только/'(х)^О(а^хг^б), но не/г(х)^>0(а^х^й);
это показывает пример функции /(х) = х3, которая, очевидно, пред-
ставляет собой возрастающую функцию на всей числовой прямой
(—оо<^х<^4“оо), в то время как/(х) = Зх2 = 0 при х = 0;
черт. 21 отчетливо показывает, какова наглядная картина этого яв-
ления: кривая у = х3 слева направо непрестанно повышается и в то
же время при х = 0 имеет горизонтальную касательную.
Само собой разумеется, что если при а х b всегда f (х) 0,
то функция /(х)— убывающая на отрезке (а, Ь), и что обратное
утверждение и в этом случае было бы неверно.
Пример 1. Функция у = х*— 6х24~9х4~2 имеет производ-
ную
у = 3х2 — 12х-}-9 = 3(х—1)(х —3);
скобки (х—1) и (х — 3) имеют разные знаки при 1<^х<^3 и
одинаковые при х 1 и при х 3; поэтому
У>0 (х<1 или х>3) и У<0 (1<х<3);
функция у возрастает при х<4 и при х^>3 и убывает при 1
<х<3. Так как непосредственный подсчет легко дает:
у = 6 (х=1), у = 2 (х = 3),
а с другой стороны, очевидно,
у —> — оо (х -> — оо), у 4“ 00 (х 4~ °°)>
то примерный график функции у этим кратким исследованием вы-
рисовывается уже достаточно четко (черт, 22).
§ 41]
ЭКСТРЕМАЛЬНЫЕ ЗНАЧЕНИЯ
167
Пример 2. Функция у = ех— х—1 имеет производную
У = ех — 1,
так что У 0 при х 0 и У 0 при х 0. Функция у возрастает
при х^>0 и убывает при х<0; а так как при х=0 она равна
нулю, то для всех других значений х она положительна;* этим дока-
зано важное неравенство
ех^Л-\-х,
справедливое для любого вещественного х, причем знак равенства
имеет место лишь при №0.
Другие полезные упражнения см, в задачнике Б. П. Демидовича,
отдел II, задачи .320—325, 332, 339.
§ 41. Экстремальные значения
Пусть — функция, дифференцируемая в каждой точке
отрезка (а, Ь). Она, как мы знаем, непрерывна в этом отрезке и,
следовательно (теорема 2 § 23), имеет в нем некоторое наибольшее
и некоторое наименьшее значение. Вопрос о том, при каком значе-
нии независимой переменной функция принимает свое наибольшее
(или наименьшее) значение, может иметь, как легко понять, большой
практический интерес. Так, y=f(x) может измерять собой коэф-
фициент полезного действия какой-нибудь установки, зависящий от
выбора некоторой величины х, — выбора, который может быть сде-
лан нами произвольно в некоторых границах (а, Ь). Очевидно, мы
будем тогда искать то значение х в этом отрезке, при котором у
принимает свое наибольшее значение (а также, конечно, интересо-
ваться и самим этим наибольшим значением). Мы увидим • сейчас,
какую пользу могут при этрм принести методы дифференциальногр
исчисления.
168
ИССЛЕДОВАНИЕ ФУНКЦИЙ
[ГЛ. 10
Наибольшее значение функции j=/(x) в отрезке (а, Ь) назы-
вают ее максимумом, а наименьшее — минимумом; когда
хотят сказать «максимум или минимум», то говорят короче «экс-
тремум» или «экстремальное (т. е. крайнее) значение».
Если речь идет об экстремальных значениях функции во всем от-
резке (а, й), то часто говорят об «абсолютном» экстремуме (мак-
симуме или минимуме) функции. Очень важно и понятие локаль-
ного (относительного, местного) экстремума: функция /(х) имеет
локальный максимум в точке с (а с 6), если значение ее
в точке с является наибольшим по
сравнению с ее значениями во всех
точках, лежащих достаточно близко
к с, т. е. если существует такое число
8, что
/(с4-й)^/(С)
—1---1------------------для всех h, для которых \ h | 8.
а с ° Аналогично определяется л о к а л ь-
Черт. 23. ныйминимум. В силу требования
а<^с<^Ь локальный экстремум опре-
деляется, таким образом, лишь для внутренних точек отрезка (а, Ь).
Черт. 23 показывает различие между абсолютным и локальным
экстремумами: функция у=f(x), изображенная на этом чертеже, имеет
в точке с локальный максимум, который, однако, не является абсо-
лютным максимумом, так как на некотором удалении от с функция
принимает значения, ббльшие, чем /(с).
Ясно, что если свое наибольшее в отрезке (а, Ь) значение функция
получает в некоторой внутренней точке с этого отрезка, то этот
абсолютный максимум является вместе с тем и локальным макси-
мумом.
Отсюда для отыскания абсолютного максимума (или минимума)
данной функции в данном отрезке намечается следующий путь:
1) найти все локальные максимумы (или минимумы) функции в
данном отрезке;
2) к значениям функции в точках локального максимума (мини-
мума) добавить ее значения в концах данного отрезка и из всех
этих значений выбрать наибольшее (наименьшее)*).
Вторая из этих задач не представляет никаких затруднений, в
особенности если, как это почти всегда бывает в практических за-
дачах, функция имеет в данном отрезке лишь конечное (и притом
обычно небольшое^ число экстремумов. Таким образом, вся труд-
ность поставленного вопроса сосредоточивается на первой задаче, к
f ♦) Если функция в отдельных точках данного отрезка не имеет произвол-
лой, то, разумеется, и все такие точки должны быть добавлены наряду с кон-
цами отрезка. Пусть читатель рассмотрит пример у==|х| (— 1 1).
§41] ЭКСТРЕМАЛЬНЫЕ ЗНАЧЕНИЯ 169
решению которой (если данная функция дифференцируема) мы и мо-
жем подойти с помощью методов дифференциального исчисления.
Пусть функция y=f (х) имеет локальный максимум в некоторой
внутренней точке х = с отрезка (а, Ь) и пусть она дифференцируе-
ма в этой точке. На основании леммы § 36 мы можем тогда утвер-
ждать, что f (с) =? 0; к этому же заключению мы приходим, конечно,
и в случае, когда /(х) имеет в точке с локальный минимум. Таким
образом, если функция /(х) дифференцируема в каждой точке от-
резка (a, Ь), то все ее локальные экстремумы, если они имеются,
найдутся среди корней уравнения
7(х)=о. , (1)
Мы должны поэтому начать решение нашей задачи с отыскания всех
корней этого уравнения, лежащих между а и Ь. Корни уравнения (1)
называются обычно стационарными точками функции /(х);
такое наименование их вполне понятно: скорость изменения /(х) в
такой точке равна нулю; при прохождении х через такую точку /(х)
меняется очень медленно, значение ее обладает особой устойчивостью.
Таким образом, прежде всего мы должны найти все стационарные
точки функции /(х) в отрезке (а, 6); все искомые локальные экстре-
мумы найдутся среди этих точек. Пусть а — такая стационарная
точка; мы должны узнать, дает ли она локальный экстремум и если
дает, то какого типа — максимум или минимум. Допустим теперь,
что функция /(х) имеет в точке а, кроме первой производной, еще
ряд производных высших порядков; допустим для общности, что
f (а) =/" (а) =... =/(^) (а) = 0,
но /(л) (а) # 0 (если уже ff (а) 0, то п = 2). Формула Тэйлора (Т)
§ 38 дает тогда, очевидно:
/(а 4- Л) —/(а) = + о (Ап),
причем для решения интересующего нас вопроса мы должны иссле-
довать знак разности —ffa) при достаточно малых |Л|.
Так как второе слагаемое правой части последнего равенства при
h -> 0 бесконечно мало сравнительно с первым, то знак всей правой
(а следовательно, и левой) части этого равенства при достаточно
малом | h ] совпадает со знаком ее первого слагаемого, который мы
поэтому только и должны исследовдть.
Если число п — четное, то Ая^>0 и знак выражения hn -nfa-
совпадает со знаком /(*) (а) (в частности, значит, не зависит от А);
если /(яЦа)>0, то при достаточно малом |А| мы, таким образом,
имеем:
да + А)-/(а)>0,
170 ИССЛЕДОВАНИЕ ФУНКЦИЙ [гл. 10
т. е. в точке а функция /(х) имеет минимум-, напротив, если
/(л) (а) 0, то для всех достаточно малых | h | мы имеем:
/(a + A)-/(a)<0,
т. е. в точке а функция /(х) имеет максимум.
Если число п— нечетное, то hn, а следовательно, и выражение
(а)
hn — р меняет знак при перемене знака Л, следовательно, если | h |
достаточно мало, то и разность для положитель-
ных h будет иметь один знак, а для отрицательных — противопо-
ложный; это, очевидно, означает, что в точке а функция /(х) не
может иметь ни максимума, ни минимума (пример этого случая дает
нам /(х) = х3 при х = 0: /г(0)=/"(0) = 0, /"(0) =£ 0 (см. черт. 21,
§ 40, где точка х = 0 дает типический пример стационарной точки
без локального экстремума).
Мы получаем, таким образом (в предположении, что функция /(х)
дифференцируема достаточное число раз), вполне определенный прием
для обнаружения характера любой стационарной точки а: пусть в
ряду производных f (а),/" (а),... первая не равная нулю будет /<я) (а);
тогда*. 1) если п нечетно, функция /(х) не имеет в точке а ни
максимума, ни минимума-, 2) если п четно, локальный экстремум
в точке а существует и притом это будет локальный минимум,
если f(n) (а) > 0, и локальный максимум, если fW (а) < 0.
В частности, при /(а) = 0, мы имеем локальный ми-
нимум, а при /г(а) = 0, /г(а)<^0— локальный максимум; случай
f (а) = /" (а) = 0 требует исследования производных высших по-
рядков.
Найденный нами прием исследования стационарных точек может
оказаться неприменимым только тогда, если функция /(х) в точке а
либо не будет вовсе иметь производных достаточно высоких поряд-
ков, либо будет иметь производные всех порядков, равные нулю.
Интересно и важно отметить, что этот последний случай действи-
тельно может представиться (и притом, конечно, исключая тривиаль-
ный случай, когда /(х) просто постоянна в некоторой окрестности
точки а). Функция
_ 1
/ е (х # 0),
У—/(*) — | 0 (Х = о)
при х = 0 имеет стационарную точку, в которой, как легко под-
считать,
у =у" =... =у(п) = ... = 0;
Между тем в соседстве точки х = 0 поведение этой функции очень
просто (см^ черт. 24), на первый взгляд ничем существенным не отли-
чаясь от поведения таких функций, к^к у = № или у — х\ лишь на.
§41] ЭКСТРЕМАЛЬНЫЕ ЗНАЧЕНИЯ 171
известном отдалении от х = 0 начинают обнаруживаться различия в
поведении этих функций.
Установленный нами прием исследования стационарных точек,
теоретически ценный своей законченностью, на практике часто заме-
няется приемами, значительно более простыми, выгодными также и
тем, что они обычно не требуют существования производных выс-
ших порядков. Если а — стационарная точка функции /(х), т. е.
/(а) = 0, то для исследования характера этой точки достаточно во
многих случаях определить знак производной f (х) в ближайшем
соседстве точки а; так, если при х<^а мы всегда имеем (при до-
статочно малом |х — а|) /(х)<^0, а при х>а (и достаточно ма-
лом |х — а|) /(х)>0, то функция /(х) убывает слева от а и воз-
растает вправо от а: в точке а имеется локальный минимум; при
обратных знаках f (х) мы получаем локальный максимум; если же
f (х) для всех х, достаточно близких к а, сохраняет один и тот же
знак, то при переходе х через а функция /(х) либо все время воз-
растает, либо все время убывает и в обоих случаях не может иметь
локального экстремума в точке а.
При всей элементарности этого способа его все же не надо пе-
реоценивать. Определить знак f (х) для всех значений х, достаточно
близких к а, в большинстве случаев бывает не легче, а сложнее,
чем вычислить значения нескольких производных в точке а. Кроме
того, прием этот может привести к цели лишь в том случае, если,
например, вправо от a f (х) имеет один и тот же знак для всех х,
достаточно близких к а; этого, конечно, может и не быть — может
случиться, что при х а 0 производная f (х) бесчисленное мно-
жество раз меняет знак; если это так, то описанный прием оказы-
вается принципиально неприменимым.
Пример 1. Найти абсолютный максимум и абсолютный минимум
функции
/(х) = х3 — 6ха 4" 9х 2
в отрезке (0,4). При исследовании этой функции в § 40 мы видели,
что она имеет две стационарные точки: х=1 и х==3, из которых
первая дает локальный максимум, а вторая — локальный минимум.
Присоединяя к ним концы данного отрезка, мы. заключаем, что
172
ИССЛЕДОВАНИЕ ФУНКЦИЙ
[ГЛ. 10
точками абсолютного экстремума для /(х) могут быть только точки
0, 1, 3 и 4. Мы имеем:
7(0) = 2, 7(1) = 6, /(3) = 2, /(4) = 6;
таким образом, функция f(x) имеет в отрезке (0, 4) два абсолют-
ных максимума (при х=1 и х = 4) и два абсолютных минимума
(при х = 0 и х = 3).
Пример 2. Найти все локальные экстремумы функции
/(х) = sh х — х= е е-----х.
Мы имеем:
f (х) = ch х — 1 = — 1,
и прежде всего сразу видим, что х = 0 есть стационарная точка
[Г (0) = 0]; далее,
/"(x) = shx, Л(0) = 0,
/"'(x) = chx, /"(0)=1;
таким образом, первая не обращающаяся в нуль производная —
нечетного (третьего) порядка, и следовательно, в стационарной
точке х = 0 функция/(х) не имеет локального экстремума. Остается
убедиться, что других стационарных точек не существует. Из
полученного выражения для /"(х) мы непосредственно видим, что
( <0(х<0),
ГМ>0<*>0);
отсюда вытекает, что f (х) убывает при х<^0 и возрастает при
х>0; а так как /'(0) = 0, то для всех х^О, т. е.
кроме точки х=.О функция /(х) стационарных точек не имеет
(график этой функции в основном напоминает нам график функции
j/ = x8, см. черт. 21 § 40). Таким образом, функция /(х) не имеет
ни одного локального экстремума.
Пример 3. Из прямоугольной полосы жести ширины 2а, отгибая
кверху с каждой стороны по полосе ширины х (черт. 25), делают
(открытый сверху) желоб, поперечное сечение которого изображено
на черт. 26. Какую ширину х должны иметь отгибаемые края для
$рго, чтобы полученный желоб имел наибольшую вместимость?
экстремальные значений
173
§ 41]
Очевидно, что длина желоба в решении задачи роли не играет —
вместимость желоба пропорциональна площади его поперечного
сечения, равной 2х(а— х). Мы должны, таким образом, найти
абсолютный максимум функции
f (х) = 2ах — 2х*
в отрезке (0, а). Мы имеем:
f (х) = 2а — 4х,
и единственной стационарной точкой будет х = -^-, так как
/"(х) =— 4<^0 (при любом х и, в частности, при x = yj, то
при х = у имеет локальный максимум
f\2/ — 2 а ’
Он же будет и абсолютным максимумом, так как/(0)=/(а) = 0.
Таким образом, наиболее выгодно отгибать края, ширина которых
составляет одну четверть ширины данной полосы.
Большое число дальнейших упражнений учащийся найдет в любом
сборнике задач по математическому анализу. В частности, в задач-
нике Б. П. Демидовича, отдел II, можно рекомендовать задачи
436—444, 448, 452—466, 468—472, 539, 541, 542, 546, 552, 558.
РАЗДЕЛ ТРЕТИЙ •
ЭЛЕМЕНТЫ ИНТЕГРАЛЬНОГО ИСЧИСЛЕНИЯ
ГЛАВА И
ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ
§ 42. Понятие примитивной функции
Если закон движения какого-либо тела задан уравнением вида
«=/(/),
где t— время, a s — пройденный телом путь, то дифференцирова-
нием функции /(/) мы находим мгновенную скорость
*=7(0
этого движения в данный момент времени. Однако в механике
гораздо чаще приходится встречаться с обратной задачей: для
любого момента времени t дана скорость тела = (Z); требуется
найти закон движения тела, т. е. зависимость пройденного им пути
от времени. Как мы можем подойти к решению этой задачи? Мы
знаем, что данная скорость v = v(t) есть производная функции
$=/(/), выражающей собой искомый закон движения тела. Таким
образом, производная f — неизвестной функции f(t) нам
дана; требуется найти эту функцию. Очевидно, что задача является
обратной по отношению к основной задаче дифференциального
исчисления: там по данной функции требовалось найти ее произ-
водную, здесь же, наоборот, по данной производной требуется
найти первоначальную функцию.
Пусть, например, дано, что в момент времени t скорость дви-
жения тела равна
т/ = а/,
где а — постоянное число. Как найти закон движения? Для этого
надо найти функцию, производная которой совпадает с at. Одну
такую функцию мы знаем: функцию
at*
2 *
§ 42] понятие примитивной функций 175
Можно ли утверждать, что искомый закон движения будет
at* ,
Очевидно, что это было бы преждевременно: ведь возможно, что
кроме функции -у- существуют и другие функции, производные
которых равны а/; и тогда, если у нас нет никаких дополнительных
данных, мы не можем определить, какая из этих функций будет
служить искомым законом движения. Легко видеть, что такие
функции действительно существуют: функция
s=^--\-b, (1)
где Ь — любое постоянное число, имеет производную at\ мы полу-
чаем, таким образом, целое семейство функций, каждая из которых
с равным правом может выражать собой искомый закон движения.
При этом мы не знаем даже, исчерпываются ли семейством (1) все
функции, имеющие данную производную at, или такие функции
существуют и вне семейства (1).
Рассмотренная нами задача легко подвергается естественному
обобщению. Производная /'(х) данной функции /(х), как мы знаем,
всегда выражает собой быстроту изменения этой функции (сравни-
тельно с независимой переменной х). Во многих реальных задачах
вопрос ставится так, что требуется найти функцию, быстрота изме-
нения которой (относительно х) дана нам при любом значении х.
Математически эта задача, очевидно, всегда состоит в отыскании
неизвестной функции по данной ее производной, т. е. в решении
задачи, обратной по отношению к основной задаче дифференци-
ального исчисления. Поставим теперь эту задачу во всей общности,
введем необходимую терминологию и постараемся разобраться
в перспективах ее решения.
Итак, нам дана в некотором отрезке (или на всей числовой
прямой) некоторая функция /(х); требуется найти всю совокуп-
ность таких функций F (х), для которых в любой точке данного
отрезка
Каждую такую функцию мы будем называть примитивной (или
первообразной) функцией по отношению к функции /(х), так
что понятия производной и примитивной взаимно обратны*).
Разумеется, заранее мы не можем ничего утверждать о том,
имеет ли данная функция /(х) примитивные функции, и если имеет,
*) Примитивную функцию иначе называют неопределенным инте-
гралом данной функции; однако мы в дальнейшем этим термином пользо-
ваться не будем.
176 ОБРАЩЕНИЕ ОПЕРАЦИЙ ДИФФЕРЕНЦИРОВАНИЙ [гл. 11
то сколько их и как они связаны между собой. Однако кое-что
в этом направлении мы сразу можем установить очень элементар-
ными соображениями; прежде всего, если F(x) есть одна из при-
митивных для данной функции /(х), то любая функция семейства
F(x) + C, (2)
где С—любое постоянное число, очевидно, также будет служить
примитивной для функции /(х). Убедимся теперь, что примитивных
функций, нё входящих в семейство (2), у функции /(х) быть не
может. В самом деле, пусть Ф (х) — любая примитивная функции
/(х); составим разность Ф (х) — F(x); так как производная этой
разности, очевидно, при любом х равна нулю, то в силу заключи-
тельной теоремы § 36 Ф (х) — F (х) есть постоянная величина, ко-
торую мы обозначим через а. Отсюда
ф (x) = F(x) -\-а,
т. е. любая примитивная Ф(х) функции /(х) принадлежит семей-
ству (2).
Мы приходим, таким образом, к следующему важному выводу.
Теорема. Если функция f(x) имеет примитивную F(x), то
она имеет бесконечное множество примитивных, и все эти при-
митивные исчерпываются семейством (2).
Важность этого результата очевидна: он показывает, что для
отыскания всех примитивных функции /(х) достаточно найти какую-
нибудь одну из них; если такая примитивная найдена, то всякая
другая получается из нее добавлением какого-либо постоянного
числа. Таким образом, поставленная нами с самого начала задача
сразу сводится к более простой: узнать, имеет ли функция /(х)
хотя бы одну примитивную, и если имеет, то найти такую при-
митивную.
Отыскание примитивной данной функции называют интегри-
рованием (или интеграцией) этой функции. Можно сказать,
что интегрирование есть переход от производной некоторой функции
к самой этой функции. Если рассматривать этот переход как йеко-
торую операцию (действие), то можно сказать, что интегриройание
есть обратное действие по отношению к дифференцированию: если
данную функцию сначала продифференцировать, а потом проинте-
грировать, то мы при надлежащем выборе постоянной С в формуле (2)
вернемся к исходной функции.
Теперь вспомним, что дифференцированием мы в свое время
условились называть как нахождение производной, так и нахождение
дифференциала данной функции. Обратное действие — интегрирова-
ние— можно поэтому определять и как отыскание функции по ее
производной, и как отыскание функции по ее дифференциалу. Диф-
ференциал dF(x) искомой функции равен /^(xjdx, поэтому задания
дифференциала и производной равносильны друг другу.
§ 42] понятие примитивной функции 177
Результатом интегрирования является примитивная функция.
Таким образом, всякая дифференцируемая функция F(x) есть при-
митивная своей производной F (х) или своего дифференциала
dF(x) = F (x)dx.
Операцию интегрирования обозначают знаком j*. Взятие при-
митивной (интегрирование) есть операция, обратная взятию диффе-
ренциала (дифференцированию), которую мы обозначаем символом d.
Таким образом, символы d и J* выражают собой две взаимно
обратные операции. Если мы над данной функцией F(x) произведем
сначала операцию d, а затем операцию J*, то мы вернемся при
надлежащем выборе постоянного слагаемого к исходной функции
F(x):
^dF(x) = F(x),
или, так как dF (х) = F (х) dx,
j* F (х) dx = F (х).
Если F (х)=/(х), то поэтому
FW = J/(x)rfx;
эта запись выражает, следовательно, тот факт,* что функция F(x)
служит примитивной функцией для функции /(х). Впрочем, чаще
принято понимать под выражением
^f(x)dx
не одну какую-нибудь примитивную, а все семействэ примитивных
для функции /(х); если F(x) есть одна из этих примитивных, то
пишут поэтому
J/(x)dx = F(x)4-C, (3)
подразумевая под С произвольное постоянное число, так называемую
«постоянную интеграции». Разумеется, равенство (3) по самому
определению полностью равносильно равенству
F(x)=/(x).
В левой части равенства (3) функцию /(х) называют «подинте-
гральной функцией», а произведение f(x)dx—«подинтегральным
выражением».
12 А. Я. Хинчив
178 ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ [ГЛ. Ц
Пример 1. Так как d(х3) = Зх’dx, то
узх8</х=х84-с.
dx
Пример 2. Так как dtgx ——;, то
г г ® cos’x ’
и т. д.
Эти примеры ясно показывают, что любая формула, дающая нам
производную (или дифференциал) какой-либо функции, вместе с тем
непосредственно дает и некоторую формулу интегрирования, если
только прочитать ее, так сказать, справа налево. Проследив с этой
точки зрени^ ту таблицу производных простейших функций, которую
мы составидй в конце •§ 29, мы легко приходим к следующим
выводам.
1. Jo • dx — C (примитивная нуля равна произвольному постоян-
ному числу).
2. J1 • dx = x С> и вообще
J a dx = ах -f- С,
где а — любое постоянное число.
3. При любом постоянном а — 1 и х^>0
в то время как (при х^>0)
Jx-1 dx = J = In х С.
К этому надо добавить следующее. Так как при х<^0 функция
1п(—х) имеет производную то при х<^0
У^ = 1п(-х) + С;
таким образом, как в случае х^>0, так и в случае х<^0 мы
имеем общую формулу
4.
^=1п|х| + С.
J е^х = ег4- С,
§ 42] понятий примитивной функции 179
и при любом положительном а Ф 1
f axdx = -I- С.
J Ina 1
5. Для многочлена Р(х) = айхп -|-а1хп_1 ••• -|-ап
Jp(x)dx=-^- + ^-+ ... 4-аях + С
так что примитивная многочлена всегда есть многочлен степени, на
единицу высшей, чем данный.
6. j* sinxrfx =— cosx-pC
cosx dx = sin x -j- C,
J'^=‘^+c’
f A* — — ctg x C.
J sm’x ® 1
7. f = arcsin x4-C = — arccosx4-C,
J r^-8==arctgx + C = —arcctgx + C.
8. J sh x dx = ch x -|- C,
J ch x dx = sh x -j- C.
Для всех приведенных нами формул обоснование (или проверка)
их может быть произведено одним и тем же путем: достаточно
убедиться, что производная правой части равна подинтегральной
функции левой части; это же во всех случаях непосредственно
вытекает из соответствующей формулы таблицы производных в
конце §29.
Таким образом, мы уже знаем примитивные целого ряда про-
стейших функций. Однако наши знания в этом направлении пока
еще очень ограничены, а главное носят, так сказать, случайный
характер: мы умеем интегрировать лишь те функции, которые слу-
чайно оказались стоящими в правых частях формул дифференци-
рования, собранных нами в нашей таблице. Но этими функциями не
исчерпываются даже простейшие элементарные функции; среди них
нет, например, таких функций, как Inx, arctgx, и многих других; и
мы действительно до сих пор не встречали такой функции, произ-
водная которой равнялась бы 1пх или arctgx; поэтому мы не
только не можем найти примитивных
Jlnxrfx йли J arctgxrfx,
но мы не знаем даже того, существуют ли эти примитивные.
i|8P ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ [ГЛ. 11
Задача интегрирования значительно и принципиально труднее
задачи дифференцирования. Это обусловливается в первую очередь
различием самой логической природы этих двух задач. Отыскание
производной данной функции очень облегчается тем, что само опре-
деление понятия производной носит «конструктивный» характер:
производная прямо определяется как
Л-0 А
т. е. как результат некоторой определенной серии операций, которые
надо произвести над данной функцией; получив, например, задание
найти производную функции sinx, мы во всех деталях знали, как
приступить к работе и как довести ее до конца. Совсем иначе
обстоит дело с определением примитивной; никакого конструктив-
ного элемента, никакого указания на то, как найти примитивную
или хотя бы только приступить к этой работе, оно в себе не
содержит. Получив, например, задание найти
J In х dx
и не найдя функции In х среди правых частей формул нашей таблицы,
мы пока не видим никакого подхода к решению поставленной задачи.
В тесной связи с этим затруднением стоит то, что для операции
интегрирования мы не имеем уже такой законченной цепи правил,
которая в случае дифференцирования позволяла нам, зная произ-
водные нескольких гфункций, с легкостью находить производные
различных их комбинаций — сумм, произведений, сложных функций
и т. д. Те правила, какими для этой цели располагает теория инте-
грирования, и малочисленны, и имеют сравнительно узкий круг
применений. Тем не менее значение таких общих приемов интегри-
рования очень велико, так как в конечном счете с их помощью мы
все же научаемся интегрировать довольно большой запас как раз
наиболее часто встречающихся функций. В следующем параграфе мы
рассмотрим несколько простейших из этих приемов. Надо, еще
отметить, что в противоположность общим приемам дифференциро-
вания, применяющимся почти механически, применение общих приемов
интегрирования требует большого искусства — в каждом отдельном
случае надо уметь найти подходящий прием и применить его наиболее
выгодным образом. Искусство это может быть выработано только
с помощью долговременной практики.
Большое число упражнений читатель найдет в отделе Ш задач-
ника Б. П. Демидовича.
Учение об интегрировании функций и о свойствах их прими-
тивных называется интегральным исчислением и наряду
с дифференциальным исчислением составляет собой важнейший раздел
математического анализа.
ПРОСТЕЙШИЕ ОБЩИЕ ПРИЕМЫ ИНТЕГРИРОВАНИЯ
181
§ 43]
§ 43. Простейшие общие приемы интегрирования
1. Если y = ul±ui± ... ±ип есть алгебраическая сумма п
функций от х и если j* ukdx существует для всех £(1
то существует и J у dx и
J у dx— J к, dx ±У dx ±... ± У ип dx. (1)
Это правило часто коротко формулируют так: «примитивная
алгебраической суммы равна алгебраической сумме примитивных».
Чтобы доказать его, достаточно убедиться, что производная пра-
вой части равенства (1) существует и равная; но это очевидно в силу
правила дифференцирования алгебраической суммы (правило 3° § 29).
2. Если и — функция от х, а — постоянное число и если у и dx
существует, то существует и § audx и
У audx — a^ и dx. (2)
Короче: «постоянный множитель может быть вынесен за знак при-
митивной». Для доказательства достаточно продифференцировать
правую часть, опираясь при этом на теорему о возможности вынести
постоянный множитель за знак производной.
В тех двух случаях, которые мы рассмотрели до сих пор, соот-
ветствующие правила дифференцирования находят себе, как мы
видим, полное обращение. Но на этом, как мы теперь увидим, ряд
вполне обратимых правил дифференцирования и заканчивается; все
другие правила могут быть обращены лишь частично и приводят
к таким правилам интегрирования, которые иногда могут оказаться
очень полезными, но применимы далеко не во всех случаях.
Заметим еще, что в соотношениях (1) и (2) мы в правых частях
не приписывали постоянных интеграции; в этом не было надобности,
так как в обоих случаях правые части содержат знак примитивной
(или несколько таких знаков); этот знак, по нашему соглашению,
уже символизирует собой все семейство примитивных функций,
а следовательно, неявным образом содержит в себе и произвольную
постоянную. Это замечание относится и к целому ряду последующих
формул.
3. Интегрирование по частям. Посмотрим теперь, к чему может
нас привести попытка обращения формулы
(iwy = «# + W,
выражающей собой правило дифференцирования произведения двух
Ь82 ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ [ГЛ. 11
функций. Интегрируя написанное равенство, мы находим:
J (uv)' dx = uv = J (uv' -J- vu') dx;
отсюда, применяя к правой части правило (1), получаем:
uv = J uv' dx -f- J vu' dx.
Эта формула содержит две примитивные; поэтому мы не можем,
пользуясь ею, найти обе эти примитивные, а можем лишь выразить
какую-нибудь одну из них через другую, например
I иг/ dx = uv — I vu! dx. (3)
Что может дать нам эта формула? Если функции и и v нам известны,
то она позволяет выразить примитивную J uv' dx через известную
функцию uv и некоторую другую примитивную J vu' dx, имеющую
«такую же структуру, как и первоначальная. Однако в зависимости
от вида функций и и v из этих двух примитивных одна может
оказаться проще другой; если, например, вторая (стоящая в правой
части) проще первой, то формула (3) приносит несомненную пользу,
так как сводит отыскание данной примитивной к отысканию другой,
более простой; в. отдельных случаях может произойти даже так, что
примитивная, стоящая в правой части, входит в элементарную таб-
лицу § 29 или известна нам из каких-либо предварительных рас-
смотрений; в таких случаях формула (3) позволяет нам довести
отыскание примитивной J uvf dx до конца.
Как силу формулы (3), так и специфические особенности ее при-
менения проще всего испытать на конкретных примерах. Эта фор-
мула называется формулой интеграции по частям*).
Пример 1. Мы уже говорили, что J In х dx нам не известна,
так как мы не знаем функции, производная которой равнялась, бы
lnx. С помощью интеграции по частям эта примитивная легко мо-
жет быть найдена. Чтобы воспользоваться здесь формулой (3), нам
надо представить подинтегральную функцию в виде произведения
двух функций, первую из которых мы могли бы принять за к, а вто-
*) В общем случае эта формула не дает окончательного выражения
примитивной J uv' dx, а лишь сводит его к другой, более простой примитив-
ной; она как бы лишь частично решает задачу интегрирования произведения
uv”, сводя ее к более простой задаче. Отсюда термин «частичное интегриро-
вание», принятый в ряде европейских языков; термин «интегрирование по
частям», утвердившийся в ряде других языков, в том числе и в нашем, зна-
чительно менее выразителен.
| 43] ПРОСТЕЙШИЕ ОБЩИЕ ПРИЕМЫ ИНТЕГРИРОВАНИЯ 183
Рую — за тЛ Это можно сделать бесчисленным множеством спосо-
бов и надо уметь из всех этих способов выбрать такой, при кото-
ром примитивная J vu9 dx, стоящая в правой части формулы (3),
оказалась бы возможно более простой. Как это можно предвидеть?
Вспомним для этого, что производная функции 1пхг равная -^,есть
функция, несравненно более простая, чем сама функция 1пх, а так
как при переходе от примитивной J uv9 dx к примитивной J vtf dx
функция и заменяется своей производной и9, то мы можем рассчи-
тывать при этом переходе на известное упрощение, если положим
« = 1пх. Но из uv9 = 1пх и w = lnx следует тИ=1, поэтому мы
обязаны выбрать в качестве v какую-нибудь функцию, производная
которой тождественно равна единице; проще всего, конечно, поло-
жить v = x. Итак,
1 г 1
и = In х, и = — ,
V9 = 1, V = X,
UV9 = in X, vu' — 1,
и формула (3) дает:
J \nxdx = x\nx— J 1 • dx=x\nx— х-}-С.
Мы видим, что применение формулы (3) в этом случае позволило
довести решение задачи до конца. Это решение полезно, как обычно,
проверить, убеждаясь, что производная найденной функции действи-
тельно равна 1пх.
Те же соображения легко позволяют найти с помощью интегра-
ции по частям и более общего вида примитивную
§xa\nxdx,
где а — любое постоянное число; если а — 1, то полагаем:
и = In х, ii = ,
= ® = Т+Т’
UV9 =ХЛ\ПХ, VII9 =-Г-Г-,
a-f- 1
и формула (3) легко дает:
f ха In х dx = Х гт (in х-4-7) 4- С.
J «4-1 \ «+1/ 1
184
ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ
[ГЛ. 11
Если а = —1, то мы име^м:
и = In х, иг — у,
т/ = —, v — In х,
X ’
и формула (3) дает:
Примитивная в правой части здесь оказалась совпадающей с той,
которую мы хотим найти. Тем не менее полученное соотношение
решает задачу, так как из него мы получаем:
2 J* ~~ dx = In2 х,
и следовательно,
Пример 2. Пусть мы хотим найти примитивную
^xexdx.
Из двух множителей подинтегральной функции второй при диффе-
ренцировании и интегрировании не изменяется, первый же при диф-
ференцировании дает 1 — выражение более простое, чем он сам;
поэтому мы делаем попытку положить и = х, x/ = ev; это дает:
и = х, и' = 1,
т/ = ех, v = ех,
utf = xe*, vu' = ex;
применяя формулу (3), находим:
( хе* dx = xe*— С ехdx=xe*—
и задача решена до конца.
Пусть теперь мы хотим найти j* х*ех dx\ применяя те же сообра-
жения, что и выше, мы полагаем:
и = х2, и' = 2х,
vr = е*, v — ех,
uvT = x2ev, vtf = 2xev,
в формула (3) дает:
f xVdx — xY^- 2 ^xe*dx;
ПРОСТЕЙШИЕ ОБЩИЕ ПРИЕМЫ ИНТЕГРИРОВАНИЯ
185
§ 43]
так как примитивная, стоящая в правой части, найдена нами выше,
то тем самым найдена и примитивная j* х*е* dx. Вообще, желая найти
примитивную
4'л(^)= ^xnexdx,
где п — любое натуральное число, мы полагаем:
и = хч9 и' = пхп~19
v = ex9 v = ex9
uv' = хпех9 vu' = nxn~le v,
и формула (3) дает:
фя (х) = хпех — п j* xn~lex dx = хпех — лфя-1 (х);
это — рекуррентная формула, дающая простое выражение фя(х)
через фя-1 (х); так как ф0 (х) и (х) нам. известны, то с помощью
этой формулы мы можем с легкостью последовательно найти (х),
<Рз(х) и вообще фя(х) для любого п. Легко усмотреть при этом,
что для любого п мы будем иметь:
фл (•*)=j* dx = Рп (х) ех 4- С,
где Ря(х)— некоторый многочлен степени п.
Дальнейшие упражнения см. в задачнике Б. П. Демидовича, от-
дел III, задачи 123—136*).
4. Замена переменной. Теперь мы обратимся , к вопросу о том,
как может быть использована для целей интегрального исчисления
формула дифференцирования сложной функции. Пусть/(а) — функ-
ция, которую мы умеем интегрировать, и F(m) — одна из ее прими-
тивных, так что
F (и) =/(и), J du = F (и) + С.
Если мы примем переменную и за функцию новой Переменной х,
и = ф(х), то мы будем иметь:
_j, = F(«) = F[?(x)],
и согласно правилу дифференцирования сложной функции (предпо-
лагая функцию ф(х) дифференцируемой)
dy = F' [<р (х)] (х) dx=f [ср (х)] dtf (х);
♦) Обращаем внимание на то, что в задачнике Б. П. Демидовича прими*
тивная функция именуется интегралом.
186 ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ [ГЛ. 11
так как это есть дифференциал функции .yssF [$(*)], то, обратно,
§ fteWW (x)dx= J f [<p (x)] dtp (x) = F [ф(х)]Ц-С.
Таким образом, если
J /(«)da=F(«) + C
и если ф(х)— любая дифференцируемая функция, то
J/ [ф (х)1 ф' (х) dx=J f [ф (х)] dtp (х) = F [ф (х)] + С.
Иначе говоря: если и = у(х) и функция ф (х) дифференцируема,
а функция f(u) имеет примитивную, то
J f [ф (*)] ф' (*) dx = У f [ф (x)I dtp (х) = У / (и) du (4)
(где в правой части после интеграции надо положить н = ф(х)).
Как и в случае интеграции по частям, соотношение (4), вообще
говоря, только сводит нахождение одной примитивной к отысканию
некоторой другой примитивной; но, как и там, эта вторая прими-
тивная может оказаться проще первой, в частности, может слу-
читься, что вторая примитивная нам известна; в такохм случае и
первая примитивная может быть непосредственно написана.
Каждая функция /(и), примитивную которой мы умеем находить,
позволяет, таким образом, с помощью соотношения (4) непосред-
ственно написать бесчисленное множество новых примитивных, по-
лучаемых из левой части этого соотношения любым выбором диф-
ференцируемой функции ц = ф(х). Однако именно благодаря этому
широкому произволу в выборе функции ф(х) метод замены
переменной (так называют рассматриваемый нами сейчас прием
интегрирования *)) для своего применения требует еще более, чем
интегрирование по частям, проявления специфической изобретатель-
ности, которая может и здесь быть достигнута только длительной
практикой. В каждом отдельном случае вопрос, очевидно, Ьтавится
так: мы хотим найти примитивную некоторой функции ф (х); с этой
целью нам надо подобрать такую дифференцируемую функцию ф (х),
чтобы было
Их)=/[ф(-*)]ф'(л)>
или, что то же,
ф (х) dx=f [(ф (х)1 dtp (х),
где /(w) — функция, примитивная которой
♦) Иногда его называют также методом подстановки.
§ 43] ПРОСТЕЙШИЕ ОБЩИЕ ПРИЕМЫ ИНТЕГРИРОВАНИЯ 187
нам известна; если это удается, то мы в. силу. (4) можем прямо
написать:
и наша задача решена. Вся трудность вопроса состоит, таким обра-
зом, в подыскании надлежащей функции ф(х). Какие соображения
в отдельных случаях могут оказать помощь в этом деле, это и здесь
лучше всего может быть показано на примерах, к рассмотрению
которых мы сейчас и перейдем.
Пример 3. Найти
sin х dx
cosx
Так как sinxdx =— rfcosx, то
d cosx ф
cosx ’
это, естественно, наводит нас на мысль положить cosx = a; тогда
формула (4), в которой надо положить /(«)= —, <p(x) = cosx,
дает нам:
J tgxrfx = — f~^=—J 7Г = — ln|u|4-C=
= — In | cosx | 4- С,
и наша задача решена.
Совершенно аналогичным образом мы находим, полагая и =₽sinx:
j’ctgxrfx = J J = In I w 14- C = ln I Sinjv 14- С.
Обе задачи служат частными случаями следующей очень часто
встречающейся общей задачи. Пусть ф (х) — дифференцируемая функ-
ция, и требуется найти примитивную функции
ф' (х) п
Полагая
ф(х)=н, мы находим qpr(x)dx = rfH, и следовательно,
v=,n’Ml + C=lnl?(x)l + c-
И т. д.
188 ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ [ГЛ. 11
Пример 4. Найти. примитивную
f х^х
J 1 +У1 + х2*
Так как числитель подинтегрального выражения с точностью до
постоянного множителя равен дифференциалу суммы 1 4* х2, стоя-
щей под знаком радикала в знаменателе, то мы делаем попытку
ввести этот радикал в качестве новой переменной:
и = у/1 4- х2,
откуда
du = —?J^ =
У1 + X2 «
и следовательно,
х dx = и du;
мы получаем:
Jxdx ________С и du
1 + 1<Г+Г2 —J W
т. е. во всяком случае сводим отыскание данной примитивной к оты-
сканию примитивной значительно более простойх которая, как мы
сейчас покажем, может быть найдена очень легко с помощью нового
преобразования переменной. Полагая 14-w = ^, мы имеем:
и = v — 1, du — dv,
и следовательно,
Ут^7==]‘-^1^=Р®-/т:==г’-1пг’ + С=
= 1 4~ « — 1п (1 —|— и) 4~ с>
поэтому равенство (5) дает:
J iwr + /Г+^>+с<!,
где С:< = 1 4" С—произвольная постоянная.
Мы решили нашу задачу с помощью преобразования и — У1 4~ х*;
но с таким же основанием мы могли бы сделать попытку ввести
в качестве новой переменной не радикал, а подрадикальное выраже-
ние 1 4" х*; это Дало бы
я==14-х2, du = 2xdx, xdx = ^du>
И мы имели бы:
Jxdx _______ 1 Г du
l + ]/T+V«~ 2 J 1+ViT
§ 43] ПРОСТЕЙШИЕ ОБЩИЕ ПРИЕМЫ ИНТЕГРИРОВАНИЯ 189
Эта новая примитивная также в достаточной мере проста. Пола-
гая мы имеем:
u = (v— I)2, du = 2(v— l)dv,
и значит,
2 J 1 + Уи J ?
это же — та самая примитивная, к которой мы в конце концов
пришли при нашем первом преобразовании переменной. Мы видим,
таким образом, что в некоторых случаях различные замены пере-
менной приводят к цели с одинаковой легкостью.'
Пример 5. При интегрировании функций очень часто прихо-
дится встречаться со следующей элементарной задачей: примитивная
функции f(x)
f(x)dx — F (х)-\-С
нам известна; требуется найти примитивную функции f(ax), где
а — данное постоянное число. Допустим, что а 0 (в случае а = 0
/(ах)=/(0) есть постоянная величина, и задача становится три-
виальной), и положим ах = ц, так что dx — ^\ тогда
f(ax)dx = J/(«) ^ = |F(H)4-C=|F(ax) + C.
Итак, если
^f(x)dx=F(x) + C
и а 0, то
J f (ах) dx = ~F(ах)Ц-С.
Так,
j* sinkxdx — — cos£x + С,
f : — = - BFCSin (йХ) 4- С
И Т. Д.
Впрочем, мы нередко встречаемся и с обратным положением
вещей, когда мы не умеем интегрировать функции f(u) и пользуемся
формулой (4), так сказать, в обратном направлении, заменяя труд-
ное выражение правой части примитивной, стоящей в левой части,
что при удачном выборе функции ф(х) может оказаться задачей
более легкой. Так, примитивную
J 1 — и2 du
190 ОБРАЩЕНИЕ ОПЕРАЦИИ ДИФФЕРЕНЦИРОВАНИЯ [ГЛ. 11
непосредственно найти трудно; полагая же и = sinx,—^^х^у,
мы в силу формулы (4) находим:
j* /1 — и2 du = J cos2 х dx\
последнюю примитивную читатель легко найдет самостоятельно:
У cos2 х dx = ~ (х -j- sin х cosx) -|- С;
здесь x = arcsi.m, sitix = w, cosx= у/1 —н2, и мы находим:
У у/1 — н2 du = (arcsin и -|- и 1 — к2) -|- С.
Дальнейшие упражнения см. в задачнике Б. П. Демидовича,
отдел III, задачи 28—60, 101—120.
Тем, что мы изложили в настоящем параграфе, исчерпывается
небольшой запас простейших общих приемов интегрирования функ-
ций; число этих приемов невелико и, как правило, они не решают
стоящих перед ними задач во всех случаях, какие могут предста-
виться; применение их происходит не механически, но требует вы-
бора специального приема для каждой отдельной задачи. Тем не
менее в своей совокупности они позволяют интегрировать довольно
широкие классы элементарных функций. Мы вскоре (гл. 16) вер-
немся к этому вопросу. Сейчас же мы должны ознакомиться с со-
всем новым подходом к основной задаче интегрального исчисления —
подходом, который, прежде всего, очень значительно расширяет и
укрепляет связь этого учения с реальным миром — его роль как
математического аппарата точного естествознания и техники.
ГЛАВА 12
ИНТЕГРАЛ
§ 44. Площадь криволинейной трапеции
Мы обратимся теперь к рассмотрению ряда задач, принадлежа-
щих к разным областям знания, но связанных между собой единст-
вом необходимого для их решения математического аппарата. Этот
аппарат на первый взгляд не имеет прямого отношения к дифферен-
цированию и интегрированию функций; исторически он в течение
долгого времени развивался независимо от этих двух операций.
Однако уже в конце XVH столетия стало ясно, что самый сильный
и общий метод решения задач этого цикла мы получаем, связывая
их с определенными задачами интегрального исчисления. Мы скоро
увидим, как это может быть сделано.
Элементарная геометрия учит нас вычислять площади только
таких плоских фигур, которые ограничены прямолинейными отрез-
ками и дугами окружностей. Общая геометрическая задача вычисле-
ния площади плоской фигуры, ограниченной кривой произвольного
вида, может быть решена только средствами математического ана-
лиза. Теоретическая и практическая актуальность этой задачи ясна
непосредственно и никакой специальной аргументации не требует.
Фигура, ограниченная произвольной кривой (черт. 27), обычно
может быть проведением нескольких прямых двух взаимно перпен-
дикулярных направлений разбита на такие части, каждая из которых
представляет собой «криволинейную трапецию», т. е. фигуру, с трех
сторон ограниченную прямыми линиями, из которых две взаимно
параллельны, а третья к ним перпендикулярна (черт. 28); четвертая
сторона представляется дугой произвольной кривой, пересекаемой
не более чем в одной точке любой прямой, параллельной боковым
сторонам трапеции. При этом не исключается и тот случай (черт. 29),
когда одна из двух параллельных сторон стягивается в точку и
вместо криволинейной трапеции мы имеем криволинейный треуголь-
ник. Мы можем, таким образом, ограничиться задачей вычисления
площади криволинейной трапеции.
Выберем систему прямоугольных координат таким образом, чтобы
сторона трапеции, лежащая против ее криволинейной стороны, была
192
ИНТЕГРАЛ
[гл. 12
расположена на оси ОХ, а сама трапеция — выше этой оси (черт. 30).
Обозначим через а и Ь (а Ь) абсциссы концов нижней стороны
(«основания») трапеции, и пусть верхняя, криволинейная сторона ее
служит графиком функции j/=/(x).
Мы ставим себе задачу — найти площадь S нашей криволинейной
трапеции. Но при этом мы не должны забывать, что самое понятие
площади фигуры, ограниченной произ-
вольной кривой, у нас еще нигде не было
определено — элементарная геометрия
определяет это понятие только для прямо-
Черт. 29.
линейно ограниченных фигур (многоугольников) и частей круга. Мы
находимся поэтому перед лицом нашей задачи в точности в таком же
положении, какое мы констатировали в § 26, когда ставили задачу
определения мгновенной скорости неравномерного движения. Здесь,
как и там, наша задача — двойная: мы должны дать понятию иско-
мой площади целесообразное определение и вместе с тем выработать
. аппарат для вычисления этой площади,
/и здесь, как там, мы будем решать эти
/ две задачи совместно.
/ Вспомним, прежде всего, что в эле-
NpJX ментарной геометрии при вычислении
‘ площади круга мы, в сущности, уже
пользуемся основной операцией матема-
I тического анализа — предельным перехо-
-----L—————J—дом: мы определяем площадь круга как
а b X предел площадей некоторых многоуголь-
Черт. 30. ников — фигур, площади которых могут
быть вычислены элементарными приемами.
Этим же методом естественно воспользоваться и в общем случае.
С этой целью разобьем отрезок (а, Ь) — основание нашей трапе-
ции — на любое число частей (отрезков), вставляя между а и b
точки деления xlt х2, ... , хп_19 и положим для общности а = х0,
Ь = хп, так что
О = Xq X} ^п-1 ===
Отрезки (jr^t, xk) (1^Л^л), на которые мы разбили отрезок
(а, Ь), могут при этом иметь произвольные длины, вообще говоря,
§441
ПЛОЩАДЬ КРИВОЛИНЕЙНОЙ ТРАПЕЦИИ
193
как угодно различные между собой. Совокупность этих точек деле-
ния xk(0^k^ri) мы будем называть «разбиением» основного от-
резка (а, Ь).
ВыбервхМ теперь произвольный отрезок (хл_п хл) нашего разбие-
ния и возьмем в нем произвольную точку которая может либо
лежать внутри этого отрезка, либо совпадать с тем или другим из
его концов (хк_г хл); в точке восставим перпендикуляр
к оси ОХ, продолжая его до встречи с кривой y=f(x) в точке М,
ордината которой, очевидно, равна /($*) (черт. 31). Проведем
через эту точку М прямую, параллельную оси ОХ, до встречи
с прямыми x = xk_t и х = хк, заштрихован-
ный на черт. 31 прямоугольник имеет тогда
основание xk — высоту f(ik) и, следо-
вательно, площадь f(£k)(xk — xk_{).
Если мы теперь проведем только что опи-
санную конструкцию в каждом из отрезков
xk) всякий раз выбирая
точку совершенно произвольно в соответ-
ствующем отрезке, то совокупность заштри-
хованных прямоугольников образует собой
(черт. 32) прямолинейно ограниченную фигуру
(многоугольник) «лестничного» вида. Оче-
видно, форма этой фигуры зависит от того,
какое разбиение отрезка (а, Ь) мы выбрали
Черт. 31.
и каково положение
произвольно выбираемых точек в различных отрезках этого раз-
биения. Нам ясно представляется, однако, что если разбиение вы-
брано достаточно мелким (черт. 33), то при любом положении то-
чек \k заштрихованная фигура будет как угодно мало отличаться от
нашей криволинейной трапеции. Обозначим площадь заштрихованной
фигуры через S*. Она равна сумме площадей составляющих ее пря-
моугольников:
п
s*= 2
1
Если мы будем теперь выбирать все более и более мелкие раз-
биения отрезка (а, Ь), каждый раз произвольно выбирая еще точки tk,
и для каждого из этих разбиений вычислять площадь S* заштрихо-
ванной лестничной фигуры, то наше наглядное представление заста-
вляет нас ожидать, что в этом процессе площадь S* будет стре-
миться к определенному пределу и что этот предел и естественно
называть площадью S данной криволинейной трапеции. При таком
выборе определения площади S нами руководит, помимо непосред-
ственного наглядного представления, еще и далеко идущая аналогия
с определением площади круга в элементарной геометрии -г- там ведь
13 А. Я. Хин чин
194
ИНТЕГРАЛ
[гл. 12
тоже эта площадь определяется как предел площадей некоторых
многоугольников, все ближе и ближе подходящих к данному кругу.
Мы, естественно, приходим, таким образом, к определению
п
S = lim S* = lim 2 /(W (** - **-.).
Этим, однако, сделано еще далеко не все. В чем состоит тот про-
цесс, при котором совершается наш предельный переход? Каково
математическое описание этого процесса? Мы знаем (§ 13), что про-
цесс, при котором производится тот или другой предельный переход,
Черт. 32.
описывается указанием на поведение некоторой величины, принимае-
мой за «основную» переменную. Какова эта величина и каково ее
поведение в данном случае?
Выше мы характеризовали тот процесс, который лежит в основе
нашего предельного перехода, как безграничное мельчание предпри-
нимаемого нами разбиения отрезка (а, й). Пусть Т — какое-либо из
этих разбиений; обозначим через 1(Т) длину наибольшего из отрез-
ков (xk_i, xk) (1 л) (очевидно, что для любого разбиения Т
это число 1(Т) является однозначно определенным). Мы можем
условиться считать, что переменное разбиение Т «безгранично мель-
чает», если 7(Г)->0, т. е. если стремится к нулю длина наиболь-
шего из отрезков (хк_и xk)> и, следовательно, писать
п
S= lim S*= lim У—(1)
/(7)—>0
Это означает, что в качестве основной переменной рассматриваемого
процесса мы выбираем величину I (Т) и описываем наш процесс соот-
ношением Z(T)->0. При этом необходимо иметь в виду, что вели-
§?44] ПЛОЩАДЬ КРИВОЛИНЕЙНОЙ ТРАПЕЦИЙ 19Б
чина S*, предел которой мы ищем, не есть функция величины Z( 7);
ясно, что одному и тому же значению Z(T) соответствует бесчис*
ленное множество различных разбиений Г, не говоря уже о том,
что если даже разбиение Т выбрано, то мы можем еще бесчислен-
ным множеством различных способов выбирать точки причем ве-
личина S* существенным образом зависит от всех этих элементов
произвола и потому при данном значении 1(Т) может принимать
бесчисленное множество различных значений.
Таким образом, мы имеем здесь дело с предельным переходом
в том расширенном понимании, которое мы подробно рассмотрели
в § 15. Интересующая нас величина S* участвует в процессе, опи-
сываемом соотношением Z(T)->0, причем 5* не является функцией
основной переменной Г(Т), так как может при данном значении Z (7)
принимать бесчисленное множество различных значений. Однако мы
знаем, что это не мешает нам приписывать величине S* в данном
процессе определенный предел 5. Соотношение
lim S*=S
Z (Г) —>0
при этом имеет следующий совершенно точный смысл: как бы мало
ни было е^>0, найдется такое 8^>0, что при любом разбиении 7,
у которого 1(Т)<^Ъ9 и при любом выборе точек мы будем
иметь*.
Is* — 5|<е.
Такое определение представляется вполне естественным. В самом
деле, если бы, например, величина S* при различном выборе раз-
биений Т или точек \k стремилась к различным пределам, то было
бы трудно решить, какой из этих пределов призван измерять собой
площадь нашей криволинейной трапеции. По смыслу же нашего оп-
ределения мы считаем, что предел (1) вwэтом случае отсутствует
и что никакой определенной площади мы нашей криволинейной тра-
пеции приписать не можем.
Если принятое в нашем определении условие соблюдено, то мы
будем кратко говорить, что при безграничном мельчании
разбиения. Мы приходим, таким образом, к следующему определе-
нию площади нашей криволинейной трапеции:
п
Если сумма S*= J^f(tk)(xk— xk-i) стремится при безгра-
. *«= i
ничном мельчании разбиения к некоторому пределу, то этот пре-
дел мы называем площадью данной Криволинейной трапеции.
Более формальная, но равносильная формулировка гласит:
Число S называется площадью данной криволинейной трапеции,
если каждому е > 0 соответствует такое 8 > 0, что при любом
196 ИНТЕГРАЛ [гл. 12
разбиении Т, для которого и при любом выборе точек
мы будем иметь:
п
12/&)(§ **-**-*)-5|<е-
£ = 1
Первая часть стоявшей перед нами двойной задачи нами тем
самым полностью разрешена: мы установили определение общего
понятия площади криволинейной трапеции. Что касается второй
части — создания аппарата для конкретного вычисления этой пло-
щади, то в принципе она также решена, так как определяющая фор-
мула (1) указывает всю последовательность необходимых для этой
цели операций. Однако практически указанный для этой цели метод
мало удовлетворителен; не говоря уже о том, что даже при каком-
нибудь одном определенном выборе разбиений Т и точек отыска-
ние предела столь сложного выражения фактически удается лишь
в немногих простейших случаях, мы не должны забывать еще и
о том, что, помимо этого, мы обязаны всякий раз доказывать неза-
висимость найденного предела от выбранной системы разбиений и
от выбора точек что в большинстве случаев бывает очень обре-
менительно. По всем этим причинам указанный нами аппарат в боль-
шинстве конкретных задач не может найти себе непосредственного
применения. Интересно все же отметить, что прежде, когда более
сильные методы решения такого рода задач не были еще известны,
задачи эти в некоторых случаях решались именно этим прямым
методом. Так, уже в древней Греции этим путем задача была ре-
шена в случае, когда кривая j/=/(x) есть парабола (например,
/(х) = ах2, где а — постоянная).
§ 45. Работа переменной силы
Пусть некоторое тело движется по прямой ОХ под действием
силы Р, параллельной этой прямой, причем направление силы со-
впадает с направлением движения тела. Если эта сила постоянна,
т. е. величина ее одинакова во всех точках х прямой ОХ, то ра-
ботой W силы Р на каком-нибудь участке этой прямой называют,
как известно, произведение силы Р на длину s выбранного участка:
W=Ps.
Так, если тело под действием своего веса Р падает на землю с вы-
соты h, то сила тяжести (которую мы в земных условиях можем
считать постоянной на протяжении всего падения) совершает при
этом работу Ph.
Пусть теперь тело движется по той же прямой под действием
силы, величина которой различна в различных точках его пути. Мы
можем себе представить, например, что в какой-либо точке прямой ОХ
§ 45] РАБОТА ПЕРЕМЕННОЙ СИЛЫ 197
помещен источник, притягивающий или отталкивающий наше тело
с силой Р, зависящей от их взаимного расстояния (таковы, как из*
вестно, силы всемирного тяготения, а также силы электрического
и магнитного притяжения и отталкивания). Тогда сила Р=Р(х)
будет функцией абсциссы х той точки, в которой находится тело
в данный момент. Пусть тело под действием этой переменной силы
переместилось из точки а прямой ОХ в точку b той же прямой.
Как найти тогда работу W, произведенную силой Р при этом пере-
мещении?
Мы прежде всего замечаем, что работа переменной силы есть
понятие, которое до сих пор нами нигде не было определено. Мы
снова оказываемся, таким образом, перед лицом двойной задачи —
определить это новое понятие во всей его общности и вместе с тем
создать аппарат для практического вычисления работы переменной силы.
Разобьем отрезок (а, Ь) произвольным образом на части с по-
мощью точек деления
а = х0 <Cxi <С <С ••• <Zxn — P^
как мы это делали в предыдущем параграфе, и снова выберем
в каждом отрезке (xk_if xk) произвольную точку lk.
Сила, действующая на тело в точке равна Р(^). Если бы она
сохраняла это значение на всем протяжении отрезка (хл-1, xk), то
работа ее на этом участке равнялась бы, как мы знаем
(О
Но на самом деле эта сила в разных точках отрезка (х^, xk) имеет
различные значения, и потому ее работа wk на этом отрезке от-
лична от написанного произведения. Однако если участок (х^, xk)
очень мал, то мы имеем основание ожидать, что на его протяжении
сила Р(х) изменяется лишь незначительно и что, следовательно,
значения ее в различных точках этого участка будут очень мало
отличаться от ее значения в выбранной нами точке Но если так,
то естественно принять, что и работа wk силы Р на участке (xk~19 xk)
будет мало отличаться от работы, производимой на этом участ-
ке силой, постоянно равной Р(^). Эта последняя работа выра-
жается произведением (1), и мы можем, следовательно, считать, что
О'* Р (W (Xk — хк-1 )• (2)
Это рассуждение может быть проведено для всех участков, на ко-
торые мы разбили отрезок (a, Ь), т. е. для всех kfl^k^n).
Далее, мы, естественно, считаем, что работа W силы Р на про-
тяжении всего участка (а, Ь) равна сумме ее работ на всех тех
участках (хл-1, xk), на которые мы разбили отрезок (а, Ь), т. е. что
п
UZ = 2 v>k.
к —I
198
ИНТЕГРАЛ
[гл. 12
Так как мы допустили, что приближенно выражается произ-
ведением P(£k)(xk — xk-d> т0 нам естественно далее допустить, что
п
2 (3)
/г = 1
Это приближенное выражение искомой работы будет, разумеется,
тем точнее, чем точнее приближенные равенства (2). А эти равен-
ства мы считаем в свою очередь тем более точными, чем меньше
отрезки (xk_lf xk), т. е. чем мельче предпринятое нами разбиение Т
отрезка (а, Ь). В результате мы должны считать приближенное ра-
венство (3) тем более точным, чем мельче разбиение Т. Будет по-
этому вполне естественно, если мы определим точное значение
работы W нашей переменной силы как предел суммы
п
fe = l
при безграничном мельчании дробления.
Эта сумма имеет в точности такое же строение, как та, с по-
мощью которой мы в § 44 определяли площадь криволинейной тра-
пеции. И по поводу того предельного перехода, с помощью кото-
рого мы определяем работу W переменной силы Р, мы можем слово
в слово повторить все то, что по поводу соответствующего пре-
дельного перехода было сказано там. Под записью
п
IF = lim 2 рШхк-*к-') (4)
мы здесь, как и там, понимаем следующее: как бы мало ни было
е^>0, найдется такое 6^>0, что при любом разбиении Т отрезка
(а, Ь), подчиненном только требованию и при любом
выборе точек ^k(xk-i^^k^xky мы будем иметь:
п
Л=1
Только при выполнении этого условия мы будем называть число IF
работой силы Р на участке (а, Ь); в случае же, например, когда
при различных системах разбиений или различных выборах точек
мы получали бы для суммы
п
2 p^)(xk — xk_t)
§ 46] ОБЩЕЕ ПОНЯТИЕ ИНТЕГРАЛА 199
различные пределы, мы предпочитали бы полагать, что работе си-
лы Р на участке (а, Ь) нельзя приписать никакого определенного
значения.
Мы снова видим, что первая часть нашей задачи (определение
общего понятия работы переменной силы) нами полностью решена,
в то время как вторую часть (создание аппарата для практического
вычисления этой работы) мы можем считать решенной лишь в прин-
ципе: по поводу практического неудобства формулы (4) можно
было бы повторить все то, что сказано нами в § 44 по поводу ана-
логичной выведенной там формулы.
§ 46. Общее понятие интеграла
В §§ 44 и 45 мы рассмотрели две задачи, взятые из различных
областей знания — одну из геометрии, другую из физики. Мы убе-
дились, что если мы отвлечемся от конкретного содержания этих
задач и сосредоточим внимание на их аналитической структуре, то
они оказываются в точности совпадающими между собой. В обоих
случаях решение задачи требует вычисления предела некоторой
суммы совершенно определенного строения.
В целом ряде вопросов геометрии, физики, техники и других
областей знания и человеческой деятельности возникает огромное
количество задач, аналитическая структура которых совпадает
с только что рассмотренной нами; в дальнейшем мы еще не раз
будем иметь дело с задачами этого рода. Поэтому понятно, что
предельный переход описанного типа заслуживает общего и всесто-
роннего изучения и является важной задачей математического ана-
лиза, которой нам предстоит теперь заняться во всех деталях.
Пусть функция /(х) определена в отрезке (а, Ь). Подвергнем
этот отрезок некоторому разбиению Т посредством точек деления
а = х0 < Xj хп = b
и обозначим через /(Т) длину наибольшего из отрезков (х^_}, xk)
(Л=1, 2, ... , п) этого разбиения. Выберем, далее, в каждом от-
резке (хм, хл) произвольную точку (xk-i^tk^xk) и составим
сумму
п
s= 2 ли (**-**_!);
k = 1
очевидно, что эта сумма зависит как от предпринятого нами раз-
биения Т, так и от выбора точек
Условимся теперь говорить, что сумма S при безгранич*
ном мельчании разбиения Т (или, что то же, при
l(T)-+ty стремится к пределу /, если имеет место сле-
дующее*. как бы мало ни было е^>0, найдется такое 8^>0, что
JOO ИНТЕГРАЛ [ГЛ. 12
при любом разбиении Т, подчиненном лишь условию и
при любом выборе точек
|S-/|<e.
Записывать этот факт мы будем в виде
п
,’imns= iim 2 лис**—
Z(F)-»O
Число /, если оно существует, зависит, очевидно, только от
вида функции /(х) и от отрезка (а, Ь). Мы будем называть его
интегралом функции /(х) от а до b (или на отрезке (а, Ь)) и
обозначать через
ь
J f(x)dx\ (1)
а
ни наименование «интеграл», ни знакомый нам знак f не должны
при этом до известной поры связываться в нашем представлении
с тем, что термин «интегрирование» и этот знак символизировали
в предыдущем; в свое время эта связь будет установлена. На обо-
значение (1) мы можем смотреть (и такая точка зрения будет исто-
рически оправданной) как на искаженное изображение суммы S;
если мы хотим просто описать структуру этой суммы, не вдаваясь
в подробности, касающиеся выбора разбиения и точек но фик-
сируя лишь вид функции f и отрезок (а, Ь), то мы можем написать
(без всякой претензии на точность нашей символики)
ъ
S = 2/(-»)A-v,
а
подразумевая под Ах приращение величины х при переходе от
одной точки деления к следующей. Если мы, далее, заметим, что
Ax = dx, и будем обозначать операцию суммирования не греческой
буквой 2, а (как это действительно делалось прежде) латинской
буквой ©7*, то мы получим:
ь
&>=<§? f(x)dxt
а
предел же этого выражения можно условиться обозначать тем же
символом с искаженным каким-либо образом знаком суммирования
таким искажением и может служить символ f и таково его дей-
ствительное историческое происхождение. Этим путем мы и прихо-
дим к обозначению
ъ
ВЕРХНИЕ И НИЖНИЕ СУММЫ
201
§ 47]
Числа а и Ь называются пределами интеграции (а —
нижним, Ь — верхним), а отрезок (а, Ь) — промежутком
интеграции; функция /(х) называется подинтегральной
функцией, а произведение f(x)dx — подинтегральным
выражением.
Функция /(х), имеющая интеграл в отрезке (а, &), называется
интегрируемой в этом отрезке. Легко видеть, что интегрируе-
мой может быть только функция, ограниченная в отрезке (а, &).
В самом деле, если /(х) не ограничена в (a, Z>), т0 при любом
разбиении Т она будет неограниченной и по меньшей мере в одном
из отрезков (хл_п хл) = Дл. Если, например, /(х) принимает в Дл
сколь угодно большие значения, то, выбирая надлежащим образом
точку в этом отрезке, мы можем сделать /(ЕД а значит, и всю
сумму
п
г= 1
Сколь угодно большой; эта сумма не может поэтому стремиться ни
к какому пределу при Z(T)->0.
Таким образом, ограниченность функции есть необходимая пред-
посылка ее интегрируемости в данном отрезке. Эта предпосылка,
однако, не является достаточной. С очень удобным необходимым и
достаточным условием интегрируемости мы ознакомимся в § 48.
Задача, стоящая перед нами, состоит в отыскании приемов вы-
числения интегралов для возможно более широкого класса подин-
тегральных функций. Как уже было сказано в §§ 44 и 45, непо-
средственный метод вычисления таких интегралов как пределов
суммы определенного вида практически пригоден лишь в немногих
простейших случаях, вообще же говоря, по своей сложности совер-
шенно недоступен. Мы должны поэтому искать других, практически
легче реализуемых путей, ведущих к этой цели.
§ 47. Верхние и нижние суммы
В § 46 мы определили интеграл как предел сумм вида
п
fe == 1
которые часто называют поэтому интегральными суммами.
Величина такой суммы зависит как от выбранного разбиения Т от-
резка (а, #), так и от выбора точек Ел в ячейках Д^. Для дальней-
шего развития интегрального исчисления очень полезным является
введение еще сумм некоторого другого вида, соответствующих дан-
ному разбиению Г»
&02
ИНТЕГРАЛ
[гл. 12
Пусть на отрезке (а, Ь) определена ограниченная функция /(х)
и пусть М и т означают соответственно ее верхнюю и нижнюю
грани на этом отрезке. Произведем обычное разбиение Т отрезка
(а, Ь) с помощью точек деления
а = х0 < Xj ... < хп = Ь;
отрезок (xk_!, xk) и длину этого отрезка будем обозначать одним
и тем же символом Дл. Пус^ь Mk и mk соответственно означают
верхнюю и нижнюю грани функции /(х) в отрезке Дл
Составим тогда суммы
п п
S(D= 2 s(T)= 2 «А-
/?= 1 k = 1
Очевидно, что обе суммы однозначно определяются заданием раз-
биения Т и не зависят ни от каких других элементов произвола.
Мы будем называть S(T) верхней, а $(7)— нижней суммой,
соответствующей данному разбиению Т. Нам надо будет теперь
ознакомиться с некоторыми свойствами этих сумм.
1°. Так как при любом выборе точки \k в отрезке Д* мы имеем:
то
п п п
k = l k= 1 fc = l
т. е. любая интегральная сумма, соответствующая данному раз-
биению, заключена между нижней и верхней суммами этого раз-
биения.
2°. Пусть е^>0 сколь угодно мало. В силу определения верх-
ней грани мы можем выбрать в каждой ячейке Дл точку так,
чтобы иметь f($ky>Mk — е; но тогда
п п п
2 /&)Д*> 2 2 Дл = 5(Л-е(6-а).
ь = 1 fe= 1 k = 1
Вместе с неравенством
п
k = 1
которое в силу 1° имеет место для любой интегральной суммы, это
показывает, что верхняя сумма разбиения Т есть верхняя грань
всех интегральных сумм, соответствующих этому разбиению.
Подобным же образом нижняя сумма разбиения Т есть нижняя
грань всех интегральных сумм, соответствующих этому разбиению.
§ 48] ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 203
3°. Пусть теперь Т и Т— два произвольных разбиения отрезка
(а, Ь). Пусть ДЛ, Mk и mk имеют прежнее значение для разбиения Т,
а Д£, Mk и fn'k означают соответствующие величины для разбиения Тг.
Наконец, обозначим через &kt длину общей части отрезков Д* и Д/
и через Mkl и mkl— верхнюю и нижнюю грани функции /(х) в от-
резке Дй/ (в случае, когда отрезки ДЛ и Д^ не имеют общих внутрен-
них точек, мы имеем Д^ = 0; символам Mkl и mkl можно в этом
случае приписать какие угодно значения, например Mkl = mkl = 0).
Очевидно, мы имеем:
2 = 2 ^kl = А**
i k
mk^mkl^Mkl^Mk (/=1, 2, ...),
/nJ mkl Mkl M'i (k — 1, 2, ..
откуда
«(D=2 =2 2 ^22 mki^ki
k k I k I
^22Л,*»Д«^22Л,{Д«=
k l k I
=2 Mt 2 д«=2 «=$ (л.
I k I
Это показывает, что нижняя сумма любого разбиения Т не
превосходит верхней суммы любого другого разбиения Г.
4°. Из 3°, в частности, следует, что множество всех нижних сумм
ограничено сверху; пусть его верхняя грань есть /0; подобным же
образом множество всех верхних сумм ограничено снизу; пусть его
нижняя грань есть /°. Так как любая нижняя сумма не превосходит
любой верхней суммы, то она не превосходит и нижней грани /°
всех верхних сумм; но если /°, таким образом, не меньше, чем любая
нижняя сумма, то 7° не может быть меньше и верхней грани /0 всех
нижних сумм. Таким образом, мы всегда имеем т. е. верхняя
грань всех нижних сумм не превосходит нижней грани всех верх-
них сумм.
С помощью установленных свойств верхних и нижних сумм мы
сможем в следующем параграфе найти ряд важнейших признаков
интегрируемости функций.
§ 48. Интегрируемость функций
Мы сохраним все обозначения двух предшествующих параграфов.
Докажем прежде всего следующий необходимый и достаточный при-
знак интегрируемости функции в отрезке.
204
ИНТЕГРАЛ
[гл. 12
Теорема 1 (критерий интегрируемости). Для интегрируемости
ограниченной функции f(x) в отрезке (а, Ь) необходимо и доста-
точно, чтобы
Пт [S(7)-S(7)] = 0. (1)
Z (Г) — о
.Примечание 1. Как всегда, соотношение (1) означает по-
дробно: сколь бы мало ни было е^>0, существует такое 8^>0, что
при любом разбиении Т отрезка (а, Ь), удовлетворяющем неравенству
1(ТХ8, имеет место и неравенство S(T) — $(Т)Се-
Примечание 2. Разность <&k — Mk — mk между верхней и ниж-
ней гранями функции f(x) в отрезке называют колебание хм
ее в этом отрезке. Очевидно, что по определению сумм S(T’) и s(T)
соотношение (1) может быть записано также в виде
п
lim У шАД* = 0.
Доказательство. 1. Необходимость. Пусть функция
/(х) интегрируема в отрезке (а, Ь); обозначим ее интеграл через /.
При любом разбиении Т с достаточно малым Z(T) любая интеграль-
ная сумма 2(^0 будет отличаться от / меньше чем на е, а так как
в силу 2° § 47 S( 7) и s(T) служат соответственно верхней и ниж-
ней гранями множества интегральных сумм 2(Г)> т0 и каждая из них
отличается от I не более чем на е. Отсюда следует, что
S(T) — s(7)^2e
при единственном условии, что 1(Т) достаточно мало; а так как е
сколь угодно мало, то соотношение (1) доказано.
2. Достаточность. Пусть для функции/(х) в отрезке (а, Ъ)
выполняется соотношение (1). Так как в силу 4° § 47 при любом
разбиении Т
а при достаточно малом 1(Т) разность S(7)— 5(7*) как угодно мала,
то /0 = /°; обозначим через I общее значение этих двух величин;
тогда для любого разбиения Т
а в силу 1° § 47 также
где 2(D — любая из интегральных сумм, соответствующих разбие-
нию Т. В силу последних неравенств
|2(Л — /|^5(7Э — 5(Т),
где Т—любое разбиение отрезка (а, £), а 2(^)— любая интеграль-
ная сумма, соответствующая этому разбиению. Но при достаточно
Г 48] ’
ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ
205
малом 1(Т) разность 5(7) — s (Т) становится в силу(1) как угодно
малой; то же самое имеет поэтому место и для величины |£(Г) — Z|,
а это и значит, что I является интегралом функции /(х) в отрезке
(а, Ь). Теорема 1, таким образом, доказана полностью.
Теорема 2. Если ограниченная функция f(x) интегрируема
в отрезке (а, 6), то и функция |/(х)| интегрируема в этом
отрезке.
Доказательство. Обозначим через и соответственно
колебания функций f(x) и |/(х)| в отрезке Д*. Легко видеть, что
если в отрезке Д* грани Mk и mk функции f(x) имеют одинаковые
знаки, то
“>*k=u>k=Mk — mk-
Если же знаки Mk и mk противоположны, то
4 < I 1 +1 mk I = Mk — mk =
Таким образом, во всех случаях Поэтому из
п
2 -> о
k = l
вытекает
п
2®»^ °-
Л = 1
В силу теоремы 1 этим теорема 2 доказана.
Доказанный нами критерий интегрируемости (теорема 1) позво-
ляет с легкостью устанавливать существование интеграла для весьма
широких классов функций.
Теорема 3. Всякая функция f(x), непрерывная в отрезке
(а, Ь), интегрируема в этом отрезке.
Большое реальное значение этой теоремы очевидно. Так, напри-
мер, она показывает, что криволинейная трапеция, ограниченная
сверху {см. § 44) непрерывной кривой, всегда имеет определенную
площадь.
Доказательство. Функция /(х), непрерывная в отрезке
(а, в силу теоремы 5 § 23 равномерно непрерывна в этом отрезке.
Это означает следующее: для любого е^>0 найдется такое 8^>0,
что если х2 — xf < 8 (a ^xf х2 Z>), то | f (х2) —/(xj | < е. Пусть
теперь Т—любое разбиение отрезка (а, />), для которого Z(T)<^8.
Функция /(х), будучи непрерывной, принимает в каждом из отрез-
ков Дл наименьшее значение /(£*) и наибольшее значение /($£')
(теорема 2 § 23); очевидно, что /(&) = /&*, /(|*)=Л!л, так что
п п
/? = 1 k — L
206
ИНТЕГРАЛ
[гл. 12
но и t'i принадлежат одному и тому же отрезку Д*, длина кото-
рого меньше чем 8; поэтому /(&')—/(&)<Се> и мы получаем:
п п
2®*д*<е 2д*=8(й—а)
/г = 1
при единственном условии Z(T)<^8. Это означает, что наш крите-
рий выполнен и, следовательно, функция f(x) интегрируема в от-
резке (а, Ь).
Теорема 4. Всякая функция f(x), ограниченная в отрезке
(а, Ь) и имеющая в нем не более конечного числа точек разрыва,
интегрируема в этом отрезке.
Пусть точки разрыва функции /(х) в отрезке (а, Ь) будут
(в порядке возрастания) ап а2, ... , аг и пусть е — произвольное
положительное число. Обозначим через dt отрезок
(az — s, az-|-e) (1^/^r),
и пусть s настолько мало, что эти отрезки попарно не перекрываются.
В каждом из отрезков (az._1-j-s, az— е) функция/(х) непрерывна
Черт. 34.
(см. черт. 34, где эти отрезки отмечены штриховкой). Поэтому, как
и при доказательстве предыдущей теоремы, мы можем для каждого
из этих заштрихованных отрезков найти такое число 8, чтобы коле-
бание функции /(х) в любой ячейке длины <^8, целиком помещаю-
щейся в данном заштрихованном отрезке, было меньше чем е.
Конечно, для каждого заштрихованного отрезка 8 будет свое; но
так как этих отрезков имеется лишь конечное число, то среди этих
значений 8 будет наименьшее, которое мы в дальнейшем и будем
обозначать через 8. Таким образом, в любом отрезке длйнц<^8,
помещающемся целиком в одном (все равно каком) заштрихованном
отрезке, колебание функции /(х) будет меньше чем е.
Пусть теперь Т—любое разбиение отрезка (а, Д), для которого
/(Т)<8. Разобьем ячейки Дл этого разбиения на два типа:
1) ячейки первого типа, целиком принадлежащие какому-нибудь
заштрихованному отрезку, и
2) ячейки второго типа, имеющие общие точки с каким-либо из
отрезков
Соответственно этому разобьем сумму
fe=l
§ 48] ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 20?
на две суммы, из которых 27 распространяется на все ячейки пер-
вого типа, а — на все ячейки второго типа. Так как /(Т)<С^Т0
для любой ячейки первого типа и, следовательно,
л
2 дл=6^—«)• (2)
= 1
Что касается ячеек второго типа, то те из них, которые имеют общие
точки с отрезком db образуют, очевидно, отрезок длины меньшей,
чем 2s —1—28, так как все они помещаются в отрезке (az — s — 8,
az “|- е -j- 8); а так как число отрезков равно г, то сумма длин всех
ячеек второго типа не превосходит 2г (е —8); очевидно, мы можем
всегда выбрать 8<^е, так что эта сумма длин будет меньше чем
4ге. Так как, наконец, колебание <&k = Mk— mk функции/(х) в любой
ячейке не превосходит М— т (т. е. колебания /(х) на всем данном
отрезке), то
— т)^Ьк^1(М—т)ге.
Из (2) и (3) мы находим:
п
• 2 а + 4(Л1 — m)r}
k = 1
при единственном условии так как е^>0 сколь угодно
мало, а остальные буквы в правой части этого неравенства означают
постоянные величины, то наш критерий выполнен и функция /(х)
интегрируема в отрезке (а, Ь).
Теорема 5. Функция /(х), ограниченная и монотонная
в отрезке (а, 6), интегрируема в этом отрезке.
Эта теорема не является следствием предыдущей, так как функ-
ция, ограниченная и монотонная на данном отрезке, может иметь на
нем и бесконечное множество точек разрыва. Так, функция
[ 0 (*=0).
/w=jl ( 1 <xjSJJ(„ = i, 2,...),
\ п \n-f-1 п / 4 ’ *
графическое изображение которой мы рекомендуем читателю по-
строить, в отрезке (0,1) есть функция, ограниченная и неубывающая,
м 111
и вместе с тем она разрывна в каждой из точек у, у» • ••,у,
Доказательство. Пусть функция /(х)— неубывающая в
отрезке (а, Ь). Тогда, очевидно, при любом разбиении Т отрез-
ка (а, Ь) мы имеем для верхней и нижней граней функции /(х) в от-
резке Д* = (хЛ_1( xk)
=f(xk), mk=f
ИНТЕГРАЛ
[гл. 15
Ж
и следовательно,
п п
2 й»а»= 2 ш**)—
fe=l fe=l
Если l(TX 8, то в этой сумме Дл<^8(1 п); а так как функ-
ция /(х)— неубывающая, то и, следовательно,
{/(**)— /(хА-1)} дл^{/(^)— (1 ^k^n),
а значит,
п п
2 “А 8 2 {/(*г) } = М /(*) -/(а)}.
Л = 1 k=l
Так как 8 может быть выбрано сколь угодно малым, то
п
2«Л + 0 [/(Г)^0];
k = 1
наш критерий выполнен, и теорема 5 доказана.
В качестве полезных упражнений рекомендуем из задачника
Б. П. Демидовича, отдела IV, задачи 57, 61, 71, 73.
ГЛАВА 13
СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ
§ 49. Простейшие свойства интеграла
Целью этой главы является установление фундаментального взаимо-
отношения между теми двумя основными понятиями интегрального
исчисления — примитивной функцией и интегралом, — которые мы до
сих пор рассматривали совершенно независимо друг от друга. Для
этого мы должны в первую очередь установить некоторые простей-
шие общие свойства интегралов, чему и будет посвящен настоящий
параграф.
Теорема 1. Если функция f(х) = с постоянна в отрезке
(а, Ь), то
ь ь
/= J /(х) dx = j* с dx = с (Ь — а),
а а
Для доказательства достаточно заметить, что при любом разбие-
нии Т и при любом выборе точек В мы имеем:
2 /(xk — Xk-i) —с 2 (*Л — **-i) = с(Ь — а).
вследствие чего и
/= lim У/^Цхь — xk_i) = c(b—а).
Теорема 2. Если /(х)^Ч>(х)(а^х^Ь) и функции f(x)u
ф(х) интегрируемы в отрезке (a, b)f то и
? *
J f (х) dx j <Р (х) dx. (1)
а а
14 А. Я. Хинчин
210 СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ [гл. 13
В самом деле, в условиях теоремы при любом разбиении Т
и любом выборе точек
п п
2/&>д*^ 2?($*)д*;
k=1 , 1
отсюда переход к пределу при /(7)->0 дает неравенство (1).
Из теорем 1 и 2 непосредственно вытекает
Следствие. Если функция f(x) интегрируема в отрезке (а, Ь)
и если в любой точке х этого отрезка m^f{x)^M, где т и
М — постоянные числа, то
ь
т(Ь — а) J /(х) dx М (Ь — а),
а
Теорема 3. Если функции j\ (х) и (х) интегрируемы
в отрезке (а, £), то и функция (х) ± A (*) интегрируема в этом
отрезке и
ь ь ь
J [/1 (х) ±/2 (x)J dx— fi (х) dx± J/2 (х) dx. (2)
а а а
Для доказательства достаточно заметить, что если мы обозначим
соответственно через 2л > Sa и S суммы вида
п
k= 1
составленные для функций /2 и Art А, то мы при любом раз-
биении Т и любом выборе точек 5* будем, очевидно, иметь:
S == Si ± Sa>
и что, переходя в этом равенстве к пределу при/(7)->0, мы дока-
зываем одновременно интегрируемость функции ±А и равен-
ство (2).
Теорема 4. Если функция /(х) интегрируема в отрезке (а, Ь)
и а — любое постоянное число, то функция а/(х) также интегри-
руема в отрезке (д, Ь) и
ь ь
J* а/(х) dx = а j*/(х) dx (3)
а а
(«постоянный множитель может быть вынесен за знак интеграла»).
Для доказательства достаточно заметить, что для любого разбие-
ния отрезка (а, Ь) и любого выбора точек
п п
2 “/ (U (** — xft_j)=а / ( W (xk — xk-i)
Л—1 Й=1
§ 49]
ПРОСТЕЙШИЕ СВОЙСТВА ИНТЕГРАЛА
211
и обычный переход к пределу показывает как интегрируемость функ-
ции а/(х), так и соотношение (3).
Теорема 5. Если а^а' <^ЬТ (т. е. если отрезок (а', V)
составляет часть отрезка (а, #)), то всякая функция, интегри-
руемая в отрезке (а, Ь), будет интегрируема и в отрезке (а', Ь’).
Доказательство. Пусть функция f (х) интегрируема в отрезке
(а, Ь). В силу доказанного нами в § 48 критерия каждому е^>0
соответствует тогда такое 8 0, что при /(Т)<^8 мы всегда имеем:
ь п
a k = 1
где сумма составлена для отрезка (а, Ь) и для разбиения Т. Пусть
теперь Т'— любое разбиение отрезка (ar, V), для которого
Разбивая дополнительно отрезки (а, а') и (Ьг, Ь) на любые части длины
меньше 8, мы получаем, очевидно, такое разбиение Г отрезка (а, Ь),
для которого /(7)<С8, а потому в силу (4)
ь
2<-
а
Ъ’
Но сумма 2 > составленная для разбиения Т, представляет собой
а’
Ъ
часть суммы , составленной для разбиения Г, причем все члены
а
этбй пбследней суммы неотрицательны. Поэтому
ь
2<2<«
а' а
при единственном условии в силу нашего критерия это
означает, что f(x) интегрируема в отрезке (af, bf).
Теорема 6. Пусть а<^с<^Ь; тогда всякая функция f(х),
интегрируемая в каждом из отрезков (а, с) и (с, Ь), интегрируема
и в отрезке (а, Ь) и
Ь с Ь
^f(x)dx = ^f(x)dx-\- J f(x)dx.
а а с
(5)
Доказательство. Пусть T — любое разбиение отрезка (а, Ь);
обозначим через Тг то разбиение, которое получается из Т добавле-
нием точки с в качестве точки деления, и через £(7) и S(Tr) —
суммы вида
п
/г = 1
212
СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ
[гл. 13
составленные соответственно для разбиений Т и Тг. Эти две суммы
отличаются друг от друга, очевидно, только тем, что при переходе
от S (Г) к JS(T') один из членов суммы заменяется двумя новыми;
а так как при все члены обеих сумм бесконечно малы, то
2(Г> — 2(Г)-^0 [/(Г)^0]. (6)
Но сумма 2(7Г), построенная нами для отрезка (а, Ь), очевидно,
распадается на две аналогичные суммы для отрезков (а, с) и (с, 6),
каждая из которых в силу предположенной интегрируемости функ-
ции /(х) в отрезках (а, с) и (с, Ь) стремится к нулю при /(Т^-^О;
следовательно, при этом и но тогда в силу (6) и
при 1(Т)-+ 0, а это и означает, что функция /(х) интегрируема
в отрезке (а, Ь).
Нам остается доказать соотношение (5) между интегралами. Теперь,
когда интегрируемость функции /(х) в отрезке (а, Ь) доказана, это
не представляет никаких затруднений. В самом деле, при
мы имеем в отрезке (а, Ь):
п b
5=2 f^k) ~J* f dx =
k — 1 а
(7)
каковы бы ни были выбираемые разбиения Т и точки \k\ в част-
ности, мы можем выбирать разбиения Т так, чтобы точка с всегда
была одной из точек деления их; но тогда сумма S распадается на
две суммы S' и S" того же вида, построенные соответственно для
отрезков (а, с) и (с, 6); эти же две суммы в силу предпосылок
теоремы при стремятся соответственно к
с Ь
j*f(x)dx = l' и ^f{x)dx = r,
а с
так что при
S = S'4-S"
(8)
из (7) и (8)
чем теорема 6 полностью доказана.
Следствие. Если а q q ... <Zcn<Zb и функция /(х)
интегрируема в каждом из отрезков (а, с,), (q, q), ... , (q, Ъ),
то она интегрируема и в отрезке (а, Ь) и
J/(x)rfx = J f(x)dx-\- J f(x)dx-\- ... + j* f(x)dx.
a a Ci cn
§ 50] СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ 213
В силу теоремы 5 предпосылка об интегрируемости функции f(x)
в каждом из частичных отрезков может быть заменена требованием
интегрируемости ее во всем отрезке (а, Ь); на основании теоремы 5
f(x) будет тогда интегрируема и в каждом из частичных отрезков
и следствие остается справедливым.
Сделаем еще следующее замечание, которое нам вскоре будет полез-
ным. Интеграл
ь
J /(х) dx (9)
а
(если он существует) по своему определению зависит, очевидно,
только от следующих элементов:
1) от вида функции f(x) и
2) от чисел а и Ъ\
если эти элементы заданы, то интеграл определяется однозначно.
Таким образом, в частности, интеграл (9) не зависит от перемен-
ной величины х, которую обычно называют «переменной интеграции».
Поэтому, изменяя обозначение этой переменной, мы ничего не изме-
няем в интеграле^ другими словами, выражения
ь ь ь
J / (х) dx, j f (J) dy, j* f (X) dK
a a a
и т. д. означают всегда в точности одно и то же. Этот простой и
самоочевидный факт вполне аналогичен тому, что, например, выра-
жения
20 20 20
2£ 2£ 2 т
fc=i z=i з=1
и т. д. означают в точности одно и то же, а именно сумму
1 _i_ £ _i_ £ _i_ _|_ £
“ 2 ' 3 ' ‘ “ 20 •
Здесь сумма не зависит от того, как мы обозначим «индекс
суммирования», подобно тому как в нашем случае величина инте-
грала не зависит от того, как мы обозначим переменную интеграции.
§ 50. Связь интеграла с примитивной функцией
Мы переходим теперь к установлению той закономерности, кото-
рую по справедливости считают основным фактом дифференциального
и интегрального исчислений, так как и логически, и исторически
она служит главным источником дальнейшего развития этих ветвей
математического анализа.
214 СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ [гл. 13
Пусть функция f (х) интегрируема в отрезке (а, Ь) и пусть
а<^х^Ь; в силу теоремы 5 § 49 функция f (х) интегрируема и
в отрезке (а, х); интеграл ее в этом отрезке нам неудобно, однако,
обозначать через
J/(x)rfx,
а
так как буква х при таком обозначении фигурировала бы в двух
совершенно различных смыслах: и как переменная интеграции, и как
верхний предел интеграла. Поэтому, пользуясь ’заключительным
замечанием § 49, мы будем всегда в подобных случаях обозначать
переменную интеграции какой-нибудь другой буквой, т. е. записы-
вать интеграл функции /(х) в отрезке (а, х), например, в виде
х
а
Если мы теперь будем нижний предел а этого интеграла считать
постоянным, а верхний предел х — произвольно изменяющимся
в отрезке (а, Ь), то написанный интеграл, очевидно, будет функцией
от х, которую мы обозначим через F (х). Мы докажем теперь сле-
дующее основное предложение.
Теорема 1. Если функция f (х) интегрируема в отрезке
(а, Ь) и непрерывна в некоторой внутренней точке х этого
отрезка, то функция
F (*)=J f^du
а
дифференцируема в точке х и Fr (х) = / (х).
Доказательство. Пусть а^х<^Ь и Дх^>0 настолько
мало, что х-[-&х^Ь. Тогда по теореме 6 § 49
*4- Ьх х
F (х 4- Дх) — F (х) = j* f (и) du — J f (и) du =
а а
= j /(«)</«*). (1)
*) Чтобы не исключать случая лг = а, мы должны придать определенный
а
смысл выражению F(a) = j* f(x)dx. Так как легко показать, что F(x)~*0
а
при х —► а 0, то естественно положить F (а) = 0, что мы и будем всегда
делать в дальнейшем.
§ 50] СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ 215
Так как функция f (и), по предположению, непрерывна в точке х,
то, сколь бы мало ни было е 0, при достаточно малом Дх
и х^и^х4-Дх мы имеем:
/(*) — •</(«)</ (х) + е>
и следовательно, в силу теоремы 2 § 49
*-|-Ах х-|-Ах x-f-Ax
j* \f {x) — z]du^ j f(u)dus£, J \f (x) -j- e] du.
X XX
Поэтому соотношение (1) дает:
х-|-Дх
j* [/ (X) - s] ~ F(x}
X
x+Ax
j* L/O)4~eW
В каждом из двух интегралов подинтегральная функция не зависит
от переменной интеграции и и потому является постоянной величи-
ной. Применяя к левой и правой частям полученных неравенств
теорему 1 § 49, мы поэтому находим:
/ (X) - е + F(X) (*) + е;
а так как е сколь угодно мало при достаточно малом Дх, то эти
неравенства показывают, что
lim F(x + y-F(x)=/(x);
наконец, аналогичное рассмотрение случая Дх<^0 (которое читатель
легко проведет самостоятельно) легко показывает, что это же соот-
ношение остается верным при а<^х^Ь и при Дх-> — 0 и что,
следовательно, функция F (х) дифференцируема в точке х и
F(x)=/(x);
теорема 1 доказана.
Примечание. Мы доказали, очевидно, несколько больше, чем
содержится в утверждении теоремы 1. Кроме соотношения F (х) = f (х)
для внутренних точек х отрезка (а, Ь), мы установили еще, что
(полагая F (а) = 0)
Um + =/ llm F(» + AAT)-fW=/m
Ах-+0 Ах — —О ЛХ
216 связь интеграла с примитивной функцией [гл. 13
(при условии, конечно, что f (х) непрерывна соответственно в точ-
ках а и Ь). Очевидно, удобно вообще называть функцию F (х) при-
митивной функции / (х) в отрезке (а, 6), если наряду с соотноше-
нием F (х) = f (х) для внутренних точек этого отрезка выполнены
и два выписанных предельных соотношения на его концах. Так мы и
будем поступать в дальнейшем.
Так как функция /(х), непрерывная в отрезке (а, 6), всегда
интегрируема в этом отрезке (теорема 3 § 48), то из теоремы 1
непосредственно следует
Теорема 2. Если функция f (х) непрерывна в отрезке (а, Ь),
то функция
F (х) = J/(и) du
а
является примитивной функцией для /(х) в этом отрезке.
Чтобы в полной мере оценить все значение этого предложе-
ния, заметим, что уже самый факт существования примитивной для
всякой непрерывной функции, устанавливаемый этой теоремой, яв-
ляется для нас совершенно новым; в главе 11 мы научились на-
ходить примитивные для сравнительно небольшого числа элемен-
тарных функций; вне же этого узкого круга вопрос о самом су-
ществовании примитивных функций оставался для нас полностью
открытым.
Если мы умеем находить интеграл данной функции f (х) в любом
отрезке (а, х), то тем самым мы в силу теоремы 2 умеем найти
одну из примитивных функции / (х); в силу результатов главы 11
мы знаем, что в таком случае нам становится известным и все
семейство примитивных функций / (х). Таким образом, умея для
данной функции решить задачу отыскания ее интеграла, мы тем
самым получаем возможность непосредственно найти все ее прими-
тивные функции. Гораздо важнее, однако, что полученные нами
результаты позволяют решить и обратную задачу: зная одну из
примитивных непрерывной функции f (х) в отрезке (а, Ь), найти
ее интеграл в этом отрезке. В самом деле, пусть Ф (х) — любая
примитивная непрерывной функции f (х) в отрезке (а, Ь). Так как
F (х) — J f (к) du
а
в силу теоремы 2 также есть примитивная этой функции, то в силу
результатов главы 11 разность Ф (х) — F (х) есть некоторое постоян-
ное число С, так что
Ф (х) = F (х) + С.
(2)
§ 50] СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ 217
Полагая в этом равенстве х = а и помня, что F (а) = 0, мы находим
С=Ф(а). Поэтому, полагая в (2) х = 6, мы получаем:
ь
F (£) = J / (и) du = Ф (Ь) — Ф (а).
а
Теорема 3. Если Ф(х) есть любая примитивная непрерывной
функции f (х) в отрезке (а, Ь), то
ь
J / (х) rfx = Ф (£) — Ф (а). (3)
а
Таким образом, знание одной какой-либо примитивной непре-
рывной функции /(х) в отрезке (а, Ь) позволяет нам непосредственно
написать ее интеграл в этом отрезке. Задача вычисления интегралов,
имеющая так много разнообразных приложений, целиком сводится,
таким образом, к задаче отыскания примитивных функций, получаю-
щей ввиду этого важнейшее значение для математического анализа
и его приложений. Этой задачей мы много занимались в главе 11
и продвинем ее еще значительно дальше в .
главах 16 и 17.
Исторически тот момент, когда была /
полностью осознана возможность вычислять
интегралы с помощью примитивных функций,
явился поворотным пунктом в развитии
интегрального исчисления. До этого времени
учение об интегралах пребывало в таком
состоянии, когда для вычисления каждого и а
интеграла приходилось изобретать особый Черт. 35.
метод; теперь же впервые эту задачу воз-
можно стало решать единым методом для весьма широких классов
различных функций; можно поэтому без преувеличения сказать, что
только с этого момента интегральное исчисление начало развиваться
как самостоятельная научная дисциплина.
Приведем только один совсем простой пример, показывающий
эффективность формулы (3). Пусть кривая, ограничивающая сверху
данную криволинейную трапецию (черт. 35), есть парабола с урав-
нением у = сх* (с^>0 постоянная). Как мы уже говорили, площадь
такой параболической трапеции умели вычислять уже древние греки
(Архимед); но их метод, основанный на прямом вычислении предела
соответствующих сумм, требовал сложных вычислений. Мы же можем
теперь непосредственно написать с помощью формулы (3) готовое
решение задачи. Искомая площадь
ь
S = J ex2 dx\
а
218
СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ [ГЛ. 13
о CXJ
но функция сх* имеет примитивную -у, которую мы и можем при-
нять за функцию Ф (х) в формуле (3); поэтому
s= Ф (Ь) — Ф (а) == 4 (*8 — а8).
О
что полностью решает поставленную задачу.
Дальнейшие упражнения см. в задачнике Б. П. Демидовича,
отдел IV, задачи 1—4.
§51. Дальнейшие свойства интегралов
В § 49 мы уже установили ряд простейших свойств интеграла.
Теперь нам предстоит продолжить этот ряд. В § 49 нашей целью
было найти те свойства интеграла, которые позволили бы нам воз-
можно скорее прийти к формуле (3) § 50, связывающей интеграл
с примитивными функциями. Теперь же, напротив, сама эта формула
позволит нам легко вывести ряд новых свойств интегралов.
1. При построении интеграла
J f (х) dx
(1)
мы до сих пор всегда предполагали, что а<^Ь; однако правая часть
формулы (3) § 50 сохраняет вполне определенный смысл и при
а^Ь. Представляется поэтому естественным придавать выражению (1)
смысл при любых а и Ь, определяя его в случае а^Ь с помощью
формулы (3) § 50. Это, в частности, дает при любом а (и любой
непрерывной функции /)
j* / (х) dx = 0
и далее, при а^>Ь
J/(х) dx = — у/(х) dx
(2)
(где уже Ь<^а). Соотношение (2) можно формулировать так: при
перестановке между собой пределов интеграции интеграл меня-
ет знак.
Во всем этом рассуждении мы предполагали функцию /(х) непре-
рывной в отрезке (а, Ь); естественно, однако, пойти дальше и счи-
тать соотношение (2) при Ь<^а определением интеграла
§51] ДАЛЬНЕЙШИЕ СВОЙСТВА ИНТЕГРАЛОВ 219
для любой интегрируемой в отрезке (а, Ь) функции f (х). Это опре-
деление мы и примем во всем дальнейшем.
Обратим еще внимание на то, что при Ь = а формула (3) § 50
дает:
j*/(х) rfx = 0;
а
это равенство было нами принято в § 50; мы видим теперь, что это
соглашение стоит в полном соответствии с формулой (3) § 50.
Формула (3) § 50 имеет своей правой частью разность Ф (Ь) — Ф (а)
значений функции Ф (х) при х = Ь и х = а. Такую разность часто
I ь
обозначают так: Ф (х) и называют «подстановкой» функции Ф (х)
от а до Ь.
Так как в формуле (3) § 50 примитивная Ф (х) может быть
записана в виде J f(x)dx, то мы можем переписать эту формулу
в равносильном виде
ь
J/(x)dx = Q’/(x)dx)|*. (3)
а
Пример 1.
I
J 6хМх = (2х3)|^ = 2 — 16==— 14.
2
2. Правило интеграции по частям для примитивных функций
имеет вид
J uv'dx = uv — j* vi£dx\
производя над обеими частями подстановку от а до 6, мы в силу
формулы (3) находим:
ь ь
J uv’dx = (uv) |b — j* vu’dx. (4)
a a
Это — формула интеграции по частям для интегралов.
Пример 2. Пусть требуется вычислить
е
J In х dx,
220 СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ [гл. 13
причем примитивной для функции 1пх мы не помним. Полагая
1 г 1
и = In X, и = — ,
X *
v' = 1, V — X,
мы с помощью формулы (4) находим:
е ее
J lnxt/x = xln х | — J dx = eln е— 1 In 1 —(е— 1)= 1.
1 1
Дальнейшие примеры см. в задачнике Б. П. Демидовича, отдел IV,
задачи 15—17.
3. Прием интегрирования с помощью замены переменной основы-
вался на формуле (7) § 43: при и = 9(х)
J f (И) dll = J f [ф (х)] ф' (х) dx. (5)
Левая часть этой формулы означает примитивную F (и) функции f(u),
в которой вместо и подставлено 9 (х), т. е. F [9 (х)]. Поэтому, про-
изводя над обеими частями формулы (5) подстановку от а до мы
находим:
Ь ср (Ь\
У f [ф (*)] ф' (*) dx = F [ф (х)] | * = F [ф (6)] — F [ф (а)] = J* / («) du.
а ср (а)
Итак, если функция 9(х) имеет непрерывную производную
в отрезке (а, 6), а функция /(и) непрерывна в отрезке [9(a), 9 (&)], то
ь Ср (Ь)
У/[ф(^)1 ф' (X)dx =
а ср (а)
Это — формула замены переменной для интегралов.
Пример 3. Полагая и = 9 (х) = cos х, имеем:
тс тс тс
Т ~4 cos *4
J £=<--“)Г=4>"2-
О 0 cos 0
4. Теорема о среднем значении. Пусть М и т означают соот-
ветственно верхнюю и нижнюю грани интегрируемой функции f (х)
j f{u) du.
§51] ДАЛЬНЕЙШИЕ СВОЙСТВА ИНТЕГРАЛОВ 221
в отрезке (а, Ь). В силу следствия теоремы 2 § 49 мы имеем:
ь
т(Ь — а) J f(x) dx^M (b — а),
а
откуда
ь
(6)
а
Эти неравенства имеют место для любой функции f (х), интегри-
руемой в отрезке (а, 6). Если f (х) непрерывна в этом отрезке, то
в силу теоремы 3 § 23 она должна принимать в отрезке (а, Ь)
любое значение, заключенное между ее наименьшим значением т и
ее наибольшим значением AL Но неравенство (6) показывает, что
этому требованию удовлетворяет число
ъ
b=-<Sf^dx'
а
следовательно, между а и Ь найдется такая точка с, что
ь
f(c) = yz^^f^)dx,
а
ИЛИ
b
§ f (х) dx—f (с) (Ь — а). (7)
a +
Эта формула не содержит для нас, в сущности, теперь ничего
нового: если обозначить через F (х) какую-нибудь примитивную
функции f (х), то формула (7) может быть записана в виде
F (b) — F (а) = F (с) (Ь — а);
существование точки с (а с Ь), удовлетворяющей этому соотно-
шению, есть просто результат применения теоремы Лагранжа (§ 36)
к функции F (х) в отрезке (а, Ь). Предыдущий вывод формулы (7)
интересен, однако, тем, что он не использует связи между интегра-
лом и примитивной функцией.
Выражаемая формулой (7) «теорема о среднем значении» может
быть существенно обобщена. Пусть функция ф (х) непрерывна и
сохраняет постоянный знак в отрезке (а, Ь); для определенности
будем считать ее неотрицательной; тогда для а^х^Ь
mtf (х) ===/(х) ф (х) Мер (х),
222 СВЯЗЬ ИНТЕГРАЛА С ПРИМИТИВНОЙ ФУНКЦИЕЙ |[гл. 13
и следовательно, в силу теорем 4 и 2 § 49
ь ь ь
т J ф (х) dx J /(х) ф (х) dx М J ф (х) dx, (8)
а а а
ИЛИ
b
j* f(x) у (х) dx
т sS -?—b--------szM.
j* <Р (*) dx
а
Как и ранее, мы можем заключить отсюда, что существует между
а и b точка с, для которой
ь
J f (х) ср (х) dx
Ш = ~Ь-------------,
J Ч> (X) dx
a
ИЛИ
b b
J / (x) <p (x) dx=f (c) j ф (x) dx. (9)
a a
Теорема (о среднем значении). Если в отрезке (а, Ь) функ-
ции f (х) и <^(х) непрерывны и ф (х) сохраняет постоянный знак,
то между а и Ь найдется точка с, для которой имеет место
соотношение (9).
Впрочем, в очень многих случаях в приложениях нужна бывает не
столько эта теорема, сколько те неравенства (8), которые нас к ней
привели.
Примечание. При доказательстве формулы (9) мы произво-
дили деление на интеграл
ь
J ф(х)с?х,
а
допуская тем самым, что он отличен от нуля. Но если функция ф(х)
тождественно равна нулю в отрезке (а, Ь), то соотношение (9) три-
виальным образом верно (при любом с). Если же ф(а)^>0 хотя бы
для одного а (а а Ь), то в силу непрерывности функции ф (х)
она будет положительна и во всех точках некоторой окрестности
(а — е, а-ре) точки а (лемма § 23). Если рь^>0 означает наимень-
§51] ДАЛЬНЕЙШИЕ СВОЙСТВА ИНТЕГРАЛОВ 223
шее значение функции ф (х) в отрезке (а — е, а -f- е), то (следствие
теоремы 2 § 49)
& а+*
Ф (х) dx J ф (х) dx р. [(а е) — (а — в)] = 2|U 0.
а а— 6
б. В приложениях очень часто оказывается нужным одно простое
следствие теоремы 2 § 49. Так как, очевидно, всегда
то в силу этой теоремы, если функция /(х) интегрируема в отрезке
(а, *)*),
ь ь ь
— J \f(x)\dx^ J/(x)rfx==S J \f(x)\dx,
a a a
или, что то же,
b b
| J/(x)rfx|s£ j \f (x)\dx.
a a
Абсолютная величина интеграла не превосходит интеграла
абсолютной величины подинтегральной функции.
Это важное неравенство вполне аналогично неравенству элемен-
тарной алгебры, согласно которому абсолютное значение суммы
нескольких чисел никогда не превосходит суммы их абсолютных
величин.
*) Интегрируемость | / (х) | доказана в § 48 (теорема 2).
ГЛАВА 14
ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ
ИНТЕГРАЛА
§ 52. Длина дуги плоской кривой
Наряду с задачей вычисления площадей плоских фигур одной
из важнейших геометрических задач, решаемых методами интеграль-
ного исчисления, является задача нахождения длины данной дуги
кривой. Практическая значительность этой задачи настолько оче-
видна, что не требует пояснений. Вместе с тем и здесь, как в
случае площадей, элементарная гео-
метрия отвечает на поставленный
вопрос только для прямолинейных
отрезков и дуг окружностей, общее
же решение возможно лишь сред-
ствами математического анализа.
Разумеется, логическая ситуация и
здесь имеет уже привычные нам чер-
ты: мы должны одновременно опре-
делить общее понятие длины дуги
кривой и создать аппарат для практи-
ческого вычисления длин этих дуг.
Мы подойдем к решению постав-
ленной задачи методом, который
в еще большей степени, чем мы
это имели при вычислении пло-
щадей, является прямым переносом на общий случай тех приемов,
с помощью которых элементарная геометрия определяет и вычисляет
длины окружностей и их дуг. Пусть данная кривая служит графи-
ком функции y=f(x) и мы хотим найти длину дуги MN этой
кривой (черт. 36) между точками 2И[а,/(а)] и N [£,/(£)]. Как во
всех задачах этого рода, мы начнем с произвольного разбиения Т
отрезка (а, Ь) посредством точек деления а = х0 < <\..
... <^хп = Ь. В каждой точке деления мы восставим перпендикуляр к
оси ОХ, продолжая его до встречи с кривой y=f(x). Дуга MN
этой кривой разбивается, таким образом, на п участков. Каждые две
§ 52] длина дуги плоской кривой 225
соседние точки деления дуги MN мы соединим прямолинейной хор-
дой. Совокупность этих хорд образует ломаную линию, вписанную
в дугу MN. Длина этой ломаной, разумеется, легко может быть
вычислена.
Если мы теперь будем делать разбиение Т все более и более
мелким, то построенная ломаная, как это нам представляется оче-
видным, будет все теснее примыкать к дуге MN. Как и в случае
окружности, нам представляется поэтому естественным определить
длину дуги MN как предел длин таких ломаных при безгранич-
ном мельчании разбиения Т. При этом необходимо, конечно, чтобы
этот предел существовал и чтобы он не зависел от системы пред-
принятых разбиений Т. Этим определением решается первая часть
поставленной задачи.
Длина построенной нами ломаной, очевидно, полностью опреде-
ляется выбранным разбиением Т отрезка (а, й); естественно поэтому
обозначить ее через L(T). Если мы обозначим искомую длину
дуги MN через L, то в силу нашего определения мы имеем:
„ L= lim L(7),
l (T) - о
где 1(Т) имеет обычное значение (длина наибольшей ячейки разбие-
ния Т). Чтобы создать на базе этого определения аппарат для вы-
числения величины L, мы должны прежде всего найти аналитиче-
ское выражение длины L(T) построенной ломаной. Это не пред-
ставляет никаких затруднений. Так как две соседние точки деле-
ния дуги MN имеют координаты [х^, /(х^)] и [хл, /(хл)], то
соединяющее их звено нашей ломаной имеет длину
/ (ХА — + {f(xk) —/(Х*.,)]2,
и следовательно,
п
L(T)=^ / (xk - xk_tf 4- [/(ХА) - /(xft_,)]2.
k = 1
Допустим теперь, что функция f(x) имеет в отрезке (а, Ь)
непрерывную производную f (х). Тогда по теореме Лагранжа мы
будем иметь:
—/(^Л-1) =/' (Ц(*Л — xk_i) (1 «= k л),
где
xk_i<Sk<xk (1 ==££=== л).
Поэтому, полагая еще xk — xk_x = &k (1 мы имеем:
п
L(T)=2 /1+ГШ.
k= 1
15 А. Я. Хинчип
226 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
Так как функция по предположению, непрерывна, то и функ-
ция
i/i4-/'aW=Ф(*)
непрерывна, и мы имеем:
л
/?=]
Но такая сумма, как мы знаем, при Z(T)->0 всегда имеет, незави-
симо от предпринимаемых разбиений и от положения точек kk
внутри ячеек Д^, своим пределом интеграл
ь ь ь
J ф (х) dx = J ]/1 (х) dx = J у41 4-У2 dx.
а а а
Таким образом, мы имеем:
ъ ь
L = ^ /14-у«</х= J /1 4- /'«(х) dx,' (1)
а а
что полностью решает поставленную нами задачу, сводя вычисле-
ние длины L дуги MN к нахождению некоторого интеграла, под-
интегральная функция которого нам известна.
Пример 1. Цепная линия
имеет форму, изображенную на черт. 37. Найдем длину L дуги
этой кривой между х = 0 и х = а^>0. Мы знаем, что
поэтому
/1 4~У2 — /1 sh2 х = ch х
(так как элементарный подсчет показывает, что. ch2x — sh2x=l
при любом х). Поэтому общая формула (1) дает:
а а 1
т Г" . "A* f* I О - р~О
£=1 у 1 -ф- У2 dx— | chxdx = shxl = sha =-----------,
о о
и поставленная задача решена.
До сих пор мы предполагали, что кривая задается уравнением
вида y=f(x). Геометрически это означает, что всякая прямая, па-
§52]
ДЛИНА ДУГИ ПЛОСКОЙ КРИВОЙ
227
раллельная оси ОУ, пересекает интересующий нас участок MN дан-
ной кривой не более чем в одной точке. Это требование часто
бывает стеснительным, а в иных случаях и невыполнимым ни при
каком выборе системы координат — например, когда ищется длина
некоторой замкнутой кривой. В таких случаях часто более удоб-
ной оказывается более общая параметрическая форма представления
кривой с помощью двух уравнений вида
y = (2)
когда параметр t пробегает некоторый участок а ^/^8, точка
(х, у) описывает интересующий нас участок кривой, который в
этом случае может иметь произволь-
ную форму; • так, если
х = г cos /, y = r sin /,
0^/^2z (г > 0),
то точка (х, у) описывает полную
окружность
х24~_у2 = г2
радиуса г.
Мы найдем теперь выражение дли-
ны L данной дуги кривой при условии,
что эта кривая выражена параметрическими уравнениями (2).
С этой целью мы подвергнем разбиению Т с точками деления
а=70<^/1 . .<^/л = Р отрезок (а, р) изменения параметра. Звено
ломаной, соответствующее ячейке &k — tk— tk_x этого разбиения,
имеет, очевидно, длину
/1ф (**)—ф +(ф (4)—ф
Допуская, что функции и ф(/) имеют в отрезке (а, Р) не-
прерывные производные, мы по теореме Лагранжа имеем:
ф (А)—Ф ) = Ф' (т* *) 4 (*а-1 <Л <
ф (4) - Ф (*й-1) = Ф' (**) Ай (<й-1 <?* < tk\
и следовательно, длина ломаной, соответствующей разбиению Т,
п
£(Л= 2 /ф'Г('1й) + Ф,’(^)Ай-
k = l
Если, бы под знаками функций ф'2 и <]/2 стояло одно и то же
значение (например, т^) параметра то при сумма в
*) /(Г) означает, как обычно, длину наибольшей из ячеек Д& разбие-
ния Т.
*
228 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
правой части стремилась бы, как мы знаем, к интегралу
3
l = J /ф'»(О + Г(ОЛ. (3)
а
Но на самом деле, т* может не совпадать с тл, и это создает для
предельного перехода небольшую трудность, которую мы должны
преодолеть. Положим для краткости
A'2 (Tfe) + Ф'2 <тл) = Pfc > /<Р'2 (xfc) + Ф'2 (xfe) = Р* >
так что
^(п= 2 р*д*= 2 ₽*д*+ 2 <₽*-р*)д*-
/? = 1 fe = l k—l
Первая сумма правой части при 1(Т)-+0 имеет, как мы уже
заметили, своим пределом интеграл (3). Поэтому, чтобы показать,
что этот интеграл служит вместе с тем пределом и для £(7), нам
достаточно убедиться, что последняя сумма правой части при
Z(T)->0 стремится к нулю. Это мы теперь и сделаем.
Если = то pfe = | Ф'(5й)|> Рй = |Ф'(хй)|> и потому
I pfe — Р/J IФ'(<) — У Offe) I-
Если же 9' (т^) ф 0, то pk 0, р^ 0 и
pfe — pfe = ф'2 «) — Ф'2 (^) = [ф' (tfe) — ф' ('tfe)] [ф'«) + Ф' (т*)1,
откуда
|Pfe~Pft| = •|ф'(^)-ф'(^)1^|ф'(^)-ф'(хй)|,
?k + 9k I
так как, очевидно,
Ф' (?fe) + ф' (Tfe) I < ।
f k + 9k 'I
Таким образом, мы имеем во всех случаях:
|р* —р*|^|ф'(Tfe) — ф' (тй)|,
и следовательно,
п п
12<pfe—рк)дл|^ 2 1ф'<х*)—4-
fe=l k = l
(4)
Но функция ф' (Z), по нашему предположению, непрерывна, а сле-
довательно, и равномерно непрерывна, в отрезке (а, (3). Если е^>0
как угодно мало, то мы будем поэтому иметь:
| ф' (T-fe) — ф'(тл)| <е (5)
§. 52] длина дуги плоской кривой 229
если Z(T) достаточно мало. Но тогда в силу (4) и (5)
п п
| 2 (Р» —Р»)Д*|<е 2 4 = е(? —<*)•
1 k=1
Этим и доказано, что при Z(T)->0
п
2 (p*-pfeMft->0,
/? = 1
а следовательно,
А(Г)->л = У йр'ЧО + Г (0л.
а
Таким образом, при параметрическом задании кривой длина ее
дуги, соответствующей отрезку значений параметра, вычи-
сляется с помощью интеграла (3). Разумеется, в частном случае
t = x этот интеграл принимает уже знакомый нам вид (1).
Пример 2. Найти длину дуги циклоиды (черт. 38)
х = a (t — sin/), у — а (1 — cos Z)
на участке 0^Z^2k.
Мы имеем (обозначая штрихами дифференцирование по /):
х1 = а (1 — cos Z), у9 = a sin Z,
и следовательно,
У2 У2 = 2а2 (1 — cos Z) = 4а2 sin2 у,
/ У2 +У2 = 2а sin у;
отсюда
2тс тс тс
L = J 2а sin у dt = 2а J 2 sin и du = 4а (— cos и) = 8а.
0 0 о
Дальнейшие упражнения см. в задачнике Б. П. Демидовича, от-
дел IV, задачи 209, 220.
Если вместо отрезка (а, £) мы будем рассматривать отрезок
(а, /), где Z изменяется от а до £, то длина дуги кривой на отрезке
(a, Z) будет функцией этой величины Z:
t
L = L(t) = § (н) + (и) du
9
230 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
(как обычно в таких случаях, мы обозначаем переменную интегра-
ции уже не через а другой буквой, например и). Отсюда
i' от=® = А" ю+Г (О=/(!)+(I)’.
dL— + (6)
В случае t — x, y=f(x) мы соответственным образом имеем:
L = L(x)= J у/ 1 -j-/'2 (x)dx,
а
L' (х)= ]/ 1+Л(х) = /1 +Уа = 1 + (gy .
Формула (6), независимая от выбора параметра /, показывает,
что дифференциал длины дуги равен гипотенузе треугольника, кате-
тами которого служат дифференциалы координат точки данной
кривой. В случае t = x, следова-
тельно, дифференциал дуги кривой
при переходе от точки М (х, у) к
точке N(x -(- Дх, у -|- Д_у) (черт. 39)
выражается длиной МТ отрезка касательной к данной кривой в
точке М между прямыми, параллельными OY и имеющими соответ-
ственно своими абсциссами х и х-\-Ьх.
Всякую кривую, которая на данном участке выражается уравне-
ниями вида (2) и имеет определенную длину, т. е. для которой
предел
L= lim L(T)
/(T)-0 ?
существует в многократно описанном нами смысле, называют спрям-
ляемой на данном участке. Из предыдущего, очевидно, следует,
что спрямляемым будет всякий участок кривой (2), на котором
функции ф(/) и ф(/) имеют непрерывные производные. Такая кривая
спрямляема, очевидно, и на любой части (a, t) (а=с/=ср) отрезка
(а, Р) и длина ее L(t) на этом участке есть непрерывная и возра-
§52] длина дуги плоской кривой 231
стающая функция от t\ поэтому каждому значению L(t) соответ-
ствуют, обратно, определенное значение параметра /, а значит,
в силу уравнений (2) и определенная точка данной кривой. При
этом /, а следовательно, и х и у — непрерывные функции величины
£(/). Для такой кривой мы можем в качестве параметра, опреде-
ляющего положение ее точек, выбрать длину X участка этой кри-
вой от некоторой точки, раз навсегда принятой за начало отсчета,
до произвольной точки кривой. Каждому значению X соответствует
определенная точка (х, у) кривой, так что координаты х и у точки
кривой становятся непрерывными функциями от X:
х=Л(Х), (7)
это есть, очевидно, параметрическая форма уравнений кривой, пред-
ставляющая собой частный случай общей формы (2). Во многих
вопросах форма (7) оказывается особенно удобной благодаря про-
стому геометрическому значению параметра X. Так, например, обе
производные
координат по параметру X получают в этом случае простой гео-
метрический смысл: в силу соотношения (6), где надо положить
Л = Х, имеем:
dx_________dx________ 1 dy_______ dy _________ у'
d* у dx3 + dp~ 1 + У8 ’ Уdx3 + dy3 У1 +У8 ’
где у = ^-. Если а есть угол, . образуемый касательной к кривой
в данной точке с положительным направлением оси ОХ, то У = tga,
и значит,
dx dy
— = cos а, — sin а.
dk dk
Эти соотношения могут быть и непосредственно усмотрены из
черт. 39.
Установленное нами определение спрямляемости данного участка
кривой, а также и выражение (3) длины этого участка, очевидно,
зависят от выбора параметра t в исходных уравнениях (2). Можно
было бы дать этим понятиям и чисто геометрическое определение,
независимое от каких бы то ни было аналитических представлений
данной кривой. С другой стороны, можно было бы доказать, что
при выполнении некоторых добавочных предпосылок как спрямляе-
мость, так и длина кривой (2) становятся независимыми от выбора
параметра t. Однако в нашем курсе мы не можем вдаваться в эти
подробности,
232 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
Как мы видели выше, спрямляемой- будет всякая кривая, выра-
жаемая на данном участке (а, р) уравнениями вида (2), если функ-
ции <р(/) и ф(£) имеют на этом участке непрерывные производные.
В приложениях часто встречается случай, когда данная непрерывная
кривая не допускает такого представления, но в то же время отре-
зок (а, р) может быть разложен на конечное число частей, на
каждой из которых такое представление возможно (пример: контур
многоугольника). Такую кривую мы условимся во всем дальнейшем
называть гладкой на участке (а, Р)*).
Очень легко убедиться, что всякая гладкая кривая спрямляема.
Чтобы доказать это, допустим для простоты, что имеется всего
одна «особая» точка, соответствующая значению т параметра t
(общий случай, очевидно, не создает новых трудностей), так что
данная кривая заведомо спрямляема на каждом из участков (а, т) и
(т, Р); пУсть длины ее на этих участках будут соответственно и
Л2. Пусть Т — любое разбиение участка (а, Р), а Г — разбиение,
получаемое из Т добавлением точки т в качестве точки деления.
Тогда ломаная А', соответствующая разбиению Т, состоит из двух
ломаных А' и А', соответствующих разбиениям участков (а, т) и
(т, р); так как на этих участках кривая спрямляема, то длины ло-
маных А' и А' при достаточно мелком разбиении близки соответ-
ственно к Li и L2, а значит, длина ломаной А' — к Lj + А2. Но
длина ломаной А, соответствующей разбиению 7, отличается от
длины ломаной А' лишь тем, что сумма двух сколь угодно малых
звеньев последней заменяется одним звеном, которое не превосходит
по длине суммы двух заменяемых и, значит, также сколь угодно
мало. Таким образом, ломаная А имеет длину, которая при доста-
точно мелком дроблении как угодно мало отличается от длины ло-
маной А', в свою очередь как угодно близкой к Но это и
значит, что данная кривая спрямляема на участке (а, Р), и длина ее
равна Li-\-L.2.
Вдоль спрямляемых (в частности, гладких) кривых можно брать
интегралы так же, как вдоль прямолинейных отрезков. Пусть дан-
ная спрямляемая кривая выражается уравнениями (7), где функции
и /2 предполагаются непрерывными. Примем за начало отсчета дуг
один из концов интересующего нас отрезка данной кривой и обо-
значим через L длину этого участка, так что на его протяжении
параметр X изменяется от 0 до L. Разобьем отрезок (О, L) на части
(ячейки) с помощью точек деления
♦) Этот случай, очевидно, равносилен тому, что на данном участке (а, {3)
кривая может быть выражена уравнениями (2), где <р(/) и ф(/) всюду непре-
рывны, а ср' (/) и ф' (/) существуют и непрерывны всюду, кроме конеч-
ного числа точек; в каждой же из этих «особых» точек функция ср (/)
(а также и ф(/)) имеет производную справа и производную слева, но эти
две производные могут иметь различные значения.
§ 53] ДЛИНА ДУГИ ПРОСТРАНСТВЕННОЙ КРИВОЙ 233
и обозначим через Zft отрезок (Xfe-1, Хл) ’ (1 ^п), а также и
длину этого отрезка.
Пусть теперь F(x, у) — функция двух переменных, определен-
ная во всех точках рассматриваемого участка кривой. В каждой
ячейке lk выберем произвольную точку Х£ (Х^ XJ Хл) и поло-
жим хл=/1(Х*), eyjfe=/2(XJ), так что (xk, yk) есть произвольная
точка того участка данной кривой, который соответствует отрезку lk
изменения параметра X. Составим сумму
п п
2 Л) 4= 2 4-
fe=l fe= 1
Если функция F [/j (X), /2 (X)] интегрируема *) в отрезке (О, L),
то сумма в правой части последнего равенства при безграничном
мельчании предпринятого разбиения имеет пределом интеграл
L
J FLA(X), А(Х)]Л.
О
Обозначая весь участок (О, L) данной кривой через С, этот инте-
грал часто записывают в виде
J Z7 (Л> У)
с
и называют интегралом функции F(x, у), взятым вдоль
кривой С.
Интегралы, берущиеся вдоль гладких кривых, часто встречаются
в приложениях. В качестве простейших типических примеров этого
рода мы рассмотрим в § 54 вопросы о ’ некоторых механических
характеристиках материализованных плоских кривых.
§ 53. Длина дуги пространственной кривой
Измерение длин дуг пространственных кривых строится настолько
аналогично всему изложенному нами для плоских кривых в преды-
дущем параграфе, что мы можем ограничиться по этому вопросу
простым перечислением основных определений и результатов.
1°. Если участок АВ данной кривой может быть выражен урав-
нениями
y==fi(x), г=/4(х) (a^x^b)
*) В частности, это будет всегда иметь место, если F (х, у) непрерывна
во всех точках данной кривой (см. дальше, § 88), так как тогда F[j\ (Л), /а (X)]
есть непрерывная функция от X в отрезке (О, L).
234 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
и если функции (х) и /2 (х) имеют непрерывные производные
в отрезке (а, Ь), то длина участка АВ существует и равна
ь ь
L = J + J /1(*)+/?(*) dx. (1)
а а
2°. В более общем случае, когда участок АВ данной кривой может
быть выражен параметрическими уравнениями вида
X = <?(t), y = ty(t), z = (2)
где функции ф (/), ф (/) и / (t) имеют непрерывные производные в от-
резке (а, Р), участок АВ имеет определенную длину, равную
з
А = j / у2 (О + г (0 + х'2 (0 dt. (3)
а
3°. Если в условиях 2° обозначить через L (t) длину участка
кривой АВ, соответствующего отрезку (a, t) значений параметра
то
L' (О = /У2(О + Г(О+х'8Ю
И
dL= /dx24-dj/a4-^2.
В частности, в условиях 1°
г (х) = /1+у2 + ^2 = /1+/;з(х)+/;2(х).
4°. Кривая (2), имеющая на данном участке АВ определенную
длину, называется спрямляемой на этом участке. Если участок АВ
непрерывной кривой может быть разбит на конечное число частей,
на каждой из которых кривая удовлетворяет условиям 2°, то кривая
называется гладкой на этом участке. Всякая гладкая кривая спря-
мляема.
5°. Спрямляемая кривая может быть выражена уравнениями вида
х = <р(Х), з/==ф(Х), г = х(Х), (4)
где К — длина участка кривой от некоторого неизменно установлен-
ного начала отсчета до точки (х, у, г). При этом
^ = <p'(X) = cos а, ^ = ф'(Х) = со8 р, g = x'(X) = cos у,
где а, р, 7 — углы, образуемые с положительными направлениями
координатных осей касательной к данной кривой в точке (х, у, г),
проведенной в направлении возрастающих X,
§ 54] МАССА, ЦЕНТР ТЯЖЕСТИ И МОМЕНТЫ ИНЕРЦИИ КРИВОЙ 235
6°. Если спрямляемая кривая задана уравнениями вида (4) и функция
F(x, уf z) непрерывна на участке С(Х,^Х^Х2) этой кривой, то
х3
интеграл J F [9 (X), ф (X), у (X)] называют «интегралом функции
F (х, у, z), взятым вдоль кривой С», и обозначают через
J F(x, у, z)dX.
с
§ 54. Масса, центр тяжести и моменты инерции
материализованной плоской кривой
1. Пусть нам дан участок С гладкой плоской кривой, уравнения
которой мы напишем в виде
х = 9(Х), .У = ф(Х), (1)
где X — длина дуги кривой, отсчитываемая от начальной точки дан-
ного участка, так что, когда точка (х, у) пробегает участок С,
X растет от 0 до некоторого числа А, представляющего собой длину
всего данного участка. Условимся в дальнейшем для краткости на-
зывать «точкой X» данной кривой ту ее точку (х, у), которая со-
ответствует данному значению параметра X.
Мы допускаем, что вдоль данного участка кривой распределено
некоторое вещество («материализованная кривая»). Пусть Л1(Х) озна-
чает массу вещества, расположенного между точками 0 и X данной
кривой, и пусть функция М (X) име’ет непрерывную производную
М(Х) = р(Х) в отрезке (О, А). В § 27, рассматривая случай прямо-
линейного участка, мы убедились, что величину р (X) целесообразно
называть плотностью вещества в точке X данной кривой. Сообра-
жения, которые мы там приводили в пользу такого наименования,’
без всяких изменений остаются в силе и в нашем общем случае
(если, как мы предположили, данная кривая — гладкая). Там мы были
вынуждены ограничиться прямолинейными участками только потому,
что общее понятие длины дуги кривой в то время еще не было нам
знакомо.
Итак, мы и здесь будем называть величину р(Х) плотностью
вещества в точке X данной кривой. Так как р(Х) = ЛГ (X), то, об-
ратно,
х
/И (X) — J р (w) du
о
(нижний предел интеграции выбран с таким расчетом, чтобы иметь
Л1(0) = 0). Если мы хотим определить массу
Ж(Х:, Х2) (О^Х^Х^Л)
236 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
участка (Хр Х2) нашей кривой, то мы находим:
Ag
Л4(Х1( Х2) = Ж(Х3) —/И(Х1) = у р(и)</и= f р(х, y)d\. (2)
Эта формула выражает массу произвольного участка материали-
зованной гладкой кривой через заданную в каждой отдельной точке
плотность вещества р (X).
2. Если мы имеем систему из конечного числа п расположенных
в одной плоскости материальных точек, массы которых соответственно
равны ... , тп, а координаты— (xn j/J, (х2, j/2), ... , (xn, j/n),
то центр тяжести такой системы имеет, как известно, координаты
2 mkXk _ s ткУк
------> ------> (3)
S тп 2
/?=] kt=l
п
или, обозначая через М = mk массу всей системы,
fe=i
п п
k=l fe=l
Пусть теперь вещество не сосредоточено в отдельных точках,
а непрерывно распределено вдоль участка (О, L) гладкой кривой (1).
Поставим себе задачу дать целесообразное определение центра тяжести
такой системы и найти спо'соб для вычисления его координат.
Разобьем отрезок (О, L) на произвольные части («ячейки») точками
деления
О = Хо<Х1 < ... <Xn = L (Т)
и положим для краткости ХА — ХА_1 = ДЛ Пусть плот-
ность материи в точке X нашей кривой равна р (X) (0 X L); как
и выше, мы предполагаем функцию р (X) непрерывной в этом отрезке.
Согласно формуле (2) масса ячейки ДА равна
mh— J
в силу теоремы о среднем значении (§ 51) мы имеем поэтому
mk = р (Х|) ДА,
где X* — некоторая точка ячейки Д*. Если ячейка Д* очень мала, то
мц можем приближенно представлять ее себе как материальную
§ 54] МАССА, ЦЕНТР ТЯЖЕСТИ И МОМЕНТЫ ИНЕРЦИИ КРИВОЙ
237
точку массы mk, помещенную в точке Х| нашей кривой. Если мы
проделаем такую замену для каждой из ячеек разбиения (7), то наша
материализованная кривая в порядке приближения заменится системой,
состоящей из п материальных точек; массы и координаты этих точек
будут соответственно равны
»*й = Р(Х1)Д*> ^ = ЧР(4), Л = ф(х*) (l=s=£^«);
координаты центра тяжести такой системы в силу формул (3) будут
поэтому
S р(хр?(х?)Д* _ 2 р(хр4-(хрд*
х ------------> У = --------------•
S р(хх)ДА 2 Р(х$дА
' fe=l k=\
При безграничном мельчании разбиения (7) построенная нами
фиктивная система из конечного числа материальных точек все ближе
и ближе имитирует собою нашу материализованную кривую. Поэтому
мы, Естественно, полагаем, что’ координаты (х, у) центра тяжести
данной материализованной кривой будут соответственно равны пре-
делам чисел х(Т) и у(Т) при безграничном мельчании разбиения (7).
Это, очевидно, дает:
L
С р (X) <Р (X) d\ f хр (х, у) dK
- о с
Р (X) dK р (х, у) d'K
L
( Р (X) ф (X) dK § у Р (х, у) dK
У = 4--------------= , (4)
j р (X) dK Р (х, у) dK
или, обозначая через
L
М — J p(X)rfX
о
массу всего данного участка,
L
fр (Х) ?(Х) rfX=i J*хр £?х>
о с
L
J = ^- f Р (X) ф (X) <zx =-^ j* j/p (х, Л.
О с
238 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА |ГЛ. 14
Если наш участок физически однороден, т. е. р (X) = р есть вдоль
него постоянная величина, то формулы (4) дают:
L L
x=4-J ф(м^=4-У-*^> j=-^y фм
о с о с
3. Вернемся снова к механической системе, состоящей из конеч-
ного числа материальных точек. Пусть тх, тг, ..., тп означают массы
этих точек, а г2, ... , гп — расстояния их от какой-нибудь оси
(или от какой-нибудь определенной точки). Сумма
п
называется тогда моментом инерции системы относительно
данной оси (или данной точки). Если точки нашей системы распо-
ложены в одной плоскости и имеют прямоугольные координаты (Xj,^),
(х2, Л)> • • • > (хп> Уп)> т0 моменты инерции системы относительно
оси ОХ, оси OY и начала координат О, очевидно, соответственно
равны
п п п
Кх — 2 ткУк, Ку=^ mkxl, Ко—^ mk(xl-\-y$.
k=\ k=\ k = \
Пусть теперь мы вместо системы из конечного числа материаль-
ных точек имеем материализованный участок кривой (1), который
мы рассматривали выше. Сохраняя все прежние обозначения и про-
водя рассуждения, в точности аналогичные тем, с помощью которых
мы пришли к определению координат центра тяжести такого участка,
мы легко получаем следующие естественные определения для его
моментов инерции относительно осей OX, OY и точки О:
L
Кх = J Р (Х)ф* (X) dX = J у* Р (х, у) d\,
6 с
L
Ку = J Р (X) (X) dX = J х*р (х, у) dl,
О с
L
Ко = ^ (X) [ф« (X) + ф’ (X)] dX = J (Xs + у*) Р (X, у) dK
О с
(6)
Пример. Найдем координаты центра тяжести однородной полу-
окружности х2Ц-_у2_ а2 (_у^0), а также момент инерции этой по-
луокружности относительно диаметраг соединяющего ее концы. По
§ 55]
ОБЪЕМЫ ГЕОМЕТРИЧЕСКИХ ТЕЛ
239
симметрии очевидно, что х = 0; поэтому мы ограничимся отыска-
нием у и Кх. Обозначая через X длину дуги полуокружности, от-
считываемую от одного из ее концов, мы можем записать уравнения
этой кривой в виде
x=acos~-, у — a sin (О^Х^ка).
Формула (5) дает поэтому:
Tza
— ) 2
у—— I a sin — d\ = — а.
тса J а тс
о
С другой стороны, формула (6) дает:
Кх = J pa2 sin2 d'K = ~ ра8.
о
§ 55. Объемы геометрических тел
Вычисление объемов геометрических тел требует, как правило,
более сложных аналитических приемов, чем те, которыми мы до сих
пор располагаем. В дальнейшем (гл. 27) мы рассмотрим этот вопрос
во всей полноте. Однако в большом числе
возникающих здесь задач простое интегри-
рование решает вопрос до конца, и этот
класс задач мы теперь и рассмотрим.
Пусть мы хотим вычислить объем тела,
изображенного на черт. 40. Возьмем в
пространстве какую-либо прямоугольную
систему координат OXYZ и условимся
называть координату г «высотой» точки
(над плоскостью XOY). Плоскость z = h
(где h — любое данное вещественное
число), вообще говоря, пересекает дан-
ное тело по некоторой плоской фигуре.
Мы будем считать, что площадь этого
«сечения» нам известна (или что мы так или иначе умеем ее вычислить)
для любого h. Эта площадь, разумеется, вообще говоря, будет различ-
ной для различных Л; она есть функция от Л, которую мы будем обозна-
чать через s(h). Тот специальный класс задач, который мы теперь
рассмотрим, будет характеризоваться именно тем условием, что функ-
ция s(h) (площадь сечения тела на высоте h) в них предполагается
данной и требуется с помощью нее выразить объем V данного тела.
240 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
Допустим сначала, что данное тело есть прямой цилиндр, т. е. что
все его горизонтальные сечения проектируются на плоскость XOY
в одну и ту же фигуру (черт. 41). Если эта фигура есть круг, то
мы имеем дело с прямым круглым цилиндром, объем которого, как
учит элементарная геометрия, равен произведению площади основания
на высоту. Это правило мы перенесем, естественно, и на общий случай,
когда основание цилиндра имеет произвольную форму *).
Итак, мы принимаем объем всякого тела, имеющего форму пря-
мого цилиндра, равным произведению площади основания этого ци-
линдра на его высоту **).
Перейдем теперь к общему случаю (черт. 40). Пусть самая низкая
точка тела имеет высоту а, а самая высокая — высоту Ь. Разобьем
. отрезок (а, Ь) произвольным образом на
—части (ячейки) с помощью точек деления
а = <^ ... <^ = & (Т)
________ив каждой ячейке (hk_i9 hk) — &k выберем
____21___ произвольную точку zk, так что
hk_x^zk^hk (X^k^ri).
Семейство плоскостей z = hk (£ = 0,
/0 / у 1, ... , п) делит данное тело на горизон-
тальные «слои», толщина каждого из кото-
71 рых равна величине &k = hk — hk_t соответ-
Черт. 41. ствующей ячейки. Если эта величина очень
мала, то объем vk £-го слоя естественно
считать приближенно равным объему прямого цилиндра высоты Д^,
основанием которого служит какое-либо одно из сечений тела внутри
этого слоя, например сечение на высоте zk. Так как площадь этого
сечения равна 5(zk), то объем такого прямого цилиндра равен
5(гл)Д^; таким образом, мы считаем, что приближенно
s (**) Д*.
а следовательно,
п п
v = 2 2s
/? = 1 fe = l
это приближенное равенство, естественно, представляется нам тем
*) Разумеется, с логической точки зрения мы находимся здесь в обычном
положении: понятие объема тела за пределами немногих случаев, рассматри-
ваемых в элементарной геометрии, до сих пор не определено, и наша первая
задача состоит в том, чтобы дать ему целесообразное общее определение.
**) Это допущение вполне аналогично тем допущениям, какие мы ранее
делали относительно скорости равномерного движения, работы постоянной
силы и т. п., при решении соответствующих задач.
§ 55] ОБЪЕМЫ ГЕОМЕТРИЧЕСКИХ ТЕЛ 241
более точным, чем мельче разбиение (Т); поэтому мы полагаем, как
обычно, по определению
п
V= lim
Z(7)-0
при условии, разумеется, что написанный предел существует и не
зависит ни от выбранной системы разбиений, ни от выбора точек zk
в ячейках. Но это, как мы знаем, всегда имеет место, если функция s(h)
непрерывна в отрезке (а, 6); в этом случае, следовательно,
ь
V=^s(h)dh. (1)
а
Эта формула решает поставленную задачу, устанавливая общее по-
нятие объема тела с данными площадями сечений и вместе с тем
указывая вполне определенный путь для вычисления этого объема.
Пример 1. Пусть данное тело есть пирамида высоты И, осно-
ванием которой служит любой многоугольник площади S. Элементар-
ная геометрия учит, что сечение такой пирамиды на высоте h есть
многоугольник, подобный основанию, с площадью, пропорциональной
квадрату расстояния этого сечения от вершины пирамиды, т. е. про-
порциональной {И—Л)*.
Таким образом, в данном случае мы имеем:
s(h).= k(H —
где k— постоянная, которую легко найти из условия s(0) = S:
и следовательно,
В силу формулы (1) мы находим для объема пирамиды выражение
/=sf (‘ - Wd"
. о
Преобразование переменной интеграции 1 — = и дает:
1в А. Я, Хинчии
242 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
Мы видим, с какой простотой может быть получена средствами
интегрального исчисления эта известная формула, вывод которой
приемами элементарной геометрии значительно сложнее. Как все рас-
суждение, так и результат остаются в полной силе, если основанием
777*^. служит не многоугольник, а любая плоская
фигура площади S. В частности, для конуса
Г высоты Ну основанием которого служит
/ ______й-г_\ КРУГ радиуса /?, мы находим известную
\/' ' ч формулу
К____________________ v_ kr*h
\ ' j у 3
Пример 2. Пусть данное тело есть
шар радиуса /?, высоту h сечений которого
Черт. 42. мы будем измерять их расстоянием от
экваториальной плоскости (черт. 42). Ра-
диус г сечения, лежащего на высоте Л, равен, как видно из чертежа,
Г= )/ /?2 —
поэтому площадь сечения
s (Л) = № = z (Z?2 — Л2),
и для объема шара формула (1) дает выражение
R R R
V = I* — h*)dh = TtR* J dh—tz
-R -R
Пример 3. Пусть участок а^х^Ь кривой y=f(x) вра-
щается вокруг оси ОХ*); найдем объем V получаемого при этом
«тела вращения» (черт. 43). Все сечения этого тела, перпендикулярные
к оси ОХ, очевидно, представляют собой круги. Сечение плоскостью
x — h(a^hs^b) имеет при этом радиус f(h) и, значит, площадь
к [/(Л)]2. Формула (1) дает поэтому:
ъ
V = v ^VQiffdh.
а
Рассмотрим еще задачу о вычислении в условиях примера 3 пло- ?
щади боковой поверхности получающегося тела вращения, причем
мы должны учитывать, что определения общего понятия площади
кривой поверхности мы до сих пор не имеем и что, следовательно,
мы должны начать с определения этого понятия (по меньшей мере
*) Мы допустим для простоты, что /(х)^0 (а^х^.Ь).
ОБЪЕМЫ ГЕОМЕТРИЧЕСКИХ ТЕЛ
243
§ 55]
для тел вращения). С этой целью мы предпримем обычное разбиение Т
отрезка (а, Ь) с помощью точек деления
л = <С **1 <С • • • <С хп =
которому соответствует разбиение данного участка кривой на п частей
точками [xk, /(х*)] (& = 0, 1, ... , п). Каждую пару соседних точек
деления [xk_1} [xk, f(xk)] соединим прямолинейной хордой,
длина которой равна
Ломаную линию, образуемую этими хордами, будем вращать вокруг
оси ОХ, и площадь S* поверхности, образуемой ее вращением, будем
считать приближенным выражением искомой площади S поверхности,
образуемой вращением данного участка кривой. Наглядное предста-
вление говорит нам, что S* тем ближе к S, чем мельче разбиение Т;
поэтому мы, как обычно, полагаем
S= lim S*
l(T)-+0
и переходим к отысканию аналитического выражения для величины S.
С этой целью заметим, что хорда lk при вращении вокруг оси ОХ
описывает усеченный конус (черт. 44), образующая которого равна lk,
а радиусы оснований — f{xk^) и f(xk). Боковая поверхность такого
усеченного конуса равна
= Я [/(^л-1) 4-
Допустим, что функция /(х) имеет, непрерывную производную в от-
резке (а, Ь). Тогда по теореме Лагранжа
f <Л) — f (*й-1) =№) (*Л — xk_i),
где xk_r <С <С xk> поэтому, если мы для краткости положим, как
обычно, xk — xk_x = (1 то мы получим:
4= /Н-Г(4)да,
244 ГЕОМЕТРИЧЕСКИЕ И МЕХАНИЧЕСКИЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА [ГЛ. 14
и следовательно,
* [/(^-0+/(ХА)] /1+Л(и ДА;
отсюда
п п
s*= 2 s*=n 2 /i+r,2(UA»=
k=l k=\
n
=2я2яи /1+л(ид*+
Z?=l
n
4-* 2[/(Xa-1)+/(x*)~2/(^)1 /1+/”(WA*.
k=\
При Z(T)->0 первое слагаемое правой части в силу нашего пред-
положения о непрерывности функции fr(x) стремится к пределу
ь
2тс J f (х) / 1 -|- /'2 (*) dx.
а
Поэтому, если мы докажем, что второе слагаемое правой части при
Z(T)->0 стремится к нулю, то существование предела величины S*
будет установлено, и мы будем иметь:
ъ
S= lim S*==2rc f /(x) / 1 + f* (x) dx.
/(D-*o J
Но в силу равномерной непрерывности функции /(х) мы, как бы
мало ни было е 0, при всяком достаточно мелком разбиении Т
будем иметь:
l/(^i)+/(^)-2/(U|<e (IsS^n),
и следовательно,
п
2 /1+/'»(иДл
А = 1
п п
Jfe=l
где L — длина данного участка. Этим, очевидно, все требуемое до-
казано.
§ 55]
ОБЪЕМЫ ГЕОМЕТРИЧЕСКИХ ТЕЛ
245
Полагая для краткости f(x)=y, мы можем записать полученное
нами выражение для площади боковой поверхности тела вращения
в виде
ь
s = 2тг J у <1 4-у« dx.
* * а
Упражнения к § 55 см. в задачнике Б. П. Демидовича, отдел IV,
задачи 183—185, 192, 195, 199, 200, 228.
ГЛАВА 15
ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
§ 56. Постановка задачи
Мы видели теперь уже большое число вполне конкретных, прак-
тически важных задач, решение которых приводится к вычислению
интегралов. Поэтому нам надо несколько глубже заглянуть в вопрос
о том, что значит «найти» или «вычислить» интеграл. Если подин-
тегральная функция и пределы интеграции нам точно заданы, то
интеграл получает определенное числовое значение, отыскание кото-
рого и составляет нашу задачу. В случае, когда это числовое зна-
чение интеграла оказывается числом, просто выражающимся с по-
мощью общепринятых в математике символов (как, например, -у,
Г- ТС2
у 2 , , sin (0,5) и т. д.), найти интеграл и означает, конечно, вы-
разить его в этой символике. Однако подавляющее большинство ве-
щественных чисел не находит себе такого простого и законченного
символического выражения, и мы должны поэтому в полной мере
учитывать возможность того, что наш интеграл окажется именно
таким числом. Числа этого рода мы можем записывать только при-
ближенно, в виде, например, десятичных дробей с тем или иным
числом верных знаков. Ясно поэтому, что в общем случае задачу
вычисления интеграла мы можем понимать только как задачу при-
ближенного вычисления его с той или другой степенью точности.
Если, например, нам удастся найти такой инструмент, с помощью
которого наш интеграл может быть представлен в виде десятичной
дроби с любым наперед заданным числом верных знаков, то мы
можем считать нашу задачу принципиально решенной, так как в об-
щем случае ничего другого под «вычислением» интеграла мы и не
можем подразумевать; впрочем, и в тех случаях, когда величина
интеграла может быть «точно» выражена с. помощью символики од-
ного из вышеприведенных типов, такое выражение обычно и указы-
вает собой просто некоторый определенный инструмент для прибли-
женного вычисления интеграла; так, если для интеграла мы находим,
тс 2
например, значение , то это действительно дает нам возможность
§ 56]
ПОСТАНОВКА ЗАДАЧИ
247
(хотя бы*с помощью известных из геометрии приемов приближенного
вычисления числа тс) найти представление данного интеграла в виде
десятичной дроби с любым числом верных знаков.
Но построение такого инструмента, который позволял бы при-
ближенно вычислить данный интеграл с любой степенью точности,
дается нам уже в самом определении понятия интеграла. Мы перво-
начально определили интеграл как предел сумм определенного вида,
в некотором определенном процессе (безграничного мельчания раз-
биения промежутка интеграции). Производя достаточно мелкое раз-
биение основного отрезка и составляя для этого разбиения выше-
упомянутые суммы, мы, очевидно, и получим приближенное значение
интеграла с любой наперед заданной степенью точности. Таким обра-
зом, в принципиальном плане исчерпывающий метод вычисления
интеграла дается уже самим его определением. И если мы тем не
менее всегда искали и впредь будем искать других методов, ведущих
к этой цели, то это лишь потому, что в практическом плане этот
прямой метод в большинстве случаев оказывается неприменимым по
своей чисто технической сложности и трудоемкости.
Мы говорили уже о том, что наиболее мощным методом, кото-
рому наука обязана почти всеми своими практйческими успехами
в этой области, служит здесь метод, связывающий понятие интеграла
с понятием примитивной функции, и мы видели ряд примеров того,
с какой легкостью этим методом решаются задачи интегрального
исчисления. Если в отрезке (а, Ь) мы умеем найти для функции f(x)
примитивную F(x), то
ь
J f(x)dx=F(b) — F(a). (1)
а
Таким образом, в этом случае задача вычисления интеграла сво-
дится к задаче вычисления двух значений некоторой известной нам
функции. Но что означает «известность» функции F (х)? В общем
случае эта известность не может для нас означать ничего иного, как
обладание инструментом, позволяющим находить приближенные зна-
чения этой функции с любой степенью точности. Во многих случаях,
как мы видели, этот инструмент оказывается простым и удобно при-
менимым, и тогда формула (1) хорошо решает поставленную задачу.
Что нужно для такого успеха? Мы знаем (§ 50), что примитивную
имеет любая непрерывная функция /(х). С принципиальной стороны
формула (1) применима, таким "образом, к вычислению интеграла
любой непрерывной функции. Но одного существования функции
F(x) для этой цели еще недостаточно: надо, чтобы она была нам
известна, т. е. чтобы мы умели находить ее приближенные значения
с любой степенью точности; а практически сверх этого еще нуж-
но, чтобы метод нахождения ее приближенных значений был до-
статочно прост и удобен, — иначе он ничего не может нам дать для
248
ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
[ГЛ. 15
конкретных расчетов. Так будет, например, всегда, если F(x) при-
надлежит к числу «элементарных» функций, так как для всех таких
функций способы приближенного вычисления их значений хорошо
разработаны.
Однако за пределами небольшого числа случаев (к которым,
впрочем, по счастью, принадлежит довольно значительный класс
функций, наиболее часто встречающихся на практике) дело обстоит
не так. Если при дифференцировании элементарных функций мы
всегда снова приходим к элементарным функциям, то при интегриро-
вании мы встречаем совсем другую картину: примитивная элемен-
тарной функции, хотя и всегда существует (так как все элементарные
функции в основном непрерывны), но, вообще говоря, уже оказы-
вается неэлементарной функцией. Можно указать сколько угодно
примеров простых элементарных функций, примитивные которых
неэлементарны: таковы, например, функции 1/1пх, 1/-/1-|-х3 и
многие другие; широкие классы таких функций, о которых мы будем
говорить в дальнейшем, были открыты П. Л. Чебышёвым. Представим
же себе, что мы хотим, например, найти интеграл
з
J £ = '’(3)-^(2). (2)
2
где F(x)— примитивная функции 1 /1п х. Для этого надо вычислить
F (3) и F (2). Но как мы можем сделать это, если мы не толькр
не знаем никакого удобного для этой цели выражения функции
F (х), но более того — знаем, что ни через какие элементарные
функции F(х) в законченном виде заведомо выражена быть не мо-
жет? Ясно, что формула (2) ничего не дает нам для вычисления
интеграла, так как о функции F (х) мы знаем только то, что она
служит (заведомо существующей) примитивной для функции 1/1пх;
и у нас нет для решения нашей задачи других средств, кроме пря-
мого или косвенного использования самого определения интеграла.
Из сказанного, в частности, вытекает, что интегрирование функ-
ций может служить мощным источником определения и изучения
новых, • неэлементарных функций. Всякий раз, когда элементарная
функция /(х) не имеет элементарной примитивной, ее примитивная
х
J f(u)du — F(x) (3)
а
представляет собой такую новую неэлементарную функцию, для изу-
чения свойств и вычисления значений которой мы на первых порах
не имеем ничего, кроме определяющего ее соотношения (3), т. е.
кроме того факта, что F (х) есть примитивная функции /(х). Целый
ряд определенных этим путем функций получил в ходе развития
пауки выдающееся значение; свойства этих функций тщательно изу-
§ 57]
СПОСОБ ТРАПЕЦИЙ
249
чены, и для многих из них составлены таблицы, подобные таблицам
логарифмов или тригонометрических функций. Именно так, в част-
ности, обстоит дело с только что рассмотренной нами функцией
С du
J Inu ’
2
которую обычно обозначают через Li(x) и называют «интегральным
логацифмом».
Возвращаясь теперь к нашей задаче приближенного вычисления
интегралов, мы видим, что решение ее методом примитивных функ-
ций возможно далеко не всегда и что поэтому задача изыскания
других, по возможности практически удобных путей к этой цели
приобретает большое значение. Такие пути можно разделить на
две большие группы: пути первой группы отправляются от перво-
начального определения интеграла как предела сумм, по возможно-
сти усовершенствуя его настолько, чтобы сделать удобным для
практических расчетов; простейшие из этих методов (называемых
иногда «механическими квадратурами») мы рассмотрим в настоящей
главе; вторую группу составляют методы, идеей которых служит
замена подинтегральной функции в порядке приближения другой
функцией, примитивная которой элементарна и в то же время близка
к примитивной данной функции; эти методы требуют применения
более сложных аппаратов математического анализа и будут рас-
смотрены нами позже (раздел IV).
§ 57. Способ трапеций
Идея простого метода приближенного вычисления интегралов,
обычно называемого «способом трапеций», наглядно иллюстрируется
черт. 45, где мы нарочно выбрали еще очень грубое разбиение Т
промежутка интеграции (а, Ь). В наших обычных обозначениях пло-
щадь заштрихованной «лестничной» фигуры, очевидно, равна «ниж-
ней сумме»:
п
fe=l
в то время как верхняя сумма *
п
S(T)= 2^
fc=l
равна площади объемлющей «лестничной» фигуры, получаемой из
заштрихованной площади добавлением сверху прямоугольников, огра-
ниченных пунктиром. Естественно, что при столь грубом разбиении
250
ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
[гл. 15
отрезка (а, Ь) обе суммы еще заметно отличны от интеграла
ь
j* /(х) dx,
а
который изображается площадью криволинейной трапеции и при-
ближенное вычисление которого является нашей задачей.
Соединим теперь каждые две соседние точки деления данного
участка кривой y=f(x) прямолинейной хордой и рассмотрим пло-
щадь S фигуры, ограниченной сверху ломаной линией, составленной
из этих хорд, с боков — прямыми х = а и х = Ь, а снизу — осью ОХ.
Мы непосредственно видим, что даже при нашем весьма грубом
разбиении Т площадь S уже очень близка
к оцениваемой нами площади криволиней-
ной трапеции, — во всяком случае, зна-
чительно ближе, чем площадь любой из
рассмотренных нами выше двух «лестнич-
ных» фигур. Поэтому для практических
расчетов в качестве приближенного зна-
чения данного интеграла нам значительно
выгоднее взять S, чем верхнюю или ниж-
нюю сумму разбиения Т, тем более, что
вычисление S нисколько не сложнее, как
Черт. 45. мы сейчас увидим, чем вычисление верхней
или нижней суммы. Мы должны, ко-
нечно, учитывать, что черт. 45 носит только иллюстративный, но
не доказывающий характер — уже потому, что он показывает нам
только случай положительной и все время в одну сторону выпук-
лой функции /(х); однако подмеченная нами на нем предпочтитель-
ность использования величины S вместо верхних и нижних сумм
остается верной и в подавляющем большинстве других случаев.
Обозначим через xk и Д^, как обычно, точки деления и ячейки
разбиения Т и положим для краткости
/(**)=Л (А = 0, 1, ... , л).
Допустим для простоты, что /(х)^0 (а^х^Ь). Площадь S есть
сумма площадей прямоугольных трапеций, расположенных над раз-
личными ячейками ДА (отсюда и название «способ трапеций»); тра-
пеция, расположенная над ячейкой Д*, имеет высоту ДА и основания
Ум и 2, ••• , л); площадь ее поэтому равна
д
2 k
и следовательно,
п
•$=42 (Ук-'
СПОСОБ ТРАПЕЦИЙ
251
§ 57]
Желая получить ту или другую точность приближения, мы, есте-
ственно, должны выбирать разбиение Т с достаточно малыми для
этой цели ячейками (достаточно малым I(73); но в остальном выбор
точек деления xk остается произвольным, и вычислитель всегда ста-
рается использовать этот произвол с целью по возможности упростить
предстоящие ему вычисления. Так как наша формула требует вычис-
ления значений функции /(х) во всех точках деления, то мы прежде
всего должны посмотреть, для каких точек значения функции /(х)
вычисляются особенно просто; может, например, случиться, что так
будет обстоять дело для точек рациональных или для точек, соиз-
меримых с те, ит. п. Если такие точки имеются, то, разумеется,
всего выгоднее выбирать точки деления именно среди них. Если же
функция /(х) такова, что таких заслуживающих предпочтения точек
для нее нет, то проще всего, конечно, разбить отрезок (а, Ь) на п
равных частей; тогда
и мы получаем:
п п—1
fe=l 4
Это и есть величина, принимаемая нами в качестве приближенного
значения данного интеграла. Формула (1), как легко видеть, остается
верной и в общем случае, когда о знаке /(х) никаких предположе-
ний не делается. Конечно, чтобы оценить доброкачественность да-
ваемого этим выражением приближения, мы должны научиться оце-
нивать получающуюся при этом погрешность. Посмотрим, как это
может быть сделано.
Пусть мы в некотором отрезке (а, (3)(Р — а=Д^>0) заменяем
кривую y~f(x) прямолинейной хордой > = Z(x), соединяющей ее
концы, так что Z(a)=/(a), Z(p) =/(₽)• Постараемся оценить раз-
ность интегралов
3 3 3
J/(x) dx— J I(x) dx = j*/(x) dx —Д.
a a a
Положим с этой целью
g(x) = /(Х)^ЦХ)лг (<x<x<p)
и рассмотрим функцию
ф О) =/(*) — / О) — g(x) (z — а) (г — р),
где х (а следовательно, и g (х)) предполагается постоянным
(а<^х<Р). Очевидно, qp(a) = 9(p) = O; но в силу определения
величины g(x) мы имеем, как легко видеть, и ^(х) = 0. Таким
252 приближенное вычисление интегралов [гл. 15
образом, функция 9 (г) обращается в нуль в точках а, р и х (а х Р).
Допустим теперь, что функция f(x) имеет в отрезке (а, р) непре-
рывную вторую производную; очевидно, тем же свойством обладает
тогда и функция 9 (г). Применяя к этой функции теорему Ролля
в отрезках (а, х) и (х, р), мы убеждаемся, что 9' (г) дважды обра-
щается в нуль в отрезке (а, р); вторичное применение теоремы
Ролля (к функции 9'(г)) показывает, что и функция 9" (z) обра-
щается в нуль в некоторой точке £ отрезка (а, (3). Но так как
/"(г) = 0, то
о=?"(е)=гф-2£(х)
и, следовательно,
= ({),
откуда, в частности, следует, что /"(£) есть непрерывная функция
от х.
Таким образом, мы находим:
/ (X) - / (X) = 1 f" ® (х - °0 (* - ?),
и значит,
J/(х) dx — Д = 4 j /" (0 (х — а) (X — Р) dx.
а а
Так как функция (х — а)(х — р) не меняет знака в отрезке (а, 3),
a f" (£) есть, как мы видели, непрерывная функция от х, то в силу
теоремы о среднем значении (§ 51) правая часть последнего равен-
ства может быть написана в виде
4 f" © (х - а) (х - р) dx = - (I),
а
где 5 — некоторая внутренняя точка отрезка (а, {3). Таким образом,
мы находим:
J/(х)dx- д = _ ^f"(F).
а
Возвратимся теперь к нашим отрезкам (х^, xk)(\ Мы
имеем в случае равных отрезков
а = хА_1( р=хА, f($)=yk,
и полученная формула дает:
xk
J7 W dx (» -а) =-(£.),
v/?-l
СПОСОБ ПАРАБОЛ
253
§ 58]
где xk (1 ^п). Суммируя же это равенство по k от
1 до /г, находим:
b п
f{x)dx — S = J /" (У,
а Л=1
где S определяется формулой (1).
Пусть т и М означают соответственно наименьшее и наибольшее
значения функции f"(x) в отрезке (а, Ь). Тогда для l^k^n
m^f”
а значит,
пт пМ.
k=i
Таким образом, величина
п
k=l
заключена между т и М, а значит, между а и b найдется точка 5*,
для которой
п
k=l
и мы окончательно получаем для погрешности формулы трапеций
выражение
Ь * / п — 1 .
[/(xK/x-ti + 2л =-п5^Г(Н.
а ' /?=! '
С возрастанием п, как мы видим, эта погрешность убывает, вообще
. 1
говоря, как бесконечно малая порядка
Упражнения к § 57 см. в задачнике Б. П. Демидовича, отдел IV,
задачи 272—274.
§ 58. Способ парабол
Способ трапеций основан на том, что на небольших участках
Д^ = (хл_1, х/г) кривая y=f(x) заменяется (или, как говорят, и«-
терполируется) прямолинейной хордой (линейной функцией). По-
этому естественной является попытка получить ббльшую точность.
254
ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
[гл. 15
интерполируя функцию y=f(x) на малых участках многочленами
высших степеней, и прежде всего трехчленами второй степени
у = ах2 Ц- fix Ц- у,
графическими изображениями которых, как известно, служат обыкно-
венные параболы.
Разобьем отрезок (а, Ь) на четное число 2л равных частей, так
что
= Т (1^^2/г),
и положим, как выше, yk=f(xk) (0^^^2л). Возьмем пару со-
протяжении составляемого ими отрезка
(х2/г_2, x2J заменим кривую j/=/(x)
параболой
У==Чх* + $кх + ъ> (О
проходящей через точки ТИ2Д,_2 (x2fe_2,
Уы-*)> Мм-i (x2Aj-1, Ум-i)’ Мм Уы5
данной кривой (черт. 46). Коэффи-
циенты о^, fik, могут, разумеется,
легко быть вычислены на основе этого
требования, однако для наших целей
их значения не понадобятся.
Способ парабол состоит в том, что
на каждом участке (х2/г_2, x2fe) (k=\,
2, ... , л) интеграл функции f(x) заменяется в порядке прибли-
жения интегралом соответствующей параболы (1):
x2k x2k
j* f (x) dx =« j* (ct^x2 4- ₽tx 4- dx.
x*k - 2 x2k - 2
и b — a । л
Но, учитывая, ЧТО = и ХЫ + X2k-<i — ^Х2/?-!, мы
имеем:
xSk
J (aftx24-Pftx4-Tft)rfx =
- 2
=«.^4 ~ ~ =
= (xlk — 2 4“ Xik-iXtk 4“ X2k) 4“ (-^8fe-4 4- Xtk) + =
=-gn- - 2 4~ + ь) 4~ (afex2fe 4~ $kx<tk 4~ t*) 4~
4r 4 (a*x^ft _ i pftx2t_! 4" Ik)} = 4“ 4№-i 4~№}•
СПОСОБ ПАРАБОЛ
255
§ 58]
Таким образом, способ парабол дает:
X2k
J /(х)dxъЬ-=^ {у9к^ + 4Уы_1 + yik}
X2k-2
и следовательно, суммируя по всем ячейкам,
Ь п
J f (х) dx {Уъь-Ь + +л&} =
a k=\
= " Qn" {л +л« + 4 2 ^2Л’“1 "Ь 2 2 •
fe=l fe = l
И здесь, как в случае способа трапеций, оценка погрешности при
замене интеграла его приближенным выражением требует специаль-
ного исследования, составляющего собой важную задачу вычислитель-
ной техники. Расчет, вполне аналогичный проведенному нами для
способа трапеций, показывает, что в случае способа парабол погреш-
ность убывает, вообще говоря, обратно пропорционально п4, т. е.
значительно быстрее, чем в случае способа трапеций.
Упражнения к § 58 см. в задачнике Б. П. Демидовича, отдел IV,
задачи 275—278.
ГЛАВА 16
ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ
§ 59. Алгебраическое введение
Теперь, после того как мы видели, что наиболее простым мето-
дом вычисления интегралов служит отыскание примитивных функций,
мы вернемся к этой задаче, чтобы по возможности расширить область
применения этого метода. Учитывая то, что по этому поводу было
сказано в § 56, мы, естественно, при этом будем стремиться прежде
всего возможно шире охватить область тех функций, примитивные
которых принадлежат к элементарным функциям. До сих пор мы
знаем только один достаточно широкий класс таких функций: это — -
многочлены, примитивные которых также всегда являются многочле-
нами; все другие рассмотренные нами примеры функций с элемен-
тарными примитивными представляли собой либо совсем отдельные
функции, либо весьма узкие семейства их.
Ближайшим расширением класса многочленов является класс так
называемых рациональных функций. Функция называется рацио-
нальной, если ее значение получается из значения независимой
переменной (и постоянных чисел) посредством рациональных опера-
ций (сложения, вычитания, умножения и деления), повторенных
в любом числе и в любой последовательности. Таким образом,
к действиям, дающим многочлены, здесь добавляется еще только дей-
ствие деления — оно и является, конечно, источником получающегося
расширения. Мы теперь займемся в первую очередь интегрированием
(т. е. отысканием примитивных) рациональных функций. Самым заме-
чательным результатом нашего исследования будет при этом тот
в высшей степени важный факт, что примитивные всех рациональ-
ных функций являются элементарными функциями. Эти элемен-
тарные функции, конечно, вообще говоря, уже не будут рациональ-
ными: мы знаем, что примитивные таких простых рациональных функ-
1
(1+х2)
ций, как —
и
, трансцендентны. Вместе с тем мы разработаем
и вполне конкретные приемы фактического отыскания примитивных
для рациональных функций.
§ 59]
АЛГЕБРАИЧЕСКОЕ ВВЕДЕНИЕ
257
Все общие методы интегрирования рациональных функций осно-
ваны на представлении их в некоторой специальной форме, особо
удобной для целей интеграции. Это представление является делом
алгебры, не имеющим никакой непосредственной связи с методами
математического анализа. Именно поэтому мы должны начать эту
главу с алгебраического введения.
Элементарная алгебра учит, что всякая рациональная функция f(x)
может быть представлена в некотором «каноническом» виде
/(х) =
Р(х)
(?(Х) ’
(1)
где Р(х) и Q(x)— многочлены, не имеющие общих корней. Такую
дробь обычно называют рациональной дробью; если степень
числителя такой дроби меньше степени ее знаменателя, то дробь
называют правильной, в противном случае — неправильной.
Если рациональная дробь (1) неправильна, то с помощью изве-
стного из элементарной алгебры деления многочленов мы
простыми рациональными операциями представить эту дробь
Р (х) о / I Р (х)
Q(x)— + Q(x)>
можем
в виде
где S(x) (частное) и /?(х) (остаток) — тоже многочлены, причем
степень остатка всегда меньше степени делителя, так что рациональ-
ная дробь в правой части последнего равенства — правильная. Таким
образом, неправильная рациональная дробь всегда может быть пред-
ставлена в виде суммы многочлена и правильной рациональной дроби.
А так как многочлены мы интегрировать умеем, то интеграция не-
правильных рациональных дробей сводится к интеграции дробей пра-
вильных. Мы можем поэтому в дальнейшем ограничиться рассмо-
трением того случая, когда /(х) есть правильная рациональная дробь.
Во всех приемах интегрирования рациональных дробей важную
роль играют корни знаменателя Q(x) этой дроби. Если веществен-
ное или комплексное число а есть корень многочлена Q (х), то Q (х)
делится без остатка на двучлен х — а, т. е.
Q (х) = (х — а) Q* (х),
где Q* (х) — тоже многочлен; если Q*(a) = 0, то
Q (х) = (х — a)2Q** (х)
и т. д. Если
Q(x) = (x —a^Q^x), (2)
где k 1 и Qj (а) 0 (т. е. многочлен Q, (х) уже не имеет а своим
корнем), то говорят, что многочлен Q(x) имеет число а корнем
кратности k.
17 А. Я. Хинчин
258 ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ [гл. 16
Лемма 1. Если вещественное число а есть корень кратности
k^>0 многочлена Q(x), то тождественно
Р (•*) _ Afc I Pl (•*) /эч
Q (X) (X — a)k (х — (х) ’ W
где Ak — постоянное число, а Рх (х) — некоторый многочлен.
Здесь многочлен Q, (х) определяется равенством (2) (так что
Q, (а) 0), число Ak вещественно, все многочлены имеют веще-
ственные коэффициенты и дробь в левой части может быть пра-
вильной или неправильной.
Доказательство. Тождество (3) равносильно тождеству.
Р{х) — AkQi(x) = (x — a)Pj(x), (4)
получаемому из него умножением на Q(x); последнее же тожде-
ство означает делимость многочлена Р(х)— AkQi (х) на двучлен
х — а, для чего, как известно, необходимо и достаточно иметь:
Р(а)-ДА<?1(а) = 0..
(5)
Если поэтому мы положим
А —Р(а)
k~Qi («)
(вспомним, что Qj (а) 0), то равенство (5) будет выполнено и
многочлен Р(х) — (х) будет делиться на х — а, т. е. мы будем
иметь тождество (4), а значит, и (3).
Если k'^2, то рациональная дробь
_____Р1(£)______
(X — а)*”1#! (X)
имеет тот же вид, что и
к Р (х) и
первоначальная дробь $ ; применяя к ней
снова доказанную лемму, мы получаем:
Р(х)____ Ak । j_________Pa (x) ,
Q (x) (x — a)k ' (x — a)k~l (x — a)Jt *Qi(x) 9
если Л^З, этот процесс может быть продолжен и далее до тех
пор, покуда знаменатель последней дроби в правой части еще содер-
жит двучлен х — а в какой-либо положительной степени. Поэтому
в конечном счете мы получаем представление
Р(х)_ Ak . .____А . Р*(х)
Q (X) (х — а)к (х — a)k~l * * ‘ ‘ * х — а ' Qt (х) ’
(6)
где А,, ... , Ак — вещественные числа, а Р* (х) — многочлен с веще-
ственными коэффициентами.
Во всем предшествующем мы предполагали число а веществен-
ным. Все наши выводы, очевидно, остаются верными и в случае
§ 59] АЛГЕБРАИЧЕСКОЕ ВВЕДЕНИЕ 259
любого комплексного а, но только при этом, конечно, будут ком-
плексными также числа А{ и коэффициенты получаемых многочле-
нов. Мы не рассматривали и не имеем в виду рассматривать инте-
грирование комплексных выражений и потому в случае, когда корень
а — число комплексное, мы поведем разложение данной рациональ-
ной дроби другим путем.
Если многочлен Q(x) (с вещественными коэффициентами) имеет
комплексное число а = |3-|~zl(T 0) корнем кратности k, то, как
учит алгебра, и «сопряженное» комплексное число а* = р — /у также
будет корнем этого многочлена и притом той же кратности k.
В этом случае многочлен Q(x) делится на (х— а)* и на (х — a*)fe,
а значит, и на их произведение; а так как
(х — а) (х — а*) = (х — Р)2 -|- у2,
то мы получаем:
Q(x)=4(x — Р)2 + №1(*). (7)
где (а) ф 0 и (а*) 0, причем числа £ и у и коэффициенты
многочлена (х), очевидно, вещественны.
Лемма 2. Если комплексное число а = £ ZT (Т 0) есть
корень кратности k многочлена Q(x), то тождественно
Р(х) _ Bkx-\-Ck ।___________А(х) m
Q (х) — [(х - + т2]6 "Г [(x-^ + v^QiW ’ w
где Bk и Ck — постоянные числа, а Р} (х) — некоторый многочлен.
Здесь многочлен Qj (х) определяется равенством (7), числа Bk, Ck
и коэффициенты многочлена Рх (х) вещественны и дробь в левой
части может быть как правильной, так и неправильной»
Доказательство. Положим для краткости
(х — а) (х — а*) = (х — ₽)« 4-т8 = ? (х).
Тождество (8) равносильно тождеству
Р (х) - (В,х + Ck) Q. (х) = q (х) Pt (х),
которое ввиду произвольности многочлена Р\ (х) в свою очередь
равносильно требованию, чтобы многочлен, стоящий в его левой
части, делился на #(х), т. е. делился на х — а и х — а*; но для
этого необходимо и достаточно иметь
Р (a) — (ВАа + Q) Qt (а) = Р (а*) — (ВАа* + СА) Qt (а*) = 0,
или
R а* I С __
260
ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ
[ГЛ. 16
Для определения неизвестных Bk, Ck мы имеем, таким образом,
систему двух уравнений первой степени с определителем а — а* =
= 2/у 7^ 0, вследствие чего Bk и Ck всегда однозначно определяются;
легко видеть при этом, что получаемые для Bk и Ck выражения сим-
метрично зависят от а и а* и потому являются вещественными. Этим
доказаны все утверждения леммы 2.
Как и в случае вещественного корня, при k 1 последняя дробь
правой части тождества (8) имеет тот же вид, что и первоначальная
дробь, стоящая в левой части. Мы можем поэтому и к ней приме-
нить ту же лемму. Продолжая этот процесс^ мы аналогично преж-
нему находим, что если многочлен Q (х) имеет комплексный корень
а = р -|- /у (у # 0) кратности k и если многочлен (х) опреде-
ляется тождеством (7), то имеет место тождество
Р(х) Bkx + Cfe । Bfe-iX + Cfe.i । । BiX + Ct । P* (x)
Q(x)— {<?(x)}« ' {? (x)}*-> “Г • • • f q (x) t- Q^x) >
где q(x) = (x— P)e + r8, Bt, Bit ... , Bk, Ct, C2, ... , Ck — веще-
ственные числа и Р*(х)— многочлен с вещественными коэффи-
циентами.
Сделаем теперь по поводу тождеств (6) и (9) следующее общее
замечание: если левая часть какого-либо из этих двух тождеств
представляет собой правильную рациональную дробь, то правильной
будет и последняя дробь правой части; проще всего в этом можно
убедиться, заставляя переменную х безгранично возрастать; относи-
Р* (х)
тельно всех членов тождества, кроме 77, \ > мы тогда непосред-
ственно видим, что они стремятся к нулю; в силу самого тождества
должна поэтому стремиться к нулю и эта последняя дробь, что воз-
можно только в том случае, если она — правильная.
Теперь мы уже легко можем привести любую правильную рацио-
нальную дробь к некоторому «каноническому» виду, удобному для
интегрирования. Знаменатель Q(x) этой дроби, как всякий много-
член с вещественными коэффициентами, имеет, вообще говоря, не-
сколько различных между собой вещественных корней оц, а2, ..., аг
и несколько различных между собой пар сопряженных мнимых кор-
ней Pjzt/Ti, ± каждый вещественный корень ат
имеет определенную кратность km(l и каждая пара мнимых
корней Рл ± /ул — определенную кратность ln (1 п s). Тогда, как
известно из алгебры,
<?(х) = а(х— а^Цх—а,)*« ... (х —ar)fcr(x —р, —^У* X
X (•*—?!+ ••• (х — — + =
Г 5
= a JJ (х — am)fcm JJ [(х — ₽„)’ + •$]'", (10)
т = 1 п = 1
где а ф 0 — постоянное число.
S’ 59] АЛГЕБРАИЧЕСКОЕ ВВЕДЕНИЕ 261
Р(х}
Применяя к данной дроби ’ и корню 04 формулу (6), мы
V \х)
находим:
р(х)_ 4? , 41?-». . . 4П . Pi(x) пп
Q{x)— (х-а^ (х-а,№ x-a^Q^x)’
где /ЦЧ А^, , А^— постоянные вещественные числа, Qt(x) =
Г S
— а | | (х—| | [(х — Рл)2 7п]‘п и последняя дробь правой
т=2 л=1
части — правильная,
u Р1 (х) р (х)
по дробь 7Г-7-4 того же типа, что и данная дробь 757—4, и мы
vi \х) Q (х)
можем снова разложить ее по формуле (6) применительно, напри-
мер, к корню а2; это дает:
Pi (х) __ • 42> Ра(х)
Qi(x) (х —aa)fcs । ' ”~1_х —as ' Q,(x) ’ ' }
где
Г S
ф (х) = a JJ (х — JJ [(х — ₽„)2 4- fi]ln
т=3 л = 1
и последняя дробь снова правильная. Внося (12) в (11), мы находим:
4" , 4" , 4” , , 4»’ , Р.м
Р (х) (X — * • ’ * X — «1 ‘ (X — as)fe2 ‘ ‘ ‘ * х — a2 ' Q* (*) ’
Проделав описанный процесс г раз (для каждого из г веществен-
ных корней am), мы, очевидно, придем к тождеству
РИ 4',’ , 4','-, ( , 4" ;
Q (X) (X —ax)6! ' (X — а,)»!-1
(х — a2)ft2 (X — а2)кв~1
X — ах 1
д(2)
42>i
I А^г „ I А^г~' I I Л‘Г) I ^(х) ИЗ)
• (х — ar)kr (х — аг)кг ~ 1 ‘ ‘ X — ar * Q* (х) ’ ' '
где последняя дробь — правильная и знаменатель ее
Q*(x) = aJJ
п= 1
имеет своими корнями уже только мнимые корни первона-
чального знаменателя Q(x). Поэтому процесс «отделения» веще-
п
262 ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ [ГЛ. 16
ственных корней, выражаемый формулой (6), к дроби -тгЛ \ уже
более применен быть не может. К ней мы, естественно, применим
теперь процесс «отделения» мнимых корней, описываемый форму-
лой (9). Очевидно, по полной аналогии с вещественными корнями,
что в результате s-кратного применения формулы (9) мы придем
к разложению вида
Р»(х)_ 4’’* + ^ , I Sp-v + C?» ,
Q*(x) [(x-fV + T?]'*
B$x + C% , B^x+C^ ,
+ [(X - W + 71К* + •••+• (х-?2)2 + 7| +
+...............................+
Sz^x + Cz7 Й^’х + С^ р**(х)
[(X - м2 + 7?fr । • “г (х _ + 7| "Г (?** (х) ’
где последняя дробь правой части — правильная; но так как все
корни первоначального знаменателя Q (х) исчерпаны и Q** (х) более
корней не имеет, то мы непременно должны иметь Р**(х) = 0.
Р* (х)
Внося в (13) найденное разложение дроби ' , мы получаем для
v \х)
первоначальной дроби окончательное разложение, которое запишем
в следующей более сжатой форме:
k i
Р(х) _ у у 4”” , у у 4и,^ + с<”»
Q(x)~ L Z(x-am)»’T £ 1(х-р„)’ + 7»]’
т=1и=1 п=1v=1
Р (х)
Это разложение правильной рациональной дроби г и
v \Х)
нашей целью. Мы доказали, что оно всегда возможно; вместе
(14)
было
с тем
оно единственно: в процессе последовательного отыскания чисел
А^, В%} и мы на всех этапах убеждались в однозначном их
определении. Однако тот прием последовательного вычисления этих
коэффициентов разложения (14), которым мы пользовались выше,
в большинстве случаев не является наиболее простым. Проще и
симметричнее обычно бывает применение метода «неопределенных
коэффициентов». Мы пишем разложение (14) с неопределенными
А{™\ и и избавляемся сразу от всех дробей, умножая обе
части этого соотношения на Q(x). При этом мы получаем налево
данный многочлен Р(х), а направо — некоторый многочлен, коэф-
фициенты которого после приведения подобных членов будут, оче-
видно, содержать неизвестные числа А{™\ В{£\ и притом будут,
как это непосредственно видно, линейно зависеть от этих чисел.
Так как полученное равенство должно быть тождеством, то
коэффициенты при одинаковых степенях х в левой и правой частях
§ 59]
АЛГЕБРАИЧЕСКОЕ ВВЕДЕНИЕ
263
должны быть одинаковы. Приравнивая их попарно между собой, мы
получаем систему уравнений первой степени относительно неизвест-
ных А^и \ В{ъ\ из которой они и могут быть определены,
причем существование и единственность решения нам известны за-
ранее. Впрочем, очень легко подсчитать, что число уравнений этой
системы равно числу неизвестных. В самом деле, пусть степень
многочлена Q(x) равна N. После умножения обеих частей тожде-
ства X14) на Q (х) мы направо получаем, очевидно, многочлен степени
N—1; налево же мы имеем многочлен Р(х), степень которого
Р
в силу правильности дроби д не выше, чем 2V—1. А так как
многочлен степени М — 1 имеет W коэффициентов, то приравнивание
коэффициентов левой и правой частей дает нам систему из W урав-
нений. С другой стороны, число чисел A«w)(l ^m^r, 1 ^u^km)
г s
равно подобным же образом число чисел равно 1п
т«=1 п = 1
и таково же число чисел С%\ Всех неизвестных мы поэтому имеем:
Г S
2 + 2 I'»’’
т = \ п = 1
но разложение (10) многочлена Q(x) на линейные множители пока-
зывает, что это число в точности равно степени N многочлена Q (х).
Таким образом, число неизвестных действительно всегда равно числу
получаемых линейных уравнений.
Для фактической реализации разложения (14), каким бы спосо-
бом мы ее ни проводили, во всяком случае необходимо знать все
корни многочлена Q(x) вместе с их кратностями. Это — алгебраи-
ческая задача, которую мы далеко не всегда умеем решать, но ре-
шение которой мы должны предполагать выполненным, прежде чем
мы перейдем к интегрированию данной рациональной дроби.
Пример. Дробь
2х + 2
(х-1)(х2+1)2
согласно формуле (14) может быть представлена в виде
2х 2 А - । -J- Ci I -j- С2 ,
(х—1)(х2+1)2 —х^Т"г (Х2+1)2“Г х2+1 ’
умножая обе части на (х—1)(х24”1)а и выполняя приведение по-
добных членов в правой части, мы находим:
2х + 2 = (Л4-в2)х4 + (с2—+ + — c2)№-f-
+(<?1-в14-с2-в8)^+(а-с1-с2).
264 ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ [ГЛ. 16
Приравнивая друг другу соответственные коэффициенты левой
и правой частей, мы приходим к системе уравнений:
Л В2 = О, С2 — В2 = О,
2Л + В1 + В2 —С2 — О,
Cj Ц- С2 — = 2,
А — Ci — С2 = 2;
эта система легко решается и дает:
Л=1, Bj = — 2, Cj = O, В2 = —1, С2 = —1.
Таким образом,
2x4-2 _ 1 2х х4-1
(х—1)(х24-1)2 х—1 (х24-1)2 х24-1 ’
§ 60. Интегрирование простых дробей
С помощью выведенной нами в § 59 формулы (14) интеграция
любой правильной (а значит, как мы знаем, и любой неправильной)
рациональной дроби сводится к интеграции ряда рациональных дро-
бей особого типа, которые мы будем называть простыми дро-
бями. Мы видим, что простые дроби распадаются на два типа; из
них дроби вида
А
(X — а)" 9
где А и а — постоянные вещественные числа, а и — постоянное на-
туральное число, мы будем называть дробями первого типа, а
дроби вида
Вх4-С
[(X_O)2 + vT ’
где В, С, р, у — постоянные вещественные числа, a v— постоянное
натуральное число, — дробями второго типа. В настоящем па-
раграфе мы научимся находить примитивные функции для всех про-
стых дробей обоих типов. В силу формулы (14) мы будем тогда
иметь возможность считать, что нами полностью решена и общая
задача интегрирования любой рациональной функции.
1°. Простые дроби первого типа. Мы непосредственно
находим:
где Н—постоянная интеграции. Столь же непосредственно мы при
«^>1 получаем:
J = р (х - «) -dx = (х - «)-" + Н=
(и-Щх-а)*-1 +
§ 60] ИНТЕГРИРОВАНИЕ ПРОСТЫХ ДРОБЕЙ 265
Этим интегрирование простых дробей первого типа, очевидно,
исчерпано. Мы видим, что в качестве примитивных функций при
этом появляются либо снова простые дроби первого типа (при
ц^>1), либо логарифмические функции (при к=1).
2°. Простые дроби второго типа. Пусть сначала v=l,
т. е. мы имеем дело с простой дробью вида
Вх+С
(x-₽)2 + f
Подстановка х = р -|“ ХУ (у — , dx = у dy} дает:
dx- f Д(? + ту) + с d
J (х-Р)2 + т2 J т2(1 +Л 1У~
_В f 2у dy . + C f dy _
~2 J 1+У5"1" 7 J
= yln(i + c arctgJZ +
= | in {1 + (yyj + arctg + H. (1)
Пусть теперь v — любое натуральное число. Тогда прежде всего
та же подстановка х = Р уу дает:
f Вх + с dx- f В№ + ТУ) + С ydv_
J [(*-₽)2 + тТ J уау~
_ В Г 2ydy . я₽ + с f dy
J (14-у2)* ”Г у2Т»-1 J 0 -j-y2)V ’
Здесь первая примитивная правой части снова находится непо-
средственно:
f _?У 4у_ —----------!_________L/y
J (i+^T (t'-iHl+jT"1
(мы предполагаем так как случай v=l нами уже рассмотрен
выше). Таким образом, нам остается для полного решения задачи
найти еще только примитивную
’ J (1+Л7”
где v — любое натуральное число (пока мы знаем только, что
/1==: arctg _у 4~Я). С этой целью мы теперь выведем рекуррентную
формулу, выражающую для любого натурального v Iv+1 через Iv.
Тогда, зная мы сможем последовательно найти /2, /3 и т. д.,
ъообще — Iv для любого v.
Мы имеем:
”+1 J О+У’Г1’1 -J (I +_У2Г+1 у~
— j_____!_ f v dy rot
” 2 J y (1+j>2)®+1 ’ ' 7
266 ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ [ГЛ. 16
К последней примитивной правой части мы применим интегрирование
по частям; замечая, что
Jtydy _______________1______. н
(l+yV+1 — t'O+J8)" ’
мы находим:
f v 2у dy _ у 1 f dy _
J у (i+yp+1 с'О+УГ (1 + уТ_
=--------_______L 1 /
vO+yT * v
вследствие чего равенство (2) дает:
I 1 т ।___________У_____. (Q4
2v v ' 2fl(l+yV ’ v ;
в частности,
4 = у А + 2(1 4-^2) = 2 агс1£-У + 2(1 +У9 + Н
и т. д. Формула (3) и есть искомая рекуррентная формула; с ее
установлением мы полностью решили задачу интегрирования и для
простых дробей второго типа.
Сопоставляя полученные результаты, мы видим, что в качестве
функций, появляющихся при интеграции простых дробей (а значит,
и при интеграции любых рациональных дробей), могут появляться,
кроме рациональных функций, только еще логарифмы и арктангенсы.
В частности, этим доказано высказанное нами выше утверждение,
что примитивные любых рациональных функций всегда представляют
собой элементарные функции.
Сделаем еще следующее интересное замечание. Уже при пер-
вых шагах интегрирования функций мы обратили внимание на то,
что функции In х и arctg х фигурируют в качестве примитивных для
весьма простых рациональных дробей:
J^ = 1nx + C, J = arctgх + С.
Теперь, когда теория интегрирования рациональных дробей раз-
вернута нами во всей полноте, мы убеждаемся, что, сколь бы слож-
ные рациональные функции мы ни составляли, для выражения их при-
митивных нам не понадобится никаких иных трансцендентных функ-
ций, кроме тех же двух функций: 1пх и arctg х.
Упражнения на интегрирование рациональных функций с приме-
нением метода неопределенных коэффициентов учащийся найдет
в большом числе в задачнике Б. П. Демидовича, отдел III, задачи
174—190, из которых можно рекомендовать 3—4 по указанию пре-
подавателя.
§ 61]
ПРИЕМ ОСТРОГРАДСКОГО
267-
§ 61. Прием Остротрадского
Мы видели в предыдущих параграфах, что интегрирование ра-
циональной дроби, корни знаменателя которой нам известны, ни-
когда не вызывает принципиальных затруднений, хотя и бывает часто
связано с довольно утомительными вычислениями. М. В. Остроград-
ский нашел остроумный общий прием, способный во многих слу-
чаях значительно сократить и упростить эти расчеты. Для изложе-
ния этого приема нам придется вернуться к рассуждениям двух
предшествующих параграфов.
Пусть снова
Р(х)
Q(x)
правильная рациональная дробь и
г s
Q (*) = a JJ (х — am)*m JJ [(х — р„)’ + 7* J1». (1)
т—\ п=1
ЖЖ Х Р (X)
Мы видели, что тогда дробь уу----
допускает (и притом единст-
венным образом) разложение (14) § 59 на простые дроби первого
и второго типа, которым мы и пользовались для интеграции данной
дроби. При этом мы обнаружили следующую картину.
Дроби первого типа
А
(X — <х)«
при интеграции давали натуральные логарифмы в случае и=1 и
рациональные функции вида
f —__________________—________L Н
J (X —а)« — (и— 1)(х~— a)"-1 ' V }
в случае и^>1.
Несколько сложнее обстоит дело с дробями второго типа
Вх+С
[(х-₽)а + тТ’
Полагая х = рХУ, мы имели при
J [(* — ?)2 + тТ dx ~ О +у2)‘°"1 +
где
I = г___________
* J (1+уТ ’
а и — постоянные. Но, с другой стороны, последовательное
применение рекуррентной формулы (3) § 60, очевидно, позволяет
представить примитивную Iv в виде суммы
/ —у / _|-----££у)___
268
ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ
[гл. 16
где — постоянное число, L(y)— многочлен и последняя дробь —
правильная. Вставляя это выражение в (3) и возвращаясь в правой
части от переменной у обратно к х, мы легко находим:
Вх+ С
[(*-?)2 + тТ
[(Х_₽)2+т2]П-1
(х-р)2 + т2’ (4)
где R(x) — многочлен, av— постоянное число и первая дробь пра-
вой части — правильная. Так обстоит дело в случае v 1; при
т>=1 мы имеем формулу (1) § 60, где в правой части рациональ-
ных членов не имеется.
Теперь мы можем составить себе ясную картину того, как будет
Р
выглядеть примитивная дроби в свете разложения (14) § 59. Мы
видим ((2) и (4)), что члены этого разложения, в которых и^>1
или х»^>1, дают при интеграции прежде всего правильные рацио-
нальные дроби с соответственными знаменателями
(х-а^)"-*, [(х-р^ + гёГ*.
Складывая между собой все эти правильные дроби, мы получим
также правильную дробь
Л(х)
Qi (*)’
знаменатель которой, очевидно, равен
Г S
Qi (X) = П {X - ]J [(X - ?„)’ + (5)
т=1 п=1
Это — рациональная часть интеграла данной дроби ~.
Q
Вторая,
трансцендентная часть будет, очевидно, состоять из: а) примитивных
тех членов разложения (14) § 59, в которых и=1 и т>=1, и
б) примитивных типа второго слагаемого формулы (4). Во всех этих
случаях подинтегральная функция имеет один из типов
А Вх + С .
X — а’ (X — р)2 + 72’
сумма всех этих подинтегральных функций поэтому будет правиль-
ной рациональной дробью
Л(х)
Qs(x)’
где
Г S
^(х)==П(х“а'")П1(х“?л)2+1”]- (6)
т=1 л = 1
§61] ПРИЕМ ОСТРОГРАДСКОГО 269
Мы приходим, таким образом, к замечательной формуле Остро-
градского
f dx — р 1 (*> । f рг (*). (7)
J Q (х) ах — (х) + J Q. (х) ах>
где в правой части первое и второе слагаемые представляют собой
соответственно рациональную и трансцендентную часть примитивной.
При этом Qi (х) и Q* (х) определяются соответственно по форму-
лам (5) и (6) и дроби и —правильные.
0/1 (х) 0/2 W
Весьма замечательно в этом разложении то, что оно может быть
найдено чисто рациональным путем, без знания корней много-
члена Q(x). В самом деле, из алгебры известно, что корень крат-
ности k>A многочлена Q(x) является корнем кратности k—l
многочлена Qr (х); если поэтому, как мы предполагаем,
Г 5
Q (•*) = a JJ (х — am)fem JJ [(х — ?„)2 +
т~1 п—1
ТО
г s
q (-v)=П(х “ П[(х “₽л)3+R (x)=(x) R (x)>
m=l
где /?(х) уже не имеет корнем ни одного из корней многочлена
Q (х). Это показывает, что многочлен (х) есть наибольший об-
щий делитель многочленов Q(x) и <?г(х) и, следовательно, может
быть найден хотя бы обычным способом нахождения наибольшего
общего делителя двух многочленов с помощью последовательного
деления. А так как формулы (1), (5) и (6) дают:
Q(x) = aQi (x)Q2(x),
то, зная Q (х) и Qt (х), мы находим элементарными рациональными
операциями и многочлен Q2(x). Наконец, для нахождения много-
членов Р, (х) и (х) мы продифференцируем равенство (7):
Р(х) _ Qi (х) (х) — Л (х) Q't (х) . Р2(х)
QW“ QU*) 'rQ2(*)’ w
Согласно формуле (5) каждый корень К многочлена Qj (х) есть
корень многочлена Q (х), а значит, в силу (6) и корень многочлена
Q2(x). Если Qj (х) содержит двучлен х — X в степени &^>0, то
Qi (х) содержит его в степени k—1, а Q2(x)— в первой степени;
поэтому произведение QJ (х) Q2(x) содержит х—X в той же сте-
пени А?, что и многочлен Qt(x); а так как это имеет место для
TJQ ИНТЕГРИРОВАНИЕ РАЦИОНАЛЬНЫХ ФУНКЦИЙ [ГЛ. 16
любого корня к многочлена Qt (х), то Qi (х) Q2 (х) делится на Qi (х)
без остатка, т. е.
Qi (х) Q2 (х) = Qi (х) S (х),
где S(x)— некоторый многочлен. Мы находим поэтому:
Qi (х) Р; (х) — Л (х) Q1 (х) _ Q2 (х) Qi (х) Р[ (х) — Q2 (х) (х) QJ (х) _
Q? (х) Q2 (х) QI (х)
_ Q1 (х) [Qa (X) р; (х) — Pl (х) S (X)] _ Q2 (х) Pj (х) — Pl (х) S (х)
Q2(x)QHx) — Qi(x)Q2(x)
и разложение (8) дает после умножения на Q (х) = aQt (х) Q3 (х):
Р (х) = a [Q2 (х) Pi (х) — Pt (х) S (х)] + аР2 (х) Q, (х). (9)
В этом тождестве многочлены Р(х), Q! (х), Q2(x) и S(x) нам
известны, наивысшая же возможная степень многочленов Pt (х) и
Р2 (х), которые мы хотим найти, определяется правильностью
jD / (х}
дробей 77-7-т- и . Поэтому из соотношения (9) многочлены Pt и
Mi (х) Q2 (х)
Р2 могут быть найдены методом неопределенных коэффициентов.
Легко подсчитать, что число неизвестных при этом совпадает с чи-
слом получаемых уравнений, а разрешимость получаемой системы
гарантируется доказанным нами существованием разложения (8).
Таким образом, все элементы формулы Остроградского (7) дей-
ствительно определяются рациональным путем, и нахождение их не
требует знания корней знаменателя данной дроби. В частности, мы
можем, не зная этих корней, найти рациональную часть примитив-
ной данной рациональной дроби.
Упражнения на прием Остроградского см. в задачнике Б. П. Де-
мидовича, отдел III, задачи 191—193.
ГЛАВА 17
ИНТЕГРИРОВАНИЕ ПРОСТЕЙШИХ ИРРАЦИОНАЛЬНЫХ
И ТРАНСЦЕНДЕНТНЫХ ФУНКЦИЙ
В предыдущей главе мы убедились, что все рациональные функ-
ции имеют элементарные примитивные, и установили общий путь
к отысканию этих примитивных. Но, как только мы выходим за
область рациональных функций, существование элементарных при-
митивных становится уже не правилом, а исключением. Поэтому
здесь мы уже не имеем возможности строить столь общих теорий,
как нам это удалось в главе 16. Тем не менее как среди алгебраи-
ческих иррациональных, так и среди трансцендентных функций
имеются довольно широкие классы таких, которые интегрируются
в элементарных функциях; эти классы во многих случаях охва-
тывают собою функции достаточно простые и поэтому часто встре-
чающиеся в приложениях; вместе с тем приемы отыскания прими-
тивных для таких функций часто бывают довольно поучительны;
поэтому мы в настоящей главе рассмотрим некоторые из важ-
нейших классов этого рода. Что касается методов интеграции
иррациональных и трансцендентных функций, то здесь играет гла-
венствующую роль так называемый прием рационализации: стараются
отыскать такое преобразование переменной интеграции, после кото-
рого подинтегральная функция становится рациональной; если это
удается, то мы можем считать нашу задачу принципиально решен-
ной, так как интегрировать рациональные функции мы умеем во
всех случаях.
§
62. Интеграция функций вида
ах + Ъ
cx±d
Если мы хотим выйти за область рациональных функций, то
простейшими функциями мы, естественно, должны считать такие,
в которых наряду с рациональными операциями один раз встречается
извлечение корня. Чтобы построить самый общий вид функции та-
кого рода, мы должны, очевидно, извлечь корень какой-либо сте-
пени п из какой-нибудь рациональной функции /(х) = (где
чг \%)
272 ИНТЕГРАЦИЯ ИРРАЦИОНАЛЬНЫХ И ТРАНСЦЕНДЕНТНЫХ ФУНКЦИЙ [гл. 17
/>(х) и Q(x) — многочлены) и затем взять произвольную рациональ-
ную функцию /?(х, у) от переменных х и
таким образом, среди примитивных иррациональных алгебраических
функций мы должны считать простейшими примитивные вида
(1)
где Р(х) и Q(x) — многочлены, п^>1—любое натуральное число,
a R(x, у) — любая рациональная функция двух переменных.
Однако .среди примитивных вида (1) лишь весьма немногие,
соответствующие самым простым предположениям относительно
числа п и многочленов Р и Q, могут быть выражены в элементар-
ных функциях. В настоящем параграфе мы рассмотрим случай, когда
Р и Q — линейные двучлены (а число п произвольно); мы увидим,
что примитивные этого типа представляют собой элементарные функ-
ции и легко могут быть найдены.
Итак, мы ставим себе задачу найти примитивную
МИЖз}**-
где а, Ь, с, d — постоянные и п — любое натуральное число. По-
ложим
(2)
F СХ + d
откуда
ах 4- b ,п dtn — Ь ... . ,
~^d=t ’ х = —=Р(0> dx = cf'{t)dt,
и следовательно,
ph
Так как функция ф(7) (а значит, и ее производная qp' (/)) рациональна,
то в правой части мы имеем дело с примитивной рациональной
функции, выражающейся в виде некоторой элементарной функции
от t\ подставляя же вместо t его выражение (2) через х, мы находим
выражение искомой примитивной в виде некоторой элементарной
функции от х.
Пример. Пусть требуется найти примитивную
§ 63] интеграция функций вида R (х, у/ах* + Ьх с) 273
Так как оба радикала в знаменателе являются целыми положитель-
ными степенями одного и того же радикала y^l 4“х» то данная при-
митивная принадлежит к только что рассмотренному нами классу
(л — 12, a = b = d=\, с = 0).
Полагая
1 -\-x = t,
мы находим х = /12—1, dx=\<2tn dt, У1-|~х = /4, 1 -|-х = /3,
и данная примитивная преобразуется к виду
Рационализация выполнена; далее, мы находим:
1 <> f t*dt , „ С t* — 1 ,, , , о С dt
12 J 7^Т= 12 J Т=Т dt + 12 J 7^T =
= 12 j*(f + /« + /’+ ^ + ^ + /2 + /4-l)^+12 J T^T =
= 12{4 + 7 + J + f + 4 + I + 4+4+ 121nj/— 1 l + C.
Подставляя сюда t= -j-x, мы находим искомое выражение
данной примитивной через первоначальную переменную х.
Дальнейшие упражнения к § 62 см. в задачнике Б. П. Демидо-
вича, отдел Ш, задачи 211, 212, 215, 217.
§ 63. Интеграция функций вида R(x, у/ах* -|- Ьх 4~ с)
Если хотя бы один из многочленов Р и Q § 62 имеет степень
выше первой, интеграция в элементарных функциях удается лишь
в сравнительно редких случаях. Мы рассмотрим теперь очень часто
встречающийся в приложениях случай, когда л = 2, Q(x)=l, а
Р(х) есть трехчлен второй степени ах*Ьхс\ речь идет, таким
образом, о примитивных вида
J R (х, ]/ ах* ftx 4“ с)
где R(x, у) попрежнему означает любую рациональную функцию
двух переменных. Мы покажем теперь, что такая примитивная всегда
допускает рационализацию и, следовательно, представляет собой
элементарную функцию. Необходимое для этой рационализации
преобразование переменной интеграции в различных случаях строится
по-разному.
1°. Если корни аир трехчлена ах*4-ЬхЛ-с вещественны, то
мы имеем (предполагая х^>а)
/ах2 Ах с = /а(х —а)(х —£)=(х—а) j/"
18 А. Я. Хинчин
274 ИНТЕГРАЦИЯ ИРРАЦИОНАЛЬНЫХ И ТРАНСЦЕНДЕНТНЫХ ФУНКЦИЙ [гл. 17
подинтегральная функция поэтому рационально зависит от х и ра-
дикала _______
г X — <3
а это приводит нас к случаю, рассмотренному в § 62; мы знаем,
что к рационализации приводит замена переменной
г X — а
2°. Если корни трехчлена ах*-\-Ьх-}-с мнимы, то этот трех-
член сохраняет один и тот же знак для всех х; мы, естественно,
допускаем, что он всегда положителен, так как в противном случае
радикал при любом х имел бы мнимое значение и задача для нас
утратила бы смысл. В частности, полагая х = 0, мы видим, что
в этом случае обязательно с^>0 (прием, который мы сейчас изложим,
приводит к цели всегда при с^>0 независимо от вещественности
или мнимости корней трехчлена). Положим
ах2 + #х + с — Ус __
х ’
отсюда
ах2 4~ Ьх с = (tx 4- У с)2 — t*x* -[-2 Ус tx 4~ G
ах 4-^ = /2х4- 2 /с/,
Ь — 214с £ ...
х = ?-а = ?(0>
dx = 9' (/) dt,
У ах* 4- йх 4- с = tx 4~ Ус = 19 (/) 4“ Ус,
и мы находим:
J /? (х, У ах* 4- bx 4~ с) dx = J /? { ф (t), t.y (/) 4> /с } У (/) dt.
Так как функция 9 (/) (а следовательно, и ее производная ср' (/))
рациональна, то рационализация данной примитивной выполнена.
В обоих случаях преобразования переменной интеграции, при-
водящие к рационализации, указаны Л. Эйлером, вследствие чего их
обычно называют подстановками Эйлера.
Пример 1. В примитивной
У Xs — а8
(а^>0, 4|^>а), корни многочлена х* — а* = (х— а)(х-\-а)
§ 63] ИНТЕГРАЦИЯ ФУНКЦИЙ ВИДА R (х, ах* 4“ Ьх 4" с)
275
вещественны. Применяя первую подстановку Эйлера
и предполагая для определенности х^>а, находим:
* ~а — f х — а '+** dx== 4at -dt
х + а 1 ’ Х~ 1 — Г-’ аХ ’
। 2а 1 1 >1 -1
1 * }Лх2 — а2 л Г х — a
V T+^(x+а)
и следовательно,
'^J^=j’T$7 + J^7=4^l+C-
Но
1+1
1 -1
У х-\-а + 1^х — а
j/~x а — ]Ух — а
(/»+« + /*—«)’=
= 1(х4- /х’ —а2),
и следовательно,
/= in (х 4- ]/х2 — а2) + С;
при х<^ — а мы находим аналогично:
/ = 1п|х + /х2—’^l+C.
Пример 2. В примитивной
i= Г г Лх .
J у\2 + аа
а2^>0 и мы можем применить вторую подстановку Эйлера:
К^±а8~а /^+Т2==^4-а.
Мы находим:
Х--Ы- dx=^(i-^dt
X 1-_^> ах ()—/*)»
/x24-a24-x = aj-±|,
и следовательно,
276 интеграция иррациональных и трансцендентных функций [гл. 17
Пример 3. К примитивной
/= f
J — X2
может быть применена любая из двух подстановок Эйлера. Однако
в этом случае значительно более простым приемом будет простая
подстановка x = at; мы находим:
1= f ...... == arcsin С— arcsin -4- С.
J У1 -I2 1 а 1
Дальнейшие упражнения к § 63 см. в задачнике Б. П. Деми-
довича, отдел III, задачи 219—222, 245—247.
§ 64. Примитивные биномиальных дифференциалов
Мы рассмотрим теперь еще интегрирование одного класса
алгебраических функций особого вида; интегралы этого рода часто
встречаются в приложениях; однако историческая известность этого
класса интегралов обусловлена главным образом тем, что здесь
мы имеем редкий случай, когда до конца исследован вопрос о том,
какие из интегралов данного класса представляют собой элемен-
тарные функции, и какие — нет.
Биномиальным дифференциалом называется выражение
вида
ха (a -j- bxty dx,
где все три показателя а, р и у — рациональные, а а и b — любые
вещественные числа. Нашей целью будет исследование того, при
каких условиях примитивная
/= J ха (а 4- dx
является элементарной функцией.
Положим x$ = t, так что*)
1 1 1-1
x — t$, dx — 4-tt dt.
F1
Тогда
1 i’ -1
/=1рЗ (a + btydt. (1)
Убедимся теперь, что если по меньшей мере одно из трех чисел
о 4“ 1 а 4" 1 ।
—, у и —р----------[- 7 — целое, то
I представляет собой элемвнтар-
*) Мы можем допустить р ф 0, так как случай р = О, очевидно, тривиален.
§ 64] ПРИМИТИВНЫЕ БИНОМИАЛЬНЫХ ДИФФЕРЕНЦИАЛОВ 277
ную функцию. Вместе с тем мы укажем и прием отыскания этой
функции.
1°. Пусть у — целое число. Тогда в примитивной (1) подинте-
а +1
тральная функция рационально зависит от t ₽ и /; если
а 4- 1____________________________т
р — п ’
где т и п — целые числа (п^>0), то эта подинтегральная функция
имеет, следовательно, вид/?(/, где/?(х, у) — некоторая рацио-
нальная функция двух переменных. Примитивная I получает вид,
рассмотренный нами в § 62, и, следовательно, выражается в элемен-
тарных функциях.
2°. Пусть число °-ф— — целое. Тогда подинтегральная функция
н
в (1) рационально зависит от t и (аесли 7 = у, где р и
<7^>0— целые числа, то эта подинтегральная функция имеет, сле-
довательно, вид /? (/, у а Ы), и мы снова имеем дело с прими-
тивной типа, рассмотренного в § 62.
а I 1
3°. Пусть, наконец, 7 есть целое число. Подинтегральная
р
функция в (1) может быть записана в виде
(а + bty
a 1
t ?
— 1 +т
, a-\-bt\4 р
и, следовательно, рационально зависит от г и (—-— ; если 7 = —
\ t / q
и — целые числа, то поэтому подинтегральная функция
вид
где р
имеет
Г а 4- bt
и мы
и на этот раз оказываемся в условиях, рассмотренных в § 62.
Таким образом, наше утверждение полностью доказано. Как по-
казал П. Л. Чебышев, оно исчерпывает собой все случаи, когда
примитивная биномиального дифференциала является элементарной
функцией: если а и b отличны от нуля и ни одно из трех чисел
а + 1 ’ а 4" 1 ,
—-г—, у и —‘----|~Т не является целым, то примитивная никогда не
представляет собой элементарной функции. К сожалению, доказа-
тельство этой замечательной теоремы Чебышева слишком сложно,
чтобы можно было поместить его здесь.
Упражнения к § 64 см. в задачнике Б. П. Демидовича, отдел III,
задачи 252, 253, 260.
278 ИНТЕГРАЦИЯ ИРРАЦИОНАЛЬНЫХ И ТРАНСЦЕНДЕНТНЫХ ФУНКЦИЙ [гл. 17
§ 65. Интегрирование тригонометрических дифференциалов
Мы переходим теперь к интегрированию некоторых классов
трансцендентных функций, и в первую очередь рассмотрим функции,
рационально зависящие от тригонометрических функций sinx, cosx,
tgx, ctgx, secx, cosec x. Так как все эти функции рационально
выражаются через sinx и cosx, то речь, следовательно, идет о функ-
циях вида /?(sinx, cosx), где /?(х, у)— рациональная функция двух
переменных.
Примитивная
/= | /?(sinx, cosx)t/x (1)
всегда представляет собой элементарную функцию. Чтобы в этом
убедиться, достаточно ввести в качестве новой переменной инте-
грации величину
, [ х\ >
(2)
При этом (ограничиваясь значениями х в отрезке—
x = 2arctgZ,
2t 1 -t2
sinx = -y-pi, cosx = pZp-^
и
1 —t2\
2dt
1 +t2
становится примитивной рациональной функции.
Пример 1. Найдем примитивную
dx
1 — X2 cos х
где X9 — любое положительное число. Мы в отдельности рассмотрим
случаи Х9<^1, Х9^>1 и Х9=1.
1) Если Х9<^1, то положим 1—Х9 = а9, 1-]-Х9 = р\ Подста-
новка (2) дает:
2dt 1 +t2
1 + *2 1+*2 — X2 (1 —
2dt 2 .
а2 -4- ^2 (ф arctg а + С
arctg fl/ 1 tg —
1 — X4 1- X2^ 2)
§ 65] ИНТЕГРИРОВАНИЕ ТРИГОНОМЕТРИЧЕСКИХ ДИФФЕРЕНЦИАЛОВ
279
становка (2) дает:
г— f Mt _ 1
J Р? — **
Mgy-a
Под-
— 1п
?tg;-+a
Г*ЧТ tg -J + Г^Т
1
3) Если X2=l, та же подстановка дает:
'=]"=—г+c=-ct8j + с-
Подстановка (2) во всех случаях приводит к рационализации
примитивной (1), что имеет большое принципиальное значение, так
как показывает, что все примитивные вида (1) представляют собой
элементарные функции. Однако практически выполнение этой под-
становки часто бывает обременительным и может быть заменено
другими, более простыми преобразованиями независимой переменной.
Можно указать обширные классы случаев, когда примитивная вида (1)
рационализируется уже более простыми подстановками t — si.ix,
7 = cosx или t = tgx. Рассмотрим некоторые из таких случаев.
1°. Если функция 7?(х, у) нечетна относительно у (т. е. только
меняет знак при перемене у на —у), то к рационализации при-
митивной (1) приводит уже преобразование sinx = 7. В самом деле,
в этом случае функция
7? (sin х, cos х)
cos х ' '
при замене cosx на — cosx не изменяется и, значит*), содержит
cosx только в квадрате; но cos2x=l—sin2x, так что функция (3)
рационально зависит от sinx = 7. Поэтому мы имеем
J R (sin х, cos х) dx = J ~^°S cos *dx = j* R* (0 dt,
где 7?* (7) — некоторая рациональная функция от 7.
*) Здесь мы пользуемся алгебраической теоремой: если R (z) — рацио-
нальная функция от z и R(—z) = R (z), то R (z) — рациональная функция
от ^.Доказательство. Мы имеем R (z) = R (— z) = ~ [7? (z) -J- 7? (— z)j;
если 7? (z) — многочлен, то правая часть, очевидно, есть многочлен относи-
9 ~ P(z)
тельно z2; в общем случае пусть R(z) равно <, так что
R(z) + R(-z)^
P(z)Q(-z) + Q(z)P(-z)t
Q (*) Q(—z)
числитель и знаменатель — многочлены, очевидно, не меняющиеся при замене
£ на — z, а потому, как мы доказали, являющиеся многочленами относи-
тельно z2,
280 интеграция иррациональных и трансцендентных функций [гл. 17
2°. Совершенно аналогично можно показать, что в случае, когда
функция R(x, у) нечетна относительно х, к рационализации при-
митивной (1) приводит преобразование cosx = /.
3°. Наконец, если R(x, y) = R(—х, —у), то примитивная (1)
может быть рационализирована преобразованием tgx = t. Действи-
тельно, если мы в выражении функции /?(si.nx, cosx) заменим
всюду sinx через cosxtgx, то мы получим некоторую рациональную
функцию /?j(tgx, cosx) от tgx и cosx, так что
R (sin х, cos х) = Ri (tg х, cos х),
и следовательно,
/?(—sinx, —cosх) = R} (tgx, —cosx).
Так как левые части этих двух тождеств совпадают между
собой, то
/?! (tg х, cos х) = Ri (tg x, — cos x),
т. e. функция Ri не меняется при замене cosx на —cosx и,
следовательно, содержит cosx только в квадрате:
(tg X, COS Х) = /?2 (tgX, COS2X),
а значит, и
R (sin х, cos х) = (tg х, cos2 x).
Полагая tgx = /, мы имеем:
о 1 . , t dt
cos2x — .2-, x = arctg/, dx — f-T—r,
1 + * 1 +t ’
а следовательно,
1 = J R (sin x, cos x) dx = J /?2 (tg x, cos2x) dx =
___ [ p (/ 1 \ dt
— J 2 \ ’ 1 + t2) 1 +t2 ’
и примитивная действительно рационализирована.
Пример 2. Подстановка tgx = Z дает:
f sinxcosx = f tF^x= f T=ln|/| + C=ln|tgxl + C.
Мы теперь остановимся несколько подробнее на одном очень
важном частном случае примитивной (1), а именно на примитивных
вида
1т,п— | sinw х cos" х dx,
где т и п — целые числа. Очевидно, если число п = 2k -ф- 1 нечетно,
мы находимся в условиях рассмотренного выше случая 1°, и под-
§ 65] ИНТЕГРИРОВАНИЕ ТРИГОНОМЕТРИЧЕСКИХ ДИФФЕРЕНЦИАЛОВ 281
становка sinx = / рационализирует примитивную немедленно; подоб-
ным же образом, при нечетном т примитивная рационализируется
подстановкой cos x = t (случай 2°); наконец, если числа тип—
одинаковой четности, мы находимся в условиях случая 3° и при-
митивная рационализируется подстановкой tgx = /. В любом случае,
X
конечно, примитивная рационализируется подстановкой tgy = /,
как мы видели выше. Однако интегрирование получающейся при
этом рациональной функции часто бывает очень сложным. Это
заставляет искать других приемов интеграции, один из которых,
обходящийся вообще без рационализации, мы сейчас изложим.
Интегрируя по частям, мы при пф — 1 находим:
Im п = J sinm х QQ$n xdx = j sin"1-1 x (cos'1 x sin x dx) =
= _ sin^xcos^x . m-1 f sinm_2 x cos„+2 xdx =
1 1 n+ 1 J
sin771-1 x cosn+1 x ! m — 1 f
— < n ! '/n-2, n+2» W
и аналогично при m ф — 1
sinm+1x cos71-1 x । n—\ C . .
Im n =---------r-j---------r-r I sinm+2 X cos" 2 x dx =
n m + 1 'tn + 1 J
__sinm+1x cos'1"1 x । n — 1 j
rn + 1 "• т_± 1 '/n+2, n-2- V J
Ho
= j* sin"1-2 x cos"42 xdx —
= J sin"1-2 x cos" x (1 — sin2 x) dx — n — Im, n,
и аналогично
An 4-2, n-2 == An, n-2 n>
вследствие чего формулы (4) и (5) дают:
, ____ sin771-1XCOS"4*1 х । т — 1 .. , 1
Ап, п--- п । ] Г п ] Г/п-2, п lm, nb V0)
sinm+1 xcos"-"1 х । л—1 г, j . . zyx
^т. п — т I Г т _|_ I Н/П, п-2 nl> V '
откуда соответственно
. ____ sinm—1 xcosn+1 х . т — i ,
1т,п т + п Г т + п 1т-Ч, ю
j . ____sinm+1 xcos”"1 x n — 1 . zqx
a tn 4- n m 4~ nm> л-2‘ * **
282 ИНТЕГРАЦИЯ ИРРАЦИОНАЛЬНЫХ И ТРАНСЦЕНДЕНТНЫХ ФУНКЦИЙ [гл. 17
Мы получили, таким образом, пару рекуррентных формул, позво-
ляющих с легкостью уменьшить в примитивной п любой из двух
индексов (если только другой индекс отличен от — 1 и если
на две единицы, причем другой индекс сохраняет преж-
нее значение. Если числа тип оба положительны, то последова-
тельным применением этих двух формул мы можем, очевидно, легко
выразить примитивную п через какую-либо из примитивных /0>1,
Л о> 4о> Л 1, вычисляемых непосредственно.
Однако выведенные нами рекуррентные формулы позволяют
столь же просто прийти к цели, когда одно (или оба) из чисел т, п
отрицательно. Чтобы в этом убедиться, заметим прежде всего, что
рекуррентные формулы (8) и (9) остаются в силе и в случаях п =
= —1, т =—1, которые мы исключали при их выводе (это пока-
зывает простая проверка дифференцированием), единственным исклю-
чением остается случай т4~л = 0. Формула (8), если в ней заме-
нить т на позволяет выразить 1т п через /ш+2 л, т. е. повы-
сить первый индекс на две единицы, если только ni 2 ф Q;
при этом же условии формула (9) позволяет повысить на две еди-
ницы второй индекс. Но если т 4- п 2 = 0, то (за исключением
единственного случая т = п = —1) одна из формул (6) или (7)
позволяет найти 1т п; так, при т-|-л-]-2 = 0, п~-£ — 1 формула (6)
легко дает, если писать в ней т — 2 вместо т
. __sinm+1 х cosn+1 х । „
lm>n ~ m+"l f"
Пользуясь этими соображениями, мы, очевидно, можем последова-
тельным применением формул (8) и (9) привести задачу к легко
вычисляемым интегралам и в случае отрицательных т, п. Заметим,
что исключительный случай /_, рассмотрен нами выше в качестве
примера.
Упражнения к § 65 см. в задачнике Б. П. Демидовича, отдел III,
задачи 295—297, 299, 261, 265, 283, 284, 304.
§ 66. Интегрирование дифференциалов, содержащих
показательные функции
1. Рассмотрим примитивную вида
/ = J еахР(х)dx (а # 0), (I)
где Р(х)— произвольный многочлен. Интегрируя по частям, находим;
/ = А е§ **Р (х) — A J е^Р' (х) dx.
Эта формула сводит вычисление примитивной I к вычислению более
простой примитивной, так как степень многочлена Р' (х) на единицу
§ 66] ДИФФЕРЕНЦИАЛЫ, СОДЕРЖАЩИЕ ПОКАЗАТЕЛЬНЫЕ ФУНКЦИИ 283
ниже степени многочлена Р(х). Повторным проведением этого
приема мы легко находим:
еах ( 1 1 1
Разумеется, получающийся при этом ряд обрывается сам собой, так
как производные многочлена Р(х), начиная с некоторого порядка,
тождественно обращаются в нуль. Таким образом, все примитивные
типа (1) представляют собой элементарные функции.
Заметим попутно, что аналогичным методом легко находятся и
примитивные вида
Д = I sin ах Р (х) dx, /2 = I cos ахР (х) dx (а ф 0).
В самом деле, интеграция по частям дает:
Ц =— CQSga—Р(х)4~ д j cos ах Р (х) dx,
4
sin ах ~ z ч If- nr / \ j
—— Р (х) — — I sm ах; Р (х) dx,
а попеременное применение
к окончательным выражениям
этих двух формул приводит легко
обеих примитивных:
I _____ sin ах ( Р' (х)___Р" (х) I Pts) (х)_____
1 а I а а3 ’ а5
COS ах ( Р"(Х) , Р(4) (X)
а а2 ' ' а4
г _ sin ах f п, . Р"(х) ! Р(4)(х)
2 — ~— tа* । &
I cos ах J Р (х)_Р" (х) | Р(5) (х)_
’ а ] а а3 • а5
Разумеется, и здесь оба ряда автоматически обрываются.
2. Рассмотрим примитивные
Ki = f еах cos fix dx, А'а = Г e“* sin fix ax (а £. 0).
Интеграция по частям дает:
Ki = — е*х cos fix + £ j* еах sin рх dx = еах cos fix -|- f
X» = 4e<Mrsin?x —1^»’
284 ИНТЕГРАЦИЯ ИРРАЦИОНАЛЬНЫХ И ТРАНСЦЕНДЕНТНЫХ ФУНКЦИЙ [гл. 17
Рассматривая эти два уравнения как систему двух уравнений с не-
известными и мы легко находим:
„ елх (ft sin рх + g cos рх) , п
„ __еа* (a sin рх — р cos рх) .
^2— rG-
Упражнения к § 66 см. в задачнике Б. П. Демидовича, отдел III,
задачи 328, 330, 332, 333, 336.
РАЗДЕЛ ЧЕТВЕРТЫЙ
БЕСКОНЕЧНЫЕ РЯДЫ
ГЛАВА 18
БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ
§ 67. Основные понятия
В каждой области точного естествознания наряду с главами,
освещающими важнейшие понятия и закономерности данной области,
имеются и такие разделы, которые посвящены созданию и изучению
специальной аппаратуры, служащей для овладения изучаемым пред-
метом; значение таких разделов не столько принципиальное, сколько
техническое; и тем не менее методологическая важность их бывает
подчас настолько велика, что без их систематического изложения
невозможно никакое цельное построение соответствующей теории.
Так, в учении о теплоте наряду с главами, в которых излагаются
принципиальные основы теории, мы обязательно должны иметь и
раздел, посвященный термометрии, т. е. методам и техническим
средствам измерения температуры.
Теория бесконечных рядов в отношении к основным понятиям и
важнейшим закономерностям математического анализа играет роль
такого технического орудия, вспомогательного аппарата; и тем не
менее, многочисленными и разнообразными применениями этого ап-
парата настолько проникнуто все здание как самого анализа, так и
большинства опирающихся на его основы прикладных наук, что мы
должны приписать учению о бесконечных рядах центральное место
в арсенале методов современной математики. Поэтому и ни один
курс математического анализа не может обойтись без систематиче-
ского изложения этого учения.
Основная идея теории бесконечных рядов настолько элементарна,
что все непосредственно связанное с нею могло бы быть изложено
в нашем курсе значительно раньше, примерно после глав, посвящен-
ных пределам и вещественным числам. Мы отложили это изложение
по двум причинам: прежде всего из-за необходимости как можно
раньше ознакомить читателя с основными для всего курса идеями
дифференциального и интегрального исчислений; а затем и потому,
что элементарное учение о бесконечных рядах желательно было
непосредственно связать с главами, дающими его дальнейшее, более
286 бесконечные ряды чисел [гл. 18
глубокое развитие, изложение которого только теперь может быть
вполне доступно читателю.
Идея бесконечного ряда очень проста и находит себе полное
выражение уже в хорошо известном из курса средней школы сум-
мировании членов убывающей геометрической прогрессии
а, аг, аг2, ... , агп, ... , (1)
где 0 <Д | г | <Д 1 и а — любое вещественное число. Сумма первых п
членов такой прогрессии
п — 1
2ъ а — агп
k=0
при /г->оо стремится к пределу
.. а
lim sn = z----,
п 1 — г *
п -> оо 1 '
который называют суммой «всех» членов данной прогрессии:
Таким образом, в случае прогрессии образование суммы «всех» чле-
нов некоторого бесконечного ряда чисел совершается так, что обра-
зуется сумма sn первых п членов данного ряда (представляющая
собой, очевидно, функцию от /г), и затем исследуется поведение
этой суммы при л->оо. Если при этом sn стремится к определен-
ному пределу $, то нам представляется естественным считать s сум-
мой всех членов данного ряда.
Убывающая прогрессия является, однако, далеко не единственным
рядом описанного типа. Так, например, ряд
_L _L_ _L ' . (2)
1-2’ 2-3’ 3 • 4’ ’ п(п+1)’ ' ’
обладает в точности такими же свойствами. В самом деле, так как
. \ ------L-г (я=1, 2, ...),
п(п+ 1) п п+ 1
то для ряда (2) мы имеем:
п
Sn== 2 — ?) + (т —у) + (т“’4‘)+ •••
k =х 1
I fl_____L_\ = 1_____L_
••• «Дл л+1/ л+1’
и следовательно,
lim sn = 1.
П -» оо
§ 67]
ОСНОВНЫЕ ПОНЯТИЯ
287
С а <>
таким же основанием, как мы считали величину суммой
«всех» членов прогрессии (1),
что сумма «всех» членов ряда
мы можем поэтому теперь говорить,
(2) равна 1, и писать
Z Л(*+1) L
С другой стороны, ясно, что далеко не всякий бесконечный ряд
может быть просуммирован указанным нами приемом. Так, для ряда
1, 1, 1, ... , 1, ...
мы имеем sn = n\ при /г~>оэ сумма sn безгранично возрастает и,
следовательно, не может иметь предела. То же явление может на-
ступить и при ограниченных sn; так, для ряда
1, — 1, 1, — 1, ... , 1, — 1, ...
sn равно 0 или 1 в зависимости от того, четно или нечетно число п;
при /г->оо сумма sn остается ограниченной, но в то же время, оче-
видно, не стремится ни к какому пределу.
Мы можем теперь перейти к общим определениям. Пусть мы
имеем бесконечную последовательность вещественных чисел
«1, «2, ... , ип, ... ;
(3)
положим
п
sn= 2 («=1> 2> •••)>
k = 1
и будем называть суммы sn частичными суммами ряда (3).
Если существует
lim sn = 5,
п -> оо
то мы будем называть ряд (3) сходящимся, а число s — его
суммой; если же при /г —> со частичная сумма sn ни к какому пре-
делу не стремится, * то ряд (3) называется расходящимся и мы
не приписываем ему никакой суммы.
Понимание суммы сходящегося ^яда как суммы «всех» его чле-
нов, хотя и представляется естественным, требует все же известной
осторожности; нельзя забывать, что сумма бесконечного ряда стро-
ится не в точности подобно конечным суммам, в ее формировании
участвует совсем новая операция — предельный переход; нельзя по-
этому без специальной проверки переносить на суммы бесконечных
рядов свойства конечных сумм; и мы в дальнейшем увидим, что
такой перенос действительно возможен далеко не во всех случаях.
288 БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ [гл. 18
Если ряд (3) сходится и сумма его равна $, то пишут
$= 4“ 4~ ••• 4~Wn4“ ••• 5
k = 1
если ПРИ я —> ос, то иногда пишут
У, «*=+
k = 1
однако в этом случае, как вытекает из общего определения, данный
ряд расходится и суммы не имеет.
Впрочем, иногда пользуются записью их и* 4“ • • • 4“ 11п 4" • • • или
оо
2 uk и для обозначения самого ряда (3), независимо от того, схо-
k = i
дится или расходится этот ряд. Так, например, говорят, что ряд
оо оо
сходится, а ряд (— l)fe расходится (см. примеры,
k=1 fe=1
разобранные нами выше).
В случае сходимости ряда (3) разность rn = s — sn между его
суммой и его частичной суммой называется остатком данного
ряда; из самого определения сходимости вытекает, что
гп -> 0 (п оо):
остаток гп сходящегося ряда есть величина бесконечно малая при
п-+оо (расходящийся ряд, разумеется, остатков не имеет, так как
не имеет сумм). Так как
5=“Ь м2 4~ • • • 4~ ип 4“ un+i 4~ • • • > sn — и\ 4~ + • • • “h ит
то мы, естественно, ожидаем, что
оо оо
rn = s — s„ = Hn+1+ ... ... = 2 un^k= 2
/?=! / =
Однако это равенство, очевидное в случае конечных сумм, мы не
имеем права переносить без доказательства на бесконечные ряды.
Впрочем, в данном случае доказательство очень просто; положим
г
2 н»+л==0'- (Г=1, 2, ...);
= 1
очевидно, что аг = $л+г— sn\ а так как при г->оо и постоянном п
$л+г->$, то предел величины аге при г—>сю существует и равен
s —5л = гл; но по определению величины аг предел этот есть сумма
§ 67] основные понятия 289
оо
ряда ип+^ таким образом, этот ряд сходится и имеет сумму гп,
k = i
что и надо было доказать. Итак, мы имеем в случае сходимости
ряда (3) для любого п 1
S = S/i + Gp
где
S/I = M1H-W24~ ••• ГП = ип+\ + иП±Ъ + ••• + + •••
По установленному нами определению сходимости ряда (3), схо-
димость эта равносильна требованию, чтобы последовательность ча-
стичных сумм
s2, ... , sni ... (4)
стремилась к некоторому пределу $, который и называется в этом
случае суммой ряда. Вопрос о сходимости и сумме любого ряда (3)
поэтому целиком сводится к вопросу о существовании и величине
предела последовательности (4). Любая задача теории бесконечных
рядов может поэтому быть формулирована в терминах последова-
тельностей и их пределов. Но легко видеть, что эта связь теории
рядов и теории последовательностей вполне взаимна. Пусть нам
дана последовательность (4) произвольных вещественных чисел sn,
положим
«1=5,, ua = sn — sn_t (я>1);
тогда, очевидно,
«1+«8+ ... 4-Hn = s„ (п=1, 2, ...),
и вопрос о существовании и величине предела последовательно-
сти (4) полностью сводится к вопросу о сходимости и сумме
ряда (3).
Этой элементарной связью между последовательностями и беско-
нечными рядами во многих случаях удобно пользоваться для того,
чтобы предложения, доказанные в одной из этих областей, непосред-
ственно, без нового доказательства, переносить в другую область.
В § 19 (теорема 2) мы доказали следующий необходимый и доста-
точный признак существования предела последовательности (4): чтобы
последовательность (4) имела предел, необходимо и достаточно вы-
полнение следующего условия: как бы мало ни было е^>.0, для
всякого достаточно большого п и для любого мы должны
иметь | sn+p— $л|<Се- Но если числа sn представляют собой частич-
ные суммы ряда (3), то, с одной стороны,
р
Sn±p Sп === 4“ ’ Т lln +р == 2 lln+k>
/? = 1
19 А. Я. Хмнчин
290 бесконечные ряды чисел [гл. 18
а с другой — существование предела последовательности (4) равно-
сильно сходимости ряда (3); мы приходим поэтому к следующему
общему необходимому и достаточному признаку сходимости рядов.
Теорема 1. Для сходимости ряда (3) необходимо и доста-
точно выполнение следующего условия: как бы мало ни было е 0
для всякого достаточно большого п и для любого р^>0
I + ип+3 + • • • + Un+p I 6«
Это условие можно образно выразить так, что всякий достаточно
удаленный «кусок» ряда (независимо от длины этого «куска») дол-
жен быть сколь угодно мал по абсолютному значению. В частности,
при р = 1 из этого признака следует, что для всякого сходящегося
ряда (3) мы должны иметь | ип | е при достаточно большом л;
иначе говоря, мы имеем
Следствие. Если ряд (3) сходится, то ип->0 при п-+оо.
В тех примерах расходящихся рядов, которые мы видели до сих
пор, ип не стремилось к нулю при /г—>оо; поэтому может возник-
нуть вопрос о том, не будет ли условие ип -► 0 (п оо), необхо-
димое, как мы только что убедились, для сходимости ряда (3),
вместе с тем и достаточным для этой цели. Легко убедиться, что
это не так. В самом деле, пусть ряд (3) строится так: ^ = 1, затем
следуют два члена (w2 и и3), каждый из которых равен у , затем три
члена, каждый из которых равен и т. д. безгранично. Тогда, с од-
о
ной стороны, очевидно, что «л->0 при n~>oo. С другой же сто-
роны, «кусок» ряда, состоящий из членов величины 1/Л, по построе-
нию имеет k членов, а значит, величина этого куска равна 1. А так
как k сколь угодно велико, то такие «куски» длины 1 будут встре-
чаться в построенном ряду как угодно далеко. Условие теоремы 1
не выполнено, и ряд (3) расходится.
Классический пример ряда того же типа представляет собой
очень поучительный и во многих отношениях важный «гармониче-
ский» ряд
1+4+4+ ••• +4+ •••; (5)
условие ип -> 0 (л —> оо) выполнено; но «кусок» ряда
1
2 4
Л=2*-Н
содержит 2*+1 — 2* = 2* членов, каждый из которых не меньше, чем
последний член, равный ; величина куска поэтому больше, чем
1 _±.
z 2^+1 2 ’
ОСНОВНЫЕ ПОНЯТИЯ
291
§ 67]
а так как такой кусок может быть найден сколь угодно далеко
(число k произвольно велико), то снова условие теоремы 1 оказы-
вается невыполненным, и ряд (5) расходится.
Понятие бесконечного ряда, как и всякое понятие большой общ-
ности, для своего полного развития требует большей конкретизации;
полное содержание его может быть раскрыто лишь тогда, когда мы
перейдем к более или менее специальным, выделяемым с помощью
конкретных признаков классам рядов. В этом же параграфе, где
мы исследуем понятие бесконечного ряда в его полной общности,
нам остается сказать еще совсем немного.
Пусть мы имеем два ряда:
Mi + й2 + • • • + ип + • • • >
••• •••;
тогда ряд
(И1 4- Vi) + (**2 + ^2) + • • • + (Мп + + • • • (6)
можно рассматривать как результат «почленного» сложения двух
данных рядов (т. е. такого сложения, когда каждый член первого
ряда складывается с членом второго ряда, имеющим тот же номер).
Пусть оба данных ряда сходятся. Обозначим их суммы соответственно
через $ и а, а их частичные суммы — через sn и аЛ, так что
sn^s9
(п -> оо).
Тогда, очевидно, сумма п первых членов ряда (6) будет равна sn и
при п -> оо будет стремиться к s —|— а; таким образом, почленное сложе-
ние двух сходящихся рядов всегда дает снова сходящийся ряд, и сумма
нового ряда получается сложением сумм данных рядов. Очевидно,
это правило остается в силе (и доказывается тем же методом) и для
почленного вычитания сходящихся рядов.
Наконец, в наших рассуждениях ничего существенно не изменится,
если мы вместо двух будем иметь любое конечное число сходя-
щихся рядов и составим их почленную алгебраическую сумму с любой
(но, разумеется, одной и той же для всех членов) комбинацией зна-
ков. Ряд, полученный в результате такого почленного алгебраиче-
ского сложения данных рядов, всегда будет сходящимся, и сумма
его будет результатом алгебраического сложения (с той же комби-
нацией знаков) сумм данных рядов. Мы приходим, таким образом,
к следующему предложению:
Теорема 2. Пусть ряды
ОО 00 00
2 «<,*- 2м’'4’ • • • ’ 2
Л = I k = 1 й=1
292 БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ [гл. 18
сходятся и суммы их соответственно равны .. , sm. Тогда
ряд
1 оо
2 •••
fe= 1
(где во всех членах берется одна и та же комбинация знаков)
также сходится, и сумма его равна
... ±Sm.
Эта теорема имеет своим важным следствием тот простой
факт, что, изменяя конечное число членов любого сходящегося ряда,
мы не можем нарушить его сходимости (хотя, конечно, изме-
няем, вообще говоря, его сумму); другими словами, имеет место
следующее
С л е д с т в и е. Если в рядах
+ • • • + ип + ttn+i + • • • (7)
и
Vi + V4 + • • • 4“ Vn + Vn+1 + • • • (8)
мы имеем для некоторого
мп+1 ==<^п+1» Мп+2 ===<^п+а> • • • > М/Ц-£ ===^П+&> • • • ,
и если один из этих рядов сходится, то сходится и другой.
Для доказательства достаточно заметить, что, например, ряд (8)
получается почленным сложением ряда (7) с (очевидно сходящимся;
рядом
(®i—+ —««)+ ••• 4-(®л —«Л-0 + 0+ ...
Разумеется, из доказанного следствия вытекает непосредственно,
что в случае расходимости одного из рядов (7), (8) расходится
и другой.
Другое общее свойство числовых рядов устанавливает следующая
Теорема 3. Если ряд
Mi + + • • • + ип + • • •
сходится и имеет сумму s и если а — любое постоянное число,
то ряд
аи^ —|— аи% —|— •.. —J— аип —J- ...
также сходится и имеет сумму as.
Для доказательства достаточно заметить, что, обозначая соответ-
ственно через sn и ап суммы первых п членов двух написанных
рядов, мы при любом п будем иметь an = asn.
Упражнения к § 67 см. в задачнике Б. П. Демидовича, отдел V,
задачи 1—3, 5, 11—12, 14—15, 21, 23, 24.
ЗНАКОПОСТОЯННЫЕ РЯДЫ
293
§ 68]
§ 68. Знакопостоянные ряды
Как мы уже заметили, для более полного раскрытия содержания
идеи бесконечного ряда мы должны будем теперь сосредоточить
наше внимание на классах рядов, обладающих некоторыми особыми
свойствами, делающими их одновременно наиболее важными и наибо-
лее доступными для исследования. История развития учения о беско-
нечных рядах показала, что важнейший класс такого рода образуют
ряды, все члены которых имеют один и тот же знак. Поэтому мы
в первую очередь займемся такими «знакопостоянными» рядами; ради
определенности мы будем при этом всегда предполагать, что все
члены ряда положительны (точнее — неотрицательны, так как в целях
общности полезно допускать и существование членов, равных нулю).
Очевидно, что ряды с отрицательными (точнее — неположительными)
членами по симметрии будут обладать вполне аналогичными свой-
ствами.
Если все члены ряда
М1 + + * * * + Un + • • • (О
неотрицательны, и если мы попрежнему положим
п
«* = *» (я=1. 2, ...),
k = 1
то мы, очевидно, будем иметь sn+1 для всех т. е. частич-
ные суммы sn образуют неубывающую последовательность. Но в таком
случае при /г—>оо имеются лишь две возможности: либо сумма sn
безгранично возрастает, sn -> -|- оо; либо она остается ограниченной,
и тогда, как мы знаем, она должна стремиться к некоторому пре-
делу $; но соотношение sn-+s (/г~>оо) означает, что ряд (1) схо-
дится и сумма его равна я. Таким образом, для знакопостоянных
рядов необходимым и достаточным условием сходимости служит
ограниченность частичных сумм. В общем случае, когда члены ряда
могут иметь различные знаки, это условие, разумеется, остается
необходимым для сходимости ряда; однако достаточным оно уже не
будет, как показывает рассмотренный нами в § 67 расходящийся
ряд:
1+(-1)+1+(-1)+ ••• -
частичные суммы которого принимают только значения 1 и 0 и, сле-
довательно, ограничены.
Установленное нами условие дает чрезвычайно мощный в практи-
ческом отношении признак сходимости знакопостоянных рядов; для
подавляющего большинства конкретно встречающихся в анализе и его
приложениях рядов сходимость устанавливается прямым или косвен-
ным применением этого признака. Вместе с тем, установленное нами
294
БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ
[гл. 18
условие имеет и большую теоретическую ценность; именно благодаря
ему теория знакопостоянных рядов приобретает особую стройность
и прозрачность и легко может быть развита значительно дальше тео-
рии знакопеременных рядов, где это условие уже не имеет места. Важ-
ное значение этого условия легко понять. Ведь по первоначальному
определению мы, желая решить вопрос о сходимости данного ряда,
должны исследовать величину sn как функцию от л с целью узнать,
стремится ли она к какому-либо пределу при п -> оо; выражение sn
через п часто бывает сложным и не позволяет непосредственно
усмотреть предельного поведения этой величины при п —> оо. Но зато
часто бывает достаточно весьма грубой оценки величины $л, чтобы
убедиться, что при /г—>оэ она остается ограниченной; в случае
знакопостоянного ряда отсюда непосредственно следует, что sn имеет
предел, и данный ряд сходится.
Рассмотрим пример. Пусть требуется узнать, сходится ли ряд
__1_ । । _!____L +-JI—4-
2+1 * 22+ 1 ' 28 + 1 * * ” * 2n + 1 ' ’ ”
Выражение, получаемое нами непосредственно для суммы sn его пер-
вых п членов, сложно и не позволяет сделать никаких заключений
о предельном поведении этой величины. Однако, так как
(*=1,2,
то
при любом л^1. Следовательно, величины sn ограничены и данный
ряд сходится.
Примененный нами при рассмотрении этого примера прием очень
часто позволяет устанавливать сходимость конкретно заданных рядов.
В общем виде он может быть формулирован следующим образом.
Теорема 1. Пусть мы имеем два ряда с неотрицательными
членами:
щ 4* • • • + ип + • • •> (и)
••• +ч.+ •••, ОО
если тогда существуют такое положительное число с и такое
натуральное число п0, что для любого n^nQ
un^cvn,
то из сходимости ряда (v) следует сходимость ряда (и) и, следова-
тельно, наоборот, из расходимости ряда (и) следует расходимость
ряда (v).
Эту теорему часто называют «принципом сравнения
рядов».
§ 68]
ЗНАКОПОСТОЯННЫЕ РЯДЫ
295
Доказательство. В силу следствия теоремы 2 § 67 мы, оче-
видно, можем считать, не ограничивая общности рассуждения, что
неравенство ип cvn имеет место для всех /г. Обозначим соответст-
венно через sn и <зп частичные суммы рядов (и) и (zj); очевидно,
sn^can (л=1, 2, ...); если ряд (zi) сходится, то суммы аЛ ограни-
чены, а следовательно, ограничены и суммы sn, что в свою очередь
влечет за собой сходимость ряда (а). Теорема 1 доказана.
Установленный нами принцип сравнения рядов может быть при-
менен не только к исследованию конкретно задаваемых рядов, но
и к выводу ряда удобных и часто применяющихся более или менее
общих признаков сходимости. Мы переходим теперь к установлению
нескольких таких признаков *).
Признак 1 (Коши). Если существует такое положительное
число г 1, что для всех достаточно больших п
пг—
У/Пп^Г,
то ряд (и) сходится; если же имеются сколь угодно большие п,
для которых
то ряд (и) расходится.
Доказательство. В первом случае для всех достаточно
больших п
и сходимость ряда (w) следует по теореме 1 из сходимости прогрес-
сии гЦ-г2-|- ... . Во втором случае для бесчисленного
множества значений п мы имеем ип 1 и расходимость ряда (w)
вытекает из следствия теоремы 1 § 67.
В частном случае, когда существует предел
п г—
Пт у ип,
П-+СО
доказанный признак легко позволяет установить простое
Следствие. Если для ряда (и) существует lim ип = Z,
_ > п —
то ряд (и) сходится, если Z<^1, и расходится, если Z>1.
В самом деле, если то пусть е^>0 столь мало, что
Z-|-s<l; из к схэ) вытекает, что для всех
достаточно больших п и ряд (а) сходится по признаку 1. Если же
Z^>1, то для всех достаточно больших п и ряд (н) рас-
ходится по признаку 1.
*) Во всем дальнейшем, до конца § 68, все рассматриваемые ряды пред-
полагаются рядами с неотрицательными членами.
296 бесконечные ряды чисел [гл. 18
пг —
В случае, когда lim умл=1, доказанное следствие не позволяет
П -* ОТ
сделать никаких заключений о сходимости ряда (и). Что ряд (и) может
при этом оказаться расходящимся, показывает простой пример ряда
1 + 1 + ... + 1 + ...
Однако при том же условии ряд (и) может, как мы скоро увидим,
оказаться и сходящимся.
Признак 2 (Даламбера). Если существует такое положитель-
ное число г <С I, чгпо для всех достаточно больших п
— ^Г,
ип
то ряд (и) сходится; если же для всех достаточно больших п
иК+1 J
то ряд (а) расходится.
Доказательство.’В первом случае мы имеем для достаточно
большого п
ипГ>
"п+2^ип+1Г^11пг\
и вообще
«n+^«Z (* = 1,2,...);
поэтому сходимость ряда (к) по теореме 1 вытекает из сходимости
прогрессии
«z+«Z + ••• 4-ияг*+ •••
Во втором случае члены ряда (и), начиная с некоторого места, оче-
видно, образуют неубывающую последовательность положительных
чисел; соотношение > 0 (/г _> оо) поэтому невозможно, и ряд (w)
расходится в силу следствия теоремы 1 § 67.
Аналогично признаку 1, признак 2 имеет
Следствие. Если для ряда (и) существует lim ^±1 = Z, то
п->оо ип
ряд (и) сходится, если Z 1, и расходится, если Z^> 1.
Доказательство полностью аналогично доказательству следствия
признака 1 и может быть предоставлено читателю. Как и там, в слу-
чае Z=1 мы непосредственно ничего не можем заключить о сходи-
мости ряда (и).
§ 68]
ЗНАКОПОСТОЯННЫЕ РЯДЫ
297
Пример 1. Рассмотрим ряд
е— 1, как мы легко заключаем
задачнике Б. П. Демидовича,
здесь
1
«лч-1 =(n+l)!= 1
ип 2
п\
1=0; ряд сходится; сумма его равна
из рассмотрений § 39.
Дальнейшие упражнения см. в
отдел V, задачи 28—32.
Рассмотренные нами два признака были, как это видно из их
доказательств, основаны на сравнении данного ряда с некоторой
геометрической прогрессией. Эти два признака могут быть поэтому
с успехом применяемы только к таким рядам, члены которых убывают
быстрее членов некоторой геометрической прогрессии. Но такие ряды
мы должны считать очень «грубо» сходящимися, их члены убывают
очень быстро, а потому и остаток гп такого ряда быстро стремится
к нулю с возрастанием л, т. е. частичная сумма быстро стремится
к своему пределу s, Про такие ряды говорят, что они «быстро
сходятся». Чем быстрее сходится ряд, тем он, конечно, удобнее для
практических расчетов; если, например, уже s4 дает нам величину s
с требуемой данной задачей точностью, то нам достаточно сложить
четыре члена нашего ряда, чтобы достигнуть этой точности; в случае
же медленно сходящегося ряда для достижения той же степени точ-
ности может понадобиться вычисление, например, s100, что будет
представлять собой уже технически сложную вычислительную опе-
рацию. Именно в этом смысле говорят иногда, что очень медлен-
но сходящийся ряд может оказаться «практически расходящимся»:
хотя sn при достаточно большом п будет сколь угодно близким
к s, но для получения требуемой точности п приходится брать
столь большим, что вычисление суммы становится практически не-
выполнимым.
К рядам, сходящимся «медленнее» любой геометрической про-
грессии, наши два признака уже неприменимы. Конкретно это сказы-
вается в том, что предел /, о котором идет речь в обоих следст-
виях, для таких рядов обычно оказывается равным 1. Для таких рядов
приходится искать более тонкие и чувствительные признаки, и этому
было посвящено много усилий, так как к числу таких более медленно
сходящихся принадлежат обширные классы рядов, имеющих очень
большое практическое значение.
Мы начнем с рассмотрения важнейшего класса рядов вида
gs + ••• + + •••* (2)
298
БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ
[гл. 18
где 5 — любое постоянное вещественное число. При s^O ряд (2),
очевидно, расходится, поэтому для нас представляют интерес только
положительные значения s. При s=l мы имеем гармонический ряд,
расходимость которого мы установили в § 67. А так как при
мы имеем:
(л=1, 2, ...),
ns п v ’ 7
то в силу принципа сравнения рядов (теорема 1) из расходимости
гармонического ряда следует расходимость ряда (2) при любом 1.
Нам остается, таким образом, рассмотреть только значения 1.
Покажем теперь, что ряд (2) сходится при любом $>1. Пусть
&^>1—любое натуральное число. Так как при 0<^x^k rfbi, оче-
видно, имеем x~s^k~s, то
k k
f x~sdx^ f krsds = ^;
J J k
л —i ft—i
полагая в этом неравенстве & = 2, 3, ... , п и складывая'между собой
полученные неравенства, мы находим:
п п
21 f 1 1 1
7-с I X dx =------г---7--------------г,
ks J s—1 (s — 1) s — 1
ft == 2 1
так как s^>l. Это показывает, что в случае 1 частичные суммы
ряда (2) ограничены в своей совокупности, что, как мы знаем, доста-
точно для сходимости ряда (2).
Способ, которым мы доказали сходимость ряда (2) при 5^>1,
применяется очень часто; в § 107 (теорема 5) мы дадим ему общее
обоснование. Здесь же заметим, что этот способ позволяет не только
установить сходимость ряда (2), но и дать удобную оценку его
остатка. В самом деле, мы на основании предыдущего имеем при
£>1
• ft+ 1 к
j х~$dx^~^ J x~sdx.
л ft -1
Суммируя эти неравенства по k от п до п-\-г, находим:
П-|-гЧ-1 п + г п 4- г
J x~’dx^ j j х"5 dx,
п k — n п— 1
или, вычисляя интегралы,
____!_______________1 V 1<
(s — 1) (S — 1) (л + г 4- l)s-1 Zj
ft «= Л
1 1
"(S- 1)(л—if1 (s - 1) (л + г)” ’
299
§ 68] ЗНАКОПОСТОЯННЫЕ РЯДЫ
при г —> оо эти неравенства в пределе дают:
(s — 1) п5-' Z ks (s — 1) (п — l)s 1 ‘
k == п
Пример 2. При s = 3 мы имеем:
J_<1 । _J_______i, i I 1
2n2^ n8 । (n+ l)8^ (n-+2)8 ' I)2’
Сходимость ряда (2) не могла быть установлена ни одним из
доказанных нами выше двух признаков. В частности, те пределы
lim lim
п —> оо п -* оо ип
о которых идет речь в вышеуказанных следствиях, для ряда (2) при
любом значении $ равны единице. В самом деле, полагая
Vn~s — Cn (я=1, 2, ...),
мы имеем:
и следовательно (см. пример 5 § 37), при п —► оо
1пс„->0, ся—>1.
С другой стороны,
1
(n+l)s Л I IV5 1 { ч
->1 (л->оо),
ns
каково бы ни было s.
Подобно тому как оба доказанных нами выше признака базиро-
вались на сравнении с геометрической прогрессией, можно построить
более тонкие признаки сходимости, основывающиеся на сравнении
с рядами типа (2). Мы докажем теперь один из таких признаков.
Признак 3 (Раабе). Если существует такое число г1, что
для всех достаточно больших п
п(—
\ип+1
(3)
то ряд
ut + u«+ • • • + нп + • • •
(«)
300
БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ
[гл. 18
сходится-, если же для всех достаточно больших п
<4>
\МЛ+1 /
то ряд (it) расходится.
Доказательство 1. В первом случае обозначим через г'
любое число, заключенное между 1 и г (1<^г'<^г). Очевидно, что
величина
при п _^оо имеет своим пределом производную функции (l-f-*)7*
при х = 0, т. е. число г'; так как f <^г, то мы имеем поэтому для
всех достаточно больших п
п
откуда
Но в таком случае из (3) следует
un+1 1 п \ 1 п) \ П ) 9
или
это показывает, что при достаточно больших п произведение
уменьшается при переходе отлкл-|-1 и, следовательно, остается
ограниченным при п—>оо; иначе говоря, существует такое число
с^>0, что
пг'ип<^с (п=19 2, ...),
или
«п<4 (п=1, 2, ...).
п
оо
Так как то ряд У - т, как мы только что доказали,
пг
п = 1
сходится; в силу принципа сравнения сходится поэтому и ряд (а).
2. Во втором случае из (4) следует
иа+1 п 9
или
лил=^(«4-1)ия+1;
§68]
ЗНАКОПОСТОЯННЫЕ РЯДЫ
301
таким образом, если п достаточно велико (л^л0), то произведение
пип не убывает при переходе от п к л—j— 1; если поэтому мы поло-
жим ло«Ло = с, то при мы будем иметь пип^.с, откуда
с
п
а так как гармонический ряд расходится, то по принципу сравнения
расходится и ряд (и). Признак 3, таким образом, доказан.
В полной аналогии с двумя предшествующими признаками, из
признака 3 вытекает
Следствие. Если для ряда (и) существует предел
lim п(-2*-----1\ = 1,
п-+оо \пп+1 /
то ряд (и) сходится в случае Z^> 1 и расходится в случае Z<4.
Доказательство снова может быть предоставлено читателю. При
Z=1 попрежнему возможна как сходимость, так и расходимость
данного ряда.
Пример 3. Положим при
и„ = а х 2 3 и-1/,
где а — постоянное положительное число. Мы легко находим
откуда
Предел этого выражения при л->оо, очевидно, равен производной
функции ах по х при х = 0, т. е. равен In а. В силу признака 3 ряд (w)
поэтому сходится при а^>е и расходится при а<^е. При а = е
вопрос требует дополнительного исследования.
Легко было бы построить простые примеры рядов, для которых
и признак 3 оказывается слишком трубым. Мы только что встрети-
лись с одним таким рядом (а — е в последнем примере). Как чита-
тель может убедиться самостоятельно, этот признак не позволяет
ничего узнать и о сходимости рядов вида
оо
у
п=2
1
п (In n)s
302. бесконечные Ряды чисел [гл. 18
где 5 — постоянное положительное число. Можно было бы найти
признак еще более тонкий, позволяющий разобраться и в этом во-
просе. В ^лаве 25 мы ознакомимся с признаком совсем нового типа,
основанным на интегральном исчислении и позволяющим легко овла-
деть рядами этого и более сложных видов.
Упражнения см. в задачнике Б. П. Демидовича, отдел V, задачи
42 и 45.
§ 69. Знакопеременные ряды
Мы переходим теперь к изучению рядов, члены которых могут
иметь любые знаки.
Здесь прежде всего выделяется класс так называемых альтер-
нирующих рядов, члены которых попеременно положительны и
отрицательны, так что, например, все члены с нечетными индексами
положительны, а все члены с четными индексами — отрицательны.
Такой ряд часто записывают в виде
М1--М2 4" М3-М4 + • • • + И2£-1 -Uik + • • • > (О
где, разумеется, уже все ип — положительные числа. Альтернирую-
щие ряды очень часто встречаются во всякого рода приложениях;
вместе с тем они представляют и теоретический интерес: сходимость
их часто удается установить с помощью простого признака, который
мы сейчас докажем.
Теорема 1 (Лейбница). Если для любого п^Л имеет место
неравенство иП[Л ^ип и если lim ип = 0,то альтернирующий ряд(1)
П-+СО
сходится.
Таким образом, для альтернирующих рядов стремление ип к нулю
при п-+оо вместе с монотонным убыванием абсолютной величины
члена гарантирует сходимость ряда (в общем случае это, конечно,
не так — вспомним хотя бы гармонический ряд, для которого оба
условия выполнены).
Доказательство. Будем, как обычно, обозначать через $п
частичные суммы ряда (1). Мы имеем для любого k^2
52fc s%k-%= lhk-i 0’
таким образом, последовательность
52> S4> s6> • • • > s№ • • • (2) ?
— неубывающая. Но с другой стороны,
= И1 — (w2 — W3) — (и4 — w5) —... — (w^_2 — и^) — Иы,
откуда
s<ik (А» = 1, 2, ...),
ЗНАКОПЕРЕМЕННЫЕ РЯДЫ
303
§ 69]
так как все вычитаемые в правой части неотрицательны; таким об-
разом, неубывающая последовательность (2) ограничена сверху и,
значит, имеет предел
lim $2Л = $.
fe-+oo
Чтобы убедиться, что к тому же пределу $ стремятся и частичные
суммы с нечетными индексами, достаточно заметить, что
— S4k “I” М2Л+1
и что при k -> оо по доказанному s4fe -> s и по предположению
wa*+i °, откуда
5 °°)>
чем теорема 1 и доказана.
Простейшим типичным примером альтернирующего ряда, часто
встречающимся в приложениях, может служить ряд
>-4+т-т + --+2Л1-^+ <3>
^сходящийся на основании теоремы 1. Если мы заменим все члены
этого ряда их абсолютными значениями, то мы получим расходя-
щийся (гармонический) ряд. Это показывает, что сходимость ряда (3)
обусловлена не столько быстротой убывания его членов (по абсо-
лютному значению), сколько именно альтернирующим (чередующимся)
распределением их знаков.
Вместе с тем ряд (3) показывает, как мы видим, возможность
такого положения вещей, когда некоторый данный ряд сходится,
в то время как ряд, составленный из абсолютных величин его чле-
нов, оказывается расходящимся. Для всей теории знакопеременных
рядов имеет основоположное значение тот факт, что положение,
обратное только что описанному, невозможно: если ряд, составлен-
ный из абсолютных величин членов данного ряда, сходится, то всегда
сходится и данный ряд. Пусть
М1 + м2 + • • • 4" Un + • • • (м)
— ряд, члены которого могут иметь произвольные знаки. Тогда имеет
место
Теорема 2. Если сходите яр яд
I М1 I + I I + * ’ * + I Un I + * • • (I tt [).
то сходится и ряд (и).
Доказательство. Пусть п и k — любые натуральные числа.
Из сходимости ряда (| и [) по теореме 1 § 67 следует, что сумма
I I +1 I+--.+I ^n+k I
304 бесконечные ряды чисел [гл. 18
сколь угодно мала при достаточно большом п и любом k\ а гак
как
I Мл+1 4” мл+2 + • • • + Нл+Л I I м/1+1 1+1 Мл+2 14- • • • +1
то то же самое имеет место и для величины | мл+1 -р ил+2 4” ♦ • •
... 4“ un^k IJ из этого же, по той же теореме 1 § 67, вытекает
сходимость ряда (и). Теорема 2 доказана.
Мы видим, что сходящиеся знакопеременные ряды (м) естественно
разделяются на два типа: такие, для которых ряд (| и |) сходится, и
такие, для которых он расходится. Ряды первого типа называют
абсолютно сходящимися, а ряды второго типа — условно
сходящимися (причина такого наименования скоро выяснится).
Различие между свойствами этих двух типов сходящихся рядов чрез-
вычайно велико и имеет фундаментальное значение для анализа и
большей части его приложений. В основном это различие может
быть охарактеризовано тем, что на абсолютно сходящиеся ряды пе-
реносятся почти все свойства конечных сумм, так что все операции
над такими рядами производятся по тем же правилам, что и над
конечными суммами; напротив, для условно сходящихся рядов целый
ряд простейших свойств конечных сумм, имеющих важное значение
для конкретных расчетов, теряется, вследствие чего практическое
применение таких рядов сильно ограничивается.
Очевидно, что знакопостоянный сходящийся ряд всегда сходится
абсолютно, так что затруднения, о которых мы только что гово-
рили, для такого ряда возникнуть не могут. Все предложения, ко-
торые мы в следующем параграфе установим для абсолютно сходя-
щихся рядов, будут, в частности, иметь место для всех знако-
постоянных рядов.
В заключение этого параграфа приведем еще один часто приме-
няющийся признак сходимости рядов с членами произвольных знаков.
Пусть оц, а2, ..., ал, ... и р2, ..., рл, ...—две последователь-
ности вещественных чисел, обладающие следующими свойствами:
1) числа ал положительны, монотонно убывают (ал+1 Ол) и lim ал =
/I—►ОО
= 0; 2) существует такое постоянное число с, что |ал| = |р1-(-
4~ 4" • • • 4" I <С с для любого п, 1, т. е. ряд чисел Рл имеет
ограниченные частичные суммы. Положим мл==алРл (л=1, 2, ...)
и покажем, что так определенный ряд (и) сходится.
С этой целью мы применим общий признак сходимости (тео-
рема 1 § 67), согласно которому достаточно показать, что при любом
s^>0, достаточно большом п и произвольном /?^>0
I ^п+1 + МЛ+2 + ••• + I < s*
Мы имеем:
Р («, Р) = аа+1 -{- un¥i + • • • + ия+р =
ал-М?л+1 + + • • • +
§69]
ЗНАКОПЕРЕМЕННЫЕ РЯДЫ
305
или, полагая
?1 + ?8+ ••• + ?* = °* (£=1, 2, ...),
Р (Л, р) = ал+1 (ал+1 — ал) + ал+2 (ал+2 — ал+1)
• • • 4“ ал+р (°л+р °п+р-1) == °пал+1 “1“ °л+1 (ап+1 ад ь?) 4-
4“ °п+2 (ап+2 ал+з) 4“ * • • 4- °л+р-1 (ал+р-1 ал+р) 4- °л+рап+р»
пусть п выбрано столь большим, что ал+1 ; тогда в силу нера-
венств | а* К с и а^+1 ал, имеющих место для любого k, послед-
нее равенство дает, каково бы ни было р,
I Р сал+1 4- с (ал+1 — ал+р) 4- сал+р = 2сал+1 < е,
что и доказывает наше утверждение. Мы приходим, таким образом,
к следующему признаку.
Теорема 3 (Дирихле). Пусть ал -> 0 (п -> сю) и при любом
п 1 имеют место неравенства
ап4-1 ап> I Pi 4" 4- • • • 4" I с>
где число с — постоянное. Тогда ряд
а1Р1 4" а2?2 + • • ‘ 4" алРл 4" • • •
сходится.
Выбирая, в частности, Рл = (—1)п-1, мы, как легко видеть, полу-
чаем в точности теорему 1, которая представляет собой, таким обра-
зом, частный случай теоремы 3.
Пример. Мы имеем для любого k
х — sin — ^-х\— 2sin у cos^x.
Суммируя это соотношение по k от 1 до л, находим:
sin (п 4" у) х—'sin 2 х = 2 sin у У cosAjx,
k=i
откуда, предполагая sin у х 0,
* sin (л + 4-)х— sin 4-х
У cos£x=-----------------— ,
k=i 2siny
и следовательно, для любого п 1
|2со8Ах1<г-тт-
ft = l I sin ~4
20 А. Я. Хинчин
306 БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ [ГЛ. 18
Полагая ад = -^-, pn=cos/zx, мы в силу теоремы 3 заключаем, что
ряд
сходится, если число х не кратно 2~; прих = к ряд (4) обращается
в ряд
п ~ 1
сходимость которого доказана нами выше; при х = 2тг ряд (4) обра-
щается в гармонический ряд.
Дальнейшие упражнения к § 69 читатель найдет в задачнике
Б. П. Демидовича, отдел V, задачи 74—77, 85—86, 89, 96.
§ 70. Операции над рядами
1. Важнейшим свойством конечных сумм является перемести-
тельность (коммутативность), т. е. независимость суммы от по-
рядка слагаемых; мы, естественно, должны поэтому поставить вопрос
о том, переносится ли это свойство на бесконечные ряды, т. е. будет
ли произвольная перестановка членов сходящегося ряда сохранять
его сходимость и величину его суммы. Мы теперь убедимся, что этот
вопрос для рядов абсолютно сходящихся и для рядов условно схо-
дящихся решается в прямо противоположном смысле.
Теорема 1. Если ряд
ui + w2 + • • • + ип + • • • (м)
сходится абсолютно и имеет сумму s, то ряд
+ + + + (®)
полученный из него любой перестановкой чисел ип, также абсо-
лютно сходится и имеет ту же сумму s.
Доказательство. Положим
оо
?»= 2 Iй*1’
Л=л + 1
так что рл-> 0 (л-► оо). Пусть е — любое положительное число и
пусть п таково, что рл<^е. Числа ..., ип ряда (и) совпадают
с некоторыми определенными числами ..., vin ряда (if).
§ 70]
ОПЕРАЦИИ НАД РЯДАМИ
307
Пусть тп— наибольший из индексов z2, in. Тогда, очевидно,
сумма
т
’т = 2
k^\
при любом т тп содержит в числе своих членов все числа
uk(l и, кроме того, может содержать еще некоторые числа
uk с индексами k^>n. Поэтому, полагая
п
^uk = sn (я=1,2, ...),
Л=1
мы будем иметь:
’т =«» + ?>
где q — сумма нескольких чисел uk с индексами k^>nf так что
оо
2 l“J = P»<s-
Отсюда
I’m — «1 = К — Sl + M =
оо оо
=| 2 н*1+и^ 2 iH*i+i^i<2e
fe=n4-l k=n+i
при единственном условии, что т достаточно велико. Таким образом,
ряд (г,) сходится и имеет сумму <9. Абсолютная сходимость этого
ряда почти очевидна; в самом деле, сумма
п
2|v*i
Л=1
есть не что иное, как сумма некоторых п членов сходящегося ряда
с неотрицательными членами | их | -|-1 м21 | ип | -(-... и, сле-
довательно, при любом п не превосходит суммы этого ряда, оста-
ваясь, таким образом, ограниченной при п->оо, откуда и вытекает
оо
сходимость ряда | vk |, т. е. абсолютная сходимость ряда (т,)-
/г=1
Переходя теперь к условно сходящимся рядам, мы прежде всего
докажем для них одно вспомогательное предложение, имеющее, впро-
чем, и значительный самостоятельный интерес.
Лемма. Если ряд (и) сходится условно, то его положитель-
ные члены образуют расходящийся ряд (w+) и точно так же его
отрицательные члены образуют расходящийся ряд (иг).
♦
308
БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ
[ГЛ. 18
Доказательство. Будем обозначать соответственно через s%
и Sn суммы тех членов рядов (м+) и (г/~), которые входят в состав
частичной суммы sn ряда (и), так что = Так как ряд (w)
сходится, то при я->оосумма sn стремится к определенному пре-
делу; поэтому равенство показывает, что если одна
какая-либо из сумм и sn имеет предел при п -> оо, то имеет пре-
дел и другая; но в этом случае стремится к определенному пределу
и их разность s^ — $п, равная, очевидно,
I U1 I + I I + • • • + I Un Ь
и следовательно, ряд (w) сходится абсолютно, что стоит в противо-
речии с предпосылками теоремы. Таким образом, ни ни $п не мо-
жет стремиться к пределу при л->оо, т. е. ряды (н+) и (w“) оба
расходятся, что и надо было доказать.
Теорема 2. Если ряд (и) сходится условно, то надлежащей
перестановкой членов его можно сделать как расходящимся, так
и сходящимся, и в последнем случае — имеющим любую наперед
заданную сумму s.
Доказательство. 1. Для получения расходящегося ряда рас-
положим члены ряда (и) следующим образом. Сначала возьмем столько
положительных членов ряда (w), чтобы сумма их превосходила 1
(это возможно в силу только что доказанной леммы). За ними по-
местим первый отрицательный член. Потом снова возьмем столько
следующих положительных членов, чтобы сумма их превосходила 1,
и за ними поместим второй отрицательный член; этот процесс мы
в силу нашей леммы можем продолжать безгранично, причем оче-
видно, что каждый член ряда (и) рано или поздно найдет себе место
в новом ряду. Так как этот ряд по нашему построению будет сколь
угодно далеко содержать «куски» величины 1, то по теореме 1
§ 67 он расходится.
2. Чтобы получить сходящийся ряд с произвольно заданной сум-
мой 5, мы расположим члены ряда (и) следующим образом. Допустим
для определенности, что $^0. Будем тогда брать сначала положи-
тельные члены ряда (и) (в том порядке, как они расположены в этом
ряду) до тех пор, пока сумма их не превзойдет 5, что рано или
поздно непременно наступит в силу доказанной нами леммы. Как
только полученная сумма превзойдет 5, мы начнем прибавлять к ней
отрицательные члены ряда (и) (снова в их естественном порядке) до
тех пор, пока вся сумма не станет меньше, чем 5, что снова рано
или поздно должно наступить по той же причине, что и выше. Как
только это случилось, мы снова начнем прибавлять еще не взятые
положительные члены ряда (к), и т. д. Получаемый таким образом
ряд
4 vt 4-... + vn +... (у)
§ 70] ОПЕРАЦИИ НАД РЯДАМИ 309
будет, очевидно, действительно иметь своими членами все члены
ряда (м), расположенные только в другом порядке. Положим
п
= • (л=1, 2, ...)•
Л=1
Пусть е^>0 произвольно мало. Так как vn-+0 при /г—>оо, то
найдется такое т, что |^л|<Се ПРИ п^т. Рассмотрим какую-либо
сумму ол (л т); если ал и ал_, лежат по разные стороны числа s, то
1°я — «KI0» — °Л-1 I = I I <
Если же ал и ол-1 лежат по одну сторону числа 5, то . по нашему
построению ол лежит к s ближе, чем ал_Р Таким, образом во всех
случаях ал лежит к 5 либо ближе, чем на расстоянии s, либо ближе,
чем предшествующая сумма ал-1. Из этого, очевидно, следует, что,
начиная с некоторого номера, все суммы ал отстоят от s меньше
чем на е; а так как е произвольно мало, то ал->$ (п->оо), что и
надо было доказать.
Мы видим, таким образом, что по отношению к операции пере-
становки членов условно сходящийся ряд представляет собой как
бы сырую, аморфную массу, из которой надлежащим применением
этой операции может быть получен ряд, либо сходящийся и имеющий
любую заданную сумму, либо расходящийся.
Примечание. Рассмотренный нами вопрос о влиянии переста-
новок членов ряда на его сходимость и его сумму возникает, как
это почти очевидно, лишь тогда, если перестановки охватывают бес-
конечное множество членов ряда. В самом деле, если, например, пере-
становке могут подвергаться лишь члены с номерами, не превосхо-
дящими т, то все частичные суммы ряда, начиная с sm, остаются
неизменными; если первоначальный ряд был сходящимся, то и полу-
ченный после перестановки ряд будет поэтому сходиться и иметь
ту же сумму.
2. Другим важным свойством конечных сумм является их распре-
делительность: чтобы перемножить между собой две суммы, надо
помножить каждый член множимого на каждый член множителя и
все полученные произведения сложить между собой. Поэтому важно
знать, имеет ли место этот распределительный закон и для беско-
нечных рядов. На эту задачу можно, впрочем, посмотреть и с другой
точки зрения: в § 67 мы видели, что два (или более) сходящихся
ряда всегда допускают почленное сложение и вычитание; теперь мы,
естественно, ставим вопрос о том, можно ли такие ряды почленно
перемножать.
Теорема 3. Если ряды
Wl+«« + ---4-«« + -- =S (И)
310 БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ [ГЛ. 18
сходятся абсолютно, то ряд, составленный из всех произведений
вида UfVk (Z, k=l> 2, ...), занумерованных в каком угодно по-
рядке, также сходится абсолютно, и сумма его равна $а.
Доказательство. Обозначим через ... за-
нумерованные в каком угодно порядке произведения вида UjVk (i, k =
= 1, 2, ...) и рассмотрим ряд
+ + (|да|)
Пусть Sn(n=l, 2, ...) — частичные суммы этого ряда. Сумма Sn
состоит из членов вида | u-vk |. Среди индексов i и k таких членов,
входящих в сумму Sn, найдется наибольший; обозначим его через т.
Если мы тогда перемножим между собой почленно конечные суммы
Ат — I и1 1 + I I + • • • + I ит b &m = I I 4" I v2 I + • • • + I vm b
то, очевидно, среди членов этого произведения найдутся все члены
I tlivk I суммы Sn. Поэтому
\ АтВт.
п Л т т
Но ряды (и) и (т>) сходятся абсолютно, и следовательно, суммы Ат
и Вт ограничены; последнее неравенство показывает поэтому, что
и частичные суммы Sn ряда (| |) ограничены и что, следовательно,
этот ряд сходится.
Нам остается убедиться, что сумма ряда
+ ®В + • • • + wn + • • • (да)
(сходимость которого вытекает, конечно, из доказанной нами схо-
димости ряда (|t^D) равна 5а. С этой целью заметим, что так как
ряд (w) сходится абсолютно, то для нахождения его суммы мы мо-
жем расположить его члены (т. е. произведения ир*) в любом по-
рядке (теорема 1). Расположим их следующим образом: сначала
возьмем (единственный) член у которого наибольший из индек-
сов равен 1; потом возьмем все члены, у которых наибольший
индекс равен 2 (их будет три: и^, потом — члены,
у которых наибольший индекс равен 3 (их будет пять: w2773,
u9v9, u3vi)> и т. д. Если мы возьмем частичную сумму так
расположенного ряда (w), заканчивающуюся группой членов с наи-
большим индексом т> то эта частичная сумма, очевидно, будет со-
стоять из всех произведений вида utvk (l^i^m, 1 ^k^m), т. е.
будет равна smam, где
sm = М1 4“ м2 + • • • + ит> ат = V1 4" vi 4“ • • • 4~ vm>
а так как при т—>оо мы имеем sm-+s и aw—>□, то выбранная
нами частичная сумма ряда (ш) при т—>оо стремится к sa. А так
как ряд (w) сходится, то предел этой частичной суммы должен
§ 71] БЕСКОНЕЧНЫЕ ПРОИЗВЕДЕНИЯ * 311
совпадать с суммой ряда (w), которая, таким образом, равна $а.
Этим теорема 3 доказана.
Более тонкий анализ, в который мы здесь не можем входить,
показывает, что для возможности почленного перемножения рядов
(«) и (г/) достаточно предположить абсолютную сходимость какого-
нибудь одного из них (и, конечно, хотя бы условную сходимость
другого). В случае же, когда оба ряда сходятся условно, почленное
умножение, вообще говоря, оказывается невозможным. Таким обра-
зом, и в отношении распределительного закона, вообще говоря, только
абсолютно сходящиеся ряды полностью воспроизводят свойства ко-
нечных сумм.
Упражнения см. в задачнике Б. П. Демидовича, отдел V, задачи
116, 119.
§ 71. Бесконечные произведения
Подобно тому как действие сложения может быть применено
к любому числу слагаемых, другое арифметическое действие — умно-
жение— также применяется к сколь угодно большому числу сомно-
жителей. В случае сложения мы, заставляя число слагаемых возра-
стать безгранично и применяя идею предельного перехода, пришли
к понятию суммы бесконечного ряда. Так как свойства умножения
во многом подобны свойствам сложения, то у нас есть все основа-
ния ожидать, что, заставляя число сомножителей безгранично воз-
растать, мы с помощью идеи предельного перехода придем к новым
плодотворным понятиям.
Пусть zi9 г2, ... , zni ... — любая последовательность вещест-
венных чисел. Положим
п
2’122...z„ = JJ^ = z„ (/1=1,2,...)
fe=l
и будем называть числа «частичными произведениями» данной
последовательности. Если существует предел
Иткл = я, (1)
и-*оо
то, по аналогии с бесконечными рядами, естественно понимать это
число те как произведение «всех» чисел zn и писать
оо
л= ДгА = г1г8...гя...
fe=l
Допустим, что все числа zn положительны. Тогда
п
ig*»=
312 БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ [ГЛ. 18
если существует предел (1) и если те 0, то из тел—^те в силу
непрерывности логарифмической функции следует lgwn->lgw, т. е.
п
fe=!
Это означает, что существование положительного предела (1) не-
обходимо влечет за собой сходимость ряда
1g + 1g 4~ • • • + 1g zn + • • • » (2)
причем сумма этого ряда равна 1g те. Обратно, если ряд (2) сходится,
то при п оо величина
п
Sn= J = 1g (*!*»•••*») = 1g
Л = 1
стремится к определенному пределу, а значит, имеет определенный
предел и частичное произведение тел (причем этот предел имеет ло-
гарифм, и, значит, положителен). Мы приходим, таким образом, к
выводу, что для существования отличного от нуля предела (1)
(в случае положительных гл) необходима и достаточна сходи-
мость ряда (2). Этот результат уже позволяет предвидеть, что
в теории бесконечных произведений случай те = 0 должен занимать
особое место.
Пусть теперь числа zk имеют любые знаки (мы допустим только,
что среди них нет равных нулю: если, например, гл = 0, то, оче-
видно, тел = 0 для всех n^k и предельное поведение тел стано-
вится тривиальным). Очевидно, мы имеем:
= (« = 2,3,...).
Пусть предел (1) существует; тогда тел—>те и тел_х —* те при п—>оо
и, следовательно, если те О,
гя-*^ = 1 (я->оо);
подобно тому как л-й член сходящегося ряда должен стремиться
к нулю при /г—>-оо, так и л-й множитель бесконечного произведе-
ния в случае существования отличного от нуля предела те должен
стремиться к единице при п->оо. Мы видим, что и здесь случай
те = 0 занимает особое место; и легко убедиться на примере, что
в случае те = 0 наш вывод, вообще говоря, неверен; для этого до-
статочно выбрать, например,
(«=1, 2, ...);
§ 71]
БЕСКОНЕЧНЫЕ ПРОИЗВЕДЕНИЯ
313
мы имеем кя=^->0 (л—>оо) и в то же время zn всегда равно
1
у и, следовательно, не стремится к единице.
' Мы, таким образом, вторично убеждаемся, что более или менее
полную аналогию сходящимся рядам представляют лишь такие про-
изведения, у которых предел (1) существует и отличен от нуля. Это
убеждение в дальнейшем развитии теории подтверждается все новыми
и новыми фактами. Поэтому оказывается целесообразным принять
следующее определение:
Бесконечное произведение
оо
= (3)
Л=1
называется сходящимся, если предел (1) существует и отличен
от нуля\ если же этот предел либо не существует, либо суще-
ствует, но равен нулю, то бесконечное произведение называется
расходящимся,
В случае, когда бесконечное произведение сходится, предел тс
называют его значением или его величиной; таким образом,
величина сходящегося бесконечного произведения всегда есть число,
отличное от нуля; расходящееся произведение никакой величины
(значения) не имеет.
Как мы видели, л-й член сходящегося произведения стремится
к единице при п —>оо. Отсюда, в частности, следует, что во всяком
сходящемся произведении (3) числа zn, начиная с некоторого п, все
положительны; такое произведение может, следовательно, содержать
лишь конечное число отрицательных множителей; если мы изменим
знак каждого из этих множителей, то все произведение либо изменит
знак, либо останется прежним, словом, претерпит лишь изменение
вполне тривиального характера. Поэтому мы, нисколько не ограни-
чивая этим общности исследования, можем и будем в дальнейшем
считать все zn положительными числами. Далее, так как для схо-
дящихся произведений zn —► 1 (п —► со), то часто оказывается удоб-
ным полагать za = 1 -|~ ип и записывать бесконечное произведение
в виде
оо
П(1+«п); (4)
Л=1
здесь во всех случаях — 1 <С а в случае сходящегося
произведения иЛ—>0 (я—>оо).
Теория бесконечных произведений имеет, конечно, своей первой
задачей установление признаков, по которым можно было бы рас-
познать сходимость или расходимость данного бесконечного произ-
ведения. Как мы знаем, сходимость произведения (.4) равносильна
314 БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ [ГЛ. 18
сходимости ряда
оо
2>g(i+«n); (5)
71=1
эта связь позволяет строить признаки сходимости произведений,
опираясь на известные нам признаки сходимости рядов. В частно-
сти, общий признак сходимости рядов, установленный в § 67, позво-
ляет утверждать, что требование, чтобы при любом е^>0, доста-
точно большом п и любом мы имели:
n+-k
12 <6>
U/i+i
является необходимым и достаточным условием сходимости ряда (5),
а значит, и произведения (4). Так как
«4- k Ti4~fe
2 +«/)=’g{]J С1 +«/)}’
7 = H-P1 7 =71+ 1
то неравенство (6) можно заменить неравенством *)
п 4-л
ITT G+«;)—1 |<Л
, = л + 1
где подобно е, — сколь угодно малое положительное число. Та-
ким образом, для сходимости бесконечного произведения необходимо
и достаточно, чтобы любой достаточно удаленный (и как угодно
длинный) «кусок» его был сколь угодно близок к единице. В этом
смысле мы имеем, следовательно, полную аналогию между произве-
дениями и рядами. Обратим внимание на то, что и здесь мы полу-
чаем эту полную аналогию лишь при том определении сходимости,
которое нами принято выше (т. е. при условии, что произведения,
у которых lim = к = 0, считаются расходящимися).
Полученный нами признак, как и в случае рядов, имеет большое
теоретическое значение, но лишь в редких случаях оказывается при-
менимым к конкретно заданным произведениям. Для получения призна-
ков большой практической действенности мы должны, как и в слу-
чае рядов, перейти от общих концепций к более конкретно опре-
деленным классам бесконечных произведений. В первую очередь
естественно, конечно, поставить вопрос о том, какие произведения
мы должны считать аналогичными знакопостоянным и какие — зна-
копеременным рядам.
*) Число сколь угодно близко к единице тогда и только тогда, если его
логарифм сколь угодно мал.
§ 71]
БЕСКОНЕЧНЫЕ ПРОИЗВЕДЕНИЯ
315
Члены сходящегося ряда стремятся к нулю с возрастанием их
номеров; если ряд знакопостоянный, то это означает, что члены его
либо все положительны, либо все отрицательны; иначе говоря, все
его члены лежат по одну и ту же сторону предельного значения 0.
В случае сходящегося бесконечного произведения члены его имеют
своим предельным значением 1; мы должны поэтому считать анало-
гичными знакопостоянным рядам такие бесконечные произведения,
у которых либо все сомножители больше единицы, либо все они
меньше единицы. Если произведение представлено в виде (4), то
это означает, что числа ип либо все положительны, либо все отри-
цательны. Для бесконечных произведений этого рода мы имеем очень
простой и практически удобный критерий сходимости:
Теорема 1. Если все числа ип имеют один и тот же знак,
то для сходимости произведения (4) необходимо и достаточно,
чтобы сходился ряд
М1 + М2 + • • • + ип + • • • (7)
Доказательство. Прежде всего мы можем допустить, что
при zz —> оо. В самом деле, если это не так, то, как мы
знаем, произведение (4) и ряд (7) оба расходятся, и утверждение тео-
ремы 1 доказано. Теперь рассмотрим в отдельности оба возможных
случая.
1. Пусть (л=1, 2, ...). Так как при х—>0
^=1-|-х + о(х), (8)
то при достаточно большом п
е2 “п 1 -|- ип^е2и”.
Мы можем допустить, что эти неравенства выполняются для всех п,
так как отбрасывание конечного числа членов не может изменить
сходимости ни ряда, ни произведения. Но тогда, полагая
k=l
п
[J(l + «*) = Wn>
k=l
мы имеем:
4 5
e2 n ^кп^е {n=\, 2, ...).
(9)
Если ряд (7) сходится, то сумма sn при п-+оо остается ограничен-
ной, но тогда в силу второго из неравенств (9) ограниченным
остается и тгд; а так как гсд+1^тсд (п^ 1), то произведение (4)
сходится; обратно, если сходится произведение (4), то кл остается
ограниченным при я—>-оо; в силу первого из неравенств (9) огра-
ниченным будет и 8Ц, а следовательно, ряд (7) сходится.
316
БЕСКОНЕЧНЫЕ РЯДЫ ЧИСЕЛ
[ГЛ. 18
2. Пусть нл^0 (/1=1, 2, ...). То же соотношение (8) дает нам
теперь при достаточно большом п
*ип
£
е
и мы снова можем допустить, что эти неравенства выполняются для
всех п, вследствие чего
е n^ttn^e‘i п (и=1, 2, ...)• (Ю)
Если ряд (7) сходится, то sn ограничена при я—>оо (на этот раз
и ограниченность sn означает существование такого положи-
тельного числа А, что sn^> — А при любом п); отсюда, в силу
первого из неравенств (10), кл^е~2Л (п=1, 2, ...); а так как
теперь (л>И), то стремится при п-^оо к некоторому
положительному пределу тг^в~2Л, т. е. произведение (4) сходится.
Обратно, если сходится произведение (4), то %—(л—>оо),
причем, очевидно, (п=1, 2, ...); второе из неравенств (10)
дает поэтому:
1
е2 5\^21птс (n= 1, 2, ...),
т. е. сумма sn остается ограниченной снизу при тг->оо; следова-
тельно, ряд (7) сходится.
Примеры. Из расходимости гармонического ряда вытекает, что
при п-+оо
Из сходимости ряда
вытекает, что оба произведения
(1 +р-)(1 И 22") — Зз)’” (1 п*)
при /г—>оо стремятся к положительным пределам.
Дальнейшие упражнения читатель найдет в задачнике Б. П. Де-
мидовича, отдел V, задачи 403, 413, 419, 420, 425.
ГЛАВА 19
БЕСКОНЕЧНЫЕ РЯДЫ ФУНКЦИЙ
§ 72. Область сходимости функционального ряда
Пусть щ (х), w2 (х), ... , ип (х), ... — последовательность функ-
ций независимой переменной х, определенных в некотором отрезке
(а, Ь). Если мы напишем бесконечный ряд
«1 (*) + «« (х) +... + ип (х) 4-. . . , (1)
то для каждого значения х0 переменной х в отрезке (а, Ь) этот
ряд будет обращаться в числовой ряд
И1(^о) + «2(^о) + --- + “Л(^о) + --- >
который может оказаться сходящимся или расходящимся. Ряд вида (1)
мы называем бесконечным рядом функций или функ-
циональным рядом, определенным на отрезке (а, Ь). Функцио-
нальные ряды являются одним из основных орудий исследования
в математическом анализе, и всю теорию числовых рядов, элементы
которой были изложены в главе 18, мы в рамках математического
анализа можем в известной мере рассматривать как введение в тео-
рию функциональных рядов, к изучению которой мы теперь переходим.
Прежде всего рассмотрим, как должно быть перенесено на функ-
циональные ряды фундаментальное понятие сходимости ряда. Как
мы уже заметили, для каждого числового значения переменной х
в отрезке (а, Ь) функциональный ряд (1) обращается в некоторый
числовой ряд, так что в смысле главы 18 выражение (1) можно
рассматривать как описывающее не один, а целое семейство число-
вых рядов. Вообще говоря, некоторые из этих рядов будут сходя-
щимися, а другие — расходящимися. Поэтому ясно, что на вопрос
«сходится или расходится ряд (1)?» в общем случае мы не можем
дать однозначного ответа и что, следовательно, такая постановка
вопроса не соответствует природе функционального ряда. Правиль-
ным образом вопрос ставится так: для каких значений х в отрезке
(а, Ь) ряд (1) сходится и для каких расходится? Таким образом,
сходимость функционального ряда представляет собой локальное
понятие: она, вообще говоря, имеет место в одних точках отрезка
318 бесконечные ряды функций [гл. 19
(а, Ь) и не имеет места в других. И только в том частном случае,
когда ряд (1) сходится (или расходится) в каждой точке отрезка
(а, Ь), разумно говорить, что он сходится (или расходится) в этом
отрезке.
Точка х отрезка (а, Ь), в которой ряд (1) сходится, называется
точкой сходимости этого ряда; соответственно точка, в кото-
рой ряд (1) расходится, называется точкой расходимости его.
Таким образом, по отношению к каждому функциональному ряду,
определенному на отрезке (а, Ь), точки этого отрезка распадаются
на два множества — совокупность точек сходимости и совокупность
точек расходимости ряда (1). Первое из этих множеств называют
областью сходимости, а второе — областью расходи-
мости этого ряда. В частном случае то или другое из этих мно-
жеств может оказаться и пустым.
Теория функциональных рядов знает случаи, когда области схо-
димости и расходимости ряда представляют собой множества чрез-
вычайно сложного строения, причем это явление иногда имеет место
и для рядов, члены которых являются простыми элементарными
функциями; так обстоит дело, например, для тригонометрических
рядов, с которыми мы ознакомимся в главе 21. Здесь же мы рас-
смотрим только один простой пример.
Ряд
1 +x4-x2 + ... + xrt + ... ,
все члены которого определены на всей числовой прямой
(—оо<^х<^-|- оо), для каждого значения х представляет собой
геометрическую прогрессию; областью сходимости ряда, очевидно,
служит открытый отрезок — 1 <^х<^ 1, область расходимости опре-
деляется неравенством | х|^> 1.
Суммы вида
п
sn{x)== ^uk(x)
k=]
мы, по аналогии со случаем числовых рядов, будем называть ч а-
стичными суммами ряда (1). Если ряд (1) сходится в точке х,
то существует lim sn (х) = s (х). Функции sn (х) определены
л-*оо
в любой точке отрезка (a, Ь), но функция $(х), называемая сум-
мой ряда (1), определена только в точках сходимости этого ряда.
Функцию rn(x) — s(x) — $п(х) мы попрежнему будем называть
остатком данного ряда. Само собой разумеется, что, каково бы
ни было п, функция гл(х) определена только в области сходимости
ряда (1). В каждой точке х этой области мы имеем:
lim rrt(x) = 0.
п—>оо
§ 73]
РАВНОМЕРНАЯ СХОДИМОСТЬ
319
§ 73. Равномерная сходимость
Мы уже заметили, что сходимость функционального ряда
«1 (*) W + - + «п (*) + ••• (О
представляет собой локальное понятие. Когда мы говорим, что такой
ряд сходится в некотором отрезке (a, Ь), то этим мы только утверж-
даем, что он сходится в каждой отдельной точке этого отрезка, и
потому не лишаем понятие сходимости его локальной природы.
Можно, однако, ввести другое понятие сходимости функционального
ряда в отрезке, которое не сводится к сходимости его в отдельных
точках и имеет уже не локальный, а «тотальный» (целостный) харак-
тер. Это понятие имеет фундаментальное значение для теории функ-
циональных рядов и ее приложений, и мы должны теперь рассмот-
реть его со всей тщательностью.
Пусть ряд (1), частичные суммы которого мы будем обозначать
через sn (х), сходится в каждой точке отрезка (а, Ь) и пусть сумма
его равна $(х); остаток ряда rn(x) = s(x)— sn(x) стремится тогда
к нулю при п оо в любой точке х отрезка (а, Ь). Подробно это
означает следующее: для любого е^>0,и любого х (а най-
дется такое натуральное число /г0, что при любом л^/г0
К(х)|<е- (2)
Это натуральное число /г0, т. е. то «место», начиная с которого
выполняется неравенство (2), зависит, очевидно, не только от е, но
и от выбранной точки х отрезка (а, Ь). Так как при разных значе-
ниях х мы получаем из ряда (1) различные числовые ряды, то,
вообще говоря, то место, начиная с которого | гп (х) | уже навсегда
становится меньше, чем е, будет различным для различных таких
рядов. Можно ли выбрать /г0 так, чтобы при любом /г^/г0 нера-
венство (2) выполнялось для всех х в отрезке (а, />)? Если бы зна-
чения х имелись в конечном числе, то дело было бы просто: каж-
дому значению х соответствует определенное значение /г0, так что
и различных л0 мы имели бы лишь конечное число; взяв из этих
значений п0 наибольшее, мы, очевидно, и получили бы такое «место»,
начиная с которого неравенство (2) выполнялось бы для всех (имею-
щихся в конечном числе) значений х. Но отрезок (а, Ь) содержит
не конечное, а бесконечное множество значений х, каждому из них
соответствует свое л0, так что и значений мы имеем бесконечное
множество; а среди бесконечного множества натуральных чисел не
всегда существует наибольшее; мы должны поэтому считаться с воз-
можностью того, что такого п0, начиная с которого неравенство (2)
выполнялось бы в любой точке отрезка (а, Ь\ не существует. Вместе
с тем мы видим и причину возможности этого явления: для каждой
точки х данного отрезка, место, начиная с которого j гп (х) | е,
рано или поздно наступит; но для одних точек оно наступит раньше,
320 бесконечные ряды функций [гл. 19
для других — позже; для одних х ряд (1) будет сходиться быстрее,
для других — медленнее; можно сказать, что сходимость ряда в одних
точках как бы «отстает» от сходимости его в других точках, что
ряд хотя и сходится для всех х(а^х^:Ь), но сходимость его
«неравномерна», быстрее для одних значений х и медленнее для
других.
В свете этой картины становится естественным следующее опре-
деление.
Ряд (1) равномерно сходится в отрезке (а, Ь), если, каково
бы ни было е 4> 0, найдется такое натуральное число nQ, что при
любом п^п0 и для любого х (а^х^Ь) имеет место нера-
венство (2).
Это новое понятие сходимости функционального ряда, очевидно,
не имеет уже локальной природы, т. е. не может быть целиком
сведено к вопросу о сходимости ряда в отдельных точках, а суще-
ственным образом учитывает сравнительную быстроту его сходимости
в различных точках. Прежде всего мы должны рассмотреть вопрос
о существовании рядов, сходящихся неравномерно. Может ли ряд (1),
сходясь в каждой точке отрезка (а, Ь), не быть в этом отрезке
неравномерно сходящимся? Вспомним по этому поводу одну в изве-
стной мере аналогичную проблему, которую мы рассмотрели в § 23:
определив сначала непрерывность функции в отрезке локально как
непрерывность ее в каждой точке этого отрезка, мы позднее опре-
делили понятие равномерной непрерывности, которое представлялось
более узким и не имело уже локального характера; однако потом
оказалось (теорема 5 § 23), что (в закрытом отрезке) всякая непре-
рывная функция вместе с тем и равномерно непрерывна, т. е. что
новое понятие по своему объему не уже первоначального. Анало-
гичное положение вещей сложилось бы и здесь, если бы всякий
ряд (1), сходящийся в каждой точке отрезка (а, Ь), был равномерно
сходящимся в этом отрезке. Однако мы сейчас убедимся, что это
не так.
Положим
(•*) = х> ип (х) = хП — (л > 1)
и рассмотрим ряд (1) в отрезке (0, 1). Мы имеем:
sn (х) = х (х2 — х) 4" • • • + С*” — х”"1) = х”-
Отсюда при 0 х 1
lim sn(x) = limxn = 0,
и—»оо п-юо
в то время как при х—1, $„(!)= 1 (я=1, 2, ...), и значит,
lim sn(l)= 1.
П-* QQ
§ 73]
РАВНОМЕРНАЯ СХОДИМОСТЬ
321
Таким образом, полагая
мы имеем:
$(х) =
(0^х< 1),
(х=1),
sn (х) 5 (х) (0 х 1);
другими словами, ряд (1) сходится в каждой точке отрезка (0, 1),
и сумма его равна s(x).
Убедимся теперь, что эта сходимость неравномерна. Точка
п п,-
V2
для любого натурального п принадлежит, очевидно, отрезку (0, 1);
но
Sn (*^л) == %П = ~2 ’ 5 ==
а потому
(*^л) == S $П С^л) :== 2~ ’ I । === ~2 *
Если е<Су ^например, e= ^j, то, как бы велико ни было п, в от-
резке (0, 1) найдется такая точка хп, в которой
\гп (xn)|>s;
неравенство (2) не может быть поэтому выполнено, как бы велико
ни было /г, для всех точек отрезка (0, 1); но это и означает, что
сходимость нашего ряда в отрезке (0, 1) неравномерна.
Очень важно по возможности наглядно представлять себе кар-
тину происходящего здесь явления. На черт. 47 изображены графики
функций y = sn(x) для п=1, п = 2 и для очень большого значе-
ния п. Какую бы точку х (0^х<^1) мы ни выбрали, мы видим,
что с ростохм п величина $Л(х) убывает, стремясь к нулю; чертеж
показывает, что она ничтожно мала при большом п. Однако, сколь
бы большое п мы ни выбрали, для значений х, очень близких к 1
/например, как мы видели, для х=-— ], $Л(х) будет еще очень
\ V2/
далека от своего предела (т. е. от нуля): на кривой y = sn (х) най-
дутся точки, ординаты которых еще далеки от нуля; и если мы
будем вновь и вновь увеличивать число /г, такие точки всегда най-
дутся (они будут только менять свое место, передвигаясь все правее
и правее). То «отставание» сходимости, о котором мы говорили выше,
здесь наглядно встает перед нашими глазами.
21 А. Я. Хинчип
322
БЕСКОНЕЧНЫЕ РЯДЫ ФУНКЦИЙ
[гл. 1Й
Читатель без труда убедится, что сколь бы мало ни былое^>0,
в отрезке (0, 1—е) данный ряд сходится равномерно. Таким обра-
зом, только поведение членов ряда в ближайшем соседстве точки 1
мешает ему равномерно сходиться в отрезке (0, 1).
Итак, мы видим, что сходимость функционального ряда в отрезке
может быть и неравномерной. Это значит, что введенное нами поня-
тие равномерной сходимости
ряда существенно сужает преж-
нее» построенное на локальной
базе понятие сходимости ряда
в отрезке. В ближайших па-
раграфах мы рассмотрим ряд
важных общих задач, для ре-
шения которых понятие равно-
мерной сходимости имеет, как
мы убедимся, фундаментальное
значение. Здесь же мы оста-
новимся еще только на во-
просе о признаках, позволяю-
щих установить равномерную
сходимость ряда в данном
отрезке.
Прежде всего имеет место
необходимый и достаточный (и
потому теоретически очень ценный) признак равномерной сходи-
мости, аналогичный теореме 1 § 67 для числовых рядов.
Теорема 1. Для того чтобы ряд (1) равномерно сходился
в отрезке (а, Ь), необходимо и достаточно выполнение следующего
условия: сколь бы мало ни было е 0, для всех достаточно
больших п имеет место неравенство
п 4-р
I 2 =l«n+l(^) + «n+2 W + ”‘ + «/l+pWl<6» (3)
Л=л-Н
каковы бы ни были натуральное число р и точка х отрезка (а, Ь).
Доказательство. 1. Если ряд (1) сходится равномерно в от-
резке (a, Ь), то при n^nQ и любом натуральном р
knWK-J’ lrn+p(x)l<Y
а следовательно,
л+р
кл+р (•*) — гп (Х)| = | 2 м*С*0|<е
Л=л-Н
что доказывает необходимость нашего признака.
§ 74] НЕПРЕРЫВНОСТЬ СУММЫ ФУНКЦИОНАЛЬНОГО РЯДА 323
«+р
2. Так как гл(х) = Ит uk(x), то в случае, когда неравен-
ство (3) имеет место для любого натурального числа р и для любой
точки х отрезка (а, Ь), мы имеем:
(а^х^Ь), (4)
и следовательно, из условия теоремы 1 вытекает выполнение нера-
венства (4) для любого е 0 при достаточно большом п\ это озна-
чает, что ряд (1) равномерно сходится в отрезке (а, £); таким обра-
зом, доказана и достаточность признака.
В конкретных случаях для установления равномерной сходимости
рядов чаще всего пользуются следующим простым и очень удобным
для применения достаточным признаком.
Теорема 2 (признак Вейерштрасса). Если существует такой
сходящийся числовой ряд с положительными членами
• • • 4“ ап + • • • > (5)
что
|м„(х)|^Ая (Я=1, 2, а^х^Ь), (6)
то ряд (1) равномерно сходится в отрезке (а, Ь).
Доказательство. Как бы мало ни было е^>0, в силу тео-
ремы 1 § 67 для всех достаточно больших п имеет место нера-
венство
ап+1 4~ ап-1-2 +’•• + е»
каково бы ни было натуральное число р. Но тогда в силу нера-
венств (6) и
р р
I 2 (а^х^ь\
k=l k=l
если п достаточно велико, а р — любое натуральное число. На осно-
вании теоремы 1 мы заключаем, что ряд (1) сходится равномерно
в (а, Ь), и теорема 2 доказана.
Упражнения к § 73 см. в задачнике Б. П. Демидовича, отдел V,
задачи 242, 243, 245, 246, 261, 262, 264, 268, 279, 285, 286.
§ 74. Непрерывность суммы функционального ряда
Одной из руководящих идей при изучении числовых рядов для
нас служил вопрос о том, какие свойства конечных сумм сохраняются
для бесконечных рядов, т. е. в какой мере мы можем обращаться
с рядами как с конечными суммами. Этот же вопрос нас, естественно,
должен интересовать и в теории функциональных рядов.
324
БЕСКОНЕЧНЫЕ РЯДЫ ФУНКЦИЙ
[гл. 19
Мы знаем, что сумма конечного числа непрерывных функций
всегда также есть непрерывная функция — идет ли речь о непре-
рывности в данной точке или в данном отрезке. Сохраняется ли это
свойство конечных сумм для бесконечных рядов? Если все члены
ряда
Kj (X) 4-И2 (X)-j-. + (1)
непрерывны в отрезке (а, Ь) и если ряд (1) сходится в каждой точке
этого отрезка, то можем ли мы утверждать, что и сумма s (х) этого
ряда непрерывна в отрезке (а, Ь)? Мы уже знаем, что это, вообще
говоря, не так. В § 73 мы рассматривали в качестве примера ряд
щ (х) = х, ип (х) = хп — х”"1 (п > 1),
все члены которого непрерывны в отрезке (0, 1), и убедились, что
ряд этот сходится в каждой точке отрезка (0, 1) и что сумма его
равна
S’(x) =
(OsSx<l),
(х= 1),
т. е. представляет собой разрывную функцию. Вспомним, однако,
что мы построили этот пример с целью получения неравномерно
сходящегося ряда и действительно убедились, что сходимость по-
строенного ряда в отрезке (0, 1) неравномерна. У нас, естественно,
возникает мысль, что, может быть, именно эта неравномерность схо-
димости ответственна за разрывность полученной суммы и что это
явление не могло бы возникнуть, если бы мы построили ряд, схо-
дящийся равномерно. Эта догадка находит себе полное подтвержде-
ние: имеет место
Теорема 1. Если все члены ряда (1), равномерно сходящегося
в отрезке (а, Ь), непрерывны в этом отрезке, то и сумма $(х)
ряда (1) непрерывна в отрезке {а, Ь),
Так как непрерывность членов мл(х) ряда (1) полностью равно-
сильна непрерывности частичных сумм $Л(х) этого ряда, то утвер-
ждение теоремы 1 равносильно утверждению, что если все члены
последовательности Sj (х), (х), ... , sn (х), ... , равномерно стре-
мящейся в отрезке (а, Ь) к предельной функции $(х), непрерывны
в этом отрезке, то и функция $(х) непрерывна в этом отрезке.
Примечание. Мы говорим, что последовательность функций
А(4А(4 (х), ...
равномерно сходится к функции /(х) в отрезке (а, Ь), если для
любого е^>0 найдется такой номер л0, что при n^nQ и при
а х b мы будем иметь:
1Л(х)-/(х)|<е.
§ 74] НЕПРЕРЫВНОСТЬ СУММЫ ФУНКЦИОНАЛЬНОГО РЯДА 325
Очевидно, что равномерная сходимость ряда (1) равносильна равно-
мерной сходимости последовательности Sj (х), (х), ... , sn (х), ...
его частичных сумм.
Доказательство. Пусть е— любое положительное число и
а — любая точка отрезка (а, Ь). Так как ряд (1) равномерно схо-
дится в этом отрезке, то при достаточно большом п мы будем
иметь:
| s (х) — (х) К 4 8 (а х ^)- (2)
Закрепим теперь какое-нибудь определенное число п, удовлетво-
ряющее этому неравенству. Так как функция sn (х) непрерывна в точке а,
то существует такое 8 О, что
| «„(*)-*»(«)!< 4 в, (3)
если только |х — а|<^8. Но
s (х) — $ (а) I = I [s (х) — sn (х)] + [s„ (х)—sn (а)] -|- [sn (а)—s (а)] | =&
Sg I $ (х) — s„ (х) 1 +1 sn (x) — sn (а) I 4-1 sn (a) — s (a) |;
в правой части первое и третье слагаемые в силу (2) меньше, чем
4- е, каковы бы ни были точки х и а отрезка (а, Ь); второе же сла-
0
гаемое меньше, чем ~е, в силу (3), если |х — а|<^8. Таким обра-
зом, при этом единственном условии каждое из трех слагаемых
правой части меньше, чем уе, а значит, сумма их меньше, чем е,
и мы находим:
| s (х) — 5 (а) | <^ s,
если |х — а|<^8; так как е^>0 произвольно, то функция $(х)
непрерывна в точке а; а так как a — любая точка отрезка (а, Ь),
то функция $(х) непрерывна в этом отрезке, и теорема 1 до-
казана.
Равномерная сходимость ряда непрерывных функций достаточна,
таким образом, чтобы обеспечить непрерывность суммы этого ряда.
И фактически в большинстве конкретных случаев непрерывность
суммы устанавливается именно этим путем — ссылкою на равномер-
ную сходимость ряда. Однако не лишено интереса замечание, что
иногда и неравномерно сходящийся ряд непрерывных функций может
иметь непрерывную сумму, так что предложение, обратное теореме 1,
было бы неверным. Мы теперь убедимся в этом на примере. Выбе-
рем члены ряда (1) так, чтобы иметь:
s„(x) = xn(l— х") (я=1, 2,...);
326
БЕСКОНЕЧНЫЕ РЯДЫ ФУНКЦИЙ
[гл. 19
для этого, очевидно, достаточно положить
щ (x) = si (х) = х(1 —х),
n„(x) = sn(x) —(x) = x"(l — xn) ——x"-') (n> 1).
Так как при O^x^l
(x)<xn,
to sn (x) -> 0 (я -> оо) при 0 x <4; а так как sn (1) = 0 при любом n,
то и srt(l)->0 (п->оо), так что sn(x) стремится к нулю в любой
точке х отрезка (0, 1). Сумма ряда (1) тождественно равна нулю и,
следовательно, непрерывна. Но, с другой стороны, при х=|/ мы
имеем:
I (•*,) I=== С**)== “4" t
и следовательно, как бы велико ни было п, неравенство
К(*)1О
при е не может иметь места для всех точек х отрезка (0, 1),
так что ряд сходится неравномерно. И здесь интересно вглядеться
в наглядную картину происходящего явления. На черт. 48 показаны
графические изображения функций y = sn(x) при п= 1, zz = 2 и при
очень большом п\ каждая из этих функций имеет (как читатель легко
подсчитает) наибольшее значение , наступающее для функции sn(x)
при х = -^—. Таким образом, при возрастании п этот максимум,
у?
сохраняя неизменной свою высоту, будет передвигаться вправо, при-
ближаясь к точке 1. Поэтому, с одной стороны, как бы близко к 1
мы ни выбрали точку х, при достаточно большом п этот максимум
продвинется правее х, в точке же х функция sn(x) с ростом п будет
уменьшаться, стремясь к нулю; но, с другой стороны, как бы велико
ни было zz, найдется точка (х=1/}/2), где sn (x) = -j, т. е. всегда
найдутся точки, где стремление sn (х) к нулю будет значитель-
но «отставать», и мы не можем найти такого п, при кото-
ром sn(x) стало бы, скажем, меньше чем 1/8 в каждой точке
отрезка (0, 1); этим и вызывается неравномерность сходимости по-
строенного ряда.
Если, таким образом, равномерная сходимость ряда непрерывных
функций, вообще говоря, не является необходимым условием для
непрерывности его суммы, то существует все же очень важный класс
рядов, для непрерывности сумм которых это условие обязательно.
Это — ряды с неотрицательными членами (и вообще — знакопостоян-
§75] ПОЧЛЕННОЕ ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ РЯДОВ 327
ные ряды). В самом деле, пусть ряд (1) имеет в отрезке (а, Ь) не-
прерывную сумму $(х); пусть все ип(х) непрерывны в (а, Ь) и
ип (х) 0 (/г=1, 2, ... ; а х Ь).
Пусть е — любое положительное число; для любой точки х отрезка
(а, Ь) найдется такой индекс п, что rn (х) = s (х)— sn(x)<^£; атак
как функция гп (х), очевидно, непрерывна, то это неравенство, будучи
справедливым в точке х, по лемме § 23 должно оставаться верным
и в некотором отрезке, со-
держащем точку х внутри себя
(или имеющем ее своим кон-
цом, если х = а или х = Ь).
Совокупность всех таких от-
резков, построенных для всех
точек х отрезка (а, Ь), оче-
видно, покрывает этот отре-
зок. По теореме о конечном
покрытии (лемма 2 § 18), су-
ществует такая конечная груп-
па Д.2, ... , Д5 построенных нами отрезков, которая также по-
крывает отрезок (а, Ь). По самому построению покрывающей системы
отрезков, для каждого из отрезков Afe(l^&^s) существует такой
индекс nk) что
для всех точек х отрезка Дл. Но из неотрицательности всех ип(х)
вытекает, что гл(х) может только убывать с ростом п; поэтому,
если мы обозначим через т наибольшее из s чисел nY, ... , ns,
то неравенство
гт(*)<е
будет выполняться уже для всех точек любого из отрезков
и, значит, для всех точек отрезка (а, />). Это же ввиду произ-
вольности s доказывает равномерную сходимость ряда (1) в от-
резке (а, Ь):
Теорема 2. Для ряда (1), члены которого непрерывны и не-
отрицательны в отрезке (а, Ь), равномерная сходимость служит
необходимым и достаточным условием для того, чтобы сумма
ряда также была непрерывной в отрезке (а, Ь).
§ 75. Почленное интегрирование
и дифференцирование рядов
Из элементов интегрального исчисления мы знаем, что сумма
конечного числа функций, интегрируемых в отрезке (а, Ь), также
интегрируема в этом отрезке и интеграл суммы равен сумме инте-
гралов слагаемых. Переносится ли это правило на бесконечные ряды
328
БЕСКОНЕЧНЫЕ РЯДЫ ФУНКЦИЙ
[гл. 19
функций? Если все члены ряда
«1 (*) + «2 (*) + ••• -Г ип (х) .
(1)
интегрируемы в отрезке (а, Ь) и если ряд (1) сходится в каждой
точке этого отрезка, то можно ли утверждать, что и сумма $(х)
этого ряда интегрируема в отрезке (а, Ь) и что
ь ь ь
ь
J s(x) dx— J «1 (х) dx-{- J«2 (x) rfx + - • • + JUn (x) dx -j- • • .?(2)
a a a a
Если равенство (2) имеет место, то мы будем говорить, что ряд (1)
допускает в отрезке (а, Ь) почленную интеграцию. Очевидно, что
в этом случае мы будем иметь, обозначая через $л(х) и гл(х) ча-
стичные суммы и остатки ряда (1),
ь ь ь
lim I sn(x)dx = | s(x)dx, lim i rn(x)dx = 0
n-»OO V v n —» oo J
a a a
и что, обратно, любое из этих двух соотношений влечет за собой
соотношение (2).
Легко убедиться, что почленная интеграция функциональных рядов
возможна далеко не всегда. Мы в дальнейшем будем для простоты
предполагать члены ряда (1) непрерывными в отрезке (а, Ь), так как
даже при этом ограничении все разнообразие возможных здесь явле-
ний развертывается в полной мере. Прежде всего, сумма $(х) ряда (1)
может оказаться неинтегрируемой в отрезке (а, Ь). Рассмотрим сле-
дующий пример (где мы будем сразу определять функции sn(x), так
как по ним, как мы знаем, члены нл(х) ряда (1) определяются
немедленно и однозначно). Положим
п*х (0 х
s„(x)==
график функции у — зп(х) изображен на черт. 49. Для любого х> О
мы имеем, как только -- х, sn (х) = —; поэтому и lim sn (х) — —
п х п-хо х
для любого х^>0. Если же х = 0, то $л(0) = 0 для любого п, а
потому и lim $л(0) = 0. Таким образом, функция $л(х) при любом
г: -»оо
х (O^jx^l) имеет своим пределом величину
(0<х^1),
(х = 0);
§ 75] ПОЧЛЕННОЕ ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ РЯДОВ 329
другими словами, ряд (1) сходится в каждой точке отрезка (О, I),
и сумма его есть функция s(x). Частичные суммы srt(x), а следова-
тельно, и члены ряда ип(х) непрерывны, а значит, интегрируемы
в отрезке (0, 1). Но функция s(x) в этом отрезке не интегрируема.
В самом деле, в противном случае
ввиду неотрицательности функции
s(x) мы имели бы при любом
а (0<а<Ч)
1 I
J 5 (х) dx J s (х) dx =
О а
1
f dx - 1
= — — In — ;
J х а
л
. 1
но при достаточно малом а In -
как угодно велик, и мы приходим к
очевидному противоречию.
С другой стороны, может слу-
читься, что функция $(х) интегри-
Черт. 49.
руема, но ряд в правой части равенства (2) расходится. Выберем
функции sn(x) для следующим образом: пусть $л(х) = 0 при
’2 /п 2\ , ч
х> —, а на отрезке (0, -•) sn(x) изменяется так, как показывает
для 0^х^ 1)
черт. 50. Мы имеем $л(0) = 0 для
любого п\ если же 0<^х^1, то при
2
мы имеем $л(х) = 0, и значит,
lim sn (х) = s (х) = 0 в любой точке х
Л—>ОО
отрезка (0, 1); другими словами, ряд (1)
сходится в каждой точке отрезка (0, 1),
и сумма его тождественно равна нулю;
но с другой стороны, интеграл
1
I sn(x)dx
о
равен площади равнобедренного тре-
угольника на черт. 50 и, следовательно,
равен п; поэтому мы имеем (полагая для общности s, (х) = п1 (х) = 0
п 1
1
J* sn (х) dx — J uk (х) dx = л;
о Jfe=l о
эта сумма безгранично возрастает, следовательно, при /г->оо; ряд
в правой части соотношения (2) расходится.
330 бесконечные ряды функций [гл. 19
Наконец, возможен и такой случай, когда и функция $(х) инте-
грируема, и ряд в правой части (2) сходится, но равенство (2) все
же не имеет места. Чтобы получить пример этого рода, достаточно
в предыдущем примере взять высоту треугольника на черт. 50 равной п
вместо л2, сохранив во всем остальном прежнее определение функ-
ций $д(х). Тогда мы будем иметь попрежнему s(x) = 0 (О^х^ 1),
и следовательно,
1
J s(x)tZx = 0;
о
но теперь
1 п 1
j sn(x)dx= j uk(x)dx=l (п = 2, 3, ...);
о /? = 1 6
правая часть равенства (2) равна единице, а левая равна нулю.
Убедимся теперь, что для равномерно сходящихся рядов все рас-
смотренные нами возможности отпадают и что такие ряды всегда
допускают почленную интеграцию.
Теорема 1. Если все члены ряда (1) непрерывны в отрезке
(а, Ь) и ряд в этом отрезке сходится равномерно, то имеет
место соотношение (2).
Доказательство. Из равномерной сходимости ряда(1) прежде
всего вытекает непрерывность, а следовательно, интегрируемость
его суммы $(х). Далее, сколь бы мало ни было е^>0, при доста-
точно большом п мы имеем:
к„(х)|<е (а^х^Ь).
Поэтому для достаточно больших п
b ь
| j rn (х) | j | гп (х) | dx s (Ь — а);
а а
отсюда
ь
J rn (х) dx -> 0 (я оо),
а
а это, как мы заметили выше, равносильно соотношению (2). Тео-
рема 1, таким образом, доказана.
Равномерная сходимость ряда непрерывных функций, будучи
достаточным условием почленной интегрируемости ряда, не является,
однако, необходимой для этой цели. Мы легко убеждаемся в этом,
вернувшись к рассмотренному в § 74 примеру неравномерно сходя-
щегося ряда
$д(х) = хл—х2л, s(x) = 0 (O^x^l).
§ 75] ПОЧЛЕННОЕ ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ РЯДОВ 331
Здесь
1 1
= — 2^+1’ js(x)dx = o,
°l 0
и следовательно,
1 1
lim I sn(x)dx= I s(x)dx\
J
это соотношение, как мы знаем, равносильно соотношению (2); та-
ким образом, ряд допускает почленную интеграцию, хотя сходимость
его и неравномерна..
Сделаем, наконец, следующее замечание. Если члены ряда (1)
непрерывны, а ряд сходится равномерно в отрезке (а, Ь), то то же
самое, очевидно, имеет место и в любом отрезке (а, х), где а<^
<^х<^Ь. Мы находим поэтому
X оо х
2 ^un{y)dy. (3)
а п = \ а
Члены ряда в правой части этого равенства — функции от х, непре-
рывные в отрезке (а, Ь). Обозначая остаток этого ряда через Rn (х),
мы, очевидно, имеем:
Rn (*) = J [« (.У) — sn (J)] dy — гп (у) dy;
а а
пусть п столь велико, что | гп (.у) | <^е (а^у ^.Ь); тогда для
а^х^Ь
X
|fln(-*0|=sS J \rn(y)\dy^e(x — a)^e(b — a).
а
Это показывает, что ряд (3) сходится равномерно в отрезке (а, Ь).
Мы приходим, таким образом, к следующему предложению, которое
можно рассматривать как обобщение теоремы 1.
Теорема 2. Если все члены ряда (1) непрерывны в отрезке
(а, Ь) и ряд в этом отрезке сходится равномерно, то равномерно
для а^х^Ь имеет место соотношение (3).
Мы обращаемся, наконец, к вопросу о почленном дифференциро-
вании функциональных рядов. Постановка задачи нам теперь уже
ясна. Сумма конечного числа функций, дифференцируемых в неко-
торой точке х, также дифференцируема в этой точке, и производная
суммы равна сумме производных слагаемых. Мы хотим знать, при
каких условиях это правило может быть перенесено на бесконечные
ряды функций.
Пусть ряд (1) сходится в каждой точке отрезка (а, Ь) и пусть
все члены его имеют непрерывные производные в этом отрезке.
332 бесконечные ряды функций [гл. 19
Допустим, что ряд
?г;(х)4-(х)4-... 4-«;(х)4- ... (4)
равномерно сходится в отрезке (а, Ь). Обозначим через $(х) сумму
ряда (1) и через t(x) сумму ряда (4). В силу теоремы к мы имеем
для а^х^Ь:
х со х оо
^t(y)dy = ^u’n(y)dy= [«»(•*) —«»(«)] =
а п=\ а п=1
оо оо
= Е ип(х)— 2 Un(a) = s(x) — s(a).
п = 1 п = 1
Левая часть этого равенства, по известному свойству интеграла,
дифференцируема по х и производная ее равна /(х); отсюда мы
заключаем, что и функция $(х) дифференцируема, и
оо
/ (х) = t (х) = 2 и'п (х) • (а х sg b),
п = 1
т. е. ряд (1) допускает в точке х почленное дифференцирование.
Мы доказали, таким образом, следующее предложение:
Теорема 3. Пусть ряд (1) сходится в каждой точке от-
резка (а, Ь) и пусть сумма его равна s (х) (а х Ь), Если тогда
все члены этого ряда имеют непрерывные производные в отрезке
(а, Ь) и если ряд (4) в этом отрезке сходится равномерно,*то
и функция s (х) имеет непрерывную производную в отрезке (а, Ь), и
оо
У (х) = (*) (а х Ь),
п = 1
т. е. ряд (1) допускает почленное дифференцирование в каждой
точке отрезка (а, Ь).
Таким образом, признаком почленной дифференцируемости ряда (1)
здесь служит равномерная сходимость не самого этого ряда, а
ряда (4), составленного из производных его членов.
Признак, устанавливаемый теоремой 3, как правило, оказывается
очень удобным в применении к конкретно заданным рядам; практи-
чески в большинстве случаев почленная дифференцируемость иссле-
дуемых рядов устанавливается именно на основе этого признака.
Заслуживает быть отмеченным, что дифференцируемость суммы s(x)
данного ряда в теореме 3 не предполагается, а доказывается на
основе предпосылок теоремы.
Упражнения к § 75 читатель найдет в задачнике Б. П. Деми-
довича, отдел V, задачи 294, 295, 287.
ГЛАВА 20
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
§ 76. Область сходимости степенного ряда
Среди обширного многообразия функциональных рядов, изучаемых
в математическом анализе, наиболее простым в теоретическом отно-
шении и вместе с тем наиболее важным для большинства приложе-
ний является класс так называемых степенных рядов, т. е.
рядов вида
аоа2х24“ ••• ~\~апхПЛ~ • ••, (О
где _а0, а19 ... , ап, ... — постоянные вещественные числа; часто,
впрочем, степенным рядом называют и несколько более общее выра-
жение вида
+ —а)4-а2(х —а)2+ ... + ап (х — а)п ... ,
где а — постоянное вещественное число. Как простота, так и важ-
ность этого класса рядов обусловлены в первую очередь тем, что
все частичные суммы sn(x) степенного ряда представляют собой
обыкновенные многочлены; поэтому если ряд (1) сходится, то его
сумма $(х), вообще говоря, являющаяся функцией весьма сложной,
непосредственно получает приближенное выражение в виде много-
члена, причем точность этого приближения может быть сделана как
угодно высокой, если взять многочлен достаточно высокой степени
(т. е. частичную сумму sn(x) с достаточно большим п).
Как и для всякого функционального ряда, мы должны при изу-
чении степенного ряда (1) в первую очередь поставить вопрос о его
области сходимости, т. е. о том, при каких значениях величины х
этот ряд сходится и при каких „расходится. В предыдущей главе мы
заметили, что для некоторых функциональных рядов область сходи-
мости может представлять собой множество очень сложного строе-
ния; теперь мы убедимся, что область сходимости степенного ряда
всегда имеет очень простую форму, что в значительной степени об-
легчает изучение этого класса рядов.
Общая форма области сходимости степенного ряда является про-
стым следствием следующего важнейшего свойства рядов этого класса.
334
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
[гл. 20
Теорема 1. Если ряд (1) сходится при х = а, то он абсо-
лютно сходится при любом значении х, для которого | х j | а |.
Доказательство. Из предположенной нами сходимости ряда
ао + а1а + а2а2+ ••• •••
вытекает, что апап 0 при п оо; из этого же в свою очередь
следует существование такого положительного числа с, что
|алал|<с (л=1, 2, ...).
Пусть теперь | х | | а |. Тогда
Так как правая часть этого неравенства от п не зависит, то левая
часть остается ограниченной при п оо, откуда следует сходимость
знакопостоянного ряда
2 |а^|,
k =0
или, что то же, абсолютная сходимость ряда (1). Теорема доказана.
Геометрическая картина, иллюстрирующая содержание теоремы 1,
состоит в том, что если степенной ряд сходится в некоторой точке а
числовой прямой, то в любой точке, более близкой, чем а, к точке 0,
он будет сходиться абсолютно. Посмотрим теперь, какую форму
должна в свете теоремы 1 принимать область сходимости степен-
ного ряда.
1. Любой степенной ряд (1) сходится при х = 0, так как в этой
точке все члены, кроме первого, — нули. Таким образом, точка х = 0
принадлежит области сходимости любого степенного ряда. Может ли
случиться, что при любом х 0 ряд (1) расходится, т. е. что об-
ласть сходимости его состоит из единственной точки х = 0? Ряд
1+х + 22х24-33х3+ ... -}-ппхп+ ...
показывает, что этот случай возможен; в самом деле, если х 0,
то при /г>щ
| ппхп | = | пх |" 1;
/z-й член ряда ппхп не стремится к нулю при /г->оо и ряд расхо-
дится. Таким образом, область сходимости степенного ряда может
состоять из одной точки х = 0.
§ 76] ОБЛАСТЬ СХОДИМОСТИ СТЕПЕННОГО РЯДА 335
2. Противоположным крайним случаем является тот, когда ряд (1)
сходится при любом х, т. е. когда областью его сходимости является
вся числовая прямая; что этот случай также возможен, показывает ряд
+*+f,+J+••• +5+
так как при п 2 | х | мы имеем
1 1 пп <Ч-2П’
то при любом х члены этого ряда для всех достаточно больших п
по абсолютной величине меньше соответствующих членов сходящейся
геометрической прогрессии, что в силу принципа сравнения рядов и
доказывает сходимость данного ряда.
3. Во всех остальных случаях существуют такие значения х О,
для которых ряд (1) сходится, и такие, для которых он расходится.
Покажем прежде всего, что область сходимости ряда (1) в этом
случае есть ограниченное множество. В самом деле, пусть а — лю-
бая точка расходимости ряда (1); в силу теоремы 1 тогда ряд (1)
должен расходиться при любом х, для которого | х | 4> | а |, и,
значит, любая его точка сходимости должна удовлетворять нера-
венству | х | | а |, что и показывает ограниченность множества то-
чек сходимости.
Обозначим через г (существующую, как мы только что доказали)
верхнюю грань множества точек сходимости ряда (1). Мы утверждаем,
что ряд (1) абсолютно сходится при |х|<у и расходится при
|х|^>г. Второе очевидно по определению числа г. Чтобы доказать
первое, допустим, что | х | г, и положим г — |х| = Х^>0. Так
как г есть верхняя грань множества точек сходимости ряда (1), то
найдется такая точка сходимости у, для которой у^>г— X = | х |.
В силу теоремы 1 точка х есть поэтому точка абсолютной сходи-
мости ряда (1), что мы и хотели доказать.
Таким образом, если область сходимости ряда (1) не сводится
к одной точке х = 0 и не охватывает всю числовую прямую, то
всегда существует такое г^>0, что ряд (1) сходится при | х | г
(т. е. внутри отрезка (— г, -|- г)) и расходится при | х | г (т. е.
вне этого отрезка). Чтобы не исключать двух ранее рассмотренных
случаев, очень удобно условиться считать в первом из них, что
точка 0 есть отрезок (—г, 4“г) ПРИ г = а во втором, что число-
вая прямая — аналогичный отрезок при г = -|-оо. Приняв это со-
глашение, мы можем формулировать полученный нами результат уже
без всяких исключений.
Теорема 2. Для всякого степенного ряда существует такое
число г (0 г 4“ °°)> что Ря& абсолютно сходится при | х ] г
и расходится при | х | г.
336
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
[гл. 20
Число г называют радиусом сходимости, а отрезок (—г,
-|- г) — интервалом сходимости данного ряда. Мы видим, таким
образом, что для степенного ряда областью сходимости всегда слу-
жит некоторый отрезок с серединой в точке 0, причем в частных
случаях этот отрезок может как сводиться к одной точке х = 0,
так и охватывать всю числовую прямую. Должны ли мы считать
этот отрезок закрытым или открытым? Другими словами, сходится
или расходится данный ряд в точках х — r и х = — г? Рассмотре-
ние простых примеров показывает, что на этот вопрос нельзя дать
ответа, который годился бы во всех случаях. Для одних рядов мы
имеем сходимость в обоих концах интервала сходимости, так что
областью сходимости служит закрытый отрезок (—г, г). Для дру-
гих же рядов мы при х — r и х = — г наблюдаем расходимость и
область сходимости имеет форму открытого отрезка (— г, г); нако-
нец, существуют и такие ряды, которые сходятся в одном из двух
концов интервала сходимости и расходятся в другом, так что об-
ластью сходимости служит «полуоткрытый» отрезок (—г, г).
Рассмотрим соответствующие примеры.
Пример 1. Для ряда
у у2 уЗ у/1
l+£ + J2 + J+ ••• ••• (2)
I X |п 1
мы имеем r= 1; в самом деле, при I х | 1 мы имеем: ,
со
а так как ряд сходится, сходится (абсолютно) и ряд (2); если
п = 1
же | х|^> 1, то так как отношение двух соседних членов ряда (2)
х"+1
_л_______i_Vr
х" ~ \ /г+1/
п2
для всех достаточно больших /г, очевидно, больше единицы по абсо-
лютному значению, то члены ряда (2) с некоторого места возрастают
по абсолютной величине и потому не могут стремиться к нулю,
вследствие чего ряд (2) расходится. В концах интервала сходимости,
т. е. при х=1 и х = —1 ряд (2), очевидно, абсолютно сходится.
Пример 2. Ряд
у уЛ
1+у+?+ ... +^+ ... (3)
также имеет радиус сходимости 1; в самом деле, при | х | 1 мы
имеем:
§ 76] ОБЛАСТЬ СХОДИМОСТИ СТЕПЕННОГО РЯДА
337
и сходимость ряда (3) вытекает из сходимости геометрической про-
грессии
14-х + х24- ... (4)
с другой стороны, если бы ряд (3) сходился хотя бы В ОДНОЙ
точке х, для которой | х |^> 1, то по теореме 1 он должен был бы
сходиться и при х=1, что невозможно, так как при х—1 ряд (3)
становится гармоническим рядом. При х = —1 ряд (3) получает вид
и условно сходится, как мы видели в § 69. Таким образом, областью
сходимости ряда (3) служит полуоткрытый отрезок (—1^х<4).
Пример 3. Наконец, мы можем считать известным из курса
элементарной алгебры, что геометрическая прогрессия (4) также
имеет радиус сходимости 1 (сходится при | х | 1 и расходится при
|х|> 1). В обоих концах интервала сходимости ряд (4) расходится,
так как, очевидно, л-й член его не может стремиться к нулю
при /г->оо.
Область сходимости степенного ряда определяется в основном,
как мы видим, знанием одного числа — радиуса сходимости г (когда г
известно, для полного определения области сходимости остается
только исследовать поведение ряда в точках -+-г). Отсюда одной
из основных задач теории степенных рядов становится определение
радиуса сходимости ряда (1) по его «коэффициентам» ап (л=1,
2, ...). Современная наука умеет решать эту задачу в самом общем
случае, но здесь мы рассматривать это общее ее решение не можем.
Мы ограничимся рассмотрением одного частного случая, который
приводит к цели в большинстве практически встречающихся задач.
Теорема 3. Пусть коэффициенты ряда (1) таковы, что
j -> I при
/г ->оо;
тогда
если 0 < / < + оо,
если 1=0,
если 1 = оо.
Доказательство. Пусть 4) I оо; тогда при п оо
I
(5)
при Ряд (О абсолютно сходится в точке х цо
признаку 2 (следствие) § 68. Напротив, при Z|x|^> 1, и
22 А. Я. Хинчин
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
[гл. 20
по тому же признаку ряд | апхп | расходится в точке х; отсюда
п = 1
следует, что r = -j-. В случае Z=0 соотношение (5) показывает, что
при л—>оо и любом х
I ап+1хП+1 I . п-
I “п*П I ’
по тому же признаку, следовательно, ряд сходится при любом х, и
г=-|~о°. Наконец, в случае / = -]-оо мы при любом х Ф 0 имеем:
ряд (1) расходится при любом х^О, и г = 0.
оо
Пример 4. Рассмотрим ряд nsxn, где s — любое постоянное
п = 1
вещественное число. Так как при л->оо
(i+irq! +
ns \ 1 п) ’
то по теореме 3 радиус сходимости нашего ряда при любом $ ра-
вен 1. Со случаями s = 0, —1 и —2 этого класса рядов мы уже
встречались в настоящем параграфе.
оо
Xя
Пример 5. Рассмотрим ряд У . При п^\
п =о
1
(п-Н)! 1 п г ч
, г*0
п\
оо
имеет радиус сходимости оо, т. е. схо-
п = 0
дится при любом значении х.
Дальнейшие упражнения читатель найдет в задачнике Б. П. Де-
мидовича, отдел V, задачи 125, 126, 132.
§ 77. Равномерная сходимость и ее следствия
В предыдущей главе мы видели, какое большое значение для
установления различного рода свойств функциональных рядов имеет
их равномерная сходимость. Теперь, после того как нами установ-
лена общая форма области сходимости степенных рядов, нам есте-
ственно поэтому обратиться к вопросу о равномерности этой схо-
димости.
§ 77] РАВНОМЕРНАЯ СХОДИМОСТЬ И ЕЕ СЛЕДСТВИЯ 839
Можно ли утверждать, что всякий степенной ряд
а0 +<*1*+ • • • Ч~апхП~Ь • •• (О
равномерно сходится хотя бы в открытом отрезке (—г, г),
где г—радиус сходимости ряда? Уже пример геометрической про-
грессии показывает, что такое утверждение было бы в общем слу-
чае неверно. В самом деле, для ряда
1+х4-х2+ ... 4-х" + ... (2)
интервалом сходимости служит открытый отрезок (—1, 4"
остаток ряда
стремится к нулю при л->оо, каково бы ни было х (—1<^х<^4“0;
однако, сколь бы велико ни было я, гя(х)->оо при х->1, а по-
тому, сколь бы велико ни было л, гп (х) будет сколь угодно велико,
если выбрать х достаточно близко к 1; таким образом, сходимость
ряда (2) в открытом отрезке (—1, 4~ О неравномерна.
Однако во всяком отрезке, который вместе со своими концами
лежит внутри интервала сходимости, степенной ряд сходится рав-
номерно, как показывает следующая
Теорема 1. Если ряд (1) имеет радиус сходимости г и
если то ряд (1) равномерно сходится в отрезке
Доказательство. Так как i3 <^г, то ряд (1) абсолютно
сходится в точке х = г', т. е. сходится ряд
оо
2^^
п — 1
но при |х| т3 мы имеем:
\апхп\ |ая| гт (л=1, 2,...),
а потому ряд (1) в силу теоремы 2 § 73 сходится равномерно в
отрезке |х| г', и теорема 1 доказана.
Эта теорема имеет много следствий, очень важных для теории
и приложений степенных рядов. Прежде всего из нее вытекает
Теорема 2. Сумма степенного ряда непрерывна в каждой
внутренней точке интервала сходимости.
В самом деле, каждая внутренняя точка интервала сходимости
может быть окружена отрезком, который вместе со своими кон-
цами лежит внутри интервала сходимости. В таком отрезке ряд
в силу теоремы 1 сходится равномерно, а значит, сумма его не-
прерывна в силу теоремы 1 § 74.
♦
340
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
[гл. 20
Далее, так как равномерно сходящийся ряд непрерывных функ-
ций всегда допускает почленную интеграцию (теорема 1 § 75),
то из теоремы 1 вытекает
Теорема 3. В любой внутренней точке х интервала схо-
димости ряда (1)
X СО X оо
J s{u)du= 2 J* 2
О л = 0 0 п = 0
где s(x) означает сумму ряда (1).
При этом последний ряд равномерно сходится, как мы знаем
(теорема 2 § 75), в любом отрезке, в котором равномерно схо-
дится ряд (1), и, следовательно, в любом отрезке, целиком принад-
лежащем интервалу сходимости ряда (1).
Наконец, основоположное значение для теории и всех прило-
жений степенных рядов имеет следующее предложение, устанавли-
вающее возможность почленного дифференцирования степенного
ряда внутри интервала сходимости:
Теорема 4. Сумма $(х) степенного ряда (1) дифферен-
цируема в любой внутренней точке интервала сходимости
(—G +0 этого ряда\ ряд
2 папхп~1, (3)
71=1
полученный почленным дифференцированием ряда (1), имеет тот
же радиус сходимости г, и сумма этого ряда равна $г(х)(|х|<У).
Доказательство. Пусть числа р и рг удовлетворяют нера-
венствам 0 р р' г. С помощью правила Лопиталя легко убе-
диться *), ЧТО при ПОСТОЯННОМ К (0<^к<^1) и П-ХЭО
Отсюда следует, что при п -> оо
и следовательно, существует такое не зависящее от п число с^>0,
что
n(-yf<c (й==1’ 2» ---х
*) Ср. последний пример § 37.
§ 77] РАВНОМЕРНАЯ СХОДИМОСТЬ И ЕЕ СЛЕДСТВИЯ 341
Установив это, заметим теперь, что
«Ырл-1=7«Ы^1р'п<^1р^
г \ г / г
так как р'<>, то ряд
оо
2ыр,п
п= 1
сходится; но в таком случае последнее неравенство показывает,
что (абсолютно) сходится и ряд (3) при х = р. А так как р может
быть выбрано сколь угодно близко к г, то радиус сходимости 7?
ряда (3) не меньше, чем г. Поэтому теорема 1 показывает, что
ряд (3) равномерно сходится в любом отрезке —р х р, если
0<^р<^г. Но в таком случае общая теорема 3 § 75 позволяет
утверждать, что при —г<^х<^г функция s(x) имеет производ-
ную, равную сумме ряда (3). Чтобы закончить доказательство тео-
ремы 4, нам остается только убедиться, что R = r. Но это выте-
кает из того, что ряд (1), получаемый почленным интегрированием
ряда (3) в пределах от 0 до х, должен по теореме 3 сходиться
при —R<^x<^R; отсюда r^R; а так как раньше мы убедились,
что R^r, то R = r, и теорема 4 доказана.
Эта теорема богата важными и далеко идущими следствиями.
Прежде всего, большое значение имеет тот обнаруживаемый ею
факт, что сумма s(x) степенного ряда внутри интервала сходимости
всегда не только непрерывна, но и дифференцируема. Так как при
этом функция $г (х) оказывается суммой степенного ряда с тем же
интервалом сходимости (—г, -j-r), т0 к этой функции мы можем
снова применить ту же теорему 4. Это убеждает нас в том, что
вторая производная $" (х) функции s (х) существует в каждой вну-
тренней точке отрезка (—г, Ц-r) и является суммой степенного
ряда, получаемого двукратным почленным дифференцированием
ряда (1). Очевидно, что это рассуждение может быть продолжено
сколь угодно далеко и приводит к следующему общему результату:
Теорема 5. Если ряд (1) имеет радиус сходимости г,
то его сумма s (х) имеет в любой внутренней точке от-
резка (—г, 4~г) производные всех порядков, причем функция
s (л)(х) (/1=1, 2,...) является суммой степенного ряда, полу-
чаемого п-кратным почленным дифференцированием ряда (1) и
имеющего тот же радиус сходимости г:
оо
О •.•(*—« +О «***"" (—'•<*< + ')• (4)
k=n
Упражнений к § 77 читатель найдет в задачнике Б. П. Демидо-
вича, отдел V, задачи 191, 192, 196, 200.
342
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
[гл. 20
§ 78. Разложение функций в степенные ряды
До сих пор предметом нашего исследования служил заданный
нам степенной ряд; мы определяли область его сходимости и изу-
чали свойства его суммы. Однако в приложениях мы в большинстве
случаев имеем дело с обратной задачей: нам задается некоторая
функция $(х) и требуется прежде всего узнать, может ли она в
данном отрезке служить суммой некоторого степенного ряда (или,
как говорят, может ли она быть «разложена в степенной ряд»);
если такое разложение возможно, то далее спрашивается, как найти
коэффициенты этого ряда и определить его радиус сходимости.
Этими вопросами мы и займемся в настоящем параграфе.
Прежде всего, теорема 5 § 77 показывает, что о разложении
функции s(x) в степенной ряд может итти речь лишь в том слу-
чае, если эта функция имеет производные всех порядков в каждой
точке данного отрезка’ (который мы можем предположить имеющим
вид (—г, 4“г)> Это, разумеется, делает класс функций,
представляемых степенными рядами, сравнительно узким; но мы
должны все же иметь в виду, что этому требованию в основном
удовлетворяют все элементарные функции и что поэтому практи-
чески оно не является столь уж стеснительным. Допустим, что
функция s (х) удовлетворяет этому требованию, т. е. что 5(х)
существует для любого /г^О ($(0) (х) = $ (х)) и для любого
х(—г<^х<^4"г)- Если s(x) может быть разложена в степенной
ряд
оо
s(x)=^akxk, (1)
/?=о
то, как мы знаем, для функций (х) (л = 0, 1, 2,...) имеет
место соотношение (4) § 77. При х = 0 это соотношение, в част-
ности, дает:
$(л) (0) = л! ап (n = 0, 1, 2, ...),
откуда
ап = -^Г~ (« = 0,1,2,...) (2)
Таким образом, коэффициенты ап степенного ряда, суммой
которого служит функция s(x), однозначно определяются через
эту функцию с помощью формул (2).
Этот результат имеет важное принципиальное и в то же время
большое практическое значение. С принципиальной стороны он
показывает, что для любой функции s(x) может существовать не
более чем один степенной ряд, сумма которого в некотором от-
резке равнялась бы $(х), иначе говоря, что два различных степей-
§ 78] РАЗЛОЖЕНИЕ ФУНКЦИЙ В СТЕПЕННЫЕ РЯДЫ 343
ных ряда, сходящихся в некотором отрезке, всегда имеют в этом
отрезке различные суммы. С практической стороны тот же резуль-
тат позволяет легко и непосредственно вычислять коэффициенты
представляющего функцию s(x) степенного ряда, не требуя для
этой цели ничего, кроме нахождения производных всевозможных
порядков этой функции в точке х=0.
Таким образом, если функция $(х) разлагается в степенной ряд(1),
то этот ряд всегда имеет вид
(3)
л=о
Ряд (3), написанный для данной функции $(х), называют ря-
дом Маклорена этой функции независимо от его области
сходимости и независимо от того, совпадает его сумма с функцией
s(x) или нет. Таким образом, рядом Маклорена обладает всякая
функция, имеющая производные всех порядков при х = 0; разу-
меется, этим еще отнюдь не предрешается вопрос о разложимости
функции s(x) в степенной ряд, так как 1) ряд (3) может оказаться
расходящимся при любом х Ф 0 и 2) в случае, когда он сходится,
его сумма может оказаться функцией, отличной от s(x). Все, что
мы знаем до сих пор, ограничивается тем, что если функция $(х)
вообще разлагается в степенной ряд, то этот ряд должен быть
ее рядом Маклорена.
Однако этот ограниченный результат очень важен. До его по-
лучения мы не имели никакого подхода к задаче о разложении
функции $(х) в степенной ряд, так как о коэффициентах такого
возможного ряда у нас не было никаких сведений; теперь же наша
задача сводится к изучению определенного, конкретно заданного
ряда (3), относительно которого нам надлежит узнать, какова
область его сходимости и совпадает ли в этой области его сумма
с функцией $(х).
Частичные суммы sn(x) ряда Маклорена мы уже встречали
в главе 9, и, в сущности, нас там, как и здесь, интересовала
оценка разности $(х)— sn(x). Однако новая постановка задачи
все же существенно отличается от прежней. В главе 9 мы не имели*
еще бесконечных рядов; нас интересовала в первую очередь оценка
разности $(х)— sn(x) при некотором постоянном п и достаточно
малом х, и с этой целью мы изыскивали различные специальные
формы для величины $(х)— sn (х) = гп (х), которую мы называли
«остаточным членом» формулы Маклорена. Здесь же нас прежде
всего интересует вопрос о сходимости ряда (3) к функции $(х),
т. е. оценка того же остаточного члена гл(х) при данном х и при
п-+оо. Очевидно, что специальные формы остаточного члена,
установленные в главе 9, могут найти себе применение и к этой
новой задаче. Примеры этого мы в большом .числе увидим дальше.
344
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
[гл. 20
Сейчас же нам важно еще раз подчеркнуть, что для решения во-
проса о возможности разложения функции $(х) в степенной ряд
мы не можем довольствоваться не только существованием у этой
функции производных всех порядков, но даже и сходимостью ряда
Маклорена (что было бы значительно проще), но вынуждены иссле-
довать поведение разности
(•*) = «(•*) — [S(°H
s'(Q) r । s»(Q) , I 8<я,(°)
1! Х I" 21 Х
при л->оо. Действительно, может случиться, что ряд Маклорена,
построенный для функции s(x), сходится, но имеет сумму, отлич-
ную от $(х). Чтобы в этом убедиться, вспомним рассмотренную
нами в § 41 функцию
( е'1'*2 (х^О),
TW = i 0 (х = 0),
для которой ф(п)(0) = 0 (л = 0, 1, 2,...). Если функция $(х) раз-
лагается в степенной ряд (1) (который, как мы знаем, совпадает
с ее рядом Маклорена), то функция
s* (х) = $(х)4-а<р(х),
где а — любое постоянное вещественное число, имеет, очевидно,
тот же ряд Маклорена, что и функция $(х); сумма этого ряда, по
предположению, равна s (х) и, значит, отлична от $* (х) (если а 0).
Мы видели выше, что степенной ряд, в который разлагается данная
функция, определяется единственным образом (как ее ряд Макло-
рена); теперь мы видим, что, напротив, один и тот же степен-
ной ряд может служить рядом Маклорена для бесчисленного
множества различных между собою функций. Если сумма ряда
равна одной из функций этого семейства, то для любой другой
функции /(х) того же семейства мы будем иметь такое положение
вещей, когда построенный для нее ряд Маклорена сходится, но
имеет сумму, отличную от /(х).
Вспомним, наконец, что в самом начале настоящей главы мы
упомянули о рядах вида
а0 -f- й! (х — а) + а2 (х — а)9 +... + ап (х — df +..., (4)
где а — постоянное вещественное число; преобразование перемен-
ной х = а-\-у приводит этот ряд к виду простейшего степенного
ряда
оо
п—0
все установленные нами свойства степенных рядов переносятся по-
этому, с соответствующими небольшими изменениями, и на ряды
§78] РАЗЛОЖЕНИЕ ФУНКЦИЙ В СТЕПЕННЫЕ РЯДЫ 345
вида (4). Областью сходимости ряда (4) всегда служит некоторый
(закрытый, открытый или полуоткрытый) отрезок вида (а — г,
(0^г^ + °о). Если $(х) есть сумма ряда (4), то (х) суще-
ствует при любом и любом х(а— и
= (« = 0, 1, 2, ...),
так что ряд (4) служит для функции $(х) рядом Тэйлора:
5(х) = 5(а) + ^(х-а) + ^(х-а)2+... + ^(х-аГ+...
Теперь мы переходим к вопросу о разложении в степенные
ряды некоторых важнейших элементарных функций. Во многих
случаях возможность такого разложения устанавливается с помощью
следующего общего предложения.
Теорема 1. Если существует такое положительное число С,
что
|s(n)(*)|<C (—r^x^r, /г = 0, 1,2, ...),
то функция s (х) разлагается в степенной ряд в отрезке
--Г X г. .
Доказательство. Как мы видели в § 39, остаточный член
ряда Маклорена может быть представлен в виде
гп &=7ЯП)!s(n+1) <6х> (° <6 < О.
Отсюда при —г^х^г
Гп
Но при любом г^>0 мы имеем -^-->0 (п->оо); это непосредст-
венно следует, например, из сходимости ряда
оо
п=0
(пример 5 § 76). Поэтому при —г^х^г
гЛх)-+° (п->оо),
и следовательно,
п—0
что и доказывает теорему 1.
346
СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ
[гл. 20
Для функций s(x) = sinx и s(x) = cosx мы имеем:
|s(n) (х)| < 1 (—сю х + °°, л = 0, 1, 2, ...);
эти функции разлагаются, следовательно, в степенные ряды, схо-
дящиеся на всей числовой прямой.
Для функции s(x) = ex мы имеем в любом отрезке —г^х^г
|$(п) (х)\ = ех ^ег (п = 0, 1, 2, ...),
функция ех разлагается поэтому в степенной ряд при —r^zx^zr,
а следовательно, на всей числовой прямой, так как число г^>0
произвольно.
Коэффициенты рядов Маклорена для функций sinx, cosx и ех
нам известны из § 39, и мы можем прямо написать
Для функции $(х) = -т—мы имеем при х^>—1
> оо (п оо),
и теорема 1 неприменима. Мы знаем, однако, что ряд Маклорена
функции $(х)
1 — х + х2 — х8 .
имеет радиус сходимости 1, и при |х|<4 сумма его равна $(х).
Так как при х^>—1
X
Г du
J 1+а
о
Ш(1 +х),
то в силу теоремы 3 §
77
мы имеем при —1<^х<^1
X СО X со
+*>== 2 <- D-!»"'»=2
О л=0 0 п = 0
у у2 Y*3 у*Л
= г Ж'-...+<-+
радиус сходимости этого ряда (см. пример 4 § 76) равен 1; таким
образом, функция ln(14~-*0 может быть разложена в степенной
§78] РАЗЛОЖЕНИЕ ФУНКЦИЙ В СТЕПЕННЫЕ РЯДЫ 347
ряд лишь в отрезке (—1, -j- 1). Совершенно аналогичным образом
ряд
2<-1)V”
п=»0
с радиусом сходимости 1 посредством интеграции приводит к раз-
ложению
arcta V— V (-1)гах^_х х* х* . п х™*
arctgx— £ 2п+1 ~ 1 3 + 5 ••• + ( ^2л + 1
п=0
также сходящемуся лишь в отрезке (— 1, -|~ 1).
Разложения в степенной ряд функций 1п(1Ц-х) и arctgx по-
лучены нами совершенно сходным путем, и оба сходятся лишь в
отрезке (—1, +0- Между ними есть, однако, одно очень суще-
ственное различие. То, что разложение функции 1п(1 -|-х) не мо-
жет быть продолжено за пределы отрезка (—1, -|~ 1), представ-
ляется естественным, так как при х->—1 функция 1п(1-]~х)->-—оо,
а при х^С—1 1п(1 -(- х) вообще не имеет смысла; напротив,
функция arctgx определена и имеет производные всех порядков на
всей числовой прямой — и тем не менее разложение в ряд Макло-
рена для нее возможно лишь в пределах отрезка (—1, 1).
В заключение рассмотрим вопрос о разложении в степенной ряд
функции s (х) = (1 -|-х)а, где а — любое постоянное вещественное
число. Мы имеем:
s(n) (0) = а(а—1) ... (а —«+ 1),
что дает для коэффициентов ряда Маклорена функции s(x) выра-
жение
<ф-1)...(—-«+.D. (л = 0 ь 2 ...).
Если а — нуль или натуральное число, то все ап, начиная с неко-
торого номера, обращаются в нуль и получаемый ряд Маклорена
просто совпадает с формулой бинома Ньютона. При всех же дру-
гих значениях а коэффициенты ап все отличны от нуля, и мы имеем
дело с бесконечным рядом. Очевидно, мы можем в дальнейшем
ограничиться рассмотрением этого случая.
Так как
то по теореме 3 § 76 радиус сходимости ряда Маклорена функ-
ции $(х) равен 1. Следовательно, вне отрезка (—1, О эта
функция не может быть разложена в степенной ряд. Мы покажем
348
степенные ряды и ряды многочленов [гл. 20
теперь, что внутри этого отрезка такое разложение возможно, т. е.
что при |х| < 1
1 + 2 а(а-1.).^(а-я+1) = (1 + х}а
п = 1
С этой целью мы воспользуемся найденным нами в § 39 выраже-
нием остаточного члена ряда Маклорена в виде
гп w = (1~^П—-s(n+1) m
где 0<^6<Ч. В нашем случае
s(n+1) (х) = а(а — 1) ... (a — л)(1+x)a-rt~1
и, следовательно,
rn (*) =—«(a - 1) • • • (а — «) (1 + =
__ (а_1)(а_2) ... (а-1-в+1)
п\
(1 _А \п
Г+^) •
Так как х^>—1, то 0<Ч—0< 1 -1-0х, вследствие чего
далее в выражении ax (1вх)а-1 от п зависит только 6; но так
как всегда 0<^6<^1, то выражение j ax (1 Ц-6х)а-11 всегда заклю-
чено между положительными числами
|ах|(1 +|х|)а-1 и |ах|(1—|хI)*"1,
не зависимыми от л; поэтому, обозначая через k наибольшее из
этих двух чисел, мы имеем при любом п
|ах(1+6х)а"1|^Л.
Таким образом, мы приходим к оценке
IГ.W|йs|;
в правой части множитель при k представляет собой абсолютную
величину л-го члена ряда Маклорена для функции (1 -f-x)*”1; но
этот ряд, как нами доказано, сходится при любом показателе, если
|х|<1; л-й член этого ряда должен поэтому стремиться к нулю
при л—> оо, и мы находим
г„(а:)->0 (п->оо),
что и надо было доказать.
§ 79]
РЯДЫ МНОГОЧЛЕНОВ
S49
В заключение настоящего параграфа, сопоставим еще раз (в свер-
нутом виде) разложения Маклорена для нескольких важнейших
трансцендентных функций:
(— оо < х 4“ оо).
п = О
sinx== 2^
п «=0
х2П+1
(2«+ 1)!
(---ОО X 4" °°)*
COS X =
п = 0
X™
' (2л)!
(---ОО X < 4" °°)-
„ хп+1
JI л
(—10^1)*).
п =0
Л___
1 2л+1
arctg х =
(— 1 ^х^ 1)*).
п = 0
(14- х)а=14- а (а-~ • ’-^а ~ п +-^- Xя (—1<х<1)*)
п = 1
Эти разложения очень часто встречаются в приложениях, и их
необходимо помнить с такой же твердостью, как таблицу производ-
ных или таблицу примитивных простейших функций.
Упражнения к § 78 читатель найдет в задачнике Б. П. Демидо-
вича, отделУ, задачи 140—143, 149—154, 163, 169, 171, 173, 178,
187, 189.
§ 79. Ряды многочленов
Мы уже говорили, что с практической стороны разложение
функций в степенные ряды имеет одной из своих главных целей
приближенное представление этих функций в виде многочленов.
В самом деле, если какая-либо функция /(х) разлагается в степен-
ной ряд, равномерно сходящийся к /(х) в отрезке (а, Ь), то при
сколь угодно малом е^>0 мы имеем, если п достаточно велико,
где $п(х) — частичные суммы степенного ряда и, следовательно,
многочлены. При этом важно еще отметить, что теория степенных
*) Указываемое здесь поведение ряда в концах интервала сходимости
может быть установлено более детальным исследованием, которое мы
опускаем.
\
350 СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ [гл. 20
рядов позволяет нам не только принципиально установить возмож-
ность приближенной замены многочленами для тех функций, к ко-
торым она применяется, но также и фактически найти эти много-
члены, выражая их коэффициенты через значения функции /(х) и
ее производных при х = 0.
Если, таким образом, разложимость функции в степенной ряд
обеспечивает возможность сколь угодно точного приближения ее
многочленами достаточно высокой степени, то представляет большой
интерес узнать, верно ли обратное предложение. Мы ведь знаем,
что в степенные ряды разлагается лишь сравнительно узкий класс
функций; от такой функции требуется, например, существова-
ние производных всех порядков, и даже это стеснительное усло-
вие оказывается еще недостаточным. Если бы оказалось, что
равномерное приближение многочленами с любой степенью точно-
сти допускают только функции, разлагающиеся в степенные ряды,
то возможности такого приближения были бы поэтому весьма
ограничены.
Условимся говорить, что функция /(х) допускает в отрезке
(а, Ь) равномерное приближение многочленами, если, как бы мало
ни было е 0, существует такой многочлен Р(х), что
|/(х) —Р(х)|<е (а^х^Ь).
Мы уже видели, что функция, разлагающаяся в степенной ряд,
допускает равномерное приближение многочленами в любом отрезке,
целиком лежащем внутри интервала сходимости этого ряда. Но сте-
пенной ряд есть частный случай ряда более общего вида
оо
2 рп^> (о
п = 1
членами которого служат произвольные многочлены Рп (х). Допустим,
что ряд (1) равномерно сходится в отрезке (а, Ь), и обозначим
через /(х) его сумму и через srt(x) его частичные суммы. По опре-
делению равномерной сходимости, для любого е 0 найдется
такое п, что
|/(x) —sn(x)|<e (а^х^ьу,
а так как sn (х) есть сумма конечного числа многочленов и, следо-
вательно,— также многочлен, то это означает, что функция /(х)
допускает в отрезке (а, Ь) равномерное приближение многочленами.
Таким образом, функция, разлагающаяся в некотором отрезке
в равномерно сходящийся ряд многочленов, допускает в этом от-
резке равномерное приближение многочленами. Но легко видеть, что
справедливо и обратное утверждение. В самом деле, пусть функция
/(х) допускает в отрезке (а, Ь) равномерное приближение много-
РЯДЫ МНОГОЧЛЕНОВ
361
§ 79]
членами. Тогда для любого натурального числа п найдется такой
многочлен Qn(x), что
|/(*)-<?я(*)|<| (а^х^Ь). (2)
Положим
Р, (х) = Q, (X), Рп (X) = Qn (X) - (X) (п > 1);
тогда частичными суммами ряда
ОО
2 рп^
п = 1
будут служить многочлены Qn(x) и неравенство (2) показывает, что
этот ряд в отрезке (а, Ь) сходится равномерно и имеет своей сум-
мой функцию /(х).
Таким образом, равномерная приближаемость функции f(x) много-
членами в отрезке (а, Ь) вполне равносильна тому, что функция
/(х) разлагается в этом отрезке в равномерно сходящийся ряд
многочленов. Наша задача состоит в том, чтобы найти, какие функ-
ции допускают такое разложение.
Прежде всего очевидно, что такая функция должна быть непре-
рывной в отрезке (а, Ъ)\ в самом деле, так как все многочлены —
функции непрерывные, то и сумма равномерно сходящегося в от-
резке (а, Ь) ряда многочленов должна быть непрерывной в этом
отрезке (по теореме 1 § 74). Одной из самых фундаментальных
теорем анализа является тот обнаруженный во второй половине
прошлого столетия (немецким математиком Вейерштрассом) факт, что
и, обратно, всякая функция, непрерывная в отрезке (а, Ь), допу-
скает в этом отрезке равномерное приближение многочленами
(или, что то же, разложение в равномерно сходящийся ряд
многочленов). Таким образом, переходя от степенных рядов к более
общему типу рядов многочленов, мы сразу очень значительно рас-
ширяем класс функций, разлагающихся в такие ряды; если мы
раньше должны были требовать от функции существования произ-
водных всех порядков, то теперь у нас нет надобности предполагать
существование даже первой производной.
Теоретическое и прикладное значение теоремы Вейерштрасса
настолько велико, что со времени ее открытия для нее было пред-
ложено много различных доказательств. Доказательства эти можно
разделить на две группы; одни из них используют для установления
теоремы свойства того или другого специального аналитического
аппарата, другие же базируются лишь на соображениях общего
характера. Обе группы чрезвычайно поучительны, так как заложен-
ные в них идеи находят себе применение и во многих других во-
просах анализа. В следующем параграфе мы изложим одно из самых
простых и изящных доказательств первой группы, принадлежащее
академику С. Н. Бернштейну.
< \
352 СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ [гл. 20
§ 80. Теорема Вейерштрасса
Теорема. Функция f(x), непрерывная в отрезке (а, Ь), до-
пускает в этом отрезке равномерное приближение много-
членами.
Доказательство. 1. Для всех доказательств основной тео-
ремы, базирующихся на некотором специальном аналитическом аппа-
рате, характерна необходимость предварительного, нужного для дан-
ной цели установления некоторых свойств этого аппарата. Так и
здесь мы должны начать с доказательства одного вспомогательного
неравенства элементарно-алгебраического характера.
Лемма. Для любого натурального числа п и для любого х
имеет место неравенство *)
2 (А — пх? xk (1 — x)n~k sS
k = 0
Доказательство. Формула бинома Ньютона дает тожде-
ственно относительно г:
п
^С*гк = и+2У; (1)
/? = 0
дифференцируя по г и умножая на г, получаем отсюда:
У kCknzk = nz (1 + г)"-1; (2)
/г = 0
а повторение той же операции дает:
2 &Ск гк = пг(\+ г)"-1 + п (п — 1) г2 (1 + г)""2
k =0
= nz (1 4“ г)п“2 { 1 + г + (л — 1) z}' —
= nz (1 + nz) (1 4- z)n-*', (3)
полагая в соотношениях (1), (2) и (3)
*) Здесь и в дальнейшем при х = 0, & = 0 мы считаем х*=1, и анало-
гично при х=1, k = n полагаем (1 — x)n-fe=l. Числа — биномиальные
коэффициенты в обычном комбинаторном обозначении.
§ 80] ТЕОРЕМА ВЕЙЕРШТРАССА 353
и помножая их на (1—х)п, находим при х 1:
^Скпхк(1—ху-к=1, (4)
6~0
2 Ь <?п хк (1 — х)п~к = пх, (5)
fe = 0
2 k*CnXk (1 —x)n~k = пх(1—х-]-пх), (6)
л = о
а непосредственная проверка показывает, что равенства (4), (5) и (6)
справедливы и при х=1.
Теперь сложим почленно тождества (4), (5) и (6), умножив пред-
варительно первое из них на л2х2, а второе на —2пх. Это дает:
2 (пЧг — 2nxk 4- А2) Ск хк (1 — х)п~к =
k =-0
= л2х2 — 2/г2х2 пх (1 — х 4- пх),
или
2 (£ — пх)* CnXk (1 — x)n~k = пх (1 — х),
/?=0
а так как при любом вещественном х
х(1 —х)^~,
то лемма доказана.
2. Теперь мы переходим к доказательству теоремы, причем сна-
чала допустим, что данный отрезок (а, Ь) есть отрезок (0, 1). Для
каждого натурального числа п положим:
п
2 / ( *-) х* (1 — х)п~к = Вп (х);
k =0
очевидно, Вп (х) представляет собой многочлен степени не выше п *).
Мы теперь убедимся, что при 72->оо равномерно в отрезке (0, 1)
Ba(x)-+f(x).
Обозначим через М верхнюю грань функции |/(х)| в отрезке
(0, 1). Пусть е — любое положительное число так как функция f(x)
*) Эти «многочлены Бернштейна» Вп(х) и составляют собой тот специ-
альный аналитический аппарат, свойства которого используются в излагаемом
доказательстве.
23 А, Я, ^Хинчин
354 СТЕПЕННЫЕ РЯДЫ И РЯДЫ МНОГОЧЛЕНОВ [гл. 20
непрерывна (а следовательно, и равномерно непрерывна) в отрезке
• (0, 1), то существует такое положительное число 8, что при
| X] — х21 3, 0 Xj 1, 0 х,2 1
мы имеем:
I/U|)—/(х4)|<е.
Нашей задачей является оценка разности \Вп(х)—f{x)\ при
При любом х по формуле (4)
п
2 / (X) Ск хк (1 - х)п~к =f (х),
fe=0
что дает возможность записать разность Вп(х)—f(x) в удобном
для требуемой оценки виде
п
Bn(x)-f(x) = \f[~)-f{x)\cknxk^-xy'-k,
k = 0
откуда при 0 х 1
п
|Вл(х)-/(х)|^ 2 (!-*)""*• (7)
fe = 0
Разобьем теперь все числа на две группы:
в группу (А) включим те числа k, для которых
(А)
а в группу (В) — те, для которых
|4-х|>8, (В)
п
соответственно этому в неравенстве (7) распадается на две
/?=-0
суммы, которые мы обозначим соответственно через 2jA и 2jb- В 2]а
мы в силу (А) имеем в каждом члене
и потому
п
Sa^Za6”**0”хУ~к^е 2 С^х"^— х)п-к = е. (8)
*«=0
§ 80] ТЕОРЕМА ВЕЙЕРШТРАССА 355
Но в каждом члене суммы мы имеем:
(k — пх)* > п«89, | / (--— f (х) | 2/И,
а потому,
2в w 2в-nx}i с*х* <1 - х)П_*
2~nxyi (1 - хг~к>
Л = 0
откуда в силу доказанной нами леммы
(9)
Наконец, из (7), (8) и (9) мы получаем:
|в.«-х+L<,+^;
если п столь велико, что п.........<Г е, то отсюда
Z/20
а так как е^>0 произвольно мало, то мы имеем равномерно в от-
резке (0, 1)
В„(х)->/(х) (л->оо),
что и надо было доказать.
3. Распространение теоремы, доказанной для отрезка (0, 1), на
произвольный отрезок (а, Ь) (а<^Ь) не вызывает теперь уже ника-
ких затруднений. Пусть функция /(х) непрерывна в отрезке (а, Ь).
Положим х = а-\-(Ь— а)у, откуда у = , так чт0 У пробе-
гает отрезок (0, 1), когда х пробегает отрезок (а, Ь). Положим
f(x)=f[a-\-(b — d)y]=y(y) (0=^_у^ 1).
Очевидно, функция непрерывна в отрезке (0, 1). Поэтому, как
бы мало ни было е^>0, в силу доказанной теоремы существует
такой многочлен Р(у), что
I ЯР О) — P(j)|<e 1),
или, что то же,
|/w-р(т=^)|
(а х Ь);
356 степенные ряды и ряды многочленов [гл. 20
н0 110 отношению к переменной х, очевидно, представляет
собой многочлен, который мы для краткости обозначим через Q(x),
так что
|/(х)—Q(x)|<^e (a^x^b);
так как число е произвольно мало, то отсюда следует равномерная
приближаемое™ функции f(x) многочленами в отрезке (а, Ь). Этим
основная теорема полностью доказана.
Как мы уже знаем, доказанная теорема равносильна следующему
утверждению: всякая функция /(х), непрерывная в отрезке (а, Ь),
разлагается в ряд многочленов, равномерно сходящийся в этом
отрезке.
ГЛАВА 21
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
v § 81. Коэффициенты Фурье
В этой главе мы рассмотрим элементы теории так называемых
тригонометрических рядов, которые образуют собой класс рядов,
после степенных бесспорно являющихся важнейшими для теории и
многочисленных приложений. Тригонометрическим рядом
называется ряд вида
оо
2 C0S sin zzx)’ (О
П 1
где а0, аъ а2, ..., blt ... —постоянные вещественные числа,
которые называют коэффициентами ряда (1). Мы увидим на
протяжении настоящей главы, что тригонометрические ряды резко
отличаются по своим свойствам от степенных рядов, будучи в неко-
торых отношениях более сложным и громоздким аппаратом для изу-
чения представляемых ими функций, ‘но обладая в других отноше-
ниях и несомненными преимуществами перед степенными рядами.
Вопрос о том, какой из этих двух аппаратов заслуживает предпоч-
тения, не может быть решен в общем виде. Решение его зависит
прежде всего от вида исследуемой функции, а затем и от того,
какие задачи мы ставим себе по отношению к этой функции. Так,
мы знаем, что представление функции степенным рядом требует
существования у этой функции производных всех порядков; между
тем для разложения функции в тригонометрический ряд достаточно,
как мы скоро убедимся, существования и непрерывности одной
только первой производной ♦); таким образом, для тригонометриче-
ских рядов класс охватываемых ими функций значительно шире,
чем для степенных, что представляет собой несомненное преимуще-
ство тригонометрических рядов. С другой стороны, область сходи-
мости степенного ряда имеет, как мы знаем, всегда очень простую
форму: это есть отрезок с центром в точке О. Напротив, область схо-
димости тригонометрического ряда может, вообще говоря, оказаться
*) Причем и это требование не является еще необходимым.
358
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
[гл. 21
множеством очень сложного строения и для своего изучения требует
чрезвычайно тонких методов исследования, которых мы в настоя-
щей книге не сможем даже и коснуться. В отношении этой задачи,
таким образом, степенные ряды имеют явное преимущество перед
тригонометрическими.
Если переменную х мы увеличим или уменьшим на 2тг, то все
члены ряда (1), очевидно, сохранят прежние значения; если ряд схо-
дится, то не изменится, следовательно, и его сумма; таким образом,
сумма ряда (1) всегда есть периодическая функция с периодом 2тг;
если функция /(х) такой периодичностью не обладает, то она может,
следовательно, быть представлена с помощью тригонометрического
ряда лишь на отрезке длины, меньшей, чем 2к. Это ограничение,
впрочем, оказывается несущественным и легко может быть устра-
нено с помощью очень простого приема, как мы увидим дальше.
С другой стороны, эта периодичность членов тригонометрического
ряда позволяет нам, очевидно, при изучении такого ряда ограни-
читься (произвольным) отрезком длины 2тг, за который мы обычно
будем принимать отрезок — тг^х^тг.
Система функций
1, cosx, sinx, cos2x, sin 2х , ..., (2)
лежащая в основании любого ряда вида (1), обладает одним заме-
чательным свойством, которое служит основным стержнем теории
тригонометрических рядов и является источником почти всех пре-
имуществ этого аппарата. Свойство это состоит в том, что любые
две функции системы (2) взаимно ортогональны в любом отрезке
длины 2к. Функции j\ (х) и /2(х) называются взаимно ортого-
нальными в отрезке (a, #), если
ь
f1(x)fi(x)dx = 0.
а
Если мы имеем (конечную или бесконечную) систему функций,
в которой любые две функции взаимно ортогональны в отрезке
(а, ft), то такую систему называют ортогональной системой
в этом отрезке. Чтобы убедиться, что система функций (2) ортого-
нальна в любом отрезке длины 2к, очевидно, достаточно показать, что
J cosmxcosnx dx = 0 (т Ф п; пг, /г = 0, 1, 2, ...),
— тс
тс
J sin тх sin пх dx = 0 (т Ф п\ т, п = 1, 2, ...),
— тс
I cos znx sin nxdx — Q (т — 0, 1, 2, .,,; п — 1, 2, ...);
§ 81]
КОЭФФИЦИЕНТЫ ФУРЬЕ
359
но
cos тх cos пх = у { cos (т -j- я) х cos (т — п) х },
sinтх sinпх = { cos (т — п)х — cos (т-\-п)х\ 9
cos тх sin пх = { sin (п-\-т)х sin (zz — т) х }.
Таким образом, все три написанных интеграла приводятся к инте-
гралам вида
•п:
J cos kx dx, j sin lx dx,
где целое число k отлично от нуля, а целое число I произвольно;
эти же два интеграла обращаются в нуль, как легко показывает
непосредственный подсчет.
Свойство ортогональности систем функций в такой мере делает
их удобным инструментом математического анализа, что функции,
даже гораздо более сложные, чем входящие в систему (2), если
только они образуют ортогональную систему, обычно приносят зна-
чительную пользу. Современная наука знает и использует большое
число таких ортогональных систем, и теория их обычно строится
по образцу теории системы (2) и связанных с ней тригонометри-
ческих рядов.
Чтобы дать первое простое применение доказанной ортогональ-
ности системы (2), мы рассмотрим теперь для тригонометрических
рядов задачу, аналогичную которой мы ранее решили для степенных
рядов: допуская, что функция f(x) разлагается в тригонометри-
ческий ряд (1), найти коэффициенты ak, bk этого ряда.
Допустим, что ряд (1) равномерно сходится в отрезке (—тс, тс)
(а значит, по периодичности и на всей числовой прямой) и что
сумма его равна /(х), так что мы имеехМ
(fl/XOs^x + bk sin£x) (—тс^х^тс). (3)
k = i
Пусть п — любое натуральное число. Умножим все члены ряда (3)
на одну и ту же функцию cos/zx; новый ряд, очевидно, также будет
равномерно сходиться в отрезке (—тс, тс), так как остаток этого
ряда равен rz, (х) cos/zx и по абсолютной величине не превосходит
остатка rk (х) ряда (3); сумма нового ряда, очевидно, равна
/(х)cos/zx, так что мы имеем:
оо
f (х) COS пх = j cos пх -|- 2 (а-cos cos пх "1“ S*n kX C0S ПХ)
k= 1
360 тригонометрические ряды [гл. 21
В силу теоремы 1 § 75 этот ряд можно интегрировать почленно
в отрезке (—тс, тс). Интеграл левой части будет
тс
f /(х) cos nxdx.
Что касается интегралов правой части, то вследствие ортого-
нальности системы (2) все они будут равны нулю, за исключением
одного только интеграла
тс
J ап cos2 пх dx
— тс
того члена ряда, в котором k = n\ таким образом, почленная инте-
грация дает:
тс тс
J /(х) cos пх dx = J ап cos2 пх dx, (4)
— тс — тс
Но cos2 пх = ~ (1 cos 2/zx), откуда
к ТС тс
J ап cos2 пх dx = ап { J dx -|- j j* cos 2/zx dx J = тшп.
— ТС — Тс — тс
Таким образом, равенство (4) дает:
J f (х) cos пх dx = яап,
— тс
откуда
тс
ап = ~ У f (х) cos пх dx (//=1,2,...). (5)
— тс
Совершенно аналогичным образом, умножая все члены ряда (3) на
si 1 пх и почленно интегрируя в отрезке (—к, тс), мы находим:
тс
Ьп = у /(х)sinnxdx (п = 1, 2, ...). (6)
— тс
Наконец, почленная интеграция самого ряда (3) в том же отрезке
дает;
/(х) tZx = 7ra0,
§81] КОЭФФИЦИЕНТЫ ФУРЬЕ 361
откуда
тс
а0 = 1 (7)
— тс •
формулу (7) можно, впрочем, рассматривать как частный случай
формулы (5) при /г = 0; именно для достижения этой общности
постоянный член тригонометрического ряда обычно обозначают через
ране а0-
Формулы (5), (6), (7) полностью решают поставленную задачу,
так как позволяют по данной функции /(х) (сумме тригонометри-
ческого ф ряда) найти коэффициенты ak, bk (при условии, что ряд
сходится равномерно). Как и в случае степенных рядов, мы видим,
что эти коэффициенты выражаются через функцию /(х) однозначно;
следовательно, может существовать только один равномерно схо-
дящийся тригонометрический ряд, сумма которого равна данной
функции f(x). В противоположность случаю степенных рядов, где
выражения коэффициентов требовали существования производных
всех порядков функции f{x), на этот раз мы видим, что формулы
(5), (б) и (7) не требуют от разлагаемой функции ничего сверх тех
ее свойств, которые обусловлены уже самой постановкой задачи;
в самом деле, из равномерной сходимости ряда (3) (которую мы
допустили с самого начала) вытекает непрерывность (а значит, и
интегрируемость) функции /(х) (а значит, и функций /(x)cosnx,
/(x)si.inx); для того же чтобы формулы (5), (6), (7) получили
реальный смысл, ничего, кроме этой интегрируемости, не требуется.
Числа ап, Ьп, определяемые через функцию /(х) по формулам
(5), (6), (7), называются обычно коэффициентами Фурье этой
функции (хотя формулы (5), (6), (7) задолго до Фурье были найдены
Эйлером). Таким образом, для любой функции /(х), непрерывной
в отрезке (—к,' z), мы можем составить с помощью этих формул
весь ряд коэффициентов Фурье а0, а2, ... , Ьи &2, ...; тогда
ряд (1), в котором коэффициентами служат только что определен-
ные нами числа, называется рядом Фурье функции /(х); короче
говоря, всякая непрерывная а отрезке (—к, -к) функция /(х) имеет
ряд Фурье. Однако, как и в случае степенных рядов, мы отсюда
еще ничего не можем заключить о возможности разложения функции
/(х) в тригонометрический ряд. Прежде всего, ряд Фурье, построен-
ный для функции /(х), может для некоторых (или даже всех) зна-
чений х оказаться расходящимся. Далее, если мы даже допустим,
что этот ряд сходится для всех х, то ничего еще не позволяет нам
заключить, что сумма его совпадает с функцией/(х). Таким образом,
вопрос о том, какими свойствами должна обладать функция /(х),
чтобы действительно быть суммой своего ряда Фурье, требует
специального исследования. В данный же момент нам известно
362 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ [гл. 21
только одно: если вообще существует тригонометрический ряд,
равномерно сходящийся к функции /(х) в отрезке (—тс, к), то этим
рядом может быть только ее ряд Фурье.
В нашем курсе мы не можем рассматривать других ортогональных
систем функций, кроме систёмы (2). Интересно все же отметить,
что все сказанное нами о коэффициентах и рядах Фурье, основы-
вается на одном только свойстве ортогональности системы (2) и ни
в какой мере не зависит от специальной природы тригонометри-
ческих функций, входящих в эту систему, а потому может быть
без всяких изменений распространено на любую ортогональную
систему. Если непрерывные функции
<Pi (х), % (х), ... , ср„ (х), ... (8)
образуют ортогональную систему в некотором отрезке • (а, Ь)
и если ряд
оо
'(9)
п — 1
где ап — постоянные вещественные числа, равномерно сходится
в отрезке (a, Ь), то мы подобно предыдущему легко находим:
ь ь
fW<pn(x)dx = an j (x)dx (л=1,2, ...);
a a
допуская ради простоты, что*)
ь
j* фл (x)<Zx= 1 (я = 1, 2, ...),
а
мы находим отсюда:
ь
а„== J/(>)q?n(x)</x (л=1, 2,...). (10)
а
Числа ап, составленные для функции /(х) по формулам (10), на-
зывают коэффициентами Фурье этой функции, а ряд (9) — ее рядом
Фурье (по отношению к ортогональной системе (8)).
*) Систему функций (8), удовлетворяющую этому требованию, называют
нормированной; очевидно, любая система (8) может быть нормирована
умножением входящих в нее функций на некоторые постоянные числа; так,
для системы (2) достаточно умножить первый ее член на , а осталь-
J/ 2тс
ные — на —L_.
У я
§ 82] ПРИБЛИЖЕНИЕ В СРЕДНЕМ 363
Общая теория ортогональных систем представляет собой одну
из важнейших глав математического анализа, имеющую большое
число практических приложений. Ее разработка широко ведется
и в наши дни. Очень многое в этой теории сделано нашими оте-
чественными учеными — Чебышевым и Ляпуновым, а также и рядом
советских математиков (Бари, Колмогоров, Лузин, Меньшов, Стеклов
и др.).
Упражнения к § 81 читатель найдет в задачнике Б. П. Деми-
довича, отдел V, задачи 332, 334, 341—344.
§ 82. Приближение* в среднем
Прежде чем перейти к основному вопросу о сходимости рядов
Фурье,’ Мы покажем теперь, что коэффициентам Фурье данной
функции присуще большое практическое значение совершенно неза-
висимо от того, сходится или расходится ряд (3) § 81. Если этот
ряд сходится в некоторой точке х, то функция f(x) может быть
с любой степенью точности приближенно представлена его частичной
суммой;
п
«я и)=-^- + У («* c°s kx bk s*n kx\
k = 1
представляющей собой так называемый «тригонометрический мно-
гочлен». Вообще тригонометрическим многочленом порядка п назы-
вают сумму вида
п
Тп (X) = 2 (aft cos kx + ?ft sin kx)> (1)
/?= 1
где а*, — постоянные вещественные числа.
Но в главе' 20 мы видели, что независимо от возможности раз-
ложения функции в степенной ряд может быть поставлен вопрос
о ее приближенном выражении в виде многочлена. Подобным же
образом и теперь мы можем, независимо от разложимости функции
/(х) в тригонометрический ряд, поставить вопрос о ее приближен-
ном представлении тригонометрическим многочленом вида (1).
Если порядок п этого тригонометрического многочлена задан
заранее, то, естественно, встает -вопрос о том, как надлежит выбрать
коэффициенты aft, $k многочлена Тл(х), чтобы это приближение
было наилучшим. При этом, если речь идет о приближении функции
/(х) не в одной какой-нибудь точке, а во всем отрезке (—тс, тс),
то необходимо еще определить, что мы хотим понимать под «наи-
лучшим приближением». Разность /(х)—Тп(х), малость кото-
рой (по абсолютному значению) мы, естественно, хотим считать ме-
рой доброкачественности достигнутого приближения, будет иметь
364 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ [гл. 21
различные значения в разных точках отрезка (— тс, тс). Если мы имеем
два различных тригонометрических многочлена Тп(х), то, вообще
говоря, эта разность в одних точках будет меньше для первого из
них, а в других — для второго; и непосредственно не видно, какой
же из этих двух многочленов мы в этом случае должны считать
приближающим функцию f(x) лучше и какой — хуже. Чтобы по-
лучить возможность однозначной оценки сравнительной доброкаче-
ственности приближений, даваемых различными многочленами, мы,
очевидно, должны условиться в каждом отдельном случае изме-
рять, оценивать эту доброкачественность некоторым определенным
числом. Это число может быть выбираемо различным образом,
подобно тому как для измерения температуры могут быть выби-
раемы различные термометры; и здесь, как там, предпочтение тому
или другому способу оценки может быть обосновано не столько
принципиальными мотивами, сколько соображениями практического
удобства.
Подобно тому как близость между двумя точками мы оцениваем
их взаимным расстоянием, так и здесь для оценки близости между
функцией f(x) и тригонометрическим многочленом Тп (х) мы должны
каким-либо разумным образом определить «расстояние» между
ними; чем меньше это расстояние, тем лучшим приближением для
функции /(х) будет служить тригонометрический многочлен Тп(х).
Разумеется, определение такого расстояния должно тем или иным
способом учитывать величину разности /(х) — Тп (х) во всех точках
отрезка (—тс, тс). Таким разумным определением расстояния будет,
например, верхняя грань величины |/(х)—Тп(х)\ в отрезке
(—тс, тс). Другим возможным определением может служить «среднее
значение» той же величины
Jl/(x)-T„(x)|dx (2)
в отрезке (—тс, тс). Однако более удобным оказывается (и в теории
ортогональных систем чаще всего применяется) определение рас-
стояния между /(х) и ТЛ(х) как среднего значения
тс
J [/ (х) - Тп (х)]* dx = р (/, Тп) (3)
— тс
квадрата разности /(х)—ТЛ(х); преимущество этого определения
перед определением (2) — чисто практическое: для расчетов самого
различного рода удобнее иметь дело с квадратом функции, чем
с ее абсолютной величиной.
Во всем дальнейшем мы будем определять расстояние между
функцией /(х) и тригонометрическим многочленом Тп (х) с помощью
формулы (3); таким образом, мы будем говорить, что из двух
§ 82]
ПРИБЛИЖЕНИЕ В СРЕДНЕМ
365
многочленов Trt>1 (х) и Тп(х) первый дает
лучшее приближение, чем второй, если
р(/, ^);
для функции /(х)
наилучшее же приближение среди тригонометрических многочленов
порядка п дает тот многочлен Тп (х),’ для которого расстояние
Р(/, оказывается наименьшим.
После того как это определение принято, мы стоим перед совер-
шенно определенной задачей: найти тот многочлен (1) порядка п,
для которого величина р(/, Тл) получает наименьшее возможное
значение. Но найти многочлен Тп(х) означает—найти его коэффи-
циенты. Очевидно, что величина р (/, Тп) есть функция этих коэф-
фициентов, т. е. функция 2/г4"1 чисел а0, oq, ... , ал, ..., рд,
если многочлен Тп(х) определяется формулой (1). Задача со-
стоит в отыскании таких значений этих 2/г —|— 1 чисел, при ко-
торых величина р (/, Тд) получает наименьшее возможное зна-
чение.
С этой целью мы представим выражение (3) величины р(/, Тд)
в виде
тс тс тс
j>(x)dx-|- J Tn(x)dx-<2 J/(x) Tn(x)dx}. (4)
— TC — TC — TC
Определяя Tn(x) с помощью формулы (1) и обозначая через ад, Ьп
коэффициенты Фурье функции /(х), мы в силу формул (5), (6) и
(7) § 81 находим:
— тс
п
2 ^kak + №k)} •
fe=I
(5)
С другой стороны, учитывая формулы
j* cos2 kx dx = J sin2 kx dx = к
(£=1,2, ...)
и ортогональность системы (2) § 81, мы находим:
J Тп (х) dx = J {-у + 2 (4 cos’kx + PfeSin2 м) dx —
— ТС — тс fe = l
п
=44+ 1(а*+Н- (6)
/?=1
366 тригонометрические ряды [гл. 21
Подставляя найденные нами выражения (5) и (6) в выражение (4)
величины р(/, ГЛ), мы получаем:
тс
Р(/. Тп) = -^ j>(x)dx +
— тс
п
+ | {а”-22а°ао + 2 К<4 - 2ал) + - 2?А)]};
fe=l
замечая же, что
а* —. 2aAaft = (а* — aft)« — al,
мы находим отсюда:
тс п
р(/, '^)=i j’/2(x)rfx-i{4+ 2^+^)}+
— Тс /г = 1
+1 {+ 2 г<«* -- мч} •
fe=]
В правой части этого равенства первые два слагаемых не зависят
от коэффициентов аЛ, многочлена Тд(х); поэтому числа а^,
надлежит выбрать так, чтобы наименьшее возможное значение по-
лучило третье слагаемое, т. е. величина
п
4- 2 [(а; - aky* + (?, - V] };
1
но эта величина, очевидно, обращается в нуль, если выбрать
= (Л = о, 1, ...),
h=bk (6=1,2,...),
и становится положительной при любом другом выборе чисел afe,
Этим наша задача решена. Мы видим, что для получения наилуч-
шего приближения надо при любом п в качестве коэффициентов
многочлена Тп(х) выбирать соответствующие коэффициенты Фурье
функции /(х). При этом мы должны, разумеется, учитывать, что
этот вывод верен лишь при условии, что мы оцениваем расстояние
между функцией /(х) и многочленом Тп (х) с помощью величины (3).
При другом определении расстояния мы получили бы для чисел а^,
другие значения.
Приближения, в которых расстояние между двумя функциями
оценивается как среднее значение квадрата их разности, принято
§ 83] ТЕОРЕМА ДИРИХЛЕ-ЛЯПУНОВА 367
называть приближениями в среднем. Полученный нами результат
может быть поэтому формулирован следующим образом.
Теорема 1. Из всех тригонометрических многочленов по-
рядка п наилучшее приближение в среднем при непрерывной
функции f(x) дает многочлен
Тп (*) = -у- + 2 coskx + si,i kx^’
где ak, bk — коэффициенты Фурье функции f(x). При этом
Тс п
р(/. Тп) = ^ 2(4 + ^)}. (7)
— Тс k= 1
Равенство (7) имеет одно интересное следствие. Так как, оче-
видно, р(/, 7\)^0, то при любом п
п тс
4+ 2(4+^^1
k = l — тс
правая часть этого неравенства от п не зависит; следовательно,
частичные суммы ряда
оо
4+2(а*+^
k=]
при /г—>оо остаются ограниченными; а так как этот ряд — знако-
постоянный, то он необходимо сходится. Таким образом, квадраты
коэффициентов Фурье непрерывной функции всегда образуют
сходящийся ряд. В частности, отсюда вытекает, что для непрерывной
функции мы при п-^оо всегда имеем:
ап 0. Ьп -> 0.
§ 83. Теорема Дирихле-Ляпунова о замкнутости
тригонометрической системы
В теории степенных рядов мы познакомились с тем важным
фактом, что один и тот же ряд может служить рядом Маклорена
для бесчисленного множества различных функций. Тот же вопрос,
естественно, встает и имеет столь же большую важность и в теории
рядов Фурье: может ли один и тот же тригонометрический ряд
служить рядом Фурье для нескольких различных функций? Заметим
прежде всего, что при решении этого вопроса естественно ограни-
читься непрерывными функциями, так как в противном случае задача
решается тривиально; в самом деле, если допускать к рассмотрению
368 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ [гл. 21
и разрывные функции, то мы можем изменить, например, значение
данной функции /(х) в какой-нибудь одной точке; новая функция
будет, как легко убедиться, иметь те же коэффициенты Фурье, что
и функция /(х), так как интегралы в формулах (5), (6), (7) § 81
не меняют своей величины от предпринятого изменения функции /(х).
Поставленная нами задача, как мы теперь убедимся, тесно связана
с одним важным свойством ортогональной системы
1, cos х, sin х, cos 2х, sin 2х, ... (1)
тригонометрических функций. Допустим, что существуют две непре-
рывные в отрезке ( — тс, тс) и различные между собой функции (х)
и /2 (х), имеющие один и тот же ряд Фурье, или, что то же, один
и тот же ряд коэффициентов Фурье. Рассмотрим тогда функцию
/(х)=/!(х)— /2 (х);
как показывают формулы (5), (6), (7) § 81, любой коэффициент
Фурье функции /(х) равен разности соответствующих коэффициентов
функций /j (х) и /2 (х) и, следовательно, равен нулю. Мы имеем
таким образом:
j /(х) cos &xdx = 0, |
}• (А = 0, 1, 2, ... ).
J* /(x)sin kxdx = Q
Но это означает, что функция /(х) ортогональна любой из функций
системы (1) в отрезке (— тс, тс). Таким образом, если существуют
две различные между собой, непрерывные в отрезке ( — тс, тс) функ-
ции с одним и тем же рядом Фурье, то существует непрерывная
в отрезке (— тс, тс) функция, не обращающаяся тождественно
в нуль и ортогональная в этом отрезке всем функциям системы (I).
Легко видеть, что имеет место и обратное предложение. В самом
деле, если функция /(х) непрерывна, не обращается тождественно
в нуль и ортогональна всем функциям системы (1) в отрезке ( — тс, тс)
и если ф (х) — любая непрерывная в этом отрезке функция, то, оче-
видно, функция ф(х)-|-/(х) в отрезке (— тс, тс) непрерывна, не сов-
падает с 9 (х), в то же время все ее коэффициенты Фурье совпадают
с соответственными коэффициентами функции 9(х).
Поставленная нами задача сводится, таким образом, к вопросу
о том, можно ли «добавить» к ортогональной системе (1) еще одну
непрерывную и отличную от тождественного нуля функцию так, чтобы
расширенная система оставалась ортогональной. Возможность такого
расширения системы (1) есть, как мы видим, необходимое и доста-
точное условие существования двух различных между собою функ-
§ 83]
ТЕОРЕМА ДИРИХЛЕ-ЛЯПУНОВА
369
ций, имеющих один и тот же ряд Фурье. Ортогональную систему,
допускающую такого рода расширение, называют незамкнутой;
напротив, система замкнута, если она такого расширения не до-
пускает. Мы приходим, таким образом, к вопросу о том, замкнута
или незамкнута ортогональная система (1).
Важнейший факт замкнутости этой системы вытекает из замеча-
тельных исследований Дирихле о сходимости тригонометрических
рядов; однако, повидимому, он был впервые явно формулирован и
самостоятельно доказан несколько позже выдающимся русским уче-
ным академиком А. М. Ляпуновым. Поэтому мы будем в дальнейшем
называть его теоремой Дирихле-Ляпунова.
Теорема Дирихле-Ляпунова. Ортогональная система (1)
замкнута.
Доказательство. Пусть функция f(x) непрерывна в отрезке
(— тс, к) и ортогональна в этом отрезке всем функциям системы (1).
Надо доказать, что f (х) = 0 (— тс х к).
Очевидно, что из ортогональности функции f(x) любой функции
системы (1) непосредственно вытекает и ортогональность ее любо-
му тригонометрическому многочлену Т(х). Мы поведем доказа-
тельство от противного: допустим, что функция f(x) не равна
тождественно нулю в отрезке (— тс, тс), и построим, исходя из
этого допущения, такой тригонометрический многочлен, которому
эта функция заведомо не может быть ортогональна в отрез-
ке ( — тс, тс).
Пусть, например, /(х)^>0 при х = а, —тс<^а<^тс. Тогда при
достаточно малом 8^>0 мы будем иметь /(х)^>0 и для всех точек х
отрезка (а — 8, а -|- 8); пусть с 0 есть наименьшее значение функ-
ции /(х) в этом отрезке, так что
/(х)^с^>0 (а — 8^x^a-J-8)«
Положим теперь
• 7-,(х) = {'+“у-д> }-,
где п — любое натуральное число. Производя возведение в степень
по формуле бинома, мы, очевидно, находим:
п
тп = 2 Л tcos (х—“)К>
г=0
где сг—постоянные вещественные числа. Известно, что функция
(cos х)г при любом г 0 может быть представлена в виде линейной
комбинации функций
1, cos х, cos 2х, ... t cos rx
24 А. Я. Хинчин
370 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ (гл. 21
с постоянными коэффициентами *); применяя это разложение ко всем
членам последней суммы, мы находим:
п
2 cos г (х —
г = 0
где dr — постоянные числа. Наконец, так как для любого г
cos г (х — а) = cos га cos гх sin га sin гх,
то мы получаем для Тп(х) выражение вида
п
Л(х) = -у- + 2 cos kx + Р* sin kx^>
где аЛ, Рй — постоянные числа. Этим показано, что при любом на-
туральном п функция Тп (х) представляет собой тригонометрический
многочлен. Мы убедимся теперь, что, если п достаточно велико,
этот многочлен не может быть ортогонален функции /(х) в от-
резке (— к, к).
Попытаемся представить себе в общих чертах течение функции
Тп (х) при большом п в отрезке (— те, те); кстати, это позволит нам
ясно увидеть мысль, лежащую в основе последующего доказательства.
Величина
1 + COS (X — а)
2 ’
л-ю степень которой представляет собой многочлен Тп (х), очевидно,
всюду неотрицательна; она равна 1 при х = а и меньше единицы
при всех других значениях х в отрезке ( — к, тс). Поэтому при боль-
шом п функция Тп (х), будучи везде неотрицательной, равна единице
при х = а и ничтожно мала для всех х, сколько-нибудь заметно
удаленных от а, так что течение этой функции имеет вид, примерно
*) Доказательство. При г = 1 утверждение очевидно. Если
г
(COS х)г = 2 as C0S SX’
s=0
то
г
(COS x)/‘+1 = (cos x)rCOS X = 2 a5C0S SXCOS X=s
s = 0
r r+1
= у 2 as (cos (s + 1) x + cos (S — 1) x] = 2 cos sx.
5=0 5=0
§83]
ТЕОРЕМА ДИРИХЛЕ-ЛЯПУНОВА
371
изображенный на черт. 51. Нашей целью является показать, что
интеграл
J /(•*) Tn(x)dx
(2)
не может быть равен н^лю, если п достаточно велико. Для этого
мы разобьем интеграл (2) на две части:
«4-3
f /GO 7n(x)dx = I1
а-8
И
а — 8
Тп 0*0 &х —
—тс «4~з _
как второй из этих интегралов
7\(х) ничтожно мало, то у нас
и сам он ничтожно мал по
Гпы
основания рассчитывать,
распространяется на область,
есть
Черт. 51.
Так
где
что
абсолютному значению. Напротив,
относительно первого интеграла мы
знаем, что в нем всюду f(x) с О,
а функция Тп (х) принимает наи-
большие из своих значений. У нас
есть поэтому все основания ожи- —н
дать, что по абсолютной величине
первый интеграл окажется значи-
тельно' больше второго; но это —
все, что нам нужно, так как при Ц |79 | мы не можем иметь /1-|-/2=0.
Перейдем к необходимым для нашей цели расчетам. Так как
1 4-cos (х-g) = cos2/х-а\
2
то
«4-3
Ц = f f (х) cos2л
cos 2/1
dx.
Полагая
а — 6
x = a-j-yf находим:
Ц с f cos2/1 f
6
17i-Sin4r
Так как
в отрезке (0, 8) 0 sin ~ 1 и 0 cos ~ 1, то
(1 — sin2 4г
1 —sin cos ,
— 8
*
372
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
[гл. 21
и мы получаем:
б
Л 2с J 1 — sin cos ~ dy,
о
или, полагая sin ^- = г,
. б
8Ш 2*
/,Э=4С J (1^г)”</г = 7^т{ 1 _(1 —sin 4Р,}>7Г^Т. (3)
О
так как при достаточно большом п выражение, стоящее в фигурных
скобках, очевидно, больше, чем 2 .
Мы оценили снизу интеграл Д; теперь мы постараемся оценить
сверху абсолютную величину интеграла /2. Обозначим через М наи-
большее значение функции |/(х) | в отрезке (—тг, т:). В пределах
тех двух интегралов, которые составляют собой /2 (т. е. при |х—а|^>8),
мы имеем:
cos2Rr)^cos8Gr)
и, следовательно,
| Тп(х) |^со8^(4) ;
поэтому
14 |з£ Mcos»« [(а-8)-(_тс)4-тг — (а + 8)]<
<^2яМcos2" = Мгп, (4)
где положено
г = COS2 < 1.
Так как при достаточно большом п мы имеем *):
2тгЛ4гп<-^-г,
п+ 1 ’
то из (3) и (4) вытекает |/2|<Vi ПРИ достаточно большом п. Ра-
венство
J /(х)Т„(х) ^=/, + 4=0
— тс
поэтому невозможно, и теорема Дирихле-Ляпунова доказана.
*) Это вытекает из соотношения пгп —> 0 (п —> оо) (см. доказательство
теоремы 4 § 77).
§ 84] сходимость рядов фурье 373
Мы видим, таким образом, что в отношении рассматриваемой
нами задачи ряды Фурье ведут себя иначе, чем ряды Маклорена:
каждый тригонометрический ряд может служить рядом Фурье не бо-
лее чем для одной непрерывной функции.
§ 84. Сходимость рядов Фурье
Мы переходим теперь к нашей основной задаче — к вопросу о том,
какими свойствами должна обладать функция /(х) для того, чтобы
ее ряд Фурье сходился и имел своей суммой именно эту функцию.
Во всей своей полноте эта задача очень сложна, и наука в наши
дни еще далека от ее окончательного решения. С одной стороны,
мы знаем целый ряд признаков, позволяющих установить разложи-
мость в ряды Фурье для тех или других классов функций, но, с дру-
гой стороны, построено большое число примеров, показывающих, что
имеются функции довольно простого строения, ряды Фурье которых
оказываются расходящимися. Мы в настоящем параграфе докажем
в этом направлении только одно предложение, показывающее, на-
сколько класс функций, разложимых в ряды Фурье, шире класса
функций, которые допускают представление степенными рядами.
Теорема. Функция /(х), имеющая период 2к и всюду непре-
рывную первую производную, разлагается в равномерно сходящийся
на всей числовой прямой тригонометрический ряд (который в силу
основного результата § 81 есть ее ряд Фурье).
Доказательство. Будем обозначать через aki bk коэффициенты
Фурье функции /(х) и через aki b'k— коэффициенты Фурье функ-
ции /(х). Формулы (5) и (6) § 81 дают с помощью интеграции по
частям при k^>0
ТС
Ttak = J f (x) cos kx dx =
— TC
TC
itbk = /(x) sin kx dx =
— TC
Таким образом, мы имеем:
2-••• )• (о
374 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ [гл. 21
Так как для любых двух чисел а и р из
ав + ₽а-2|а₽| = (|а|-|р|)4^0
следует
2|ар|^а2 + р2,
то соотношения (1) дают:
2 | ak | Ь'ь 4" , 2 I bk | a'k 4“ ,
откуда при любом х
|a*cos Лх + ^sin kx | | ak | +1 bk | (a'k2 + bj2) + -|2. (2)
Так как числа akf b'k служат коэффициентами Фурье непрерыв-
ной функции f (х), то согласно заключительному результату § 82 ряд
оо
Л = 1
оо
сходится; а так как ряд также сходится, то правая часть не-
fe=i
равенства (2) представляет собой &-й член сходящегося числового
ряда с положительными членами; но тогда в силу (2) ряд
у 4“ (ал C0S + bk sin
fe=i
сходится абсолютно и равномерно на всей числовой прямой. Обозна-
чим его сумму через $(х); в силу основного результата § 81 ряд (3)
есть тогда ряд Фурье для функции’s (х), в то время как по своему
определению он служит рядом Фурье для функции /(х). Так как
функции /(х) и s(x) обе непрерывны, то на основании § 83 они
должны совпадать друг с другом, чем наша теорема и доказана.
^/§ 85. Обобщенные тригонометрические ряды
Как уже было замечено в § 81 и как это непосредственно оче-
видно, разлагаться в тригонометрический ряд на всей числовой пря-
мой могут только функции периодические с периодом 2тс. Для функ- ?
ции /(х), не обладающей этим свойством, разложение возможно
в лучшем случае в (любом) отрезке (а, а 4~ 2тс) длины 2тс; при этом,
очевидно, требуется еще, чтобы было f(a 4~ 2тс)=/(а). Это огра-
ничение, если бы от него нельзя было легко освободиться, конечно,
очень стеснило бы использование аппарата тригонометрических рядов.
В настоящем параграфе мы поэтому кратко рассмотрим вопрос о том,
как с помощью простого и естественного расширения идеи тригоно-
§ 85] ОБОБЩЕННЫЕ ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ 375
метрического ряда можно избавиться от этого затруднения. Для
простоты мы при этом все время будем предполагать, что данная
функция f (х) имеет непрерывную производную в каждой точке того
отрезка (a, Ь), в котором мы хотим разложить ее в тригонометри-
ческий ряд.
Если речь идет об отрезке (а, а-]-Х) длины меньшей, нежели
(X 2г), то наша задача, разумеется, очень проста: стоит просто
продолжить функцию /(х) в отрезке (а —|— X, а-\-2ъ) произвольным
образом, лишь бы было f(a 2тс)=/(а) и f (а 2iz)=f (а), и
функция /(х) имела непрерывную производную ‘во всем отрезке
(а, а -]- 2тс) (что, конечно, возможно сделать бесчисленным множеством
способов). Так продолженная функция в силу теоремы § 84 может
быть представлена в отрезке (а, а-|~27г) равномерно сходящимся
рядом, сумма которого в отрезке (а, а 4- X), очевидно, совпадает
с данной функцией /(х), чем и решается поставленная задача. По
этому поводу интересно еще только заметить, что в случае X 2тс
продолжение функции /(х) на весь отрезок (а, а2тс), возможное
бесконечным множеством различных способов, тем самым будет да-
вать для исходной функции бесконечное множество различных рядов
Фурье. Суммы этих рядов Фурье будут, разумеется, различными между
собою функциями, если их рассматривать во всем отрезке (a, a -j- 2тс);
но в отрезке (а, а-]-Х) все они будут совпадать с функцией /(х).
Таким образом, в отрезке длины <^2тс функция, вообще говоря, мо-
жет быть представлена бесчисленным множеством различных между
собой тригонометрических рядов.
Пусть теперь Х^>2тг; мы снова предположим, что функция /(х)
имеет непрерывную производную в отрезке (a, a -j- X) и что f (а X) =
=/(а), f (а-|-Х)=/г (а); за пределами отрезка (а, а —X) мы
можем тогда предположить функцию /(х) периодически*продолжен-
ной (с периодом X) на всю числовую прямую.
Положим
Очевидно, что функция 9(3/) — периодическая с периодом 2п (так
как, увеличивая у на 2тс, мы, очевидно, увеличиваем х на X) и при
любом у имеет непрерывную производную; обозначая через aki bk
коэффициенты Фурье этой функции, мы поэтому имеем для любого у
в силу теоремы § 84:
оо
ф Су)=у + 2 cos ky + sin ky>i’
fe=l
причем ряд сходится равномерно на всей числовой прямой. Так как
2тс z ч
—а),
376
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ
[гл. 21
то отсюда равномерно на всей числовой прямой
со
/(*)=-у + 2 [a6C0S a)-H*sin -у- (х — а)1; (1)
Л = 1 1
применяя же к выражениям
cos -г- (х — a), sin -г- (х — а)
л к
тригонометрические формулы для косинуса и синуса разности двух
аргументов, мы, очевидно, приводим разложение (1) к виду
со
/(х) = cos ^Tx+₽*sin ~х),
k=\
гдеаЛ, — постоянные числа; в частности, при а^х сумма
этого ряда совпадает с соответствующими значениями заданной в этом
отрезке функции /(х).
Мы видим, таким образом, что заданная в любом отрезке (а, а 4~ X)
функция /(х) (при оговоренных нами условиях) разлагается во всем
этом отрезке в равномерно сходящийся обобщенный тригонометриче-
ский ряд, отличающийся от ряда (1) § 81 только тем, что элементами
разложения служат вместо функций системы (2) § 81 функции
1, cos -у- х, sin -г- х (п = 1, 2, ... ),
Л Л
образующие, как легко убедиться, ортогональную систему в отрезке
(а, а-|-Х) (и в любом отрезке длины X). Все функции этой системы
имеют период X. Для коэффициентов $k мы прежним путем легко
находим выражения
ай = у J /(x)cos^xdx (& = 0, 1, 2, ... ),
а
а-|-х
Рй = у j /(x)sin ~ Хб/х (k=\, 2,...).
а
Наконец, если требуемые для полученного разложения условия
f (a -j- X)=f (а), f (a-j-X)=/(а) не выполняются, мы всегда можем
продолжить функцию /(х) за пределы точки а--|-Х до некоторой
точки b а X так, чтобы в отрезке (а, Ь) выполнялись все не-
обходимые требования, и затем провести разложение функции /(х)
в этом расширенном отрезке только что описанным нами способом.
Упражнения к § 85 см. в задачнике Б. П. Демидовича, задачи
331, 356, 357.
РАЗДЕЛ ПЯТЫЙ
ДАЛЬНЕЙШЕЕ. РАЗВИТИЕ
ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
ГЛАВА 22
ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ
ПЕРЕМЕННЫХ
§ 86. Непрерывность функции нескольких
независимых переменных
Уже при первом знакомстве с идеей функциональной зависимости
(глава 1) мы рассматривали функцию y=f(x) одной независимой
переменной х ллшь как простейшую форму этой общей идеи. В тех
типах функциональной зависимости, с которыми мы встречаемся
в действительности, по большей части приходится иметь дело с ве-
личинами, зависящими не от одной, а от нескольких (иногда очень
многих) других величин, значения которых могут быть выбираемы
произвольно и независимо друг от друга и которые мы можем по-
этому называть независимыми переменными. Лишь когда все эти
значения выбраны каким-либо определенным образом, функция полу-
чает определенное значение. Однако до сих пор мы занимались
исключительно тем простейшим случаем, когда имеется лишь одна
независимая переменная. Между тем, понятия и методы как диффе-
ренциального, так и интегрального исчисления вполне естественно
переносятся и на функции любого числа независимых переменных
и приносят и в этой более широкой области очень значительную
пользу.
В настоящей главе мы, как правило, будем рассматривать во
всех подробностях перенос понятий и методов дифференциального
исчисления лишь на случай функций двух независимых переменных,
предоставляя затем читателю убедиться, что дальнейшее увеличение
числа независимых переменных не требует уже ничего принципиально
нового. Такой путь представляется целесообразным потому, что, как
мы увидим, переход от функций одной переменной к функциям двух
переменных связан с появлением некоторых Принципиально новых
моментов, для прочного усвоения которых нам желательно иметь
возможность сосредоточить свое внимание на идейной стороне дела»
378 дифференцирование функций нескольких переменных [гл. 22
не растрачивая его на слишком громоздкий формальный аппарат.
Напротив, переход от двух к трем и более независимым переменным
уже, как правило, влечет за собой лишь осложнения технического
характера, с которыми справиться нетрудно, после того как прин-
ципиальная сторона дела прочно усвоена.
Пусть величина и есть функция двух независимых переменных х
и у, Подобно тому как мы до сих пор изображали различные зна-
чения переменной х точками прямой линии («числовая прямая») и
иногда прямо называли эти значения «точками», мы и теперь часто
будем понимать независимые переменные х и у как прямоугольные
координаты точки на плоскости, которую естественно называть
«числовой плоскостью»; и здесь, вместо того чтобы говорить о «паре
значений (х, у) независимых переменных», мы часто будем говорить
просто о «точке (х, у)» и значение величины и при х = а, у = Ь
называть значением ее «в точке (а, Ь)». Такая терминология очень
удобна в двух отношениях: во-первых, она в большинстве случаев
значительно короче (при той же степени точности), а во-вторых,
она, естественно, вызывает у нас наглядные представления, во многих
случаях облегчающие усвоение излагаемого. Иногда бывает удобно
обозначать точку (х, у) одной буквой, например Р, Q, ..., и вместо
u=f(x, у) писать короче u=f(P); правда, в случае двух незави-
симых переменных этим приемом пользуются сравнительно редко, так
как даваемое им сокращение записи в этом случае не очень велико;
однако в случае, когда независимых переменных много, это сокра-
щение может оказаться очень чувствительным.
Подобно тому как функция y=f(x) имеет своим геометрическим
изображением в прямоугольной системе координат (х, у) некоторую
кривую, пересекаемую не более чем в одной точке любой прямой,
параллельной оси OY, так и функция u=f(x, у) изображается
в прямоугольной системе координат (х, у, и) некоторой поверх-
ностью, пересекаемой не более чем в одной точке любой прямой,
параллельной оси OU (это равносильно требованию, чтобы каждой
паре значений переменных х, у соответствовало не более чем одно
значение величины w). Мы знаем, какую пользу приносят графические
изображения при изучении функций одной переменной х. Аналогич-
ную роль в теории функций двух переменных играет геометриче-
ская иллюстрация их с помощью поверхностей в трехмерном прост-
ранстве.
Пусть функция u=f(x, у) определена в некоторой области*)
плоскости и пусть Р(а, Ь) — одна из точек этой области. Рассмотрим
наряду с этой точкой другую точку Р' (х; у), которую мы будем
*) Форма этой области в данный момент для нас в широкой степени
безразлична: это может быть квадрат, круг или какая-либо другая конечная
фигура, или бесконечная часть «числовой плоскости», или даже вся эта
плоскость,
§ 86] НЕПРЕРЫВНОСТЬ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 379
мыслить как безгранично приближающуюся к Р, так что х—
и у-*Ь, что можно выразить одним соотношением
р = /(х ——й)а -> 0.
Если в этом процессе величина /(х, у) стремится к некоторому
пределу А, то мы будем писать
/(х, У)-+А (р—>0) или lim /(х, у) = А.
р—о
Описание процесса с помощью соотношения р—>0 наиболее
просто; однако мы должны иметь в виду, что здесь мы встречаемся
с предельным переходом в том обобщенном смысле, который мы
подробно рассмотрели в § 15; в самом деле, /(х, у) не является
функцией «основной переменной» р, так как, очевидно, на данном
расстоянии р от точки Р будет находиться бесчисленное множество
различных точек Рг (х, у), в которых функция /(х, у) будет, вообще
говоря, принимать «различные значения. Тем не менее, конечно, на-
писанные нами предельные соотношения имеют совершенно опреде-
ленный смысл: сколь бы мало ни было е > 0, существует такое 8 > 0,
что для любой точки Рг (х, у), отличной от Р и отстоящей от нее
менее чем на 8 (т. е. при единственном условии р 8), мы будем
иметь: • '
!/(•*> У)~ 4|<е.
После того как выяснено понятие предела для функции двух пе-
ременных, становится уже вполне ясным, как мы должны перенести
в эту область понятие непрерывности, получившее, как мы знаем,
основоположное значение в случае функций одной переменной.
Функция и=f (х,у) называется непрерывной в точке (х, у),
если, полагая р= у/ Дх2 -J- Д.У2, мы имеем:
Пш/(х-|-Д*, У + &y)=f(x, у).
р-*о
Подробнее это означает: для любого £^>0 существует такое
8^>0, что при единственном условии р<^8 мы имеем:
| Ди I = I f(x 4- Дх, у + by) J)| < 8.
Мы видим, что понятие непрерывности и здесь, как в нашем
прежнем случае, имеет локальную природу: функция двух перемен-
ных может быть, вообще говоря, непрерывной в одних точках и
разрывной в других. И здесь, аналогично прежнему, мы условимся
называть функцию /(х, у) непрерывной в данной области числовой
плоскости, если она непрерывна в каждой точке этой области.
Когда мы занимались функциями одной независимой перемен-
ной, мы, прежде чем установить важнейшие свойства непрерывных
функций (глава 5), должны были тщательно исследовать строение
380 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
континуума (множества вещественных чисел), т. е. множества значений
самой независимой переменной. Подобным же образом и здесь мы
должны предпослать изучению функций двух переменных детальное
рассмотрение свойств множества пар (х, у} вещественных чисел.
Это множество естественно называть двумерным контину-
умом; геометрическим образом его служит плоскость.
До сих пор мы говорили о функциях двух независимых пере-
менных; однако все сказанное в настоящем параграфе настолько
естественно переносится на случай функций любого числа перемен-
ных, что мы можем ограничиться по этому вопросу самыми краткими
указаниями.
Если величина и есть функция п независимых переменных, то
мы для удобства терминологии называем совокупность значений этих
переменных точкой /z-м ерного пространства (или про-
странства п измерений). Расстоянием между двумя
точками попрежнему называется квадратный корень из суммы квадра-
тов разностей соответственных координат этих точек (в случае п = 3
мы имеем дело с обычным расстоянием между двумя точками в трех-
мерном пространстве). Функция u—f(Xy yf z) непрерывна в точке
(х, уу z) трехмерного пространства, если
Дм=/(х4-А^ .у + ДУ, г-j-^z)—/(х, у у г)->0 (р->0),
где
р = уДх2 Д.У2 +
(нет надобности формулировать определение непрерывности при
л^>3 — оно самоочевидно). Для дальнейшего развития учения о функ-
циях п переменных необходимо подробное рассмотрение свойств
n-мерного континуума, т. е. множества всех групп из п веществен-
ных чисел (аь а2, ..., ал).
Мы рекомендуем учащемуся рассмотреть поучительные примеры
из задачника Б. П. Демидовича, отдел VI, задачи 44, 45, 55.
§ 87. Двумерный континуум
На прямой линии возможен только один тип простейшей фигуры —
отрезок. Но уже при переходе к двумерному континууму — плоско-
сти— мы сразу встречаемся с огромным разнообразием простейших
фигур: многоугольники, круги и вообще фигуры, ограниченные любым ?
простым контуром. Это разнообразие типов простейших фигур и
является первоисточником большей части новых моментов, возникаю-
щих при изучении двумерного континуума сравнительно с простей-
шим линейным (одномерным) континуумом.
Совокупность всех точек такой простой плоской фигуры мы бу-
дем называть областью, — закрытой, если все точки контура
считаются принадлежащими области, и открытой, если, напротив,
ДВУМЕРНЫЙ КОНТИНУУМ
381
§ 87]
ни одна точка контура не принадлежит области. При этом мы не
будем исключать из рассмотрения и такие области, которые прости-
раются в бесконечность: мы будем, например, называть областью
(открытую) полуплоскость х > О, а также и всю числовую плоскость,
подобно тому как прежде мы считали частным случаем отрезка
(открытую) полупрямую х^>0 или даже всю числовую прямую.
Если Р(х, у) есть внутренняя (т. е. не принадлежащая кон-
туру) точка такой области D, то, очевидно, всякий достаточно малый
круг с центром* в Р будет всеми своими точками принадлежать
этой области. Напротив, если Р есть точка контура (или, как чаще
говорят, границы) области D, то любой круг с центром в Р будет
содержать как точки, принадлежащие области D, так и точки, ей
не принадлежащие. Эти свойства можно понимать как определения
понятий внутренней точки и пограничной точки области. Открытая
область состоит только из внутренних точек; закрытая область со-
держит наряду с внутренними и все свои пограничные точки.
В случае линейного континуума размеры простейших фигур —
отрезков — полностью характеризовались их длинами. В случае пло-
скости дело обстоит сложнее: смотря по характеру задачи, нас мо-
жет интересовать либо площадь данной области, либо ее линейные
размеры; эти последние удобнее всего характеризовать диаметром
области, который определяется как верхняя грань взаимных рас-
стояний всевозможных пар точек, принадлежащих данной области*,
так, диаметром круга служит длина его обычного диаметра, диа-
метром прямоугольника — длина его диагонали и т. д. Если упомя-
нутая верхняя грань существует, область называется ограничен-
ной, в противном случае — неограниченной; неограниченной
области иногда приписывают диаметр оо. Для того чтобы область
была ограниченной, очевидно, необходимо и достаточно, чтобы она
целиком помещалась внутри некоторого круга (подобно тому как
для ограниченности линейного множества необходимо и достаточно,
чтобы оно целиком помещалось внутри некоторого отрезка).
Пусть на плоскости даны область D и точка Р и пусть р (Р, Q)
означает расстояние между точками Р и Q плоскости. Если Q про-
бегает всевозможные точки области D, то р (Р, Q) имеет определен-
ную нижнюю грань, которую мы будем называть расстоянием
точки Р от области D и обозначать через р(Р, D).
Теорема 1. Если точка Р не принадлежит закрытой обла-
сти D, то р(Р, £))^>0.
Доказательство. Если бы было р(Р, D) = 0, то сколь
угодно малый круг с центром в Р содержал бы точки области D.
Но тогда имело бы место одно из двух:
1) всякий достаточно малый круг с центром в Р целиком при-
надлежит области D, или
2) любой круг с центром в Р содержит как точки, принадлежа-
щие области D, так и точки, не принадлежащие этой области.
382 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
В первом случае точка Р была бы по определению внутренней,
а во втором — пограничной точкой области/). Так как область D —
закрытая, то в обоих случаях точка Р принадлежала бы этой обла-
сти, что исключается предпосылками теоремы. Значит, р(Р, D) О,
и теорема 1 доказана.
По аналогии с теоремой о стягивающейся последовательности отрез-
ков (§ 18, лемма 1), нам нужно будет установить теперь соответ-
ствующую важную теорему о стягивающейся последовательности
закрытых областей. Последовательность областей Di9 D%, ..., Dn,...
с соответственными диаметрами dlf d2> dn) ... мы называем
стягивающейся, если 1) Dn+1 czDn (п = 1, 2, ...) (т. е. область
Dn+l целиком входит в область Dn) и 2) dn~^0 (/г—>оо).
Теорема 2. Стягивающаяся последовательность закрытых
областей всегда имеет единственную точку, общую всем областям
данной последовательности.
Доказательство. Обозначим через (ап, Ьп) отрезок, служа-
щий проекцией области Dn на ось ОХ, и через (сл, — анало-
гичный отрезок на оси OY. Очевидно, что каждая из двух последо-
вательностей (ап, Ьп) (п=1, 2, ...) и (сп, dn) (п=1, 2, ...) пред-
ставляет собой стягивающуюся последовательность отрезков. Пусть
а — общая точка всех отрезков (anf bn) (существующая и единствен-
ная в силу леммы 1 § 18) и £ — общая точка всех отрезков (сп, dn).
Мы утверждаем, что точка Р(а, (3) принадлежит каждой из областей
Dn. В самом деле, если бы существовала закрытая область Dk, не
содержащая точки Р, то в силу теоремы 1 мы имели бы р(Р, Dk) =
= d^>0. Но при l^y>k, Dl(zzDk, а потому
р(Р, А)^Р(Л Dk)^d (1)
Но если Q (х, у) есть любая точка области Dt, то х и а принад-
лежат отрезку (az, bt), а р и у — отрезку (cz, dj), так что
Р (Л Q) = /(*-<*)* +О'/(^_a^ + (dz_Cz)»,
а следовательно, и подавно
Р (Л Dt) /№-az)2 + (rfz-C/)2; (2)
но при /~>оо, bt — az~>0 и dt — cz->0, а потому в силу (2) и
р(Р, Dz)->0, что противоречит неравенству (1), согласно которому
р(Р, Dt)^d при любом l^k. Итак, точка Р(а, Р) принадлежит
каждой из областей Dn. Если бы существовала другая точка Р', 1
обладающая тем же свойством, то пусть расстояние между Р и Р'
равно р; очевидно, в этом случае любая из областей Dn, включая
в себя обе точки Р и Р', должна была бы иметь диаметр не мень-
ший, чем р. Это же противоречит тому, что области Dn образуют
стягивающуюся последовательность. Таким образом, доказана и един-
ственность точки Р.
ДВУМЕРНЫЙ КОНТИНУУМ
383
§ 87]
Теперь мы переходим к доказательству «теоремы о конечном
покрытии», аналогичной лемме 2 § 18. Пусть мы имеем некоторую
(конечную или бесконечную) совокупность (систему) 5 областей (D).
Условимся говорить, что система 5 покрывает некоторую об-
ласть Д, если каждая точка области Д является внутренней точкой
по крайней мере одной из областей D системы S.
Теорема 3. Если система S покрывает ограниченную закры-
тую область Д, то из этой системы можно выделить другую,
состоящую из конечного числа областей и также покрывающую
область Д.
Доказательство. Так как область Д ограничена, то она це-
ликом помещается внутри некоторого квадрата Q. Разделим этот
квадрат на четыре равных квадрата, соединяя прямыми линиями се-
редины его противоположных сторон. Условимся называть любой
квадрат «нормальным», если заключенная в нем часть области Д
не допускает требуемого теоремой 3 конечного покрытия (квадрат,
вовсе не содержащий точек области Д, не считается нормальным).
Очевидно, утверждение теоремы 3 состоит в том, что квадрат Q
не нормален. Допустим, напротив, что он нормален; тогда легко
видеть, что из тех четырех квадратов, на которые мы его разбили,
по меньшей мере один также должен быть нормальным; в самом
деле, если бы каждый из этих четырех квадратов допускал конечное
покрытие (или вовсе не содержал бы точек области Д), то, оче-
видно, и весь квадрат Q допускал бы конечное покрытие.
Пусть — нормальная четверть; разделяя ее снова на четыре
равных квадрата, мы тем же путем убеждаемся, что по меньшей
мере один из этих четырех квадратов снова должен быть нормаль-
ным, и т. д. Этот процесс мы можем продолжать сколь угодно да-
леко, причем мы, очевидно, получим стягивающуюся последователь-
ность квадратов Q, Qi9 Q2, ... Пусть Р есть (существующая и един-
ственная в силу теоремы 2) общая точка всех этих квадратов.
Убедимся прежде всего, что Р принадлежит области Д. В самом деле,
любой круг с центром в Р содержит, очевидно, все квадраты Qn
с достаточно большими п, а значит, содержит и точки области Д.
Если этот круг, при достаточно малом радиусе, целиком входит
в область Д, то Р есть внутренняя точка этой области; если же,
при сколь угодно малом радиусе, этот круг содержит как точки,
принадлежащие Д, так и точки, не принадлежащие этой области, то
точка Р есть пограничная точка области Д; так как область Д —
закрытая, то в обоих случаях точка Р принадлежит этой области.
Но в таком случае в силу предпосылок теоремы существует
область D системы 5, имеющая Р своей внутренней точкой. Всякий
достаточно малый круг с центром в Р целиком принадлежит поэтому
области D; но такой круг содержит, как мы видели, бесчисленное
множество квадратов Qn, каждый из которых, таким образом, покры-
вается одной областью D системы 5, в то время как он по своему
384 дифференцирование функций нескольких переменных [гл. 22
определению является нормальным и не может допускать конечного
покрытия. Полученное противоречие доказывает, что наше допуще-
ние не может быть верным, т. е. квадрат Q не может быть нор-
мальным и, следовательно, должен допускать конечное покрытие.
Этим теорема 3 доказана. *
Пусть теперь и Д2— две ограниченные закрытые области,
не имеющие друг с другом общих точек, и пусть Р—любая точка
области В силу теоремы 1 существует круг с центром в точке Р,
не содержащий ни одной точки области Д2. Пусть г(Р) — радиус
такого круга. Условимся тогда называть «собственным» кругом
точки Р круг радиуса уГ(Р) с центром в Р и обозначим через 5
совокупность собственных кругов всех точек Р области Dv Так как
система S покрывает область DX) то по теореме 3 существует ко-
нечная группа S' кругов системы S, также покрывающая область Др
обозначим через 8 радиус наименьшего из кругов этой конечной
группы S'.
Пусть Pt и Р2— произвольные точки, принадлежащие соответ-
ственно областям Di и Д2. Точка Pt лежит внутри одного из кру-
гов системы S'; пусть Р и г = ~г(Р) соответственно означают
центр и радиус этого круга. Тогда мы имеем, во-первых, р (Р, Р2) г (Р)
(так как точка Р2 принадлежит области Р2) и, во-вторых,
р(Р, P1)<^r = ir(Р). Отсюда
Р(Л, Л)^р(Я Р,)-Р(Л А)>г(Р)- Р(Р)=|г(Р)^8.
Так как Рг— произвольная точка области Dit а Р2 — произволь-
ная точка области Р2, то мы приходим к выводу, что нижняя грань
всех расстояний р(Рр Р2) есть некоторое положительное число.
Эту нижнюю грань называют взаимным расстоянием обла-
стей Di и Д2 и обозначают через р(Дп Д2). Мы имеем поэтому
следующее важное предложение.
Теорема 4. Если Dr и D% — ограниченные закрытые области,
не имеющие друг с другом общих точек, то р(Дп Р2)^>0.
Все понятия, а также формулировки и доказательства теорем
этого параграфа без каких-либо существенных изменений перено-
сятся на континуум любого числа измерений, что читатель легко
проверит самостоятельно.
§ 88. Свойства непрерывных функций
Мы обладаем теперь достаточной базой для установления важ-
нейших свойств непрерывных функций нескольких переменных.
Прежде всего, для функций двух переменных сохраняют силу
все теоремы, которые для функций одной переменной были нами
§ 88] СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 385
доказаны в §§21 и 22. Результат любой рациональной операции
над функциями, непрерывными в какой-либо точке Р, снова есть
функция, непрерывная в этой точке (в случае деления необходимо
лишь потребовать, чтобы делитель в точке Р не обращался в нуль).
Теорему о непрерывности сложной функции надо понимать здесь
так: если z=f(u, v), и = <^1(х) у), ъ = <^(х, у) и если функции
cpj и ср2 непрерывны в точке Р(х, у} плоскости XY, а функция
/(a, v) непрерывна в точке и = ^Лх> У)> = У) плоскости
UV, то функция
_y)=/hPi (х, у), tf>3(x, _v)],
которую при этом способе задания называют сложной функцией от
х и у, непрерывна в точке Р.
Доказательства всех этих теорем в точности аналогичны дока-
зательствам соответствующих теорем § 21 и § 22 и потому могут
быть предоставлены читателю.
Перечислим теперь несколько важнейших свойств непрерывных
функций двух переменных.
Теорема 1. Функция f(x, у), непрерывная в закрытой огра-
ниченной области D, ограничена в этой области.
Доказательство этой теоремы в такой мере аналогично доказа-
тельству соответствующей теоремы 1 § 23, что читатель без затруд-
нений проведет его самостоятельно.
Теорема 2. Функция /(х, у), непрерывная в закрытой огра-
ниченной области D, принимает в этой области некоторое наи-
большее и некоторое наименьшее значение.
Доказательство снова может быть предоставлено читателю, так
как оно в точности аналогично доказательству соответствующей
теоремы 2 § 23.
Понятие равномерной непрерывности для функций
двух переменных устанавливается вполне аналогично одномерному
случаю и имеет здесь столь же большое значение. Функция
/(х, У} называется равномерно непрерывной в области D,
если имеет место следующее: сколь бы мало ни было е^>0, суще-
ствует такое 8^>0, что для любых двух точек Рх и Р2 области D
с расстоянием
Р(^. Л)<8
мы имеем:
1/(Л)-т)1о
В полной аналогиии с теоремой 5 § 23 имеет место
Теорема 3. Функция f(x, у), непрерывная в каждой точке
ограниченной закрытой области D, равномерно непрерывна в этой
области,
25 А. Я. Хин пип
386 дифференцирование функций нескольких переменных (гл. 22
Хотя доказательство этой теоремы в точности аналогично дока-
зательству упомянутой теоремы 5 § 23, мы все же проведем его
полностью ввиду его сравнительной сложности.
Доказательство. Пусть Р—произвольная точка области
D и е — любое положительное число. Так как функция f(x, у)
непрерывна в точке Р, то в любой точке Р круга достаточно ма-
лого радиуса р (Р) с ^центром в Р мы будем иметь:
поэтому, если Р и Р” — любые две точки упомянутого круга (при
этом имеется в виду, что Р и Р' принадлежат области D), мы
имеем:
(1)
Такой круг мы построим для каждой точки Р области D; ра-
диусы р (Р) этих кругов, вообще говоря, будут, конечно, различны
между собой. Теперь вообразим себе вокруг каждой точки Р обла-
сти D, наряду с построенным нами кругом радиуса р(Р), другой,
концентрический круг вдвое меньшего радиуса ур(Р). Этот круг
мы будем называть собственным кругом точки Р.
Так как такой собственный круг имеет каждая точка Р обла-
сти D, то совокупность S всех собственных кругов покрывает собой
область D. Поэтому в силу теоремы 3 предыдущего параграфа
должна существовать конечная группа С1} С2, ... , Сп собственных
кругов, также покрывающая область D. Каждый из этих кругов Ck
имеет свой центр Pk и свой радиус ~ р (Pfe). Обозначим через 8
наименьший из этих п радиусов.
Пусть теперь Р и Рг — две любые точки области D, взаимное
расстояние которых
?(/*. Р")<8.
и пусть точка Р принадлежит кругу Ск с центром Рк и радиусом
yP(Pfe)- Тогда
?(Р, Р*)^1р(РД (2)
и в то же время, так как 8 р (Рл),
р(Р, p")<4pPJ; (3)
из (2) и (3) следуеч
Р(^'> Рь)<?(?*),
ЧАСТНЫЕ ПРОИЗВОДНЫЕ
387
§ 89]
т. е. точка Р" принадлежит кругу радиуса р (Pfe) с центром в точке
Pk\ а так как точка Р, очевидно, также принадлежит этому кругу,
то имеет место неравенство (1). Но число е произвольно мало, а Р
и Р1 — любые две точки области D, взаимное расстояние которых
меньше, чем 8. Поэтому функция /(х, у) равномерно непрерывна
в области D, что и надо было доказать.
Мы предоставляем читателю убедиться, что все результаты
настоящего параграфа без существенных изменений переносятся
вместе с их доказательствами на непрерывные функции любого
числа переменных.
§ 89. Частные производные
А
\У, 'У,
Мы переходим теперь к построению дифференциального исчисле-
ния для функций нескольких переменных, причем сначала опять
сосредоточим внимание на случае функции двух переменных. Веду-
щей задачей здесь попрежнему остается оценка скорости изменения
функции; однако даже с первого взгляда ясно
видно, что здесь уже самая постановка задачи Y 1
значительно сложнее. Прежде течение процесса
описывалось изменением одной переменной х,
и надо было лишь проследить, как быстро
изменяется функция у=f(x) при том или дру-
гом приращении этой переменной; теперь же “ =
мы имеем дело с точкой Р(х, у) плоскости;
эта точка может быть смещаема не только Черт. 52.
на любое расстояние, но и в любом направ-
лении, и ясно, что, вообще говоря, быстрота изменения функции
и =f (х, у) будет различной при смещении этой точки в различных
направлениях. Для полного решения вопроса мы должны будем
создать себе четкое представление об этой сложной картине во
всей ее полноте.
Вначале, однако, мы рассмотрим только простейший случай,
когда из координат х, у точки Р изменяется только одна, другая
же остается неизменной, так что точка Р смещается в направлении
одной из координатных осей. Пусть, например, переменная х полу-
чает приращение Дх, а переменная у остается неизменной, так что
мы переходим от точки Р(х, у) к точке Р (x-\-Lx, у) (черт. 52).
Функция u=f(x, у) при этом, очевидно, получает приращение
Ди=/(х-|-Дх, y)—f(X, у).
_ Дц А
Отношение — даст нам тогда среднюю скорость изменения
функции и относительно переменной х на участке (х, х-[-Дх)
♦
388 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
при данном постоянном значении переменной у. Если существует
предел
Иш
д*-*о
Ди
Дх
lim /(* +Дх, у)—/(х, у)
А*-* О Дх
этого отношения при Дх—>0, то мы можем, очевидно, рассматри-
вать его как локальную скорость изменения функции u=f(x, у)
относительно переменной х в точке Р(х, у). В этом предельном
переходе, разумеется, х и у означают постоянные величины, изме-
няется только Дх. Однако величина предела будет, конечно, зави-
сеть от того, какие значения были выбраны для х и у; она, вообще
говоря, различна в различных точках (х, у) и является, подобно и,
функцией от х и у (поэтому мы и говорим о локальной скорости).
Эту величину называют частной производной функции
u=f(x, у) по переменной х и обозначают через или >
а также через fx (х, у). В первом случае — буква д (круглая), а во
втором — нижний индекс х имеют целью указать на то, что речь
идет о дифференцировании по одной из двух переменных при фик-
сированном (закрепленном) значении другой переменной.
Таким образом,
g = у}== lim = lim
&Х &х Дх->0 Дх Ал--*0 Дх
Разумеется, совершенно аналогично величина
= (х, j)= lim ^ = lim
дУ & У ’ Ly^y Ду-о by
называемая частной производной функции u—f(x, у) по перемен-
ной у, выражает собой локальную скорость изменения этой функ-
ции относительно переменной у; здесь, очевидно, речь идет о ско-
рости изменения величины и при смещении точки Р(х, у) в напра-
влении оси OY.
Знание обеих
ди ди
частных производных и
в точке Р дает нам, таким образом, возможность судить о том, как
быстро изменяется функция u=f(x, у) при смещении точки Р(х,у)
в направлении той или другой из координатных осей; о скорости
же ее изменения при смещении точки Р в других направлениях мы
по значениям частных производных, очевидно, непосредственно су-
дить не можем.
Из сказанного ясно, что нахождение частных производных кон-
кретно заданных функций никаких новых технических приемов не
требует; чтобы найти, например, , достаточно отыскать обычную
производную функции u=f(x, у) по х, считая при этом у постоян-
ным, так что и обращается в обычную функцию одной перемен-
ной х.
§ 89]
ЧАСТНЫЕ ПРОИЗВОДНЫЕ
389
Пример. M=_y9sLi3x, ^=3_y9cos3x,
-г- = 2у sin Зх.
оу
Частные производные функции двух переменных допускают про-
стую геометрическую иллюстрацию,
собой в трехмерном пространстве
некоторую поверхность; давая у
какое-либо закрепленное значение,
например у = Ь, мы фиксируем наше
внимание на сечении этой поверх-
ности плоскостью у = Ь\ сечение
это есть плоская кривая, уравнение
которой имеет вид
«=/(х, b) (1)
(черт. 53). Частная производная
в ’ какой-либо точке Р(а, Ь)
есть обыкновенная производная
функции /(х, Ь) по х в точке а
и, следовательно, равна угловому
коэффициенту касательной к кри-
вой (1), проведенной в точке х = а
(т. е. тангенсу угла, образуемого
этой касательной с положительным
Уравнение u=f(x, у) выражает
шенно 'аналогичную геометрическую иллюстрацию получает, разу-
ди
меется, и -т—.
оу
Частные производные функций трех и более независимых пере-
менных определяются в точности таким же образом; если, например,
u=f(x, у, г),
ТО
ди _ i:m f(x + Дх> У* — У> .
д*
аналогичным образом определяются и Очевидно, что функ-
ция п независимых переменных имеет п различных частных произ-
водных. Каждая из этих производных выражает собой локальную
(вычисленную в данной точке л-мерного пространства) скорость
изменения функции в направлении соответствующей координатной
оси. Эта геометрическая иллюстрация, разумеется, обладает нагляд-
ностью лишь в случаях л=1, 2 и 3.
Настоящий параграф не требует большого числа упражнений.
Учащийся может ограничиться решением 5—6 из задач 66—81 VI
отдела задачника Б. П. Демидовича.
390 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
§ 90. Дифференциал
Когда мы рассматривали функцию y=f(x) одной переменной х,
мы ставили в соответствие каждому смещению точки х в какую-
либо новую точку х-\-Ьх некоторую величину dy, которую мы
называли дифференциалом функции у, соответствующим произве-
денному смещению точки х. Дифференциал dy определялся как
произведение f (х) Дх. Он обладает следующими двумя свойствами:
1) он пропорционален смещению Дх точки х и 2) при Дх—>0 он
отличается от приращения &y=f(x-\- Дх)—/(х) функции у на
бесконечно малую высшего порядка сравнительно с Дх. На этих
двух свойствах основана большая часть применений дифференциала.
Мы видели также, что этими двумя свойствами дифференциал функ-
ции у полностью определяется, так что не может существовать
никакой другой, отличной от dy, величины, которая обладала бы
теми же двумя свойствами.
Когда мы имеем дело с функцией u=f(x, у) двух переменных,
то представляется желательным построение величины, обладающей
аналогичными свойствами. Пусть мы переходим от данной точки
Р(х, У) к какой-либо другой точке Р (х -|- Дх, _у-|~А-У)- Обозначим
через р = }/Дх2Ду2 расстояние между этими двумя точками.
Переходу (смещению) от точки Р к точке Р мы хотим сопоставить
некоторую величину, которая играла бы для функции u—f(x, у)
роль, аналогичную роли дифференциала для функции одной перемен-
ной. Так как в случае одной переменной дифференциал функции
имеет вид ЛДх, где А не зависит от Дх (но, вообще говоря, зави-
сит, конечно, от х), то теперь нам естественно потребовать, чтобы
величина du была линейной комбинацией приращений Дх и by, т. е.
имела вид
du = A Дх-[-£ А_У, (1)
где А и В не зависят от Дх и by (но, вообще говоря, зависят от
х и у). Это требование, очевидно, соответствует вышеуказанному
первому свойству дифференциала. Второе его определяющее свой-
ство состояло в том, что разность между приращением и диффе-
ренциалом функции была бесконечно малой высшего порядка по
сравнению с величиной смещения, которая там измерялась величи-
ной | Дх|, а здесь — расстоянием р = у/Дх2 -|- Ду2 между точками
Р и Р. Поэтому мы, естественно, и здесь требуем, чтобы при пе-
реходе от Р к Р дифференциал du функции u=f(x, у) отличался
от ее приращения Ди=/(х4-\у +4У)—/(*, У) на величину,
бесконечно малую высшего порядка сравнительно с р.
Мы можем соединить оба требования, если примем следующее
определение.
§ 90]
ДИФФЕРЕНЦИАЛ
391
Дифференциалом du функции u = f(x, у) в точке
Р(х, у) называется выражение вида (1), где А и В не зависят
от Ах и &у, если при р = у4Дх2 -|~ &у* 0
Дм — du = о (р), (2)
где Дм есть приращение функции и при переходе от точки Р(х, у)
к точке Р' (х 4- У + 4у)-
Разумеется, из этого определения мы непосредственно не только
не можем установить вида коэффициентов А и В, но не можем извлечь
и никаких соображений относительно существования и единственно-
сти дифференциала для данной функции м=/(х, у). Этими вопро-
сами нам сейчас предстоит заняться.
Теорема 1. Если функция u=f(x, у) имеет в точке
Р{х, у) дифференциал (1), то в этой точке существуют и обе
частныые производные и и А = ^-, В = ^— , так что
Г дх ду дх1 ду
. ди . । ди .
</н = д_дх4-^д3/.
Доказательство. Пусть мы даем величине х приращение
Дх, а величину у оставляем постоянной (Д_у = 0), т. е. смещаем
точку Р в направлении оси ОХ\ тогда du = А Ьх, и следовательно,
Дм = du о (р) = А Дх о (| Дх |),
так как в нашем случае, очевидно, р = |Дх|. Отсюда
Дм /(х + Дх, у) — f(x, у)
Ьх
Ьх
При Дх->0 предел правой части равен Л; следовательно, предел
« л ди
левой части существует и также равен Л; другими словами,
существует и равна Л. Совершенно аналогично можно, очевидно,
ди
доказать, что существует и равна В. Таким образом, теорема 1
доказана.
Из теоремы 1, очевидно, вытекает единственность дифферен-
циала.
Теорема 1 устанавливает, что, как и в случае функций одной
переменной, существование дифференциала влечет за собой сущест-
вование частных производных и . В случае функций одной
переменной имело место и обратное утверждение: из существования
производной вытекает существование дифференциала, так что мы
могли определять понятие дифференцируемости функции либо как
существование производной, либо как существование дифферен-
циала,— эти определения были равносильны друг другу. Поэтому и
392 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ•ПЕРЕМЕННЫХ | гл. 22
в случае функций двух переменных естественно поставить аналогич-
ный вопрос: пусть функция u=f(x, у) имеет в точке Р обе част-
ей ди .
ные производные и ; следует ли из этого существование диф-
ференциала du в этой точке? Легко заранее предвидеть, что здесь
это может оказаться необязательным; если в случае функций одной
переменной производная полностью характеризует собой скорость
, ди ди
изменения функции, то в нашем новом случае знание*^ и по-
зволяет определить эту скорость лишь в двух направлениях из бес-
численного множества возможных и тем самым характеризует изме-
няемость данной функции лишь весьма неполным образом.
Легко убедиться, что, вообще говоря, существование в данной
точке частных производных действительно еще не гарантирует су-
ществования дифференциала. Рассмотрим функцию u = f(x, У) =
—}/1 ХУ \ в соседстве точки (0, 0). Так как w = 0 всюду на осях
ОХ и OY, то в точке (0, 0) ~- = 0 и ^- = 0. Если бы в этой
’ 7 дх ду
точке функция и имела дифференциал, то в силу теоремы 1 мы
должны были бы иметь при любых Дх и &у
du = 0
и, следовательно, в силу (2) Дм = о(р). Но если мы выберем Дх =
= Ду>0, то мы будехМ иметь:
р = /Дх24- ду2 = Дх/2, Дм=/(Дх, Дх)—/(0, 0) = Дх,
и при Дх->0 приращение Дм имеет одинаковый порядок малости
со смещением р. Мы приходим, таким образом, к противоречию,
показывающему, что функция и в точке (0, 0) не имеет дифферен-
циала, несмотря на существование обеих частных производных.
Таким образом, вообще говоря, требование существования диф-
ференциала в данной точке в случае функций двух переменных
оказывается более сильным, чем требование существования частных
производных. Однако мы все же должны рассматривать те случаи,
когда наличие частных производных сочетается с отсутствием диф-
ференциала, как более или менее исключительные. Это вытекает из
следующей теоремы, благодаря которой мы в большинстве реально
встречающихся случаев получаем уверенность в существовании диф-
г \ л ди
точке (х, у) частные производные и
существуют и непрерывны, то в этой
дифференциал.
ди
дх
ференциала.
Теорема 2. Если в
ди , е , ч
функции u—f(x, у)
точке функция и имеет
Разумеется, непрерывность функций и в точке (х, у)
предполагает существование их в некоторой окрестности этой точки
§ 90]
ДИФФЕРЕНЦИАЛ
393
(в круге достаточно малого радиуса с центром в (х, J/)), так как
в противнохм случае непрерывность этих функций в точке (х, у) не
имела бы смысла.
Доказательство. Полагая. р = |/Дх24~Дд/2, du=^kx-\-
. ди . ~
-j- Ду, мы должны доказать, что при р —► 0
Ди — du = o (р).
Мы имеем:
Да=/(х4~Дх, y-\-ky)—f(x, у) —
=f(x 4- Дх, у 4- Ду) —/(х, у 4- Ду) 4-/(х, у 4- Ду) —/(х, у). (3)
В правой части этого равенства стоит сумма двух разностей. Рас-
смотрим первую из них. Второй аргумент в обоих ее членах имеет
одно и то же значение мы можем поэтому смотреть на эту
разность как на приращение некоторой функции одной переменной х,
соответствующее приращению Дх этой переменной. Если j Дх | и | Д_у |
достаточно малы, то эта функция имеет производную в каждой
точке отрезка (х, х-|-Д-^)’ эта производная есть ведь не что иное,
как частная производная функции и по переменной х, существование
которой в достаточно малой окрестности точки (х, у) мы предпо-
ложили. Поэтому мы можем применить теорему о конечном прира-
щении (§ 36) и написать
/(х4-Дх, j4-Ду)— /(х, _у4-Ду)=Л(х4-91Дх, _у4-Ду)>
где 0 1. Но совершенно аналогично мы получаем и для вто-
рой разности правой части равенства (3)
/(х, ^4-Д^)—/(X, y)=fy(x, .У4-МЛ
где 0<^62<Ч. Поэтому равенство (3) дает:
Д« =Гх (-* + eiД*> У + ДУ) Д* + Л (х> У + ду) ду,
и следовательно,
Ди — du = \fx (х 4- Дх, у 4- by) — f'x (х, j/)] Дх 4~
+ [fy (*, У + М.У) — fy (*, .У)] ДУ,
а так как, очевидно,
| Дх | p, | Ду | p,
TO
|A«~do| j д (x 61 Дх> у _|_ Ajz) _д {x> y} |
+1 fy (*, у 4- Mj) — fy {x, y) |.
394 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ (ГЛ. 22
Так как функции Д(х, у) и /^(х, у) непрерывны в точке (х, у),
то при р—>0 оба слагаемых правой части стремятся к нулю; мы
имеем, следовательно,
.. hu — du п
hm -------= 0
p-о Р
или, что то же, *
&u = du -j- о(р);
, ди А । да А , < .
этим доказано, что аи = -^~ Дх-f-^ &У есть дифференциал функ-
ции и в точке (х, у).
Сделаем еще следующее замечание. Если мы имеем, в частности,
tt=f(x, у) — х,
ТО
^=1 ^ = 0
дх ’ ду ’
и следовательно,
du = dx = &х;
подобным же образом, рассмотрение функции и=у приводит нас
к заключению, что dy = &y. Таким образом, и здесь, как в наших
прежних случаях, для независимых переменных приращения и диф-
ференциалы в точности совпадают между собой. Отсюда, в частности,
следует, что дифференциал функции w, если он существует, может
быть записан и в виде
du = dx -j- dy.
дх 1 ду
Ввиду того, что в случае функций двух переменных существо-
вание дифференциала, вообще говоря, не равнозначно существованию
частных производных, естественно встает вопрос о том, при каких
условиях целесообразно называть функцию двух переменных диффе-
ренцируемой в некоторой данной точке. Ответ на этот вопрос до
известной степени уже подсказывается тем, что нам известно до сих
пор. В то время как дифференциал характеризует нам поведение
функции при смещении данной точки в любом направлении, частные
производные информируют нас лишь о том, что происходит при сме-
щении этой точки в двух совершенно определенных (взаимно пер-
пендикулярных) направлениях (в частности, существование частных
производных может, очевидно, исчезнуть при простом повороте коорди-
натных осей около данной точки). Поэтому, естественно, согласились
называть функцию /(х, у) дифференцируемой лишь в тех
точках, где она имеет дифференциал, не довольствуясь существо-
ванием частных производных. Целесообразность такого определения
дифференцируемости будет многократно подтверждена в дальнейшем,
в частности в ближайшем § 91.
§ 91] ПРОИЗВОДНАЯ ПО ЛЮБОМУ НАПРАВЛЕНИЮ 395
Понятие дифференциала и все его свойства без существенных
изменений переносятся и на функции трех и более переменных. Так,
в случае функции ц=/(х, у, z) мы определяем дифференциал du
в точке (х, у, z) как выражение вида
du = А Дх В Ьу С Дг,
где А, В и С не зависят от Дх, &у и Дг, при условии, что Дм — du —о (р),
когда р= j/Дх2 Ду2 0* Как выше, мы легко убеждаемся,
что в случае, когда дифференциал существует, необходимо А =
В = ^9 С—^ . В частности, ^х = Дх, д?у = Ду, dz = kz, так что
ду9 dz
du = ^-dxj- dy-\- dz.
дх 1 dy 1 dz
Функция w, имеющая дифференциал в точке (х, у, г), называется
дифференцируемой в этой точке. Существование частных про-
изводных функции и в точке (х, у, z) еще не гарантирует ее, диф-
ференцируемости в этой точке; однако, если все три частные про-
изводные в точке (х, у, z) непрерывны, то функция и в этой точке
дифференцируема.
Упражнения к § 90 читатель найдет в задачнике Б. П. Демидо-
вича, отдел VI, задачи 96а, 97а, 104.
§91. Производная по любому направлению
Мы уже не раз отмечали, что частные производные функции
двух переменных дают нам представление о скорости ее изменения
лишь в направлениях координатных осей; эти два направления, вообще
говоря, ничем особо не выделяются из
числа всевозможных других направлений;
поэтому нам необходимо рассмотреть
теперь вопрос о быстроте изменения
функции u=f(x, у) при смещении точки
(х, у) в произвольном направлении.
Проведем через точку Р(х,у) полу-
прямую, образующую с положительным
направлением оси ОХ произвольный
угол ф (черт. 54), и перейдем от точки
Р(х, у) к произвольной точке Р (x-f-Ax,
y-f“A.y), лежащей на проведенной полу-
прямой. Расстояние р между точками Р
и Р, очевидно, равно у^Дх2 А_у2. Деля приращение Aw=/(x-j- Дх,
—/(х» -V) данной функции при переходе от Р к Р на рас-
стояние р между этими точками, мы получаем величину, которую
естественно рассматривать как среднюю скорость изменения функции
396 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
при этом переходе; если же при р->0 эта средняя скорость стре-
мится к некоторому пределу, то этот предел естественно расцени-
вать как (локальную) скорость изменения функции в данной точке
в направлении, характеризуемом проведенной нами полупрямой, кото-
рое Мы для краткости будем называть просто «направлением 9».
Этот предел, если он существует, мы и будем называть производ-
ной в направлении 9 функции и =/(х, у) в данной точке (х, у)
и обозначать 'через D^u или Dyf(x, у) там, где в таком обозначении
встретится надобность. Таким образом,
Dvf(x, у)= lim Л* + ^ + 4У)-/(*> у),
р-0 Р
где р = Дх2 4" &У* и где Дх и &у предполагаются изменяющимися
так, чтобы точка (х-|-Дл;, J' + Aj) всегда находилась на проведен-
ной нами полупрямой направления 9 (для этого, очевидно, необходимо
и достаточно, чтобы всегда было ^ = tg9). Очевидно, что частная
производная есть общее значение величин D^u и —DTCu, когда
эти две величины совпадают между собой; подобным же образом
есть общее значение совпадающих между собой величин DKu и
— D^u.
2
Допустим теперь, что функция u=f(x, у) в точке (х, у) диф-
ференцируема, т. е. имеет дифференциал, который, как мы знаем,
равен
. ди » । ди .
du — Дх + 3- Ду,
дх 1 ду
причем при переходе от точки Р к точке Р'
Дн=/(х-|-Дх) у + y) = du-\-o(y),
откуда
Ди ди^ Дх . ди^ Ду о (р)
р дх р "т" ду р ' р *
или, так как Дх = рсо$ф, Ду = р81пф (см. черт. 54),
Ди ди , ди . I о (р)
— =з- cos ф + ^- sm ф н—— .
р дх т 1 ду т 1 р
Когда точка Р' неограниченно приближается к точке Р по на-
правлению ф, т. е. когда р->0, первые два слагаемых правой части
последнего равенства остаются постоянными, а третье стремится
к нулю. Поэтому мы в пределе получаем:
..Ди ди , ди .
J1“o7=^cos? + ^
§ 91] ПРОИЗВОДНАЯ ПО ЛЮБОМУ НАПРАВЛЕНИЮ 397
Таким образом, мы доказали следующее предложение, очевидно,
подчеркивающее целесообразность избранного нами определения диф-
ференцируемости функции двух переменных.
Теорема 1. Если функция u=f (х, у) дифференцируема
в точке Р, то она имеет в этой точке производную по любому
направлению ф и
гу ди । ди .
D-₽M = ^cos? + d7sln?-
Мы видим, что для дифференцируемой функции знание частных
производных (т. е. производных по двум взаимно перпендикулярным
направлениям) позволяет непосредственно, не производя никаких
вычислений, написать выражение производной по любому направлению.
Так как при изменении данного направления на прямо противо-
положное (т. е. при переходе от ср к ср 4“ к) cos 9 и sin 9 меняют
знак, то для любого направления ср мы имеем:
+ j(M)== (к)>
т. е. производные по двум взаимно противоположным направле-
ниям совпадают по абсолютной величине, но имеют разные знаки.
Для производных по направлениям координатных осей мы это уже
видели выше.
Рассмотрим теперь аналогичную задачу для функции трех пере-
менных u=f(x, у, г). Проведем через точку Р(х, у, z) полупря-
мую, образующую с положительными направлениями координатных
осей соответственно углы а, £ и у, и возьмем на этой полупрямой
произвольную точку Р (х Да;, У + Ду, * + А^). Обозначим через
р= /дх2 4-Ду2 + Д-2*
расстояние между точками Р и Р; мы, очевидно, имеем:
Ax = pcosa, Ay = pcosp, Дг = рсо8 7.
Допустим теперь, что функция и дифференцируема в точке (х, у, г),
так что при р О
ди=/(х4-Дх, .У4-Д-У, ^4-Дг)—/(х, -У, *) =
=йр cos a + %р cos р +йр cos 7+° (р)-
Если мы будем неограниченно приближать точку Р к точке Р, оста-
ваясь все время на проведенной нами полупрямой, то мы будем иметь
р -> О, в то время как углы а, р, и у будут оставаться постоянными;
поэтому мы получаем:
lim — = cosa cos 0+ cosy.
₽ дх дг
398 дифференцирование функций нискольких переменных [гл. 22
Этот предел, как и в случае функций двух переменных, очевидно,
характеризует собой локальную (в точке Р(х, у, г)) скорость изме-
нения функции и при смещении точки Р в выбранном направлении,
характеризуемом углами а, р и у. Поэтому этот предел мы и здесь
называем производной Du функции и в данном направлении. Таким
образом, если функция u=f (х, у, z) дифференцируема в точке. Р,
то она имеет в этой точке производную Du по любому напра-
влению (а, р, у) и
гу ди . ди а , ди
Dll = -^- COS01—j—-т—COSР 4- 75- COSY. (1)
дх 1 ду г 1 dz • v 7
Упражнения к § 91 см. в задачнике Демидовича, отдел VI, задачи
198, 199, 201.
§ 92. Дифференцирование сложных и неявных функций
Мы рассмотрим теперь две задачи, в которых речь идет об обыч-
ном дифференцировании функций одной переменной, но которые мы
в свое время не могли изучать, так как методы их решения требуют
знакомства с дифференцированием функций нескольких переменных.
1. Пусть w=/fx, у) есть функция от двух переменных х и у,
каждая из которых мыслится, однако, не как независимая переменная,
а как функция некоторой (одной и той же в обоих случаях) новой
переменной t: x = cp(t), y = ^(Z). Тогда
«=/[ф(0. ф(0]
становится сложной функцией от t. Задача состоит в том, чтобы
найти производную величины и по независимой переменной /, зная
ди ди dx r dy .,
частные производные и производные = ср (г) и = у (г).
При этом существование всех этих производных является предпо-
сылкой задачи, существование же искомой производной должно
быть доказано. Относительно функции f(x, у) мы допустим, что
в точке x = 9(Z), ^ = Ф(0 она имеет не только частные производ-
ные, но и дифференциал.
Пусть приращению AZ величины t соответствуют приращения Дх,
Ду величин х, у, в свою очередь влекущие за собой приращение Д«
величины и. Положим /Дх2 &у* — Р- Тогда, как мы знаем,
Ди = </м + о(р) = ^Дх + ^Д^4-ар,
где а—>0 при р->0. Отсюда
дх М ' ду М У \Д< / \Д// ' '
§ 921 ДИФФЕРЕНЦИРОВАНИЕ СЛОЖНЫХ И НЕЯВНЫХ ФУНКЦИЙ
399
Пусть теперь >0. При этом Дх->0 и Ду->0 (так как х и у
дифференцируемы, а следовательно, и непрерывны); поэтому и р -> 0,
а значит, и а—>0. Так как, с другой стороны, при Д/->0 производ-
им ди Ьх Ду
ные дх И ду П0СТ0ЯННы> а отношения & и имеют своими пре-
dx ,, .. dv . г х ух
делами соответственно —- = ф (г) и = ф (г), то правая часть со-
отношения (1) при Д/->0 имеет пределом
ди dx । ди dy
дх dt ' ду dt '
/р du Дм
Гем самым доказано, что -тт = lim А7- существует и
at д/-*о
du du^dx .ди dy
dt дх dt ду dt ’
(2)
Эта простая формула, очевидно, полностью решает поставленную
задачу.
Заслуживает особого внимания часто встречающийся случай, когда
х = ф (/) = /, т. е. когда новая переменная t совпадает с одной из
старых переменных. Это означает, что величина и задается, нам как
функция двух переменных х и у, причем х — независимая перемен-
ная, ay = ty(x) — некоторая данная функция от х: u=f[x, ф (х)].
Полагая в формуле (2) dt — dx, мы находим:
du ди . du dy
dx дх' ду dx* * '
Как левая часть, так и первое слагаемое правой части этой формулы
представляют собой производные функции и по независимой пере-
менной х; однако эти производные не совпадают между собой, так
ди
как их находят при различных предположениях: есть частная
производная и по х, т. е. вычисляется в предположении, что вели-
* du
чина у остается постоянной; напротив, есть «полная» производ-
ная и по х, т. е. вычисляется в предположении, что величина ^/ = ф(х)
совершенно определенным образом изменяется при изменении х.
Формула (3) наглядно показывает нам, насколько важно иметь раз-
личные обозначения для частных и полных производных.
Пример, и = ~ , у = ]/1 — х?;
ди_____у ди_____ I. dy_________х ________ х ,
дх х2’ ду х ’ dx у 1 _ Х2 у ’
по формуле (3) имеем:
du у I х х2 -f- у8 ________________1______
dx — х* ~ х ’ у х2у — ‘
400 дифференцирование функций нескольких переменных [гл. 22
Совершенно аналогичным образом решается вопрос о производ-
ной и в том случае, когда и задается как дифференцируемая
функция любого числа переменных, каждая из которых есть в свою
очередь дифференцируемая функция от t. Так, в случае u=f(x, у, г),
х = ф(0, «У = ф(О> г = Х(0 мы находим:
du ди dx । ди dy . ди dz ди , , ди .. ... . ди f ... ...
Tt = Txd-t+-^ft+di Ш = & + ъ W + (О- (4)
Вывод этого соотношения читатель легко проведет самостоятельно
по аналогии с проведенным выше выводом формулы (2).
Во всех рассмотренных нами до сих пор случаях мы имели дело
с таким положением, когда в основе задачи лежит одна независимая
переменная (которую мы обозначали через /). Однако в приложениях
очень часто бывает, что и независимых переменных имеется несколько.
Пусть мы, например, имеем, как выше, и =f (х, .у), но пусть на этот
раз х и у представляют собой функции двух переменных: х = ^(/, $),
y = ^{t, s). Тогда ц,
И=/[ф(Л ®)> ф (Л «)]
становится функцией тех же переменных; и в этом случае мы говорим
о сложной функции. Задача состоит в том, чтобы, зная частные про-
изводные функции f(x, у) по х и у, а также частные производные
функций ф(/, 5) и по t и $, найти частные производные
величины и по t и 5. Так как частное дифференцирование ничем не
отличается от дифференцирования обычного (выполняемого при опре-
деленных условиях), то эта задача, разумеется, не требует нового
рассмотрения. Она решается соотношениями, аналогичными формуле (2):
ди___ди дх . ди ду
dt дх dt ‘ ду dt ’
ди___ди дх । ди ду .
ds дх ds ' ду ds ’
к подобным же выводам мы приходим и в случаях, когда число про-
межуточных функций или число независимых переменных больше
двух.
2. Переходим к рассмотрению второй задачи. Пусть нам дано
произвольное уравнение с двумя переменными
F(x, з/) = 0. (5)
Вообще говоря, оно определяет собой одну или несколько функ-
ций у независимой переменной х*); так, уравнение
ху — 2х Зу — 1=0
*) Условия, при которых эго имеет место, будут подробно исследованы
в главе 24.
§ 92] ДИФФЕРЕНЦИРОВАНИЕ СЛОЖНЫХ И НЕЯВНЫХ ФУНКЦИЙ 401
определяет одну функцию
а уравнение
х2-)-^2—1 = 0
— две функции
_у = 4" у/1—х2, у = — у/1 — х2;
бывает много случаев, когда функции, определяемые данным урав-
нением (5), не могут быть выражены через х элементарными фор-
мулами, как это имело место в двух приведенных нами простых при-
мерах; независимо от того, удается такое выражение или нет, каж-
дая функция j/=/(x), тождественно удовлетворяющая в некоторой
области значений х уравнению (5), называется неявной функцией,
определяемой этим уравнением. Наша задача состоит в отыскании
производной такой неявной функции.
Пусть y—f(x) — неявная функция, определяемая уравнением (5);
тогда мы имеем при любом х в некоторой области
F[x,f(x)}.=Q,
вследствие чего в этой области и
dF[x, /(х)1 _д
dx
при любом х. Допустим теперь, что функции F(x, у) и /(х) обе
дифференцируемы; тогда формула (3) дает:
dF [х, /(х)] _dF . dF dy ,
dx дх • ду dx9
следовательно, мы имеем в данной области при j/=/(x)
i п
дх ' ду dx 9
откуда
dF
dy___дх
dx~ dF
ду
(6)
^если только, конечно,
Эта формула и решает поставленную нами задачу. По поводу
этого решения необходимо, однако, сделать следующее замечание.
На первый взгляд может показаться странным, что нам удается найти
«явное» выражение (6) производной даже в тех случаях, когда
26 А. Я. Хинчин
402 дифференцирование функций нескольких переменных [гл. 22
мы не умеем «явно» выразить самую функцию у, т. е. решить отно-
сительно у уравнение (5). Ведь решить это уравнение означало бы
выразить у через х с помощью какой-либо элементарной формулы;
было бы действительно странно, если бы мы, не умея сделать этого
для самой функции у, во всех случаях могли решить ту же задачу
для ее производной однако формула (6) вовсе не дает такого
dy
выражения для ; так
dF dF
как и нам заданы как функции двух
переменных х и у, то через эти же две переменные формула (6)
dy т-r
выражает производную ~. Поэтому если явное выражение функ-
ции у через х нам неизвестно, то формула (6) не может дать нам
явного выражения через х и для производной этой функции.
Тем не менее формула (6), устанавливающая связь между произ-
водной неявной функции и частными производными той функции двух
переменных, которая ее определяет, имеет большое теоретическое зна-
чение и целый ряд важнейших применений, с некоторыми из которых
мы встретимся в дальнейшем.
Пример. Пусть у определяется как неявная функция от х
уравнением
F(x, у) = ху* — х*у— 2 = 0;
мы имеем:
й=-ув-бхъ'’
и формула (6) дает:
dy________ у (у4 — бх4)
dx х (5у4 — х4) '
Упражнения к § 92 см. в задачнике Б. П. Демидовича, отдел VI,
задачи 137—139, 223—226, 229, 231.
§ 93. Однородные функции и теорема Эйлера
Многочлен Р(х, у) от двух переменных называется, как известно,
однородным, если во всех его членах сумма показателей при
переменных х и у имеет одно и то же значение k, называемое в этом
случае степенью однородности данного многочлена. Так,
многочлен
ах3 -|- bx*y -j- сху* + dy3
при любых коэффициентах a, b, с, d будет однородным многочленом
третьей степени.
Если Р(х, у) есть однородный многочлен степени то мы,
очевидно, имеем при любом t (и при любых х, у)
P(tx, ty) = tkP(x, у).
§ 93] ОДНОРОДНЫЕ ФУНКЦИИ И ТЕОРЕМА ЭЙЛЕРА 403
Это свойство однородных многочленов может служить основанием
для очень полезного расширения понятия однородности функции.
Условимся вообще называть однородной функцией степени &
любую функцию /(х, у), тождественно (т. е. при любых х, у, t)
удовлетворяющую соотношению
Ktx, ty) = tkf(x, у). (1)
В отличие от случая многочленов, здесь показатель k может иметь
любое вещественное значение; само собой разумеется, t при этом
должно получать лишь такие значения, для которых & имеет опре-
деленный смысл; так, например, при k 0 мы должны иметь i ф О,
при k = ~ должно быть ^0, и т. д.
Примеры. х , -х, --f представляют собой однород-
х~гУ х ~гУ х “г.У
ные функции, степени которых соответственно равны 1, 0 и — 1.
Для частных производных однородной функции имеет место про-
стое и удобное во многих приложениях соотношение, найденное
Эйлером. Пусть /(х, у)— однородная функция степени k. Будем
считать в соотношении (1) величины х и у постоянными, а величину £
переменной, так что обе части этого соотношения будут функциями
от t. Тождество (1) мы можем тогда дифференцировать по t. В левой
части мы, очевидно, имеем сложную функцию от /, производная
которой найдется по формуле (2) § 92: полагая tx = u, ty = v, мы
находим:
df(u, v)__df(u, v) du <df(u, v) dv_ df(u, v) . df(u, v)
dt du dt ’ dv dt X du • dv
Производная же правой части соотношения (1) равна £/*-1/(x, у)\
полученные нами две производные равны между собой при любых
х, у, t; полагая в них, в частности, t= 1, мы находим ц = х, v—y,
и следовательно,
Это и есть соотношение Эйлера. Тем же путем легко установить
аналогичное соотношение для однородных функций любого числа
переменных; мы ограничимся формулировкой результата для случая
функции трех переменных.
Функция/(х, у, г) называется однородной степени k, если
тождественно имеет место соотношение
f(tx> ty, tz) = Pf(x> у, z);
для такой функции, если она дифференцируема, мы имеем:
XV+ V+^=i/,
dx 1 dy 1 dt J
Упражнения см. в задачнике Б. П. Демидовича, отдел VI, задача 93.
26*
404 дифференцирование функций нескольких переменных [гл. 22
§ 94. Частные производные высших порядков
являются
и. К ним
тт ди ди < г, х
Частные производные и функции u=f(xt у)
функциями тех же переменных х и у, от которых зависит и
поэтому снова могут быть применены операции частного дифферен-
цирования по каждой из этих переменных. Частные производные по
. ди ди ,
х и у функций и называются, по отношению к исходной функ-
ции ц, производными
ди ди
водных " --------
ох
всего мы получаем четыре
обычно обозначаются так:
второго порядка. Каждая из произ-
и порождает две производные второго порядка, так что
производные второго порядка* которые
дх\дх)~ дх*~?*х(х’
jd[du\ д2и .
ду \дх) “ дх~ду ~Jx>
д [ди \ д2и j,, .
дх\ду)~ду дх~'ух(х’ У)>
д [ди\ д2и ч
ду ~ ду3
В свою очередь каждая из этих четырех производных второго порядка
являетсй функцией тех же переменных х и у и может иметь част-
ные производные по этим переменным, которые мы будем называть
производными третьего порядка функции к. Обозначения для произ-
водных третьего порядка вводятся по полной аналогии с предыдущим
и не требуют особых пояснений; так,
означает функцию, получаемую трехкратным дифференцированием
функции ц==/(х, у), причем первые два раза дифференцирование
производится по х, а в третий раз — по у. Вообще, частные произ-
водные первого порядка любой из производных порядка п называются
частными производными порядка п -}-1 функции и и получают обо-
значения, аналогичные только что описанным. Очевидно, что для функ-
ции двух переменных число производных третьего порядка равно
восьми, и вообще число производных порядка п равно 2П. Частные
производные высших порядков занимают очень большое место в мате-
матическом аппарате точного естествознания; в особенности значи-
тельно применение их в математической физике.
Частные производные высших порядков обладают одним очень
важным свойством, которое делает их совокупность значительно легче
обозримой и сильно упрощает большинство связанных с ними формул.
§ 94] ЧАСТНЫЕ ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ 40В
Свойство это состоит в том, чго две частные производные одного и того
же порядка, если они отличаются друг от друга только порядком
произведенных дифференцирований и если обе они непрерывны, в точ-
ности совпадают друг с другом.
Обратимся сначала к производным второго порядка. Функции
fxy(x, У) и fyX (х, у) получаются из функции u=f(x, у) двукрат-
ным дифференцированием. В обоих случаях из этих двух дифферен-
цирований одно совершается по х, а другое по у\ различие обусло-
влено лишь тем, в каком порядке производятся эти две операции.
Мы утверждаем, что если в некоторой точке (х, у) функции fXy и
fyX обе непрерывны, то
fxy(x> y}==fyx(x> У)*
Чтобы доказать это, рассмотрим выражение
Д=/(х4-Дх, у-[-^у) — /(x-f-Дх, y)—f(x, У&у) f (х, у).
Полагая при постоянных у и &у
f(x, _у + Ду)— f(x, _у) = ф(х).
мы, очевидно, можем написать
Д = ф(х4-Дх) —<р(х). (1)
Из существования вторых производных функции f вытекает суще-
ствование у нее первых производных в некоторой окрестности точки
(х, у); поэтому, если Дх и &у достаточно малы, функция ф (х) диф-
ференцируема в отрезке (х, х -|- Дх). Применяя к правой части фор-
мулы (1) теорему о конечном приращении, мы находим:
Д = qp' (х -|- Дх) Дх,
где 0<^Oi 1. Но из определения функции ф(х) следует
ф' <Х) =fx {х, y+^y)—fx(X, У),
так что мы получаем:
Д = [Д(х + 6,Дх, у + Ду)—Д(х4-61 Дх, .у)] Дх. (2)
Но, с другой стороны, применение теоремы о конечном прираще-
нии к разности, стоящей в прямых скобках в правой части послед-
него равенства, очевидно, дает:
Л(* + Мх, y-\-by)—fx(x-\-bibx, _у) =
== Ду (X + 61 Дх, у + W) Д.У,
где снова 0<^Оа<^1. Поэтому соотношение (2) дает:
д = ft? (х + OtAx, у 4- 6,Ду) Дх ДЛ (3)
406 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
Теперь мы вернемся к первоначальному выражению величины Д
и преобразуем его другим способом. Положим
/(х4-дх, y)—f(x, _у)=фсу),
так что
, д=фсу+ду)—фсу),
или, применяя теорему о конечном приращении,
Д = <|»'Су4-
где 0<^63<^1. В силу определения функции ф(_у)
Ф'Су)=Л(х+Дл;> у)~ fy(x> у\
и мы находим:
д = \fy (X + Дх, у 4- 63Ду) — fy (х, у + 93Д_у)] by,
или, снова применяя теорему о конечном приращении,
д = fix (х + 63Дх, у + 63Д_у) Дх by (0 < 0J < 1). (4)
Сопоставляя равенства (3) и (4), мы находим, что при Дх Ду 0
Лу (X 4- 61 Дх, у 4- 62 by) —fix (х 4- 63 Дх, у 4- 03 by).
Заставим теперь Дх и &у стремиться к нулю так, чтобы иметь все
время ДхДу^О. Так как функции fxy и fyX по нашему предполо-
жению непрерывны в точке (х, у), то переход к пределу дает:
Лу {х, у) =ЛХ (X, у), (5)
что и надо было доказать.
Обратимся теперь к общему случаю. Пусть мы имеем сначала две
частные производные одного и того же порядка п^2, отличаю-
щиеся друг от друга только тем, что в одной из них два последо-
вательных дифференцирования производятся в обратном порядке по
сравнению с другой, например
Л5) /(5)
Jххуху ’ Jхухху ’
где различие сводится к перестановке второго и третьего дифферен-
цирований, все же остальные операции протекают в обоих случаях
совершенно одинаково. Очевидно, из того, что мы только что дока-
зали, вытекает совпадение между собой таких двух производных
(при соблюдении требуемых условий непрерывности); так, в нашем
примере, применяя равенство (5) к функции f'x(x, у), мы находим:
/1И XIII
хху---JxyXf
§ 95] ФОРМУЛА ТЭЙЛОРА ДЛЯ ФУНКЦИЙ ДВУХ ПЕРЕМЕННЫХ 407
дифференцируя же далее обе части этого равенства сначала по х,
а затем по у, мы и приходим к равенству между двумя данными
производными пятого порядка.
Но в самом общем случае, когда мы имеем две любые производ-
ные порядка zz, отличающиеся друг от друга только порядком произ-
водимых дифференцирований, мы, очевидно, можем постепенно перейти
от одной из них к другой рядом перестановок двух соседних
дифференцирований. Так как всякая такая перестановка оставляет
производную неизменной, то и две данные производные совпадают
между собой.
Доказанное таким образом предложение прежде всего значительно
сокращает число различных между собой производных порядка п
и делает совокупность их более легко обозримой. В самом деле,
если порядок дифференцирований безразличен, то мы можем, напри-
мер, получить любую производную, выполняя сначала все необходи-
мые дифференцирования по х, а затем — все положенные дифферен-
цирования по у; поэтому любая производная порядка п функции и
может быть представлена в виде
дпи
dxkdyn~fc *
где k — одно из чисел ряда 0, 1, ... , я. Это сразу показывает, что
число различных между собой производных порядка п равно п -1- 1,
тогда как раньше мы имели таких производных 2я, т. е. при боль-
ших п во много раз больше.
Определения и обозначения, связанные с частными производными
высших порядков, остаются в силе и для функций, зависящих от
трех и более переменных. Остается справедливой и возможность
изменения порядка производимых дифференцирований при условии
непрерывности сравниваемых между собой производных. Доказатель-
ство этой теоремы непосредственно вытекает из предыдущего, так как
любое изменение порядка дифференцирований для функции любого
числа переменных, очевидно, может быть реализовано рядом перемен
порядка двух соседних дифференцирований, а такая перемена, как
мы доказали, оставляет результат неизменным.
Упражнения к § 94 см. в задачнике Б. П. Демидовича, отдел VI,
задачи 82, 112, 113, 118—120, 162, 164, 166.
§ 95. Формула Тэйлора для функций двух переменных
Все соображения, которые побудили нас в свое время (в главе 9)
создать для функций одной переменной представление с помощью
формулы Тэйлора, остаются в полной силе и для функций любого
числа переменных: и здесь, как там, для теоретических и практиче-
ских целей очень удобно иметь возможность приближенного предста-
вления данной функции в виде многочлена той или другой степени.
408 дифференцирование функций нескольких переменных [гл. 22
С другой стороны, первоначальные предпосылки такой возможности
в нашем новом случае налицо в такой же мере, как и прежде. В свое
время формула Тэйлора была нами получена, как результат дальней-
шего развития идеи, заложенной в простой формуле
f(x 4- h) —/(х) = hf (х) 4- о (Л),
имеющей место для всякой дифференцируемой функции. Но в случае
дифференцируемой функции двух переменных u=f{x, у) мы имеем
совершенно аналогичную формулу
Ди=/(х4-й, y-\-k)—f(x, y) = hfx(x, y) + kfy(x, j)4-o(p),
где p = у/Дх2 4- Д.У2- Поэтому у нас есть все основания попытаться
построить и здесь приближенное выражение величины f (х h, у k)
в виде многочлена, расположенного по степеням приращений h и k.
Это действительно можно было бы сделать, повторяя с соответст-
вующими изменениями и усложнениями весь тот путь, который
в главе 9 привел нас к формуле Тэйлора для функций одной пере-
менной.
Мы можем, однако, гораздо быстрее и проще прийти к намечен-
ной цели, если вместо того, чтобы начинать все сначала, восполь-
зуемся тем, что нами уже построена одномерная формула Тэйлора.
Путь, которым мы при этом пойдем, выгоден еще и по той причине,
что он протекает совершенно одинаково для функций любого числа
переменных, и только ради сокращения записи мы ограничиваемся
случаем функции двух переменных. Будем считать постоянными как
значения х и у, так и их приращения h и k и рассмотрим функцию
Ф (О =f(x 4- ht, у 4- kt) (1)
одной переменной t в отрезке Допустим, что функция
/(х, У) имеет все частные производные до порядка п включительно
и что все эти производные дифференцируемы в точке (х, у). Тогда
в силу формулы (2) § 92 производная (t) существует и равна
= j/ d (. + Л<) if + W = hif+kif
T v 7 dx dt 1 dy dt dx 1 dy 9
где обе частные производные берутся в точке (х ht, у kt). При-
меняя ту же формулу к функции 9' (/) и пользуясь тем, что в силу (5)
§ 94
d*f _ d*f
dx dy dy dx9
мы легко находим:
ф" (t)=л2 -4- 2hk ъЦг 4- а2 4^4,
т 4 7 dx* ' дхду 1 dy*9
§ 95] ФОРМУЛА ТЭЙЛОРА ДЛЯ ФУНКЦИЙ ДВУХ ПЕРЕМЕННЫХ 409
где снова все частные производные берутся в точке (x-\-ht,y-\-kt).
Тем же путем мы далее получаем:
Г <о=+3*** +ЗМ« Д, 4- .
Эти формулы заставляют предполагать, что в случае существо-
вания и дифференцируемости всех входящих частных производных
имеет место общая формула
п
т‘”и= 2ч*’-'4'(2)
г = 0
где все частные производные берутся в точке (х -|~ ht, у kt). Фор-
мула (2), установленная нами для я=1, 2, 3, в общем виде может
быть доказана, как мы теперь увидим, с помощью индукции — от п
кл-|-1; доказательство это, простое и прозрачное в идее, сопря-
жено, однако, с довольно громоздкими вычислениями.
Итак, пусть формула (2) верна для некоторого п и пусть все
входящие в нее частные производные дифференцируемы в точке
(x^-ht, y-\-kt). Применяя к функции (/) формулу (2) § 92, мы
находим:
ф(«+!) га — V. Crhn~rkr ( h । £ dn^f | —
9 W ^Пп к | n дхп-г+1 дуг "Г * dxn-r dyr+1 (
r = 0
n n
- 2 2 =2+Z-
r = 0 r = 0
Во второй из этих сумм мы преобразуем индекс суммирования, пола-
гая г — s—1; таким образом,
л Ц- 1
у — у cs^hM‘s ks
L * dxw-sdys>
s = I
или, обозначая новый индекс суммирования попрежнему через г,
п +1
У = У с'~1 hn+l~rkr Г • (3)
^2 п дхп+1~г дуг v J
г — 1
Заметим еще следующее: если мы условимся считать при любом п
С-1 =Сп+* = 0,
п п
то мы можем, как в выражении суммы 2,, так и в выражении (3)
суммы X» производить суммирование от г — 0 до r=«-J~ Ъ ничего
410 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
не меняя в этих суммах. Поэтому мы находим: z
я 4" 1
ф(я+1)ю= 2(С« + СГ1)АП+1_ГЛГ^%?-
г = 0
Но по известному свойству биномиальных коэффициентов
crn + cra-l=Q+l (О^г^л+1);
поэтому мы получаем:
л -J-
т,"+,,и= 2
г — 0
т. е. формула (2) остается верной и при замене п на тем
самым эта формула доказана во всей своей общности.
В частности, этим установлено существование у функции <?(/)
производной порядка л, если, как мы предположили, функция f(x,y)
обладает дифференцируемыми частными производными до этого
порядка включительно. Отсюда следует, что для ф(/) имеет место
формула Маклорена
?(0=Т(0)4-/<(0) + ^?"(0)+...
где мы написали остаточный член в хорошо известной нам из § 39
специальной форме Лагранжа; в частности, при t = 1
»<1) = Т(0) + ч='(0)+^Т"(0>+
где 0<6<Ч. Но 9(0)=/(х, jO, ?(1) = /(4+ + ^)> а последова-
тельные производные функции 9 при / = 0 выражаются с помощью фор-
мулы (2), где все частные производные надо брать уже в точке (х, у).
Таким образом, мы получаем:
/(* + *, , + *)=№. у) + (k g + k +1 (л> g +
_L ^hk 4- k*-I- -4- 1 V Cr hn~l~rkr I
лплдхду dy*)' ••• + („__ 1)! «-1 dxn~l~rdyr'
r = 0
I J V M-W dnf{x-\-^y^^
‘ n\ L “ * dxn~r~dyr ~ W
r = 0
§ 95] ФОРМУЛА ТЭЙЛОРА ДЛЯ ФУНКЦИЙ ДВУХ ПЕРЕМЕННЫХ 411
где 0 в 1 и где все частные производные, за исключением вхо-
дящих в последнюю сумму (остаточный член) правой части, берутся
в точке (х, у) (и, следовательно, не зависят от h и k).
Полученная формула полностью решает поставленную нами задачу,
так как дает приближенное выражение величины /(x-|~^, +
в виде многочлена степени п — 1 относительно h и k, причем оста-
точный член имеет, как легко видеть, требуемую форму о(рп"1)
(р = j/A2 -f- £а), так как | h | р, | k | р и, следовательно,
| hn~rkr | рп = о (р""1) (О г л).
Выбранная нами подробная запись этой формулы страдает, однако,
некоторой громоздкостью (хотя сама формула имеет прозрачную
структуру и легко запоминается, несмотря на внешнюю сложность).
Эта громоздкость еще значительно увеличивается, когда мы от функ-
ций двух переменных переходим к функциям трех и более перемен-
ных. Поэтому в целях более краткой записи формулы Тэйлора часто
прибегают к удобному символическому приему. Напишем для любого
натурального числа q выражение
(л
\ дх 1 ду / J
Если мы будем возводить двучлен, стоящий в скобках, в ^-ю степень
по формуле бинома, считая д числом (а не символом дифференциро-
вания), то мы получим:
[ 2 ч 2 ч
г = 0 г = 0
т. е. ^с точностью до множителя как раз #-й член формулы
Тэйлора. Условимся еще короче писать
lh
\ дх 1 ду] J &
таким образом, Lq становится некоторой производимой над функ-
цией f вполне определенной операцией, содержание которой мы
только что описали с полной точностью. Пользуясь введенными
обозначениями, мы можем записать формулу Тэйлора в символи-
ческом виде
/(X + », у + 4) = 1 (л £ + к f (х, у) +
д = 0
+ + № + ««. з- + «‘).
412 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
или, еще короче,
п — 1
/(*+*. y-\-k) = 2 ^Lqf{x, j)4--Ll„/(x + 6A, jr + 6A).
g = 0
Упражнения к § 95 читатель найдет в задачнике Б. П. Деми-
довича, отдел VI, задачи 390, 391, 396, 398, 400, 406, 407.
§ 96. Экстремальные значения
Максимум и минимум функции любого числа переменных в дан-
ной области значений этих переменных определяются в точности
так же, как в одномерном случае. И здесь приобретает основное
значение понятие точки локального экстремума: так мы
называем внутреннюю точку данной области, в которой значение
функции не меньше (или не больше), чем в любой другой точке,
достаточно близкой к данной. Как и в одномерном случае, экстре-
мум функции в данной области может наступить либо на границе
области, либо в некоторой внутренней точке, которая в этом случае
обязательно будет и точкой локального экстремума. Разумеется,
в многомерном случае дело осложняется тем, что даже для про-
стейших областей в конкуренцию вступают все точки границы —
в бесконечном числе (в одномерном случае граница отрезка состояла
всего из двух точек); приходится поэтому находить наибольшее или
наименьшее значение функции на контуре данной области, т. е.
решать дополнительную экстремальную задачу. Правда, в реальных
задачах очень часто те или другие предметные соображения позво-
ляют заранее считать известным, что функция принимает, например,
свое наибольшее значение внутри (а не на границе) области, и тем
самым существенным образом упрощают решение задачи. Как бы
то ни было, задачей дифференциального исчисления и здесь остается
разыскание точек локального экстремума.
Если функция u=f(x, у) имеет локальный экстремум в точке
(а, й), то непосредственно ясно, что функция
<Р(-*7)=/<ЛГ, А)
одной переменной х должна иметь локальный экстремум в точке
х = а. Допустим, что функция /(х, у) дифференцируема всюду
в данной области; тогда, очевидно, в некотором соседстве точки а
функция ^(х) имеет производную, равную f'x(x, b). Из § 41 мы
знаем, что отсюда следует срг(а) = О, т. е. частная производная
функции /(х, у) в точке локального экстремума х=а, у = Ь
должна обращаться в нуль. В точности аналогичное рассуждение
показывает, разумеется, что в той же точке мы должны иметь и
|£ = 0. Наконец, тем же путем мы легко убеждаемся, что полу-
§ 96] ЭКСТРЕМАЛЬНЫЕ ЗНАЧЕНИЯ 413
ценный нами результат остается в силе и для функций любого
числа переменных: если такая функция дифференцируема в неко-
торой области, то во всякой точке локального экстремума
(лежащей внутри данной области), частные производные по всем
переменным должны равняться нулю,
И здесь мы будем называть стационарной такую точку,
в которой обращаются в нуль частные производные данной функции
по всем переменным; формула (1) § 91 показывает, что в стацио-
нарной точке производная данной функции по любому направлению
равна нулю; таким образом, стационарная точка есть как бы точка
минимальной изменяемости функции при сдвиге в любом направле-
нии, чем и оправдывается ее наименование.
Таким образом, и в многомерном случае задача отыскания экстре-
мальных значений прежде всего требует нахождения всех стацио-
нарных точек данной функции в данной области. Если речь идет
о функции п переменных, то, приравнивая нулю частные производные
этой функции по всем переменным, мы получаем для определения
координат стационарных точек систему п уравнений с п неизвест-
ными. Решение этой системы не является уже делом дифферен-
циального исчисления.
В дальнейшем, предполагая все стационарные точки уже найден-
ными, мы должны, подобно тому как мы это делали в одномерном
случае, для каждой такой точки исследовать в отдельности, дает
ли она максимум или минимум данной функции, или не дает ни того,
ни другого. Это исследование в многомерном случае протекает
значительно сложнее, чем в одномерном, и мы покажем здесь лишь
для случая функций двух переменных, как строятся его первые шаги.
Пусть Р(а, Ь) — стационарная точка функции u=f(x, у) и
пусть эта функция имеет в точке Р все частные производные
второго порядка. Рассмотрим наряду с Р точку Q(a-\-h, b-\-k)
и обозначим через р расстояние между этими двумя точками, так что
р =
пусть, наконец, А, В и С соответственно означают частные произ-
водные
ду ду d3f
дх2 9 дх ду 9 ду2
в точке Р, В силу формулы Тэйлора ((4) § 95) мы тогда имеем
при р -> О *):
Д«=/(а-|-/г, & + &) — f(.a> й) = 1(Ай«4-2ВЛАН-СА!’)4-о(р’).
*) Члены первого порядка относительно h и k обращаются в нуль ввиду
стационарности точки Р(а, Ь).
414 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [гЛ. 22
Если обозначить через а угол, образуемый вектором PQ («сдвигом»
точки Р) с положительным направлением оси ОХ, то, очевидно,
h = р cos a, k = р sin а,
и следовательно,
Ди=/(а4-/г, *4-Л)—/(а, Ь) =
= у р2 (A cos2 а 2В cos а sin а С sin2 а) о (р2).
Пользуясь этим выражением приращения Дм, легко убедиться,
что природа взятой стационарной точки Р(а, Ь) зависит от пове-
дения величины
ср (а) = A cos2 а 2В cos а sin а Ц- С sin2 а
как функции «угла сдвига» а, изменяющегося от 0 до 2тг. Пусть,
например, ср (а) О (0 а 2к). Будучи непрерывной функцией
от а, ср (а) имеет в отрезке (0, 2к) некоторое наименьшее значение
р., которое по предположению положительно; в силу полученного
выражения для Ди мы имеем при р->0
ди=ра{4-,;р(а)+о(1)}>
а так как ср (а) it (0 ^а^2тг), то при достаточно малом р мы
будем иметь Дн^>0, каково бы ни было а; но это означает, что
функция u=f(x, у) имеет минимум в точке (и, Ь). В точности
тем же путем мы убеждаемся, что в случае, когда ф(а)<С0
(0^а^2тг), функция u=f{x, у) имеет в точке (а, Ь) максимум.
Наконец, если ср (а) принимает в отрезке (0, 2тг) как положительные,
так и отрицательные значения, то пусть 9(оц)^>О и ф(а9Х0.
Заставляя р стремиться к нулю при постоянном а, мы при доста-
точно малом р, очевидно, будем иметь Ди^>0 при 01 = 04 и Ди<^0
при а = а2. Это показывает, что функция u=f(x, у) в стацио-
нарной точке (и, Ь) не имеет ни максимума, ни минимума. Таким
образом, знак величины ср (а) при О а 2тг действительно имеет
решающее значение для исследования характера данной стационар-
ной точки.
Известно, что в исследовании знака такого «квадратичного трех-
члена», какой представляет собой функция 9(a), решающую роль
играет знак «дискриминанта» Д = ЛС—В2. Мы должны поэтому
рассмотреть три случая.
1. Д = ЛС—В2^>0. Мы имеем тождественно
Аср (а) = (Л cos а В sin а)2 A sin2 а. (1)
Так как в рассматриваемом случае, очевидно, А^О, то первое
слагаемое правой части обращается в нуль лишь при ctga =— -д,
§ 96]
ЭКСТРЕМАЛЬНЫЕ ЗНАЧЕНИЯ
415
а второе — лишь при sina = 0; так как эти два условия несовме-
стимы (при sina = 0 угол а не имеет котангенса), то Лф(а)^>0
при любом а. Если А 0, то и ср (а) 0 и функция и в точке Р
имеет локальный минимум; напротив, при Л < 0 мы имеем 9(а)<^0
и Р есть точка локального максимума функции и. Таким образом,
в случае Д 0 точка Р всегда дает локальный экстремум, природа
которого определяется знаком величины А.
2. Д = ЛС—В2<0. Допустим сначала, что и здесь
Соотношение (1) показывает, что при а = 0 (первое слагаемое
правой части положительно, второе равно нулю) мы имеем A 9(а)^>0;
напротив, при
, В
ctga = —-А
мы будем иметь Лф(а)<^0 (первое слагаемое равно нулю, вто-
рое отрицательно); значит, 9(a) принимает для различных а раз-
ные знаки, и функция и не может иметь в точке Р локального экс-
тремума.
К тому же выводу мы приходим и в случае А = 0. В этом
случае
ф (a) = 2В cos a sin а С sin2 а = sin а (2В cos а С sin а), (2)
причем В 0, так как иначе мы имели бы Д = 0. Если a —
достаточно малый положительный угол, то, очевидно,
| С| sina<^ 2 | В | cos а,
так что знак скобки (2В cos a-)- С sin а) совпадает со знаком ее
первого слагаемого, который не меняется при замене а на —а;
а так как sin а при этой замене меняет знак, то соотношение (2)
показывает, что 9(a) и 9(—а) имеют противоположные знаки,
и функция и снова не может иметь в точке Р локального экстре-
мума. Таким образом, в случае Д<^0 локальный экстремум в точке Р
отсутствует.
* 3. Д = ЛС—В2 = 0. В этом случае исследование членов второго
порядка формулы Тэйлора, вообще говоря, не приводит к оконча-
тельным результатам. В случае, если функция и обладав/ в точке Р
частными производными третьего порядка, можно обратиться к ис-
следованию дальнейших членов формулы Тэйлора. Однако здесь
мы этих вопросов касаться не можем.
Пример. Функция
z = х* — ху -j- У2 — 2х 4-У
416 ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ [ГЛ. 22
имеет единственную стационарную точку х=1, у = 0, как пока-
зывает решение системы уравнений
Й = 2*“Л’-2 = 0, -g=-x |-2^+1=0.
При этом
А = 2, В — — 1, С=2,
и значит, Д = ЛС—В2 = 3. Так как Л^>0, то г имеет единствен-
ный экстремум — минимум в точке (1,0).
Дальнейшие упражнения к § 96 см. в задачнике Б. П. Деми-
довича, отдел VI, задачи 425, 429, 430, 435, 487, 488.
Г Л А В A 23
ПРОСТЕЙШИЕ ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
§ 97. Уравнения касательной и нормали
к плоской кривой
Геометрическая иллюстрация производной как углового коэф-
фициента касательной к данной кривой в данной ее точке позволяет
использовать средства дифференциального исчисления для решения
целого ряда геометрических задач. Пусть мы хотим провести каса-
тельную к кривой, служащей графиком диф-
ференцируемой функции y=f(x), в точке,
абсцисса которой равна а (черт. 55). Из ана-
литической геометрии известно, что уравне-
ние прямой, проходящей через точку с коор-
динатами (а, Ь), может быть написано в виде
у — b = k(x — а),
где k — угловой коэффициент прямой. В на- Черт. 55.
шем случае b—f(a\ k=f(a); следова-
тельно, уравнение касательной к кривой y=f(x) в точке с абс-
циссой а имеет вид
JZ—/(а)=/(а)(х —а).
Прямая, проходящая через точку касания под прямым углом
к касательной, называется нормалью к данной кривой в данной
точке; так как угловые коэффициенты k и Н двух взаимно перпен-
дикулярных прямых связаны соотношением kk = —1, то угловой
коэффициент нормали к кривой _y=f(x) в точке с абсциссой а
равен — у* (при условии, что f (а) Ф 0). Поэтому уравнение этой
нормали может быть написано в виде
или
3,_/(а)==_7^-(х-а),
х — а 4-/ (а) [j — f (а)] = 0.
27 А. Я. Хинчин
418 геометрические приложения дифф, исчисления [гл. 23
Как известно из аналитической геометрии, во многих случаях
бывает удобно «параметрическое» представление кривой, т. е.
выражение ее с помощью двух уравнений вида
y=W),
так что каждому значению «параметра» t в некотором отрезке
соответствует некоторая определенная точка (х, у) данной кривой.
Мы знаем, что угловой коэффициент касательной к кривой в такой
точке равен
мы знаем также (§ 33), что это выражение производной через
дифференциалы остается в силе и в том случае, когда х (а следо-
вательно, и у) становится функцией какой-либо новой переменной t,
как это имеет место в данном случае. Принимая за независимую
переменную /, мы имеем:
dy
, dy dt
У dx dx 9
~dt
но и значит>
У==О);
у <f' (О ’
если мы хотим написать уравнение касательной к данной кривой
в точке, соответствующей значению t параметра, то мы должны
учитывать, что координаты этой точки равны x = cp(t), y = ty(t),
а угловой коэффициент касательной равен у' = <|Z (t); поэтому
уравнение касательной принимает вид
или
* - ? (О _У — Ф (0 (] х
У (0 4'(О ’ v '
очень удобный своей симметрией; так как угловой коэффициент
нормали в этом случае равен
1... . У(П
у' 4' (0 ’
то уравнение нормали получает вид
или
<?' (О [* - ф (О] +1' (О [У - Ч- (01=о- (2)
§ 98] КАСАТЕЛЬНАЯ ПРЯМАЯ И НОРМАЛЬНАЯ плоскость 419
Если кривая задана уравнением в полярных координатах
г=/(0)
и мы хотим написать уравнение касательной в точке с координа-
тами 0О, г0=/(60), то мы можем свести эту задачу к только что
рассмотренной, если заметим, что общая связь между декартовыми
и полярными координатами
x = r cos 6, j/=rsin6
для точек, лежащих на данной кривой, получает вид
x = /(6)cos6, у =f (6) sin 6. (3)
Уравнения (3) представляют данную кривую в параметрической
форме, роль параметра играет полярный угол 6; мы имеем:
J =f (0) cos0 -/(0) 6, g =/' (0) sin 0 +/(0) cos0.
Уравнение касательной в точке 6 = 60 запишется в декартовых
координатах согласно (1) в виде
у — /(%) sin 60 __ х —/(60)cos 0о
f (0о) sin 0о + f (0о) cos 0о f (0О) cos 0о - f (0о) sin 0О ’
а в полярных — в виде
г sin 0 — / (0о) sin 0О _ г cos 0 — /(0О) cos 0О
/'(0О) sinOo +/(0o) cos (J., “ f (0о) cos 0о — f (0О) sin 0о ’
или, полагая /(60) = г0, /'(60) = г^, в виде
г sin 0 — r0 sin 0о г cos 6 — r0 cos 0О
rj sin 0О + r0 cos 0о Го cos 0О — r0 sin 0о
Упражнения к § 97 см. в задачнике Б. П. Демидовича, отдел И,
задачи 119—121, 124, 126, 141, 142.
§ 98. Касательная прямая и нормальная плоскость
к пространственной кривой
Геометрическое определение касательной к пространственной
кривой ничем не отличается от того, которое нами принято для
плоских кривых. Желая провести касательную к данной кривой
в некоторой ее точке Л4, мы берем на кривой вторую, близкую
к М точку N и проводим прямую (секущую) через эти две точки;
если тогда, при неограниченном приближении точки N вдоль данной
кривой к точке Ж, проведенная секущая стремится к некоторому
предельному положению, то эту предельную прямую и называют
касательной к данной кривой в точке М Предполагая простран-
27»
420 геометрические приложения дифф, исчисления [гл. 23
ственную кривую заданной уравнениями в параметрической форме
= ?=<№)> * = Х(0>
мы ставим себе задачу найти уравнения касательной к этой кривой
в точке, соответствующей данному значению /0 параметра t (т. е.
в точке с координатами х0 = ?(/0), у0 = ф(/0), г0 = х(^0)). С этой
целью дадим параметру t приращение Д/ и перейдем от данной
точки к точке
Хо + Дх = ф(У04- Д/), л + д-У = Ж + д/)> г0Ц-Дг = х(^о4-ДО-
Прямая (секущая), проходящая через обе точки (данную и сме-
щенную), по правилам аналитической геометрии выражается урав-
нениями
Дх Ду Дз ’
или равносильной системой
x — x^_y—y^_z — z^ rn
Дх Ду Дз ‘ '
д7 д7 д7
Если мы теперь заставим Д/ стремиться к нулю и допустим, что
функции 9(/), ф(/) и /(/) имеют при / = /0 отличные от нуля
производные, которые мы обозначим соответственно через х'о, y'Qi
то система уравнений (1) проведенной нами секущей в пределе
примет вид
х—х§ _у—у0 _ —g0
х'о у'о г'о ’
или, что то же,
X — ср (tQ) У — ф (Zo) Z — X (t0) (
<р'(А>) Ф' (А>) х' (4>) ‘ k }
Система уравнений (2) или (3), полностью аналогичная уравне-
нию (1) § 97, очевидно, и решает поставленную нами задачу анали-
тического выражения касательной к пространственной кривой.
Обозначая через а, р и у углы, образуемые касательной к дан-
ной кривой в точке (х0, у/0, г0) с положительными направлениями
координатных осей, мы по правилам аналитической геометрии будем
иметь:
cos а — —- - ? ——-, cos Р = - г,
V Г2 М + Ф'2 + х'2 (Q V ч'2 (Q + Ф'2 (А>) + х'2 (4>)
COS у = -----.
1М(*о) + Ф'2 (А>) + х'2(*о)
§ 99] КАСАТЕЛЬНАЯ ПЛОСКОСТЬ И НОРМАЛЬ К ПОВЕРХНОСТИ 421
В частности, если данная кривая выражается ^уравнениями вида
у=у(х), z = z(x), (4)
уравнения касательной в точке (х0, _у0, г0) получают вид
и мы имеем:
cos а — .................. , cos 8 = ............=.,
1/1 +У2(х0) + ^2(х0) /1+ГМ + ^М
cos 7 = ----- z -.
У1+У2(хо) + *'2(*о)
Во всех случаях выбор знака перед радикалом соответствует выбору
того или другого направления на касательной.
Плоскость, проведенная через точку пространственной кривой
перпендикулярно к касательной в этой точке, называется нор-
мальной плоскостью данной кривой в данной точке. Нор-
мальная плоскость играет важную роль в теории пространственных
кривых, занимая в ней то же место, какое в теории плоских кривых
присуще нормальной прямой (т. е. обыкновенной нормали). По
общим правилам аналитической геометрии мы можем, зная уравне-
ния касательной в форме (2) или (3), непосредственно написать
уравнение нормальной плоскости к той же кривой в той же точке
в виде
X (х — *о) +Х О' — Jo) + А (г — z0) = о,
или
ф' (*о) к - ф (4>)] + ф' tt.) к - Ф («]+X' (4) к - X (4)]=0.
Мы видим, что эти уравнения вполне аналогичны уравнению (2)
§ 97 нормали к плоской кривой.
В частном случае, когда данная кривая выражается уравнениями
вида (4), уравнение нормальной плоскости в точке (х0, yQ, г0)
получает вид
х — х0 + У (хв) (у — л) + г' (х0) (г — г0) = 0.
Упражнения к § 98 см. в задачнике Б. П. Демидовича, отдел VI,
задачи 341, 342, 344, 346.
§ 99. Касательная плоскость и нормаль к поверхности
Рассмотрим в пространстве поверхность, выражаемую уравнением
Р(х, у, z) = 0 (1)
и выберем на ней произвольную точку М с координатами х0, у9, гп,
так что F (х0, у9, zo) = O. Проведем на поверхности (1) произ-
422 ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ДИФФ. ИСЧИСЛЕНИЯ [гл. 23
вольную кривую, проходящую через точку Ж; пусть параметри-
ческие уравнения этой кривой будут
x = y — tytt), z = x(t). (2)
Так как кривая (2) целиком лежит на поверхности (1), то мы
должны иметь тождественно (т. е. при любом в некоторой области
значении параметра /)
И? (О, НО, х(0] = о. (3)
С другой стороны, так как кривая (2) проходит через точку
2И(х0, yQ, г0), то при некотором значении/0 параметра t мы должны
име гь:
•*о = ф(4>), .Ув = Ш), -г,о = х(^о)-
Для получения дальнейших выводов нам надо теперь допустить,
что функция F(x, у, г) дифференцируема в точке Л4(х0, _у0, г0).
В главе 22 мы условились называть функцию u=f(x, у, г) диф-
ференцируемой в точке (х, у, г), если, полагая
Дп = / (х Дх, у Ду, z Дг) — / (х, у, г),
, df А । df А । df А
du ~ -4- Дх -4- ДУ
дх 1 ду 1 dz
р — / Дх2 Ду2 + Дг*>
мы при р -> 0 имеем:
Дц = du 4~ о (р).
Для дифференцируемых функций имеет место правило дифференци-
рования сложной функции (§ 92): если функция и =f (х, у, г) диф-
ференцируема, а х, у9 z в свою очередь — дифференцируемые функ-
ции некоторой новой переменной /, то
du ди dx j. ди dy i ди dz
dt дх dt ду dt ’ dz dt' * '
В нашем случае, как мы уже сказали, мы предположим функ-
цию F(x, у, z) дифференцируемой в точке (х0,_у0, г0), соответствую-
щей значению t0 параметра t. Если выразить х, у9 z через t по-
средством соотношений (2), то F (х, у, г) обращается в функцию
параметра /, представляющую собой в силу (3) постоянную величину.
dF
Поэтому — _ Q, а следовательно, в силу формулы (4)
dF ^5 । ^у । dz _ n /k\
dx dt 4”dy dt dz dt—u' w
Заметив это, напишем теперь уравнения касательной к кривой (2)
в точке М (xq, j/0, г0), соответствующей значению /0 параметра 4
§ 99] КАСАТЕЛЬНАЯ ПЛОСКОСТЬ И НОРМАЛЬ К ПОВЕРХНОСТИ 423
Согласно формуле (2) § 98 эти уравнения могут быть написаны
в виде
х ~ х0___у—Уо___Z — Zp
*£ У'о Zp
Таким образом, для любой точки (х, у, г) проведенной нами каса-
тельной эти три* отношения имеют одно и то же значение, которое
нам будет удобно обозначить через -у (где X, разумеется, различно
для различных точек касательной). Но в таком случае
х^ = Х(х — х0), у'0=Л(у — j/0), zi = X(z —г0). (6)
С другой стороны, тождество (5) при / = дает, если обозначить
. D dF dF dF
соответственно через А, В и С значения , з~ и -т— в точке
г дх’ ду дг
М (*о> № ^о).
лх; + ву'а + = о.
Вставляя в это соотношение вместо х', у'*, и z'Q их выражения (6)
и сокращая на X, мы находим:
A(x-xo)-bB(j/-j/o) + C(^-^o) = O. (7)
Вспомним теперь, что х, у, z здесь означают координаты любой
точки проведенной нами касательной к кривой (2) в точке Ж, а А,
В и С—значения частных производных функции F в точке М. Урав-
нение (7), если рассматривать в нем х, у, z как текущие коорди-
наты, представляет собой некоторую плоскость, проходящую через
точку М и зависящую от вида поверхности (1), но совершенно не
зависящую от выбранной на этой поверхности кривой (2). То, что
координаты любой точки касательной к кривой (2) связаны уравне-
нием (7), показывает, что эта касательная целиком лежит в пло-
скости (7). Но кривая (2) есть любая кривая, проведенная на поверх-
ности (1) через точку М. Таких кривых может быть проведено бес-
численное множество; и мы видим, что касательные ко всем этим
кривым лежат в одной и той же плоскости (7); эту плоскость, являю-
щуюся своего рода «носителем» (геометрическим местом) касатель-
ных к любым кривым, проведенным на поверхности (1) через точку 2И,
называют касательной плоскостью к данной поверхности
в точке М Уравнение (7) касательной плоскости может быть напи-
сано в более выразительном виде, если вместо нейтрального обозна-
чения А, В, С частных производных функции F в точке М писать
соответственно
dF dF dF
dxp 9 dyp 9 dzp 9
424 ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ДИФФ. ИСЧИСЛЕНИЯ [гл. 23
где индекс 0 означает, что все три производные берутся в точке
х — х^ y=yQ, z — Zq. Уравнение касательной плоскости принимает
вид
дР f \ \ ^ f \ \ ^ г \ с\
^(х—х0)4--^- (у—_Уо)-|--^0 —^o) —о.
Прямую, проходящую через точку М перпендикулярно к каса-
тельной плоскости, называют нормалью к поверхности в точке М
Согласно правилам аналитической геометрии, уравнения этой прямой
(в случае, когда ни одна из трех частных производных не обра-
щается в нуль) могут быть записаны в виде
X — Хо _у —Уо __Z — Zo
дР дР дР ’
dxQ dyQ dzo
В частном случае, когда поверхность выражена уравнением вида
Z=f{x, у), (8)
мы имеем F(x, у, z) — z—f(x у) и уравнение касательной пло-
скости принимает вид
г - -л) •
а уравнения нормали —
_ ___ х — х0____ У — Уо
2 0— а/ — а/ •
дхь dyQ
Если обозначить соответственно через а, £ и у углы, образуемые
нормалью к поверхности (8) в точке (х0, у^ г0) с положительными
направлениями координатных осей, то, как известно из аналитической
геометрии, отсюда следует
df
Выбор того или другого знака перед радикалом соответствует при
этом выбору того или другого направления на рассматриваемой
§ 100] НАПРАВЛЕНИЕ ВЫПУКЛОСТИ И ВОГНУТОСТИ КРИВОЙ 425
нормали; разумеется, этот знак должен быть одним и тем же во
всех трех формулах.
Упражнения к § 99 см. в задачнике Б. П. Демидовича, отдел VI,
задачи 351, 352, 360—362.
§ 100. Направление выпуклости и вогнутости кривой
Теперь мы вернемся к теории плоских кривых и обратимся к дру-
гой задаче — к вопросу о направлении выпуклости и вогнутости кри-
вой. Пусть функция y=f(x) при х = а имеет производные первых
двух порядков. Уравнение касательной в точке а к кривой y—f(x}
имеет вид
>=/(а)+/(а)(-г—«)•
В точке a-\-h, близкой к а, ордината касательной будет поэтому
Лас=/(а) + /г/г(а),
в то время как ордината кривой в той же точке равна
чтобы узнать, какая из этих линий в ближайшем соседстве точки а
будет лежать выше другой, составим разность
ЛР—Лас =f(a 4- h) — f(a) — hf (a);
а так как fr (а) по нашему предположению существует, то правая
часть этого равенства на основании формулы Тэйлора может быть
представлена в виде
и мы получаем:
л2
-Укр Лас = 2“ f” (a) -|- О (Л2).
Допустим, что ff (а) 0; тогда второе слагаемое правой части при
/г—>0 бесконечно мало сравнительно с первым; знак правой (а сле-
довательно, и левой) части при достаточно малом | h | совпадает со
знаком ее первого слагаемого и, значит, со знаком/" (а). Если f" (а)^>0,
то во всех точках, достаточно близких к а, Лр^>Лас> т. е. кривая
расположена выше своей касательной (черт. 56, а); при f (a) 0
мы имеем обратное взаимное расположение (черт. 56, б).
В первом случае говорят, что кривая y—f(x) в точке а обра-
щена выпуклостью книзу (в сторону отрицательных у) или вогну-
тостью кверху (в сторону положительных у); во втором случае дело
обстоит наоборот — кривая в точке а выпукла кверху и вогнута
книзу. Наглядная естественность такого словоупотребления непо-
средственно видна при взгляде на черт. 56, а и б. Таким образом,
426 геометрические приложения дифф, исчисления [гл. 23
мы видим, что знак вторсй производной определяет собой направле-
ние выпуклости и вогнутости кривой, подобно тому как знаком первой
производной решается вопрос о возрастании или убывании функции.
Пусть теперь, обратно, известно, что кривая y=f(x) в соседстве
точки а выпукла книзу (т. е. расположена выше своей касательной).
Если ff {а) существует, то в силу предыдущего она не может быть
отрицательной, так как тогда мы имели бы как раз обратную картину
взаимного расположения кривой и касательной. Следовательно,/'(а)^0.
При этом случай /'(а) = 0 вполне возмо-
жен, как показывает пример кривой у = х^
при х = 0; разумеется, такое же рассужде-
ние показывает, что в случае, когда в точ-
ке а кривая выпукла кверху, мы должны
иметь /"(а)^:0, причем значение(а) = О
также не исключено. Наконец, возможен
случай, когда в соседстве точки а кривая
по одну сторону от а лежит выше, а по
другую — ниже своей касательной; именно
так обстоит дело с не раз уже рассмот-
ренной нами функцией у = хА в соседстве
точки х = 0 (черт. 21 § 40); в такой точке
кривая пересекает свою касательную, меняя
при этом направление выпуклости. Точки
этого рода обычно называют точками
перегиба кривой. Очевидно, что в точке
перегиба вторая производная (а), если она
существует, должна быть равна нулю.
Таким образом, если /'(а) = 0, то о на-
правлении выпуклости кривой в соседстве
точки а на основе одного этого факта еще
б)
Черт. 56.
ничего нельзя высказать; при этом мы можем
иметь и выпуклость кверху, и выпуклость книзу, и точку перегиба;
возможны и более сложные картины. Для дальнейшего исследова-
ния в этом случае необходим анализ последующих членов ряда
Тэйлора, аналогичный тому, который мы провели при отыскании
экстремальных значений функции (§41). Здесь, однако, мы не можем
более останавливаться на этом вопросе.
Упражнения к § 100 см. в задачнике Б. П. Демидовича, отдел II,
задачи 348, 349, 352—354, 362.
§ 101. Кривизна плоской кривой
Мы непосредственно видим, что различные кривые на различных
участках искривлены в различной степени. Кривая черт. 57 в своей
левой части протекает почти прямолинейно, искривление ее почти
незаметно; в своей правой части она, напротив, сильно искривлена.
§ 101] кривизна плоской кривой 427
Окружность представляется нам искривленной в одинаковой степени
на всех своих участках. А если мы представим себе несколько окруж-
ностей различных радиусов, имеющих в некоторой точке общую каса-
тельную (черт. 58), то мы отчетливо увидим, что окружность тем
более искривлена, чем меньше ее радиус. Сильное искривление пути
(крутой поворот) при поездке в автомашине или на железнодорож-
ном поезде мы ощущаем и осязательно (не глядя в окно). Реальная
значимость такого рода искривлений заставляет нас научно подойти
к их оценке; нам необходимо научиться не только качественно сравни-
вать между собой искривленность различных кривых (такая-то кривая
искривлена больше, а такая-то — меньше), но и давать искривлен-
ности кривой количественную оценку, научиться измерять степень
Черт 57. Черт. 58.
искривленности кривых. В технике дорожного строительства (любого
типа путей) такой точный подход совершенно необходим — так же
как в физике и теплотехнике мы не можем довольствоваться простым
установлением того, что одно тело теплее или холоднее другого, но
должны научиться количественно оценивать, измерять степень нагре-
тости различных тел (т. е. их температуру).
В нашем наглядном представлении степень искривленности кри-
вой тесно связана с тем, насколько быстро она меняет свое напра-
вление. Так, кривая черт. 57 на участке (а, Ь) почти не изменяет
своего направления — касательные в различных ее точках (в част-
ности, в точках с абсциссами а и Ь) почти параллельны друг другу;
поэтому эта кривая представляется нам мало искривленной на участке
(а, Ь); напротив, на участке (Ь, с) та же кривая кажется нам сильно
искривленной потому, что на этом участке она сильно меняет свое
направление — в частности, ее касательные в концах этого участка
направлены резко различно. Ясна поэтому, что для количественного
измерения степени искривленности кривой на том или другом участке
исходной величиной должен служить тот угол, на который повора-
чивается касательная к кривой при прохождении этого участка, т. е.
угол между касательными в начале и в конце участка. Однако зада-
нием одного этого угла мы еще не можем определить степени искрив-
ленности кривой на данном участке. В самом деле, если вам скажут,
например, что железнодорожный путь делает на некотором участке
428
ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ДИФФ. ИСЧИСЛЕНИЯ
[гл. 23
поворот в 30°, то это не дает вам еще никакого представления об
искривленности этого пути. Вы, несомненно, спросите о том, как
велик тот участок, на протяжении которого происходит этот поворот.
Если, например, путь повернулся на 30° на участке длины 2 км, то
это—искривление незначительное; если же тот же поворот произошел
на участке длины 100 лг,*то это уже серьезное искривление. Таким
образом, для оценки степени искривленности пути на данном участке
необходимо знать не только угол ср, измеряющий собой изменение
направления кривой на этом участке, но и длину $ самого участка.
Очевидно, естественной мерой степени искривленности кривой на
данном участке будет тогда служить отношение т. е. изменение
направления, приходящееся на единицу длины пути. Эту величину
называют средней кривизной кривой на данном участке. Смысл
такого наименования вполне понятен: непосредственно ясно, что кри-
вая может быть в различной степени искривлена в различных частях
данного участка и что понятие средней кривизны всех этих различий
совершенно не учитывает, показывая лишь, как велико в среднем
изменение направления кривой на единицу длины пути.
Если мы хотим от этой средней кривизны перейти к локальной
характеристике степени искривленности кривой в ближайшем со-
седстве некоторой ее точки А, то мы должны рассуждать аналогично
тому, как мы рассуждали в § 26, когда от средней скорости дви-
жения тела за некоторый промежуток времени перешли к опреде-
лению мгновенной (локальной) скорости этого движения в данный
момент времени. Возьмем на нашей кривой, наряду с А, еще какую-
либо другую точку В; пусть длина дуги АВ данной кривой равна 5,
а угол между касательными к кривой в точках А и В равен 9, так
что средняя кривизна дуги АВ равна у. Если точка В расположена
близко к А (т. е. если s мало), то мы имеем основание рассчиты-
вать, что степень искривленности кривой при переходе от А к В не
успеет сколько-нибудь значительно измениться и что поэтому сред-
няя кривизна у дуги АВ даст нам достаточно точную характеристику
того, насколько искривлена кривая в ближайшем соседстве точки А;
эта характеристика тем точнее, чем меньше $, т. е. чем ближе точка В
взята к точке А. Поэтому, если при В-> А (или, что то же, при 0)
средняя кривизна у стремится к некоторому пределу /С, то мы,
естественно, принимаем этот предел за (локальную) кривизну
нашей кривой в точкеА (или в ближайшем соседстве точки А).
Таким образом, кривизной данной кривой в данной точке А мы
называем предел отношения угла между касательными к кривой
в точках А и В к длине дуги АВ при условии, что точка В,
оставаясь на данной кривой, неограниченно приближается к точке А.
§ 101]
КРИВИЗНА ПЛОСКОЙ КРИВОЙ
429
Установив это геометрическое определение понятия (локальной)
кривизны, мы покажем теперь, что методы дифференциального исчи-
сления дают нам возможность фактического вычисления кривизны
кривой в любой ее точке. Пусть функция _у=/(х), графиком кото-
рой служит данная кривая, имеет в точке х производные первых
двух порядков. Наряду с точкой
А (*> У) рассмотрим на кривой точку
В(х-|-Ах, .у-|-А.У) (черт. 59). Если
мы обозначим углы, образуемые каса-
Черт. 59. Черт. 60.
тельными к кривой в этих двух точках с положительным направле-
нием оси ОХ, соответственно через аир, то, очевидно,
tga=/(x), tgP=/'(x + Дх).
Угол 9 между этими двумя касательными равен, как показывает
черт. 60, 9 = | a — р | = | arctg f (х Дх)— arctg/'(х)|. С другой
стороны, если мы обозначим через s(x) длину дуги данной кривой
на участке (а, х), где а — некоторое постоянное число, то длина s
участка АВ данной кривой будет равна
s = s (х —Ах) — s (х).
Таким образом, для средней кривизны дуги АВ данной кривой мы
получаем выражение
? _ | arctg f (х + Ах) — arctg f (х) |
s s (х + Дх) — s (х) ’
или, деля числитель и знаменатель на Дх,
I arctg f (х + Дх) — arctg f (х) |
9 __ ____________Дх_____________
$ s (х + Дх) — s (х)
Дх
Если мы теперь заставим Дх стремиться к нулю, то в силу нашего
предположения о существовании У'=/"(х) числитель будет стре-
миться к величине
I arctg у I__ 1УЧ
| dx |— 1+У»’
430 ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ДИФФ. ИСЧИСЛЕНИЯ [гл. 23
в то время как знаменатель согласно § 52 будет иметь положитель-
ный предел
Отсюда для кривизны данной кривой в точке А(х,у) мы получаем
выражение
К= lim
$ —> 0
? __ 1У'1
8 (1+У»)’/8 ’
(1)
и наша задача решена.
Если кривая задана уравнениями в параметрической форме
то
V- __ Л_У _ Ф' (О
у dx ф' (t) ’
d. ГУ (t) ]
. _d_ (/) 1 _ dt -У'ЧОПО
y dx L<p' (0 ] dx [cp' (/)]’
dt
и формула (1) дает после элементарных вычислений:
|ф'(0Г |
3/й
[?'2w+r(oi‘
(2)
Прямая линия выражается линейным уравнением у = тх-\-п\
в этом случае в любой точке У' = 0, а значит, в силу (1) и /<= 0:
кривизна прямой линии равна нулю. В случае окружности радиуса г
удобнее пользоваться параметрическим представлением
х — r cos t, y = r sin /;
формула (2) после легких вычислений дает К кривизна окруж-
ности одинакова во всех ее точках и равна обратной величине
ее радиуса. *
§ 102. Соприкасающийся круг
Пусть кривая v=/(x) имеет в точке А (х, у) кривизну от-
личную от нуля (Уг 0). Проведем нормаль к кривой в точке А
(черт. 61) и отложим на ней в сторону вогнутости кривой отрезок АС
длины Если мы теперь проведем окружность радиуса г==^
с центром в точке С, то эта окружность пройдет через точку А и
§ 102] СОПРИКАСАЮЩИЙСЯ КРУГ 431
будет иметь с ней в этой точке общую касательную, так как радиус СА
лежит на нормали к кривой; далее, кривая y=f(x) и наша окруж-
ность, очевидно, имеют в точке А одинаковое направление выпуклости;
наконец, и кривизна этих двух кривых в точке А одна и та же,
так как кривизна проведенной нами окружности равна — — К. Можно
поэтому сказать, что из всех окружностей, проходящих через точку Л,
наша окружность в соседстве точки А ближе всех примыкает к те-
чению данной кривой, имея с ней общее направление (касательная)
и одинаковую кривизну и будучи обращена в ту же сторону своей
выпуклостью.
Эту окружность называют кругом кривизны данной кривой
в точке А. Ее радиус
г . , 1 .. _ (1 +Г)8/8
к ~~ 1У'|
называется радиусом кривизны, а ее центр — центром кри-
визны кривой y=f(x) в точке А. Подобно тому как касательная
прямая может заменить собой дан-
ную кривую во всех вопросах, где
речь идет только о направлении
кривой, так круг кривизны может
заменить собой данную кривую во
всех тех более сложных вопросах,
где наряду с направлением кривой
играют роль также направление
выпуклости и кривизна кривой. На
этом основывается значение круга
кривизны для большого числа свя- Черт. 61.
занных с данной кривой геометри-
ческих исследований. Понятно, почему круг кривизны естественно
называть касательным (или, как чаще говорят, соприкасаю-
щимся) кругом к данной кривой в данной точке А.
Найдем теперь аналитические выражения для координат (а, Ь)
центра кривизны. В случае черт. 61 [у" | =У' 0,У ^>0, х^>а,У<^Ь.
Разности х — а и b—у служат проекциями отрезка г соответственно
на направления ОХ и OY. Поэтому если мы обозначим через 9 угол,
образуемый касательной в точке А с положительным направлением
оси ОХ (так что tg9=y), то
х — a = rsin 9
!)s/s
У'
b—y = rcos 9
(1 +У2)*/з
У"
j 1 +У3
У
432
ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ДИФФ. ИСЧИСЛЕНИЯ [ГЛ. 23
откуда
УО+У2) U I 1+У2
а = х—у v Ь=уА- —.
у" ’ 1 у"
Эти формулы, как легко убедиться, сохраняют силу и при любом
другом характере течения кривой _у=/(х) в соседстве точки А.
Можно подойти к соприкасающемуся кругу и с другой точки
зрения, еще убедительнее показывающей его аналогию с касательной
прямой. Касательную прямую мы определяли как предельное поло-
жение секущей, соединяющей данную точку А(х> у) с другой точкой
В(х-^-кх, —|— Д_у) той же кривой при условии, что Дх (а следова-
тельно, и ку) стремится к нулю. Но если мы хотим проводить через
эти две точки не прямую, а окружность, то мы встречаемся с тем
затруднением, что таких окружностей можно провести бесчисленное
множество: как известно, для однозначного определения окружности
надо задать не две, а три точки (не лежащие на одной прямой),
через которые она должна проходить. Поэтому мы возьмем на нашей
кривой, кроме точки А, еще две точки, и В2, с абсциссами xt и х2.
Уравнение окружности, проходящей через точки А, Вг и В2, мы можем
записать в виде
(х — а)2 + О'— Ю2 = р2>
причем радиус р и координаты а и р центра круга определяются из
требования, чтобы окружность, выражаемая этим уравнением, прохо-
дила через точки A, Bt и В2. Если мы положим
(х _ а)2 + [/(х) _ рр _ = Л(х),
то это требование, очевидно, может быть записано в виде
F(x) = 0, F(Xj) = 0, B(x2) = 0. (1)
Из этих трех уравнений мы и можем определить неизвестные а, р
и р. Однако мы пойдем другим путем. Пусть для определенности
Тогда к функции В(х) мы можем в силу (1) приме-
нить в каждом из отрезков (х, хх) и (хп х2) теорему Ролля. Это
дает нам:
F(^)==F4U=0,
где х < <С ^2 <С х2; отсюда же, применяя теорему Ролля
к функции F (х) в отрезке (^, £2), мы находим:
F"G) = 0,
где 5 — некоторая точка между и ё2.
Будем теперь безгранично приближать точки Bi и В2 вдоль дан-
ной кривой к точке А, т. е. допустим, что xt->x и х2->х; оче-
видно, что тогда и точки £2 и Е будут стремиться к х. Наш круг,
проходящий через точки A, Bt и В2, будет при этом все время ме-
§ 102] СОПРИКАСАЮЩИЙСЯ КРУГ 433
нять и свой радиус, и свое положение; при каждом положении
точек Bt и мы можем найти элементы а, р и р этого круга из
уравнений (1); можно было бы проделать эти вычисления и посмо-
треть, к каким пределам стремятся а, р и р, когда Xj—>-х и
х2—>х. Однако проще поступить иначе. Так как при любых xt и ха
мы имеем
F(x) = 0, FrG1) = 0, F"(E) = O
и так как $х->х, $~>х, то для предельного круга мы должны
иметь *):
F (х) = F (х) = F' (х) = 0,
т. е., обозначая элементы предельного круга через а, b и г и по-
лагая /(x)=j,
F (х) = (х — — ЬУ — га = 0,
F (х)==2(х —a) + 2(j/ —д)/ = 0,
F' (х)= 2 + 2Уа 2 (у — 1>)у" = 0.
Последнее из этих уравнений сразу дает:
после чего предыдущее дает:
п г_ (1+У8)У.
У”
наконец, первое уравнение после подстановки в него найденных
значений b—у и а — х дает:
(1
1У'1 •
Полученные формулы показывают, что искомая предельная окруж-
ность действительно совпадает с кругом кривизны данной кривой
в точке А.
Таким образом, круг кривизны (или соприкасающийся круг)
данной кривой в точке А есть предельное положение круга, про-
ходящего через точку А и две другие бесконечно близкие к ней
точки данной кривой.
Упражнения к §§ 101—102 читатель найдет в задачнике Б. П. Де-
мидовича, отдел II, задачи 566, 567, 571, 572, 575, 576, 577.
*) При этом предполагается непрерывность F" (х) в точке х, для чего
достаточно, чтобы f" (х) была непрерывной в этой точке.
28 А. Я. Хивчин
ГЛАВА 24
НЕЯВНЫЕ ФУНКЦИИ
§ 103. Простейшая задача
Мы встречались уже с неявными функциями в § 92, и сейчас
будет уместно вспомнить, какую задачу мы там решали. Мы исхо-
дили из допущения, что функция y=f(x) в некотором отрезке
(а, Ь) тождественно удовлетворяет уравнению
F(x, j) = 0, (1)
т. е. что
F[x, /(х)] = 0 (а^х^Ь).
Предполагая тогда функцию f(x) дифференцируемой в отрезке
(а, Ь), мы ставили себе задачу выразить ее производную через
частные производные функции F по х и у и нашли для этой про-
изводной выражение
dF
' Я Г ч дХ
ду
Однако в реально встречающихся задачах обычно вопрос ста-
вится иначе. Дается только функция F(x, у)\ что же касается функ-
ции y=f(x), тождественно удовлетворяющей в некотором отрезке
уравнению (1), то не только дифференцируемость или непрерывность
ее, но и самое ее существование не предполагается заранее; напро-
тив, вопрос о том, при каких условиях такая функция существует и
обладает теми или другими нужными нам свойствами, и составляет
собой главную задачу исследования. Среди многочисленных приемов
определения новых неэлементарных функций такое «неявное» зада-
ние функций с помощью уравнений занимает одно из важнейших
мест. Совокупность закономерностей, свойственных этому способу
задания функций, составляет собой теорию неявных функций, эле-
ментам которой и будет посвящена настоящая глава.
Постановка задачи, которую мы только что обрисовали, может
быть при этом значительно расширена. Вместо функции F(x, у)
§ 103] ПРОСТЕЙШАЯ ЗАДАЧА 435
двух переменных может быть задана функция F(x, у, z, ...» и, v)
любого числа переменных, и мы можем поставить себе задачу
определить из уравнения
F (х, у, z9 ,.., и, у) = 0
какую-нибудь одну из этих переменных, например т/, как функцию
остальных переменных х, у9 zt ..., и; это значит, что ставится
вопрос о существовании такой функции
v=f(x, у, z, ... г и)9
переменных х, у, z9 ... 9 и, которая в некоторой области значений
этих переменных тождественно удовлетворяла бы уравнению
F [х, у, z, ..., и, f(x, у, z, ..., «)] =0>
и о свойствах этой функции в тех случаях, когда она существует.
Общая теория неявных функций рассматривает и более широкую
постановку вопроса, когда дается не одно, а несколько определяю-
щих уравнений
Fi (Xj, х2, ..., хл) = 0, 1
F2(Xi, х2, ..., хЛ) = 0, I ^2)
*^2> • • • > = 1
левые части которых зависят от п переменных, причем п^>т. Эту
систему уравнений мы хотим «решить» относительно каких-нибудь т
из числа переменных хь например переменных хр х2, ..., хт.
Это означает следующее: установить, при каких условиях суще-
ствует т функций
•^1 ==/l C^m+1, • • • >
*^2 ==А *^т4-2> • • • >
Хт—(xm+1, xm+2, . . . , ХЛ)
переменных xm+1, хот+2, ..., хл, которые в некоторой области зна-
чений этих переменных тождественно удовлетворяют системе уравне-
ний (2), так что для любых xm+1, хт+2, ..., хп в этой области
[/1 • • • > • • • 9 fm • • • 9 ^m+2> • • • > ^«1 “ ®
(4=1, 2, ..., tn); в случае, когда такие функции fk существуют,
изучить их важнейшие свойства (непрерывность, дифференцируе-
мость и т. д.).
В дальнейшем мы будем называть простейшей задачу
с одним определяющим уравнением (независимо от числа перемен-
ных) и общей — задачу с несколькими определяющими уравне-
ниями. В настоящем параграфе мы рассмотрим только простейшую
задачу. Метод исследования, как мы при этом увидим, не будет
зависеть от числа переменных; поэтому, чтобы не делать наших
436
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
записей излишне громоздкими, мы остановимся на простейшем случае
двух переменных, причем все проводимые рассуждения будут сохра-
нять силу и в случае любого числа переменных.
Итак, мы будем предполагать заданным уравнение
F(x, j/) = 0 (3)
и будем искать функцию y=f(x), тождественно удовлетворяющую
ему в некоторой области значений х. Непосредственно ясно, что
существование такой функции, а также и ее свойства зависят от
свойств данной функции г(х, у). Чем больше допущений мы сде-
лаем относительно функции F, тем более определенные утвержде-
ния мы сможем обосновать для
функции f(x). Таким образом,
поставленная нами задача может
иметь различные варианты; из
всех этих возможных вариантов
мы здесь рассмотрим только
один — тот, с которым прихо-
дится иметь дело в значительном
большинстве приложений теории
неявных функций.
Теорема 1. Пусть функ-
ция F (х, у) непрерывна и имеет
Черт. 62.
непрерывные частные производные по обеим переменным в неко-
тором прямоугольнике /?(х0—а^х^х^а, yQ—Ь^у^Уц-\-Ь).
Пусть
F(xQ, у0) = 0, F'y (х0) у9) Ф 0.
Тогда существует единственная функция y=f(x), непрерывная и
удовлетворяющая уравнению (3) в некотором отрезке Д (х0 — а
и равная у$ при х = х0. Эта функция имеет не-
прерывную производную в отрезке Д.
Доказательство. 1°. Определение функции /(х).
Пусть для определенности Fj,(x0, ,Уо)>О. Согласно лемме § 23
(имеющей место и для непрерывных функций любого числа пере-
менных) мы должны тогда иметь FJ>(x, у)^>0 и для всех точек
некоторого прямоугольника /?'(х0 — а ^хг^х0 Л —
(черт. 62). Для дальнейшего важно иметь в виду, что
числа аир могут быть выбраны сколь угодно малыми; так, мы
уже теперь можем допустить, что Rf лежит целиком внутри R.
В частности, мы имеем:
F'y (ХО. У) > 0 СУо — ₽ У ^Уй + Р);
это показывает, что F(x0, у) есть возрастающая функция от у
в отрезке (_у0— р, л + Р); а так как F(x0, j/o) = O, то
F (х0, л - ₽) < 0, F (х0, Л + Р) > 0. (4)
§ 103]
ПРОСТЕЙШАЯ ЗАДАЧА
437
Согласно лемме § 23 эти неравенства сохранятся и тогда, когда
мы заменим в них число х0 любым числом х, достаточно близким
к х0; а так как в предыдущем число а могло быть выбрано сколь
угодно малым, то мы вправе допустить, что неравенства
F(x, j0 — р)< 0, F(x, j0 + Р) > 0 (5)
выполняются в любой точке х отрезка Д(х0— а, х0-|~а)« Выберем
и временно закрепим произвольную точку х этого отрезка и по-
ложим
F(x, у) = <р (j) (j0 — р у jo 4- р);
мы имеем:
ф' О) = Ру (X, У) > о (Jo — р у ==£ Jo 4- Р),
так что функция 9 (.у) — возрастающая в отрезке (j/0— р, л4“Р)>
а так как в силу (5) 9(j/0— Р)<0 и 9(.Уо + Р)>О, т0 между
Уо — Р и у0 р найдется единственная точка у*, для которой
9Су*) = 0 или, что то же,
F(x, у*) = 0.
Число у*9 однозначно определяющееся описанным образом для лю-
бого х в отрезке Д, есть в этом отрезке функция от х, которую
мы обозначим через /(х). Мы доказали, таким образом, что для
любого х в отрезке Д существует единственное значение у,
заключенное между уъ — р и yQ Р 11 удовлетворяющее уравне-
нию (3). Это значение мы и обозначаем через /(х). В частности,
/(x0)=j0, так как при х = х0 значение У=У^ удовлетворяет
обоим поставленным требованиям.
2°. Непрерывность функции f (х).
Убедимся теперь, что определенная нами в отрезке Д функция
/(х) непрерывна в этом отрезке. Пусть хх— любая внутренняя точка
отрезка Д и пусть е^>0 сколь угодно мало. Положим f (х1)=<у1,
так что — р <^У1 + Р- Так как точка (xn j/J принадлежит
прямоугольнику /?', то найдется такой прямоугольник R” (xt— Х^
^x^Xj-f-X, у! — ^^У^У1 + н) с центром в (xn yt), который
целиком лежит внутри RT; при этом, очевидно, мы вправе допустить,
что |А<^е. Во всех точках (х, у) прямоугольника R" мы имеем
/>(х, j)>0; в частности, Fy(xlt у)^>0 при т- е-
F(xf, у) есть возрастающая функция от у в отрезке (yt— щ 54+ н);
а так как F(x19 54) = 0, то
F(xlt Jj— р)<0, F(xt, Ji4-p.)>0.
Снова применяя лемму § 23, мы заключаем отсюда, что неравенства
F(x, J1 — н)<°. Р(х, J14-|*.)>O
имеют место и для всех значений х в некотором отрезке (Xi—8,
Xj -f- 8), причем мы можем допустить, что 8 X. Следовательно,
438
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
для любого х в отрезке (Xj — 8, хг -f- 8) найдется такое число
У*(У1— Р'<С5'*<Сз,1 “Ьн), что F(x, у*) = 0. Так как рь меньше,
чем е, то принадлежит отрезку (yt — е, у} 4~ е). С другой сто-
роны, так как R” cz R', то отрезок —рь, уг —|— рь), а с ним и число
у*, лежит внутри отрезка Qy0— р, _У04~Р)- Но в 1° мы показали,
что в этом отрезке лежит лишь одно число y=f(x), удовлетво-
ряющее уравнению F(x, у) = 0. Таким образом, мы имеем y*=f(x)
и, следовательно,
У1 — е</(х)<^4-е
для любого х в отрезке (Xj—8, х14~^)- Так как е произвольно
мало, a xt есть любая точка отрезка Д, то это и означает, что
функция /(х) непрерывна в отрезке Д.
3°. Единственность функции f(х).
Пусть ф(х) — функция, непрерывная в отрезке Д и такая, что
<Р(*о)=Л> ФИ1=° (х0—asgxsgx0 + a).
Если в отрезке Д _у0— p^q>(x)^j/0-|- р, то в силу 1° ф(х) тожде-
ственно совпадает с /(х). Остается поэтому показать, что ф(х) не
может принимать в отрезке Д значений, лежащих вне отрезка (_у0— р,
«Уо-]-Р). Пусть ср(х) — такое значение и пусть для определенности
9(х)^>^о“Н?- Так как ф(х0)=_у0<^.у0 4~ Р, то в силу непрерывно-
сти функции ф(х) между х0 и х найдется точка х*, в которой
9(x*)=j/04-p- Но тогда F[x*, 9(x*)]=F[x*, j/o-]-P] = O, что
противоречит второму из неравенств (5), так как точка х*, оче-
видно, принадлежит отрезку Д.
4°. Существование и непрерывность /(х).
Так как функция F(x, у) по предположению имеет непрерывные
частные производные в прямоугольнике R, а значит, и в прямо-
угольнике R', то по теореме 2 § 90 она дифференцируема в любой
точке (х, у) этого прямоугольника, т. е. при переходе от точки
(х, у) к точке (x-f-Дх, .уЦ-Ду) мы имеем:
ЯР ЭР
ДЛ=/7(х4-Дх, .у+Ду) — F(x, у) = -^ Дх + ^-Д^4-о(р),
где р = УДх9 4* Ду9. Приращения Дх и Ду при этом могут быть
произвольными. Предполагая, что точки х и х-\-Ьх принадлежат
отрезку (х0 — а, х0 4~ а), положим теперь
у =f (х), у 4- by =f (х 4- Дх),
так что
Ду=/(х4-Дх)—/(х),
в то время как Дх остается произвольным. Тогда, очевидно,
Г(х, j/) = F(x4“ Д*> «У4~ Ду) = 0,
§ ЮЗ]
ПРОСТЕЙШАЯ ЗАДАЧА
439
а следовательно, и
Д/7 = Э7Дд; + ^Д-)/ + о(Р) = 0’
откуда
£ =°(р)=°( /Д^+Ау*)>
ИЛИ
£+<£=» (/4W)=4+I£1)'
так как всегда ]/1 -р а? 1 + | я |, в чем можно убедиться хотя
бы возведением в квадрат обеих частей. Но отсюда
+ =Х(1 + |£У П = х(1
дх 1 ду &х \ 1 I Дх I ) \ Дх /э
где А -> 0 при р -> 0; следовательно,
Ду дх
, Дх ~ dF _ , '
В 2° мы доказали, что функция y=f(x) непрерывна в отрезке
(х0— а, х04-а); поэтому при Дх->0 мы имеем Д_у->0, а значит,
и р->0, откуда в свою очередь А->0. Но при Дх—>0 величины
dF dF
и постоянны, причем последняя отлична от нуля^ поэтому
последнее равенство дает:
dF
дх
1F'
ду
lim 17= А*)
Дат-о
Этим, очевидно, доказаны все утверждения теоремы 1. Выражение,
которое мы нашли для f (х), совпадает с тем, которое было нами
получено в § 92.
Заслуживает быть отмеченным, что теорема 1, подобно боль-
шинству теорем о существовании неявных функций, имеет локаль-
ную природу: как предпосылки ее говорят о поведении функции F
лишь в некоторой окрестности точки (х0, д/0) (в прямоугольнике /?),
так и утверждения касаются поведения функции f лишь
рой окрестности точки х0. Вообще говоря, обе окрестной?! ’SSfyk*
оказаться сколь угодно малыми.
Естественным обобщением теоремы 1 является случай опреде-
ляющего уравнения
F(xlt х2, ..., хп, у) = 0
(6)
440 неявные функции [гл. 24
с любым числом п независимых переменных. Если в точке
дР
(х10, х20, •••> хп*> Л) ^=0 и то в некоторой окрестности
точки 2V(xI0, х20, ..., хп0) существует единственная непрерывная
функция y=f(xu х2, ..., хл), удовлетворяющая уравнению (6) и
обращающаяся в у^ в точке N; эта функция имеет непрерывные
частные производные по всем переменным, и выражения этих про-
изводных легко могут быть найдены. Доказательство всех этих
утверждений проводится в точности так же, как только что прове-
денное доказательство теоремы 1.
Упражнения к § 103 см. в задачнике Б. П. Демидовича, от-
дел VI, задачи 232, 235, 237, 275.
§ 104. Общая задача
Переходя теперь к общей задаче, мы ограничимся рассмотрением
случая двух определяющих уравнений. Переход от двух уравнений
к трем, затем от трех — к четырем и т. д. не вызывает уже новых
принципиальных трудностей и связан лишь с более громоздкой
записью.
Пусть дана система уравнений
Л(Х, Л *) = 0, |
Ft(x, У, z) — 0 )
(ради краткости записи мы выбираем задачу с одной независимой
переменней), где функции и Д непрерывны и имеют непрерыв-
ные частные производные по всем переменным в некоторой области Р
значений этих переменных, которую можно выбрать в виде прямо-
угольного параллелепипеда. Пусть Л1 (х0, yQ9 г0) — внутренняя точка
области Р и пусть ее координаты удовлетворяют уравнениям (1):
Л») = °>
*,) = 0.
Мы хотим установить, при каких условиях существует единственная
пара непрерывных функций
y=fi(x), z—f9(x),
тождественно удовлетворяющих уравнениям (1) в некоторой окрест-
ности точки xQ и таких, что
f1 У в* fb == ^0*
Нас будет также интересовать вопрос о дифференцируемости этих
функций.
§104]
ОБЩАЯ ЗАДАЧА
441
Допустим сначала, что из двух частных производных
по меньшей мере одна отлична от нуля в точке М. Для опреде-
ленности пусть
в точке М. Тогда в силу теоремы 1 § 103 (распространенной на
случай двух независимых переменных) в некоторой окрестности Q
точки N (х0, yQ) плоскости (ху) существует единственная непрерыв-
ная* функция
*=7(х, у),
удовлетворяющая первому из уравнений (1) и принимающая значе-
ние г0 в точке N; эта функция в окрестности Q точки 7V имеет
непрерывные частные производные по х и у. Таким образом,
в окрестности Q точки М мы имеем тождественно относительно
X и у
Ftlx, У> J)] = O. (2)
Положим теперь
Pi [х, У, / (х, .у)] = Ф (х, у) (3)
и заметим следующее. Если нам удастся найти непрерывную
функцию
y==fi (X),
тождественно удовлетворяющую в некоторой окрестности точки х0
уравнению Ф(х, j/) = 0 и равную _у0 в точке х0, то, полагая
Z=f lx, fl (х)] =/2 (х), (4)
мы сразу заметим, что функции и /2 удовлетворяют всем поста-
вленным условиям. В самом деле, соотношение (2) выполняется
тождественно относительно у, и потому останется в силе при за-
мене у любой непрерывной функцией от х> в частности при
wy=/1(x), лишь бы ^(Xq)—yQ, что как раз имеет место; таким
образом, в некоторой окрестности точки х0 тождественно
Pt {•*> ft (*). f[x, fi (X)]} = F1 {х, fl (х), /2 (х)} = 0.
С другой стороны, функция y—j\(x) определена нами как реше-
ние уравнения
Ф (х, у) = 0,
а потому соотношение (3) дает тождественно в некоторой окрест-
ности точки х0
Ф к> /1 (•*)] = Pi {х, fl (X), / [X, fl (X)]} = .
= Pi{x, /,(х), /,(х)} = 0.
442
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
Таким образом, функции _у=/1(х), z=f*(x) действительно
в некоторой окрестности точки х0 удовлетворяют обоим уравне-
ниям (1). С другой стороны, мы имеем по самому определению
функции (х)
А(Л)=л>
откуда
/а (*о) == f А 00] ==/ С^о’ Л)===
по определению функции /.
Таким образом, наша задача сводится к решению уравнения
Ф(х, _у) = 0
относительно у, Очевидно, все предпосылки для существования
нужного нам решения j/=/1(x) в силу теоремы 1 § 103 будут
налицо, если в точке Af(x0, _у0) мы будем иметь:
посмотрим же, к чему приводит это требование. Из определения (3)
функции Ф мы имеем:
дФ dF2 . dF2 df
ду ду ' dz ду ’ ' '
но тождество (2) после дифференцирования по у дает:
dF\_ । ЗЛ
ду ’ dz ду ’
/ д?1
откуда (ввиду #01
dFt
df _ ду t
ду '
dz
вставляя это выражение в правую часть равенства (5), мы находим:
1 Г dFx dF±_dFy_ 1
ду dFt [ dz dy dy dz J
dz
dFr dF\
1 dz dy
= 'дК dF2 dF2
dz dz dy
§ 104]
ОБЩАЯ ЗАДАЧА
443
дФ
ду -
точке Af(x0, j0, г0) мы имели:
Требование, чтобы в точке М было Ф 0, равносильно, таким
образом, требованию, чтобы в
dFt
dz
dFs
dz
dF,
ду
dF2
ду
^0-
. Определитель, стоящий в левой части этого неравенства, мы будем
называть определителем Остроградского функций Fif Л2
по переменным z, у и обозначать через
1_D (^i>
J— D(z, у) >-
Мы приходим, таким образом, к требованию, чтобы определитель J
был отличен от нуля в точке М (х0, yQ, zQ). Заметим сейчас же, что
выставленное нами в самом начале требование, чтобы из двух про-
dFi dF2
изводных и по меньшей мере одна была отлична от нуля
в точке М, является прямым следствием нашего нового требования,
так как если бы обе эти производные обращались в нуль, опреде-
литель Остроградского имел бы столбец, состоящий из нулей и,
следовательно, сам обращался бы в нуль.
Тогда, как мы видели,
решения нашей задачи
Итак, допустим, что J^O в точке Ж.
дФ
Ф 0 в точке (х0, j/0), и существование
обеспечено. Так как при этом функции (х) и /2 (х) получены нами
повторным применением теоремы 1 § 103, всякий раз обеспечиваю-
щим нам непрерывность получаемых решений, а также их производ-
ных, то функция /j и /2, а также их производные f\ и будут
непрерывны в некоторой окрестности точки х0.
Нам остается доказать единственность полученного решения.
Пусть мы имеем две функции /*(х) и /*(х) в некоторой окрестно-
сти точки х0, непрерывные и удовлетворяющие требованиям
Ft (*> Л. Л)=0, f, (х, Л)=о (6)
и такие, что
Л(*о)=.Уо, Ли0) = 20;
(7)
покажем, что тогда в некоторой окрестности точки х0 тождественно
л=л. /:=/«•
*) Это общепринятое обозначение связано с именем немецкого матема-
тика Якоби, которому обычно приписывается разработка теории и приложений
определителей Остроградского («якобианов»). Однако Остроградский, несо-
мненно, получил важнейшие результаты за несколько лет до Якоби.
444
НЕЯВНЫЕ *ФУНКЦИИ
[гл. 24
Как мы уже отмечали выше, соотношение (2) выполняется
тождественно относительно х, у в некоторой окрестности точки
(х0,_у0) и потому будет выполняться в некоторой окрестности точки х0,
если вместо у мы подставим в него любую непрерывную функцию
от х, обращающуюся в у0 в точке х0. В качестве такой функции
мы в силу (7) можем выбрать функцию f* (х), так что
fik, л/(х,/:)]=о (8)
в некоторой окрестности точки х0. Но в силу (6) мы имеем, с дру-
гой стороны,
FAX, Л) = 0, (9)
а так как z=f(x> у) служит единственным непрерывным решением
уравнения
FAx, У, г) = 0,
равным в точке (х0> у0), то из (8) и (9) следует, что
/(х, /!)=/; (10)
в некоторой окрестности точки х0. Но из (3), (10) и (6) следует,
что в некоторой окрестности той же точки х0
ф (х, Л*)=f2 [х, /(х, /;)]=f2 [х, л. /П=0. (11)
Так как функция y=f1(x) по своему определению есть единствен-
ное непрерывное решение уравнения
Ф (х, у) = 0,
обращающееся ву0 в точке х0, то из (11) следует
fAx)=fi(x)
в некоторой окрестности точки х0; отсюда же в силу (4) и (10) сле-
дует, что и
f*(x)=fAx),
чем и доказано все требуемое.
Результат произведенного нами исследования можно формулиро- ?
вать в виде следующего предложения.
Теорема 1. Пусть функции (х, у, z) и (х, у9 z) не-
прерывны и имеют непрерывные частные производные по всем пе-
ременным в некоторой окрестности точки (х0, уь> г0) и пусть
в этой точке
Г, = 0, F, = 0,
§ 104] ОБЩАЯ ЗАДАЧА 445
Тогда существует в некоторой окрестности точки х0 един-
ственная пара непрерывных функций
y=fAx), г=Д(х),
удовлетворяющих уравнениям (1) и условиям (х0)=<у0,
/2(х0) = г0. Эти функции имеют непрерывные производные в не-
которой окрестности точки х0.
Как мы уже говорили выше, эта теорема с помощью индукции
легко может быть распространена на случай любого числа т опре-
деляющих уравнений с левыми частями Fit F* .Fm и с т-\-п
неизвестными yl9 yi9 ymi xlf xif ..., xn. Специфическим доста-
точным условием возможности однозначно выразить в окрестности
некоторой точки переменные ylf у$, ..., у^ как функции перемен-
ных xi9 х3, ..., хп в общем случае служит требование, чтобы в этой
точке
J='P(./7b о,
0(У1>Л....Ут)
где
dF, dFt dFa
dyt dyt ...
dFa dFa dFa
«b'l dya дУт
dFm dFm dFm
dyt ' dya ... дУт
— определитель Остроградского системы функций Fu Fif ..., Fm
по переменным yi9 у%, ..., ут (мы не упоминаем здесь об обычных,
одинаковых для всех случаев условиях непрерывности и дифферен-
цируемости).
Очень важно отметить, что все установленные нами предложения
имеют отчетливо выраженный локальный характер: во всех случаях
из свойств данных уравнений в некоторой окрестности данной точки
доказывается существование решений также лишь в некоторой окре-
стности определенной точки, причем о размерах этой окрестности
наши теоремы никаких утверждений не содержат.
Нам остается рассмотреть вопрос о том, как в общем случае
производные искомых функций ft могут быть выражены через частные
производные данных функций Ft. Рассмотрим этот вопрос примени-
тельно к условиям теоремы 1. Так как в некоторой окрестности
точки х0 мы имеем тождественно:
/1(*)> А(х)]=о,
F%\x> ft(x)] = 0,
446
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
то, дифференцируя эти тождества по х, мы находим (напомним, что
существование и непрерывность производных /1(х) и fz(x) нами
уже установлены)
dF1 । dF1 df 1 । dFi df2 Q
дх * ду dx ' dz dx ’
I ^_^. = 0 (12)
dx 1 dy dx* dz dx
Рассматривая в этой системе и как неизвестные, мы и
получаем для них однозначные выражения через частные производ-
ные функций Ft и F2, так как определитель системы (12) есть опре-
делитель Остроградского J и отличен от нуля в интересующей нас
области. Мы находим:
dfi - 1 Г dFs dFt dFt dF, j
dx J 1 dx dz dx dz J ’
df2 = 1 рЛ dF2 dF2 dFt 1
dx J I dx dy dx dy J *
§ 105. Определители Остроградского
D(F F F )
1. Общие свойства. Определитель J—ь—системы
D(yitys,
m функций Ff, F2, ..., Fm по m переменным yi9y%9 ..., ym, от ко-
торых эти функции зависят, играет, как мы видели в предыдущем
параграфе, важную роль в вопросе о функциональной разрешимости
системы уравнений (или, что то же самое, в вопросе о существо-
вании неявных функций). Однако с этими определителями прихо-
дится встречаться и во многих других задачах анализа и его при-
ложений; поэтому мы должны смотреть на эти определители как на
важный инструмент аналитических рассуждений и расчетов. Если мы
имеем т функций Fit F2, ...,FmOT т переменных ylf у$, ..., ут
и если мы хотим, по смыслу поставленной задачи, обобщить понятие
производной одной функции от одной переменной на наш случай
так, чтобы это обобщение выражалось одним числом (каково бы ни
было т)9 то почти всегда за это число оказывается удобным при-
нять как раз определитель J. Именно так обстояло дело в § 104
при рассмотрении вопроса о существовании неявных функций; это
отчетливо показывает сравнение формулировок теорем § 103 и § 104.
Причина этого общего явления, заставляющего нас в известном
смысле смотреть на определитель J как на «производную системы
функций Flt Fit ..., Fm по системе переменных yi9 yi9 ..., ут»9
лежит в том, что многие из важнейших свойств этих определителей
обнаруживают полную аналогию соответствующим свойствам обыкно-
венных производных; мы теперь рассмотрим несколько таких про-
стейших свойств, ограничиваясь при этом ради простоты случаем
т = 2 (хотя все свойства, о которых будет итти речь, имеют место
для любого ш).
§ 105]
ОПРЕДЕЛИТЕЛИ ОСТРОГРАДСКОГО
447
Пусть функции х — х(и, v), у=у(и, v) непрерывны и имеют
непрерывные частные производные по и и v в некоторой области
значений этих переменных и пусть в этой области
г Р(х, з?) п
D (и, v)
Тогда для системы функций
Л (х> У* и> v) — x — х (и, г/),
F2(x, у, и, v)=y—y(u, v)
выполняются в окрестности любой точки (х0, уц, ц0, г/0) (где (и0, г>0)
принадлежит данной области, x0 = x(w0, р0) и yQ=y (и9, х>0)) все
условия теоремы 1 § 104. Эта теорема позволяет поэтому заключить
о существовании и единственности пары обратных функций
и = и(х, у)> v = v(x, у)
в некоторой окрестности точки (х0, j/0), а также утверждать не-
прерывность этих функций и их частных производных по х и у.
Пусть теперь мы снова имеем х = х(и, р), у=у(и, v) и пусть
и и v в свою очередь являются функциями новых переменных s и t
u = u(s, /), v = v(s, Z),
причем эти функции подчиняются обычным условиям непрерывности
и дифференцируемости. Тогда х и у становятся «сложными» функ-
циями от 5 и /:
x = x[u(s9 /), z/(s, У=У\ц(з, 0, 0J-
По правилу дифференцирования сложных функций (§
имеем:
дх___дх ди . дх dv ду________ду да . ду dv
~ds ~ди ~ds ' dv ds ’ ds du ds ' dv ds ’
92) мы
и аналогичные формулы для и Отсюда
дх ди । дх dv ду 6u_\dy dv
du ds ' dv ds du ds ’ dv ~ds
dx du i dx dv dy du , dy dv
~du ~dt dv dt du dt dv dt
Щх, у) _
t) ~
(1)
Но, с другой стороны, dx fir
du dv (2)
D(u, v) dy dy
da dv
du du
D(u, v) _ ds dt
D(s, t) dv dv • W
ds dt
448
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
Так как, по известному правилу умножения определителей, опре-
делитель (1) равен произведению определителей (2) и (3), то отсюда
D (*, У) (*, У) D (и, v) m
P(s, t) D(ut v) ’ D(s, t) ’ 1 }
Это соотношение (сохраняющее силу и для определителей с лю-
бым числом т строк и столбцов) дает правило составления опреде-
лителя Остроградского для системы сложных функций, в точности
аналогичное правилу дифференцирования сложной функции одной
независимой переменной:
, ч z ч dx dx du
х = х(и), u = u(s); —
v v 7 ds du ds
В частности, полагая s = x, t=y (т. e. возвращаясь от новых
переменных w, v к старым х, у), мы находим из соотношения (4)
D (х, у) Р(и, у) _Р (х, у) _ [ 10 =1.
Р (и, у) ’ Р (х, у) Р(х, у) I 0 1 ’
это показывает, что определители Остроградского системы данных
функций и системы обратных функций представляют собой величины
взаимно обратные; это правило снова в точности аналогично правилу
x = f =
dx
дифференцирования обратных функций в случае одной функции от
одной независимой переменной.
2. Определитель Остроградского как локальный коэффициент
растяжения площади. Теперь мы рассмотрим одно очень важное
геометрическое приложение определителя Остроградского, которое
нам понадобится в дальнейшем; при этом мы снова ограничимся
рассмотрением случая /п = 2.
Пусть функции
« = «(х, у), v = v(x, у) (5)
непрерывны и имеют непрерывные частные производные в некоторой
области плоскости X/ и пусть в этой области
-6 0.
D(x,y)
Рассмотрим преобразование переменных (5) с геометрической
точки зрения. Пусть и и v — декартовы координаты точки (и, v)
некоторой новой плоскости, которую мы будем называть плоскостью
UV. Тогда соотношения (5) ставят в соответствие каждой точке
PC*, У) данной области плоскости XY некоторую точку Q(n, v)
плоскости UV (черт. 63). Если мы заставим точку Р как-нибудь
§ Ю5]
ОПРЕДЕЛИТЕЛИ ОСТРОГРАДСКОГО
449
передвигаться в данной области плоскости XYy то соответствующая
ей точка Q будет совершенно определенным образом менять свое
положение в плоскости UV. Каждой кривой в плоскости XY будет,
таким образом, соответствовать некоторая кривая в плоскости UV
и каждой фигуре в плоскости XY — некоторая фигура в плоскости UV.
В частности, вся та область, в которой определены функции (5),
перейдет в некоторую область
плоскости UV.
Пусть теперь А (а, Ь) — не-
которая определенная точка плос-
кости XY, лежащая внутри той
области, где определены функ-
ции (5), и пусть h — малое по-
ложительное число.Точки А (а, Ь),
B(a-\-h, b), C(a + h, b^h),
D (at b 4- h) (черт. 64, а), оче-
видно, служат вершинами квадра-
та со стороной h. Преобразование (5) переводит эти вершины соот-
ветственно в точки А', В, С, D' плоскости UV (черт. 64,б), коор-
динаты которых, очевидно, равны:
А' [и (a, b), v(a9 #)],
В' [й (а b), v(a-\-h, £>)],
C[«(a-j-^, b + h), v(a-\-h, * +
D' [к (a, b h), v (a, b -j- Л)].
Весь квадрат переходит в криволинейный четырехугольник A'B'C'D',
изображенный на черт. 64, б. Мы поставим себе задачу найти при-
Черт. 64.
ближенную величину площади этого криволинейного четырехуголь-
ника, в предположении, что число h очень мало. С этой целью мы
сначала заменим дуги кривых А'В, В'С, CD\ D'A' прямолинейными
хордами с теми, же концами и подсчитаем площадь прямолинейного
четырехугольника A’BCD' (черт. 64, б), представляющую собой сумму
площадей треугольников А'ВС и A'D'C. По известной формуле
29 А. Я. Хинчин
450
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
аналитической геометрии, площадь треугольника с вершинами (ии т^),
(ц2, ^2)» (из> ^з) равна половине абсолютной величины определителя
«1 Vi 1
т/2 I
v3 1
w2--Wj — Vi
и* — u2v3 — v9
Это дает для площади треугольника А'В'С выражение
£
2
u(a-\-hy b) — и {а, Ь)
u(a-\-h, b-[-h)—u(a-[-h'y b)
v(a-\-hy b) — v(ay b)
v(a-\-hy b-\-h)—v(a-[-1vy b)
__ t £
— — 2
ux (a b) h
Uy (a -|- hy b-\- 63/z) h
v'x (a 4~ 62/z, b) h
v'y(a-\-hy b-[- 64Л) h
— 4-^
2
Uy (a —j— hy b —|— 93/z)
vx (a
vy(a-]-hy b-^-^h)
где Oj, 62, 63, 04 — числа, заключенные между 0 и 1.
Мы предполагаем частные производные функций и и v по х и у
непрерывными, а следовательно, и равномерно непрерывными в рас-
сматриваемой (закрытой) области. Вследствие непрерывности частных
производных в точке (а, &) при достаточно малом h все элементы
последнего определителя будут сколь угодно мало отличаться от зна-
чений соответствующих производных в точке (ау &), а значит, сам
этот определитель будет сколь угодно мало отличаться от опреде-
лителя
их(а, b) vx(ay b)
иу (ау b) Vy (а, Ь) 9
J(ay b) =
т. е. от определителя Остроградского функций и, v по переменным
ху у в точке (а, Ь). Таким образом, при Л—>0 мы имеем для пло-
щади треугольника A'B’C выражение
* {| J(a,b) | Н-о(1) }=у|/(а,
но совершенно аналогичный расчет показывает, что в точности то
же выражение получает и площадь треугольника AD'Cfy так что
площадь всего прямолинейного четырехугольника A’B’CD’ равна при
Л->0
Л«Ц(а, &)| + <> (Л2); (7)
при этом важно напомнить, что полученная оценка имеет место
равномерно относительно всевозможных положений точки (а, Ь)
в рассматриваемой области *).
*) Это означает, что при h —- 0 отношение второго слагаемого к вели-
чине Л2 стремится к нулю равномерно относительно а и Ъ в данной области.
§ 105]
ОПРЕДЕЛИТЕЛИ ОСТРОГРАДСКОГО
451
Нам остается перейти от прямолинейного четырехугольника
A'B’C'D* к криволинейному четырехугольнику с теми же вершинами.
Но разность площадей этих двух четырехугольников не превосходит,
очевидно, суммы площадей четырех узких площадок, заштрихован-
ных на черт. 64. Поэтому, чтобы показать, что выражение (7) пред-
ставляет собой и площадь криволинейного четырехугольника A'B'CD1,
достаточно убедиться, что эти заштрихованные фигуры имеют пло-
щади типа о (Л2). Расчет проводится, разумеется, для всех четырех
фигур одинаково; проведем его, например, для фигуры А’В' (черт. 65)
и обозначим для краткости координаты точек
А и В’ соответственно через (и0, р0) и
(и04-Ди, ©о + Дг/).
Допустим, что J(a, b) 0; тогда в точке
(а, Ь) по меньшей мере одна из частных
ди dv
производных , -т- отлична от нуля; пусть,
С/Л С/Л
ди n z
для определенности -^^>0 в точке (а, я),
тогда, если h достаточно мало, мы будем
ди
иметь 0 во всех точках квадрата ABCD
Черт. 65.
0
и в частности — во всех точках стороны АВ этого квадрата. Таким
образом, когда точка (х, 3/) пробегает эту сторону от А к В, со-
ответствующая точка (к, v) пробегает кривую A'Bf в сторону воз-
растающих и; мы можем поэтому представить уравнение этой кривой
в виде v=f(u), где w0 и ==^ и0 -р Уравнение же прямолиней-
ного отрезка А'ВГ будет, очевидно,
= ^0 + ^ (« — «о) = / («о) + /(Ц<> + Адц /(“о) (« — «о).
так что площадь S фигуры, заштрихованной на черт. 65, выразится
интегралом
я04-д« .
5= J |/(«)-/(«о)—^^ [/(«<•+А«)-/(«о)|^
«О
Так как вдоль отрезка АВ величина у остается постоянной, то
и и v становятся функциями одной переменной х и мы имеем:
j ди 1 . dv .
du = -^~ dx, dv — -^-dx,
откуда
dv
dv ~дх .
du ди ’
dx
♦
452
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
так как -2 0 на участке АВ, то отсюда вытекает существование
и непрерывность производной f (а) = на участке (а0, а0 Дм).
Мы находим поэтому при а0 и ==^ а0 -|- Да:
/(и)— /(«») = (« — «о)/'(«1)> /(и0 + д“)—/(“») = Ди/'(«Д
где af и а2 заключены между а0 и а0-[-Лм; вследствие этого най-
денное нами для площади 5 выражение может быть переписано
в виде
и0 +Д«
5= J (« — а0)|/'(«1)— /'(и2)|</н,
и0
что в силу непрерывности функции f (и) дает при Да->0
и04-Д«
S = о ( J (а — а0) duj = о (Да2),
«о
Но
Да = а(а-}~ h, b)— и (а, Ь)
при h -> 0 есть бесконечно малая одинакового порядка с h, вслед-
ствие чего мы получаем:
5 = о(Л2),
что и надо было установить.
Мы можем, таким образом, считать установленным, что пло-
щадь криволинейного четырехугольника A’B'C'D', в который пере-
ходит квадрат ABCD посредством преобразования (5), равна выра-
жению (7), причем эта оценка имеет место равномерно относительно
положения точки (а, Ъ) в рассматриваемой области. Так как пло-
щадь квадрата ABCD равна Л2, то отношение преобразованной
площади к первоначальной равно
\J(a, b)\ + о(1),
а предел этого отношения при /г->0 равен \J(a, Z>)|.
Этот результат может быть значительно обобщен. Вместо квад-
рата ABCD мы могли бы взять любую достаточно простую, содер-
жащую точку А (а, Ь) фигуру и уменьшать ее затем так, чтобы
диаметр ее стремился к нулю; при этом (как показывает более
детальный анализ, которого мы здесь привести не можем), отноше-
ние площади преобразованной фигуры к площади данной фигуры
всегда будет иметь своим пределом величину \J(a, &)|. Таким обра-
зом, абсолютная величина определителя Остроградского преобразо-
вания (5) может рассматриваться как коэффициент растяжения
или сжатия площадей, вызываемого преобразованием (5) в бли-
§ 106] УСЛОВНЫЙ ЭКСТРЕМУМ 4S3
жайшей окрестности точки (а, Ь). Этот результат имеет очень
большое значение в теории кратных интегралов, к которой мы
перейдем в следующем разделе. Эта геометрическая роль опреде-
лителя* Остроградского распространяется и на пространство любого
числа измерений. Так, при преобразованиях трехмерного простран-
ства определитель Остроградского такого преобразования дает нам
коэффициент объемного расширения или сжатия небольших геоме-
трических тел, целиком лежащих в ближайшем соседстве некоторой
данной точки.
§ 106. Условный экстремум
В настоящем параграфе мы рассмотрим элементы теории так
называемых условных экстремумов (максимумов и минимумов), в
которой теория неявных функций находит себе одно из важней-
ших непосредственных приложений.
Пусть в пространстве задана некоторая поверхность уравне-
нием
F(x, у, г) = 0 (1)
и тр'ебуется найти точку этой поверхности, в которой некоторая
функция /(х, у, г) принимает наибольшее (или наименьшее) значе-
ние в сравнении с другими точками той же поверхности. Аналити-
чески это означает, что ищется максимум (или минимум) функции
/(х, у, г) для всевозможных троек чисел х, у, z, связанных соот-
ношением (1); от обычной постановки экстремальных задач этот
вопрос отличается именно наличием связующего уравнения (1), т. е.
тем, что нас интересует сравнительная величина функции /(х, у, z)
только в таких точках, координаты которых связаны соотноше-
нием (1).
В других случаях бывает, что точка, в которой данная функ-
ция f имеет наибольшее или наименьшее значение, ищется среди
точек некоторой линии, выражаемой уравнениями
Р,(Х.У.Х) = 0,\
F,{x, у, г)=0. J 1'
Аналитически это означает, что среди всех троек чисел (х, у, z),
удовлетворяющих соотношениям (2), ищется такая, для кото-
рой функция /(х, у, z) имела бы наибольшее или наименьшее
значение.
Во всех подобных случаях говорят об условном экстре-
муме функции /(х, у, г), имея в виду, что искомая точка дает
функции /(х, у, z) наибольшее или наименьшее значение лишь
относительно точек, удовлетворяющих некоторым дополнительным
условиям типа (1) или (2). Сами эти соотношения называют обычно
454
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
уравнениями связи, свойственными данной задаче. Самый
общий вид задачи об условном экстремуме, очевидно, может быть
формулирован так, что среди точек (х15 х2, ..., хп), удовлетворяю-
щих уравнениям связи
FifXi, х2, ..., хп) = 0 (/= 1, 2, ..., хп; т<^п),
ищется такая, в которой данная функция f(xu х2, ..., хп) имела бы
наибольшее или наименьшее значение. При этом обычно, как это
делается и в задачах на простой экстремум, заранее задается та
область значений переменных xt которая интересует
нас в данной задаче.
Если в этой области из т уравнений связи какие-нибудь т
переменных (например, хр х2, ..., хт) определяются как однознач-
ные функции остальных переменных (хт+1, ..., хл):
(xm+1, хт+2, хп) (/=1, 2, .... т),
то, вставляя эти их выражения в функцию /, мы получаем, оче-
видно, функцию переменных (хт+1, ..., хл), экстремум которой
ищется уже среди всевозможных, ничем не связанных систем зна-
чений этих переменных, т. е. наша задача сводится к задаче о про-
стом экстремуме, решение которой мы рассматривали в § 96. По-
нятно поэтому, что для задач на условный экстремум имеет важное
значение вопрос о возможности решения системы уравнений связи
относительно той или другой группы переменных и что тем самым
общая теория условного экстремума тесно связывается с теорией
неявных функций.
Для упрощения записи и связанной с этим лучшей обозримости
рассуждений мы в дальнейшем рассмотрим частный случай п = 5,
хи = 2, т. е. задачу об условном экстремуме функции f{x,y, z, и, v)
пяти переменных, подчиненных двум уравнениям связи:
Fx (х, у, z, и, -у) = 0, |
F* (х, у, z, и, v) = 0. J (3)
Все рассуждения, проводимые нами в дальнейшем для этого слу-
чая, могут быть в точности аналогично проведены и для случая
любых п и т. Как и при рассмотрении задачи о простом экстре-
муме, и на тех же самых основаниях, мы будем исследовать только
признаки относительного (локального) условного экстремума и,
естественно, как и там, ограничимся установлением необходимых
признаков общего характера, так как вхождение в более глубокие
детали задачи здесь для нас еще менее возможно, чем там.
Итак, мы допустим, что в некоторой точке Af(x0, y^t z0, и0, *у0),
координаты которой удовлетворяют уравнениям связи (3), функция
/(х, у, г, и, v) принимает значение, наибольшее или наименьшее
по сравнению со всеми достаточно близкими точками, координаты
§ 106]
УСЛОВНЫЙ ЭКСТРЕМУМ
455
которых также удовлетворяют уравнениям (3). Напишем матрицу
с двумя строками и пятью столбцами
!
дх
\ дх
dF, dFi dF, dFi
dy dz du dv
dFa dF. dFi dF.
— — 1 1»^^— - - -
ду dz du dv
и допустим, что среди определителей второго порядка, которые
могут быть составлены из элементов этой матрицы, по крайней
мере один отличен от нуля в точке 7И. Для определенности, пусть
это будет определитель
dFr дЬ\
ди dv .
dF. dF. '
ди dv
Тогда (предполагая выполненными обычные условия непрерывности
и дифференцируемости функций Fy и Л2) мы* можем заключить из
теоремы 1 § 104, что существует единственная пара функций
и = и(х, у, z), v = v(x, у, z),
которая в некоторой окрестности точки Р(х0, _у0, z0) тождественно
удовлетворяет уравнениям (3) и для которой
«(*0> У О’ ^ — и9> л, -?o) = ^o-
В некоторой окрестности точки Р эти две функции непрерывны и
имеют непрерывные частные производные по всем трем переменным.
Так как нас по смыслу поставленной задачи интересуют значе-
ния функции /(х, у, z, и, v) в точках, которые близки к точке М
и координаты которых связаны соотношениями (3), то мы можем,
следовательно, заменить в выражении этой функции и и v соответ-
ственно функциями и (х, у, z) и v (х, yt z) и утверждать, что полу-
чаемая таким образом функция от х, у, z
<?(х, у, z)=f[x, у, z, и(х, у, z), v(x, у, Z)] (4)
имеет простой (обычный) локальный экстремум в точке Р(х0, yQf z0).
В силу § 96 мы должны поэтому иметь в точке Р
д® ду д*
дх Ну dz 9
в силу же выражения (4) функции ср это дает:
гdf du । df dv — 0
дх 1 1 ди dx । dv dx
д/ , df du । df dv = 0,
ду 1 ' da dy * dv dy (5)
JL । du , df_ dv .— о.
dz 1 1 du dz * dv ~dT J 1
456
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
Чтобы левые части этих уравнений могли считаться данными
функциями от х, у, z, и, v, мы должны выразить через эти пять
. „ да dv ди dv ди dv
переменных функций Но это есть
задача дифференцирования неявных функций, подробно рассмотрен-
ная нами в § 104. Как и там, мы для этой цели дифференцируем
по х, у и z тождества
Л [*, Л z> и (•*> У> z\ v (х> У* *)] = °>
F* [*, У, z> и (х, у, г), v (х, у, z)\ = 0
и находим:
dFv I dFi ди . dFx dv ____q ’
дх * ди дх ’ dv дх ’
dF^ । dF^da^ । dF± Jto=() W
dx ‘ du dx ”* dv dx
и аналогичные соотношения для производных по у и z. Из уравне-
ний (6) мы, как обычно, можем однозначно выразить производные
и чеРез частные производные данных функций Ft и F*
(определитель системы (6) есть J и по предположению отличен от
нуля в точке 7И, а значит, и в некоторой ее окрестности). Оче-
видно, что аналогичные системе (6) системы, написанные для
производных по у иг, дадут нам аналогичные выражения для
ди dv ди dv
-х—, -3—, -3—, -ч—. Вставляя эти выражения в соотношения (о),
ду ’ ду ’ dz ’ dz F v
мы будем иметь три уравнения, левые части которых мы можем
теперь считать данными нам функциями от х, у, z, и, v. Присоеди-
няя же к этим уравнениям уравнения связи (3), мы получим пять
уравнений, левые части которых представляют собой известные нам
функции переменных х, у, z, и, v. Как мы доказали, этой системе
пяти уравнений с пятью неизвестными должны удовлетворять коор-
динаты точки М, если эта точка дает нужный нам условный
экстремум. Естественно поэтому называть всякую систему пяти
чисел (х, yf z, и, v), удовлетворяющую полученной нами системе
уравнений, стационарной точкой поставленной нами задачи. Полу-
ченный нами результат можно тогда формулировать аналогично ра-
нее полученным нами выводам для простых экстремумов: при со-
блюдении обычных условий непрерывности и дифференцируемости
данных функций локальный условный экстремум функции может
иметь место только в стационарных точках. Разумеется, вопрос
о том, действительно ли та или другая стационарная точка дает
условный локальный экстремум функции f и если дает, то какова
природа этого экстремума, — все эти вопросы еще никак не решаются
предшествующим рассмотрением и Требуют специального исследо-
вания.
§ 106]
УСЛОВНЫЙ ЭКСТРЕМУМ
457
Как мы видели, первые три из системы пяти уравнений, служа-
щих для определения стационарных точек, получаются решением
системы линейных уравнений (6) относительно и и подста-
новкой найденных решений в первое из уравнений (5), с последую-
щим проведением тех же операций для производных по у и г и
соответственно для второго и третьего из уравнений (5). Разумеется,
не представляло бы никаких затруднений фактически провести все
эти простые операции и в явном виде написать окончательную си-
стему уравнений (она содержала бы, очевидно, только частные про-
изводные функций /, Fx и F2 по всем пяти переменным). Однако
мы не сделали и не будем делать этого, потому что на практике
в большинстве случаев получают окончательную систему уравнений
для определения стационарных точек другим, более удобным путем,
с помощью так называемого «метода неопределенных множителей».
Покажем, как это делается.
Та последовательность операций, которую мы только что описали,
по существу представляет собой, очевидно, элементарную алгебраи-
ди dv ди
ческую операцию — исключение шести неизвестных
"ST’ "3F из девяти лине^ных уравнений ((5), (6) и четырех
аналогичных (6) уравнений, написанных для производных функций
и и v по у и г). Такое исключение может быть, ’ разумеется, про-
ведено различными способами. В частности, наш путь состоял в том,
что мы выражали все исключаемые неизвестные из шести последних
уравнений и вставляли найденные их выражения в уравнения (5).
Практически этот путь часто оказывается неудобным благодаря
своей асимметрии: роль переменных и, v в нем существенно отли-
чается от" роли остальных переменных х, у, z. Основным преиму-
ществом метода неопределенных множителей является как раз пол-
ное равноправие в его применении всех пяти переменных.
Мы попрежнему допустим, что точка Л4(х0, j/0, z0, и0, г/0) дает
искомый локальный условный экстремум функции f и сохраним все
прежние предположения относительно функций /, Fx и F2 в окре-
стности точки Л4. Система уравнений
1__L1 I 1 п
ди ' 1 ди * 2 ди ’
(7)
dv 1 1 dv 1 2 dv
0,
где все частные производные берутся в точке Л4, имеет тогда един-
ственное решение (Хп Х2). Умножая уравнения (6) соответственно
на Xj и Х2 и складывая их почленно с первым из уравнений (5),
мы в силу (7) находим в точке М
+ + хв-^ = °; (8)
дх 1 1 дх 1 2 дх 9 4 7
458
НЕЯВНЫЕ ФУНКЦИИ
[гл. 24
если мы выпишем уравнения, аналогичные (6), для производных
по у и z и скомбинируем их только что описанным образом со
вторым и третьим из уравнений (5), то мы, очевидно, в полной
аналогии с уравнением (8) получим уравнения
df I
£_li ।
dz ' 1 dz '
dy
х^=0-
2 dz
(9)
Система пяти уравнений (7), (8) и (9), очевидно, обладает пол-
ной симметрией относительно пяти переменных х, у, z, и, V. При-
соединяя к этим пяти уравнениям еще уравнения связи, мы получаем
систему 7 уравнений с неизвестными х, у, zt и, v, Хр Х2, которые
(при обычных условиях непрерывности и дифференцируемости дан-
ных в задаче функций) должны выполняться в каждой стационарной
точке.
Если мы наряду с данной функцией f рассмотрим еще функ-
цию
ф =/+ 1 ^2^2
тех же переменных, где kj и Х2— неопределенные числовые множи-
тели, то полученная нами система уравнений (7), (8), (9) может быть
записана в виде
дФ____дФ ___дФ ___дФ ___дФ____q
dx dy dz du dv ’
и потому представляет собой как раз ту систему уравнений, кото-
рую мы получили бы, если бы вместо условного экстремума функ-
ции f искали простой экстремум функции Ф. В этой редукции
определения условных стационарных точек функции f к отысканию
простых стационарных точек функции Ф практически и состоит
применение метода неопределенных множителей. Мы видим, что си-
стема уравнений, определяющих условные стационарные точки функ-
ции /, имеет двумя неизвестными (Xj и Х2) больше, чем в случае
простых стационарных точек; вместе с тем и число уравнений уве-
личивается на два, так как присоединяются уравнения связи, отсут-
ствующие в случае простого экстремума.
Пример. Параболоид вращения
х2 -\-y* = z
(Ю)
пересекается плоскостью
(11)
по некоторому эллипсу; найти наибольшее и наименьшее расстоя-
ния точек этого эллипса от начала координат.
§ 106] условный экстремум 459
Аналитически задача состоит, очевидно, в нахождении максимума
и минимума функции
х2 -f-J'2 + z*
при уравнениях связи (10) и (11). Следуя методу неопределенных
множителей, мы составляем функцию
Ф(х, у, г) —№-|-У+ (х2-)-^4 —г)-4-Х2(хЦ-5'-|-г—1)
и приравниваем нулю ее частные производные по всем трем пере-
менным; это дает:
х=У—~~-2(ХЯПТ’ г = -2-±:
подставляя эти выражения в уравнения связи (10) и (11), мы с по-
мощью легких вычислений находим:
Х,=— 3±|/3, Х2 = —7±-У-/3,
и следовательно,
' " — 1 zt ]ЛЗ п
х=у =-------гу--—, z==2qz/3.
Для величины х2 -|-j/2 это Дает Два значения 9zjz5 у/3; так
как в данном случае существование искомых экстремальных значе-
ний геометрически очевидно, то никаких дополнительных исследо-
ваний полученных двух стационарных точек не требуется и задача
может считаться решенной.
Дальнейшие упражнения читатель найдет в задачнике Б. П. Де-
мидовича, отдел VI; например, можно рекомендовать задачи 447,
448, 453, 456, 465.
РАЗДЕЛ ШЕСТОЙ
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ИНТЕГРАЛЬНОГО
ИСЧИСЛЕНИЯ
ГЛАВА 25
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
§ 107. Интегралы с бесконечными пределами
В этой главе мы рассмотрим два расширения понятия определен-
ного интеграла, имеющих важнейшее значение как для дальнейшего
развития теории, так и для приложений.
Функция у = в области положительна, непрерывна, не-
престанно убывает с возрастанием х и стремится к нулю при
х->оо. Рассмотрим площадь, располо-
женную ниже кривой у — ~~ и выше
оси ОХу между абсциссами 1 и Ь^>1;
мы знаем, что эта площадь (черт. 66)
выражается интегралом
(1)
Если мы заставим b возрастать, то
будет расти и рассматриваемая нами
площадь; и если b возрастает безгра-
нично, то хотя заштрихованная на
черт. 66 фигура безгранично удлиняется,
простираясь все дальше и дальше вправо, но площадь ее остается огра-
ниченной и стремится к единице, как показывает соотношение (1). Это
явление очень напоминает то, что происходит при суммировании какого-
нибудь сходящегося ряда с положительными членами, например про-
стой геометрической прогрессии; как там частичные суммы, охваты-
вая все больше и больше членов ряда и непрестанно возрастая, тем
не менее не растут безгранично, а приближаются к некоторому ко-
нечному пределу, так и здесь заштрихованная площадь с ростом
числа b охватывает область все большей и большей протяженности
и непрестанно возрастает, но растет при этом не безгранично,
§ 107]
ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ
461
а стремясь к некоторому конечному пределу. И как там мы, есте-
ственно, понимали предел частичных сумм как сумму «всех» чле-
нов ряда, так и здесь предел площади заштрихованной области мы
столь же естественно хотим понимать, как площадь всей прости-
рающейся в бесконечность фигуры, ограниченной сверху кривой
у = снизу — осью ОХ и слева — прямой х=1 (а справа ничем
не ограниченной).
Но в случае рядов предел частичных сумм существует только
для сходящегося ряда, и мы знаем, что бывают ряды, члены кото-
рых положительны, монотонно убывают и стремятся к нулю и ко-
торые все же расходятся, так что частичные суммы их безгранично
возрастают, не стремясь ни к какому пределу (вспомним гармони-
\^еский ряд). Аналогичное положение вполне возможно и в рассма-
триваемой нами задаче о площади фигуры, простирающейся в бес-
конечность. Так, кривая у=~ имеет в области х^>1 течение в
основном того же типа, что и кривая у = -^ (черт. 66); но так
как при />->оо
ь
С dx
то в этом случае площадь заштрихованной фигуры с возрастанием b
растет безгранично, так что вся простирающаяся в бесконечность
фигура уже не имеет конечной площади.
Условимся вообще для любой функции /(х), интегрируемой в
отрезке (а, Ь) при сколь угодно большом Ь, называть предел
ь
lim I f(x)dx,
b—>oo J
a
(2)
если он существует, обобщенным интегралом функции/(х),
распространенным на отрезок (полупрямую) (а, -р°°) (или взятым
в пределах от а до 4“°°)» и обозначать этот предел через
оо
(3)
а
Если предел (2) существует, то интеграл (3) называют сходя-
щимся, а предел (2)—величиной этого интеграла. Если предела (2)
не существует, то интеграл (3), как говорят, расходится и ве-
личины не имеет. Во всем этом функция /(х) не обязательно
должна быть положительной и монотонной; чтобы установленное
нами определение имело смысл, надо, очевидно, только чтобы
462 ОБОБЩЕННЫЕ интегралы [гл. 25
функция /(х) при любом Ь"^>а была интегрируема в отрезке (а, Ь);
в частности, значит, достаточно предположить функцию /(х) не-
прерывной в области х^а. Разумеется, в этом общем случае
та простая геометрическая интерпретация интеграла (3), с которой
мы только что начали, уже не будет иметь места.
Мы предполагали до сих пор, что нижний предел интеграла
остается постоянным, в то время как верхний безгранично возра-
стает. Очевидно, вполне аналогичным будет случай, когда, напротив,
постоянным остается верхний предел Ь, в то время как нижний
предел а, будучи отрицательным, безгранично возрастает по абсо-
лютной величине (а-> — оо). Если при любом а<^Ь функция /(х)
интегрируема в отрезке (а, Ь) и если существует предел
ъ
lim f/(x)dx, (4)
а-» — оо
а
то мы обозначаем этот предел через
ь
J f(x)dx (5)
— оо
и называем последний интеграл сходящимся и равным пределу (4);
если этого предела нет, то интеграл (5) расходится и мы никакой
величины ему не приписываем.
Наконец, возможен и случай, когда одновременно и независимо
друг от друга а--> — оо и 6->-|-оо, т. е. промежуток интеграции,
расширяясь, охватывает в пределе всю числовую прямую. Мы будем
считать, что при этом интеграл
ь
j*/(x)dx = /(a, Ь)
а
стремится к пределу /, и писать
lim /(а, Ь) = 1, (6)
а-* — оо
b -+ -|-оо
если для любого е^>0 найдется такое А^>0, что при а<^ — А
Ь^>А всегда
|/(а, Ь)-/|<е.
Очевидно, что для существования предела (6) необходимо и доста-
точно, чтобы сходились оба интеграла
+ °° О
J f(x)dx и j* f(x)dx,
О — оо
§ 107] ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ
463
и что в случае, когда это так, предел (6) равен сумме этих двух
интегралов. Если предел (6) существует, то мы будем обозначать
его через
J f(x)dx . (7)
— оо
и называть интеграл (7) сходящимся; в противном случае интеграл (7)
расходится и мы не приписываем ему никакого числового значения.
Пример 1. Так как
ь
С dx . . .
J = arctg b — arctg a,
a
TO
dx
1 + X2
интеград
поэтому сходится и равен я.
Пример 2. Так как
cos х dx = sin b — sin a
и так как sinx при x—>oo ни к какому пределу не стремится, то
интегралы
-|-оо ъ 4" °°
J cosxdx, J cosxtZx, j* cosxrfx
a — oo — oo
все расходятся и никакого числового значения не имеют.
Пример 3. Так как
ь
J exdx — еь — еа,
а
то интеграл
ь
f exdx
— оо
464
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[гл. 25
сходится и равен еь (так как при — оо). Напротив, ин-
теграл
4-00
J л
а
расходится (так как еь-+-]-оо при 6->-|-оо). Поэтому расходится
и интеграл
4- оо
J exdx.
— оо
Аналогия между бесконечными рядами и обобщенными интегра-
лами заставляет нас искать признаков сходимости обобщенных ин-
тегралов на тех же путях, где прежде нами были установлены при-
знаки сходимости для бесконечных рядов. Для определенности мы
оо
в дальнейшем будем иметь дело только с интегралами вида J ;
а
однако все, что будет для них установлено, без существенных из-
ь 4~°°
менений может быть перенесено и на интегралы типов J и j* .
— оо — оо
Прежде всего, общая теорема 2 § 19 дает нам необходимый и
достаточный признак сходимости обобщенного интеграла
оо
(8)
а
в виде требования, чтобы при любом е^>0 для всех достаточно
больших Ъх и было
I J f(x)dx—f/(x)rfx|<^e;
a a
так как
f(x)dx— f f(x)dx= \f(x)dx,
а а
то это приводит к следующему признаку.
Теорема 1. Для сходимости интеграла (8) необходимо и до-
статочно, чтобы, как бы мало ни было е^>0, для всех доста-
точно больших Ьх и Ь2 имело место неравенство
I \ f(x) dx|<^e
§ 107] ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ
465
(говоря образно, для сходимости обобщенного интеграла необходимо
и достаточно, чтобы любой достаточно удаленный (и как угодно
длинный) «кусок» его был сколь угодно мал).
Подобно тому как для знакопостоянного ряда необходимым и
достаточным условием сходимости служит ограниченность его частич-
ных сумм, так для сходимости интеграла (8) с неотрицательной
подинтегральной функцией f(x), очевидно, необходимо и доста-
точно, чтобы интеграл
ъ
^f(x)dx
а
оставался ограниченным при й->оо. Это обстоятельство позволяет
легко установить принцип сравнения интегралов, вполне аналогичный
принципу сравнения знакопостоянных рядов (теорема 1 § 68).
Теорема 2. Если при а 00 мы имеем 0=^/(х)^
^qp(x) (где с^>0 — постоянное число) и если функции f(x) и
ср(х) интегрируемы в любом отрезке (а, Ь) (а<^Ь), то из сходи-
мости интеграла
I 00
J <Р (х) dx
О’
вытекает сходимость интеграла
а также неравенство
оо
§f(x)dx,
а
оо
а
Доказательство вполне аналогично тому, с помощью которого
был установлен принцип сравнения рядов, и может быть предоста-
влено читателю.
Пример 4. Так как при постоянном а и при х -> -)- со мы
_ 1
всегда имеем хае 2 -> 0 (пример 7 из § 37), то при достаточно
большом х‘
хае 2*<1,
откуда
1 1 1
хав*~х = х*е 2 е 2 <2 е 2 .
30 А. Я. Хинчин
466
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[гл. 25
Поэтому из сходимости интеграла
ОО J
J е 2 х dx
1
следует, что интеграл
оо
J х*е~х dx
।
сходится при любом постоянном а.
со
Пример 5. j*e~xdx = сходится; так как е~х при
!
х^1, то сходится и интеграл
оо
J е~х2 dx,
1
хотя величина его нам и неизвестна.
Мы не будем останавливаться здесь на простейших свойствах
обобщенных интегралов, полностью аналогичных соответствующим
общим свойствам бесконечных рядов и доказываемых аналогичными
методами и с той же простотой. Так, легко убедиться, что, изменяя
функцию f(x) произвольным образом на конечном участке (лишь бы
она оставалась интегрируемой), мы не можем нарушить сходимости
интеграла (8) (хотя, конечно, изменяем, вообще говоря, его вели-
чину). Далее, если оба интеграла
оо оо
/1 = J Л (X) dx, ft (х) dx
а а
сходятся, то сходится и интеграл
оо
/= J {/1 (•*) ±/s О)! dx,
а
причем
' 1=
Интеграл (8) называется абсолютно сходящимся, если
сходится интеграл
со
(9)
§ 107] ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ 467
Из сходимости интеграла (9) следует сходимость интеграла (8);
в самом деле, если интеграл (9) сходится, то в силу теоремы 1,
как бы мало ни было е^>0, для всех достаточно больших Ьх и
ь2
I f |/(х) \ dx |<^е.
'*1 1
Но мы знаем (заключительная теорема § 51), что
ь2 ь2
I Ц*|/(x)|rfx|;
• bi bi
поэтому для достаточно больших bi и
а это в силу той же теоремы 1 имеет свои.м следствием сходи-
мость интеграла (8).
Как и у случае бесконечных рядов, теорема 2 (принцип сравне-
ния) позволяет легко установить ряд конкретных, удобных для прак-
тического применения признаков сходимости обобщенных интегралов;
на нескольких простейших признаках этого рода мы теперь кратко
остановимся.
Теорема 3. Если а^>1 и для всех достаточно больших х
имеет место неравенство |/(х) | сх~ а, где с^>0 — постоян-
ная, то интеграл (8) абсолютно сходится] напротив, если а 1
и для всех достаточно больших х мы имеем /(х)>х~“, то ин-
теграл (8) расходится.
При этом, как всегда, функция /(х) предполагается интегрируе-
мой в любом конечном отрезке (а, Ь) (а<^Ь).
Так как интеграл
со
J х~ а dx
а
(где а^>0) сходится при а^> 1 и расходится при 1, то теорема 3
прямо следует из теоремы 2; возможность ограничиться лишь до-
статочно большими значениями х вытекает, конечно, из того, что
изменением. функции /(х) на конечном участке сходимость инте-
грала (8) не может быть нарушена.
Теорема 3 имеет своим непосредственным следствием абсолютную
сходимость таких интегралов, как, например
со оо
Jsinx , f xdx
1 о
♦
468
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[ГЛ. 25
и т. п. Однако устанавливаемый ею признак сходимости, хотя и
имеет большое количество конкретных приложений, все же должен
быть признан несколько грубым, так как с его помощью (как видно
из самой его формулировки) сходимость может быть установлена
лишь для абсолютно сходящихся интегралов (да и в этой области
могут быть легко найдены значительно более сильные признаки).
Мы приведем поэтому еще другой, существенно более тонкий признак.
Теорема 4. Если а О, а 0, функция ср (х) непрерывна при
любом х^а и существует такое положительное постоянное
число С, что для всех Ь^>а
ь
| J 9 (х) dx | С,
а
со
а
ь с т в о. Положим
то интеграл
сходится.
Доказател
J 9 (и) du = Ф (х),
а
так что
|Ф(х)1<С (а<х<-|-оо).
Тогда, интегрируя по частям, находим:
Если мы заставим теперь х безгранично возрастать, то первое
слагаемое правой части будет стремиться к нулю, так как
и, с другой стороны, Ф (а) = 0 по определению функции Ф (х). Что
касается второго слагаемого правой части, то оно при х -> сю будет
иметь пределом интеграл
(10)
§ 107] ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ 469
который в силу а > 0 и | Ф (и) | С (абсолютно) сходится по тео-
реме 3. Таким образом, предел
lim f f
x-ooj ua JU
a a
существует (и совпадает с величиной абсолютно сходящегося инте-
грала (10)).
С помощью теоремы 4 легко устанавливается сходимость боль-
шого числа интегралов, играющих важную роль в различного рода
приложениях; типичным представителем интегралов этого рода может
служить интеграл
00
(11)
о
сходящийся согласно теореме 4, так как
х
| sinM4Zw| = | 1—cosx|^c2 (0 х°°)*
о
Покажем, что интеграл (11) сходится не абсолютно (или, как го-
ворят, условно), т. е. что интеграл
а
(а^>0) расходится. Так как всегда | sin х | sin2 х, то в силу прин-
ципа сравнения (теорема 2) для этого достаточно доказать расходи-
мость интеграла .
оо оо
Jsin2x . fl — cos2x ,
-Гах=) - 2x (12>
a a
Но интеграл
co
J cos 2x .
-bTdx <13)
a
— того же типа, что и интеграл (11), и сходимость его столь же
просто устанавливается с помощью теоремы 4. Поэтому, если бы
сходился интеграл (12), то, складывая его с интегралом (13), мы
получили бы, что и сумма их, которая равна
оо
Г dx
J
а
470
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[гл. 25
должна сходиться, что неверно; таким образом, интеграл (12) рас-
ходится и, следовательно, интеграл (11) сходится лишь условно.
Подобным же образом дело обстоит и для всех интегралов вида
оо оо
Jsin х , р cos х j
ах, | -ах,
ха J ха
а----------------а
если 1.
Упражнения см. в задачнике Б. П. Демидовича, отдел IV, задачи
108, 109, 111, 120.
На протяжении настоящего параграфа мы неоднократно видели,
как аналогия между бесконечными рядами и обобщенными интегра-
лами играет руководящую роль в определении основных понятий и
установлении важнейших свойств интегралов с бесконечными преде-
лами. Теперь мы покажем, что из понятия обобщенного интеграла,
наоборот, можно сделать вывод, имеющий первостепенное значение
для теории бесконечных рядов; с помощью понятия обобщенного
интеграла мы установим признак сходимости знакопостоянных рядов,
который по своей силе и удобству конкретных применений во мно-
гих случаях превосходит все элементарные признаки, доказанные
нами в § 68.
Теорема 5 (интегральный признак Коши сходимости рядов).
Пусть f(x) — положительная, невозрастающая, непрерывная функ-
ция, определенная для всех х^а, где а — некоторое постоянное
натуральное число. Тогда ряд
/(а)+/(а+1)+ ... +/(« + *)+ ••• (14)
будет сходящимся или расходящимся в зависимости от того, схо-
дится или расходится интеграл
со
J f(x)dx. (15)
а
Доказательство. Так как функция /(х)— невозрастающая,
то при a-\-k^x^a-\-k-[- 1 мы имее^м /(а-|"^)^/(х)^
^f(a -|-£ И> следовательно,
a -J- к -j- 1
/(a-|-£)Ss J f(x)dx^2-.f(a-{-k+ 1) (£ = 0,1,2,...).
а k
Суммируя эти неравенства по k от 0 до п, мы находим:
п а 4- п 4-1 п
J/(а4~ £):=== f f(x)dx^ 2/(а + *4~1)-
Л = 0 а к — О
§ 107]
ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ
471
Если интеграл (15) сходится, то при л->оо средняя часть этих не-
равенств остается ограниченной; тем более будет ограничена и пра-
вая часть, откуда вытекает сходимость знакопостоянного ряда (14);
если же интеграл (15) расходится, то средняя часть при /г->оо
безгранично возрастает; тем более должна возрастать и левая часть,
а это показывает, что ряд (14) расходится. Этим теорема 5 доказана.
Пример 6. В § 68 мы рассматривали важный класс знакопо-
стоянных рядов вида
р + ••• ••• (16)
и доказали, что ряд (16) сходится при $>1 и расходится при 1.
С помощью теоремы 5 вопрос о сходимости ряда (16) решается не-
медленно. Полагая в теореме 5 а = 1, /(x) = x“s, мы видим, что
сходимость ряда (16) равносильна сходимости интеграла
оо
j x~sdx,
сходящегося при $^>1 и расходящегося при
П р и мче р 7. Рассмотрим более тонкую задачу о сходимости
рядов типа
оо
2 <”>
п =2
где 5 — постоянное вещественное число. Легко было бы убедиться,
что при s^>0 ни один из признаков § 68 не может решить вопроса
о сходимости рядов этого класса. С помощью же теоремы 5 этот
вопрос получает простое решение. Положим а = 2, /(х) = ,
так что сходимость ряда (17) равносильна сходимости интеграла
dx
X (In x)s •
Так как
X
f du
J и (In ti)s
{(Inx)'-5 —(ln2)‘-s}
In In x — In In 2
(18)
№ 1),
(5=l),
1
1 — s
то интеграл (18) сходится при 1 ^величина его равна ^s_
и расходится при s^l; следовательно, и ряд (17) сходится при
s^> 1 и расходится при s^l. В частности, таким образом, ряд
У —
п In п
472
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[гл. 25
расходится, в то время как ряд
оо
У —5-
п In2 п
п = 2
сходится.
Дальнейшие упражнения см. в задачнике Б. П. Демидовича,
отдел V, задача 64.
§ 108. Интегралы неограниченных функций
Определяя понятие интеграла, мы до сих пор всегда предполагали
подинтегральную функцию ограниченной в промежутке интеграции.
Теперь мы должны ознакомиться с таким расширением понятия ин-
теграла, которое в некоторых случаях позволяет интегрировать и
неограниченные функции. Как и в § 107, мы начнем с рассмотрения
простого примера. Пусть функция /(х) определена в отрезке (0, 1)
следующим образом:
/(х) =
(0<х^1),
0=0).
Так как —Ur безгранично возрастает при х->0, то функция f(x)
У х
не ограничена в отрезке (0,1). Она имеет разрыв в точке х = 0 и
непрерывна во всех других точках
отрезка (0, 1). График ее изображен
на черт. 67. Очевидна, сколь бы
мало ни было е^>0, мы можем ин-
тегрировать функцию /(х) в отрез-
ке (е, 1), и ее интеграл
= 2(1-/Г) (О
выражает собой члощадь криволи-
нейной трапеции, заштрихованной
на черт. 67. Когда е уменьшается,
площадь эта непрестанно растет;
если е 0, то заштрихованная фигура неограниченно простирается
кверху; и тем не менее площадь ее при этом, как показывает фор-
мула (1), возрастает не безгранично, а стремится к пределу 2. Этот
предел мы, естественно, понимаем как площадь всей области, лежа-
щей над участком (0, 1) оси ОХ и ниже кривой У—-,Мы сно-
§ 108] ИНТЕГРАЛЫ НЕОГРАНИЧЕННЫХ ФУНКЦИЙ
473
ва встречаемся в этой геометрической иллюстрации с таким поло-
жением вещей, когда фигуре бесконечной протяженности естественно
приписать конечную площадь. Впрочем, сравнивая черт. 67 с черт. 66,
мы с непосредственной наглядностью усматриваем близкое сходство
этих двух картин.
С чисто аналитической стороны дело обстоит так, что мы не
можем определить ту площадь, о которой мы только что говорили,
с помощью интеграла
1
так как подинтегральная функция не ограничена в промежутке (0, 1);
но мы полагаем эту площадь равной пределу
1
lim f/(x)cZx; (2)
s-*0 «1
е
как бы мИло ни было е^>0, интеграл
1
]/(•*) dx
s
имеет смысл, так как функция f(x) непрерывна в промежутке инте-
грации.
Предел (2) называют (обобщенным) интегралом неограниченной
функции f(x) от 0 до 1 (или в отрезке (0,1)) и обозначают просто
через
1
мы можем, следовательно, написать
Перейдем теперь к общему определению. Пусть функция /(х)
определена в отрезке (а, Ь) и, сколь бы мало ни было е 0, инте-
грируема (и, следовательно, ограничена) в отрезке (а -|- е, Ь), но не
ограничена во всем отрезке (а, Ь). Если тогда существует предел
ь
Jim f f(x)dx, (3)
8->0 J,
« + «
474
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[гл. 25
то мы называем этот предел (обобщенным) интегралом неогра-
ниченной функции /(х) в отрезке (а, Ь) и обозначаем его
просто через
ь
§f(x)dx; (4)
а
интеграл (4) в этом случае называется сходящимся; в случае же,
когда предела (3) не существует, говорят, что интеграл (4) расхо-
дится, и не приписывают ему никакого числового значения.
Это расширение понятия интеграла применяется, как мы видим,
в том случае, когда подинтегральная функция не ограничена только
в ближайшем соседстве одной точки промежутка интеграции, на
всех же других участках этого промежутка она ограничена и инте-
грируема. В качестве такой «особой» точки в нашем примере, а вслед
за тем и в общем определении фигурировал левый конец а проме-
жутка интеграции. Но само собою понятно, что определение естест-
венно распространяется на случай любого положения «особой» точки
в промежутке интеграции. Так, если функция /(х) интегрируема
при любом е^>0 в отрезке (а, b — е), но не ограничена во всем
отрезке (а, Ь) и если интеграл
Ь — £
J f(x)dx
а
стремится к пределу при е->0, то мы полагаем по определению
Ь Ь —£
Гf (х) dx = lim f f (x) dx\
J e—>0 J
a a
здесь особой точкой служит правый конец b промежутка интегра-
ции. Наконец, если такой особой точкой служит какая-либо внутрен-
няя точка с в отрезке (a, Ь), т. е. если функция /(х) интегрируема,
как бы малы ни были q 0 и е2 0 в каждом из отрезков
(а, с — ej и (с -1- е2, Ь), то мы просто полагаем
Ь с b
Р/(х) dx= §f(x) dx J/(x) dx,
a a c
где оба интеграла правой части являются обобщенными интегралами
с особой точкой с в одном из концов промежутка интеграции, и
потому могут считаться уже определенными нами. Само собой разу-
меется, что для сходимости интеграла
ь
§f(x}dx
а
§ 108] ИНТЕГРАЛЫ НЕОГРАНИЧЕННЫХ ФУНКЦИЙ
475
в этом случае необходимо и достаточно существование обоих пре-
делов
с — Sj с
lim I f(x)dx— \f(x)dx
е.->о J J
* a a
b b
lim I f(x)dx = I f (x) dx.
£o—►O J V
“ c + s2 c
Мы уже обратили внимание на то, что в случае положительной
подинтегральной функции геометрическая иллюстрация задачи инте-
грирования / неограниченной функции напоминает соответствующую
иллюстрацию задачи об интегралах с бесконечными пределами, кото-
рой мы занимались в § 107. Легко убедиться, что эти две задачи
чисто аналитически тесно связаны между собой. Пусть, например,
функция f(x) не ограничена в соседстве левого конца а промежутка
интеграции, так что
£f(x)dx= lim f f(x)dx. (5)
J S —> 0 J
Ct Ct “I- s
Преобразование переменной
2. 1
be s
§ f(x)dx = j ^(yldy,
a-f- в 1 _1_
b — a b —a
где положено
Поэтому соотношение (5) дает:
1
Ь 6 оо
\f(x)dx = lim f <f>(y)dy= f if>(y)dy,
J s-t-0 J J
a 1 - 1_
b—a b—a
так что’интеграл неограниченной функции простым преобразованием пе-
ременной интеграции всегда приводится к некоторому интегралу с бес-
конечным пределом. С помощью этой связи между введенными нами
двумя расширениями понятия интеграла любому из свойств инте-
гралов первого типа, рассмотренных нами в § 107, соответствует
476
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[гл. 2б
аналогичное свойство интеграла неограниченной функции. Таким обра-
зом, все основные черты теории интегралов неограниченных функций
могут быть построены параллельно основам теории интегралов с бес-
конечными пределами, изложенным в § 107. Доказательства всех
предложений могут быть при этом одинаково легко проведены лю-
бым из двух способов: либо мы их строим заново по полной анало-
гии с соответствующими рассуждениями § 107 (которые в свою
очередь в большинстве случаев проводились по аналогии с теорией
бесконечных рядов), либо мы вышеуказанной заменой переменной
интеграции просто сводим доказываемое предложение к соответст-
вующей теореме об интегралах с бесконечными пределами и затем
ссылаемся на эту теорему.
Имеют место следующие предложения, аналогичные соответствую-
щим теоремам § 107 (причем мы во всех случаях для определенности
предполагаем, что подинтегральные функции ограничены и интегри-
руемы в отрезке (а е, Ь), сколь бы мало ни было е 0, но, вообще
говоря, не ограничены во всем отрезке (а, &)).
Теорема 1г. Для сходимости интеграла (4) необходимо и
достаточно, чтобы, сколь бы мало ни было е 0, для всех доста-
точно малых 0, й2 0 имело место неравенство
+ 52
I f(x)dx <Л*
Теорема 2' (принцип сравнения). Если при а^х^Ь мы
имеем 0^f(x)^cip(х), где с — постоянное положительное число,
то из сходимости интеграла
ъ
J Ф (х) dx
а
следует сходимость интеграла
ь
J/(x) dx,
а
(4)
а также неравенство
ь ъ
J/(x) dx с j*qp (х) dx.
а а
Интеграл (4) называют абсолютно сходящимся, если схо-
дится интеграл
а
§ 108] ИНТЕГРАЛЫ НЕОГРАНИЧЕННЫХ ФУНКЦИЙ 477
из сходимости интеграла (6) по теореме Г легко следует сходи-
мость интеграла (4).
Так как интеграл
ъ
ч J(x— d)~adx>
а
как легко убедиться непосредственно, сходится при а <4 и расхо-
дится при. а^1, то из теоремы 2Г легко выводится следующий
простой признак сходимости.
Теорема 3\ Если а 1 и для всех х^>а, достаточно близ-
ких к а, имеет место неравенство | f (х) | (х — а)~а, то инте-
грал (4) абсолютно сходится} напротив, если а 1 и для всех
х^>а, достаточно близких к а, мы имеем /(х)^(х— а)~а, то
интеграл (4) расходится.
Более тонкому признаку, содержащемуся в теореме 4 § 107,
позволяющему иногда судить, как мы видели, и о неабсолютной
(условной) сходимости интегралов, также соответствует признак схо-
димости интегралов неограниченных функций, выражаемый следующим
предложением.
Теорема 4'. Если а 0, функция ф (х) непрерывна при х^>а
и существует такое постоянное положительное число С, что для
сколь угодно малого е^>0
ъ
| J 9 (х) | < С,
то интеграл
ь
J(x — а)а ф (х) dx
а
сходится.
Доказательство. Положим
ъ
j* Ф (х) dx = Ф (и) (а < и Ь),
и
так что | Ф (и) | <С (а<^и^Ь), Интегрируя по частям, находим:
ъ
J (х — а)а ф (х) dx =
“+‘ ' b b
= [ — (х— а)а Ф (х)] -|“а j* (х— а)®—'Ф(х)б/х=
s
= е® Ф (а + е)-|- а
(х — а)®-1 Ф (х) dx
478
ОБОБЩЕННЫЕ ИНТЕГРАЛЫ
[гл. 25
(так как ф(#) = 0). При е—>0 первое слагаемое правой части стре-
мится к нулю, так как а^>0 и | Ф (ае) | <^ С.. Что касается вто-
рого слагаемого, то его подинтегральная функция по абсолютной ве-
Q
личине меньше, чем , где 1—а<^1. В силу теоремы 3'
поэтому второе слагаемое правой части при s—>0 имеет пределом
сходящийся интеграл
ь
a J(x — а)а“! Q(x)dx.
а
Следовательно, левая часть последнего равенства при е 0 также
имеет (тот же самый) предел, и теорема 4Г доказана.
Пример 1. Рассмотрим интеграл
1
При любом постоянном X 0 произведение хх In х стремится к нулю
при х->0, как непосредственно показывает применение правила
Лопиталя,
гая, в частности, Х = ^-, мы имеем поэтому при достаточно малом
х>0
1
|lnxj<^x 4,
§ 108] ИНТЕГРАЛЫ НЕОГРАНИЧЕННЫХ ФУНКЦИЙ
479
и следовательно,
| In X |
3
4
откуда по теореме 3' следует абсолютная сходимость интеграла /.
Пример 2. Рассмотрим интеграл
'=
о
х2-а >
где а — любое постоянное положительное число. При малом а вели-
чина —2— очень быстро растет при х->0; а так как cos - при
этом бесконечное множество раз колеблется между 1 и — 1, то
подинтегральная функция сильно неограничена в соседстве точки
х = 0; график этой функции схематически изображен на черт. 68.
Замена переменной х = ~ дает:
1 £
| J cos = | J cos у dy | = | sin ~---sin 1 | <^ 2.
s 1
Поэтому функция
<p(*) = ^c°s^
удовлетворяет в отрезке (0, 1) требованиям теоремы 4Г. Применяя
эту теорему (а = 0), мы находим, что интеграл
1 1
j* х«* (x)dx= Jcos-L —
о о
сходится при любом а^>0.
Дальнейшие упражнения см. в задачнике Б. П. Демидовича, от-
дел IV, задачи 102, 104, 110.
ГЛ AB A 26
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
§ 109. Интегралы с конечными пределами
Изучение количественных отношений между величинами окру-
жающего нас внешнего мира приводит к обнаружению в нем все
новых и новых видов функциональной зависимости. Одной из основ-
ных задач математического анализа является поэтому вовлечение
в круг нашего рассмотрения все более и более широких классов
функций. Однако одного только указания на то или другое вновь
возникающее перед нашим взором семейство функций было бы, ко-
нечно, совершенно недостаточно; вместе с определением такого се-
мейства нам важно получить в руки и орудие для его изучения, так
как без такого орудия наше приобретение будет обречено лежать
мертвым грузом: функции, которых мы не умеем изучать, для рас-
крытия свойств которых мы не располагаем никакими средст-
вами, ни в чем не смогут быть нам полезными. Поэтому наука
всегда стремится сочетать определение новых не изученных еще
функциональных зависимостей с созданием такого инструмента,
такого аппарата, который позволил бы систематически исследо-
вать эти новые функции и постепенно раскрывать их важнейшие
свойства.
Пройденный нами путь уже достаточно богат примерами, всесто-
ронне иллюстрирующими эти общие соображения. Сумма бесконеч-
ного ряда функций, члены которых принадлежат к числу функций
нам хорошо известных (вспомним, например, степенные и тригоно-
метрические ряды), вообще говоря, является функцией новой природы,
свойства которой нам мало знакомы; но как раз тот ряд, который
служит для ее определения, обычно оказывается сильным и удобным
орудием изучения ее важнейших черт (например, вычисления ее зна-
чений и определения результатов производимых над нею операций).
Мы уже знаем, какими полезными качествами обладает аппарат бес-
конечных рядов и какое тесное соответствие имеет место между
свойствами ряда и свойствами представляемой им функции. Еще бо-
лее поучительным примером может служить аппарат интегрального
исчисления. Мы знаем, что каждая непрерывная функция имеет це-
§ 109] интегралы с конечными пределами 481
лое семейство примитивных и что даже для простейших (элементар-
ных) функций эти примитивные, как правило, оказываются совершенно
новыми функциями, о каждой из которых мы не знаем ничего, кроме
того факта, что она дифференцируема и производная ее равна такой-
то знакомой нам функции. Понятно, что задача отыскания примитив-
ных дает нам поэтому мощный источник определения новых функций;
однако само по себе такое определение почти бесполезно, так как,
зная, например, об «интегральном логарифме» только то, что его
1
производная равна -, мы отсюда непосредственно многих нуж-
ных нам черт этой функции усмотреть не сможем; в частности,
эта информация непосредственно не дает нам никакого инструмента
для вычисления значений интегрального логарифма. Как же мы вышли
из этого затруднения? Мы создали превосходный аппарат (интеграл),
позволяющий по данной функции находить ее примйтивную; мы, как
говорят, дали примитивным функциям конструктивное определение,
т. е. определение с помощью такого инструмента, который очень
удобен для изучения свойств этой функции (и, в частности, позво-
ляет вычислять ее значения принципиально с любой степенью точ-
ности); и исторически только после создания этого инструмента
интегральное исчисление смогло стать мощным источником изучения
новых классов функциональных зависимостей.
Задача настоящей главы состоит в том, чтобы ознакомиться с од-
ним новым способом определения и изучения функций — способом,
исторически оказавшимся одним из наиболее плодотворных и позво-
лившим найти и детально исследовать целый ряд функциональных
зависимостей, имеющих первостепенное значение как для теории, так
и для весьма разнообразных приложений.
Пусть /(х, и) — функция двух независимых переменных, непре-
рывная в области (прямоугольнике) (а^х ^b, а^и^р). Вы-
берем и закрепим какое-нибудь определенное значение переменной и
.в отрезке (а, (3); тогда /(х, и) станет непрерывной функцией од-
ной переменной х в отрезке (а, й); интеграл
ь
j*/(х, u)dx
а
этой функции, вообще говоря, зависит, очевидно, от выбранного
нами значения переменной w, получает определенное значение при
каждом таком выборе и, вообще говоря, изменяется при изменении
к; он является, таким образом, функцией от и, определенной в от-
резке (a, Р); мы обозначим его через qp(«), так что
ь
y(u)=^f(x, u)dx (asgusgP). (1)
.а
81 А. Я. Хинчин.
482 интегралы как функции параметров [гл. 26
Переменную и, от которой зависит подинтегральная функция,
но которая при интеграции мыслится постоянной (получившей какое-
либо закрепленное значение) величиной, называют обычно пара-
метром; от выбранного значения такого параметра зависит вели-
чина интеграла. Разумеется, возможны и случаи, когда подинте-
гральная функция зависит от целого ряда параметров ...
..., uk; тогда интеграл
ь
uit uk) = §f(x, и(> иа, .... uk)dx (2)
а
представляет собой функцию всей совокупности этих параметров.
Пример. В § 66 мы видели, что
J„x , еих (v sin vx 4- и cos ок) . „
еи cos vx dx=-----------x-j—------- 4- С;
и2 + & 1
отсюда мы легко находим:
( COSVX dx=^(VSiny-]-UC0SV)-U
J и* + vi ’
о
интеграл в левой части этого равенства есть функция двух пара-
метров и и v; правая часть дает нам элементарное выражение этой
функции.
В рассмотренном примере зависящий от параметров и и v инте-
грал оказался элементарной функцией этих параметров. Однако
в значительном .большинстве случаев интеграл вида (2), даже при
условии, что /(х, Wj, иъ ...» является элементарной функцией
входящих в нее переменных, представляет собой неэлементарную
функцию, для определения и изучения которой мы не имеем ника-
кого другого аналитического аппарата, кроме самого интеграла (2).
Во всех таких случаях свойства функции <р нам приходится нахо-
дить, исходя только из ее представления (2); в частности, и для
приближенного вычисления значений этой функции мы непосредст-
венно не располагаем никаким другим орудием, кроме этого инте-
грала. Естественно поэтому, что как свойства такого рода интегра-
лов, так и правила аналитических операций над ними требуют с
нашей стороны внимательного изучения, которому и будет посвя-
щена настоящая глава.
Ради простоты мы ограничимся при этом рассмотрением интегра-
лов вида (1), зависящих только от одного параметра, хотя наши
рассуждения и их результаты без затруднения могут быть перене-
сены и на общий случай интегралов вида (2).
Теорема 1. Если функция f(x, и) непрерывна в прямоуголь-
нике off(a^x^b, то функция <р(н), определяемая
интегралом (1), непрерывна в отрезке (а, Р).
§ 109] ИНТЕГРАЛЫ С КОНЕЧНЫМИ ПРЕДЕЛАМИ 483
Доказательство. Если точки и и и-\-&и принадлежат от-
резку (а, Р), то
ь
9 (м 4~ Ди) — 9 (и) = J [/(х, и + Ди) — /(х, и)] dx,
а
откуда
ъ
|?(а-|-Да)—9(h)|s=s и-|-Ди) — f(x, u)\dx. (3)
а
Но по теореме 3 § 88 функция /(х, и) равномерно непрерывна
в прямоугольнике поэтому, сколь бы мало ни было е 0, суще-
ствует такое 8^>0, что для любых двух точек (хп и,), (х2, и2)
этого прямоугольника, взаимное расстояние которых меньше, чем 8,
|/(х2, и2)—/(*!, иОКе.
Так как взаимное расстояние точек (х, и) и (х, и Ди) равно | Ди |,
то при | Ди К 8 мы имеем:
|/(х, и 4- Дм)—/(х, м)|<^е,
каковы бы ни были точки (х, и), (х, и4~Дм) прямоугольника
В силу (3) поэтому при | Ди К 8
19 (и 4- Ди) — 9 (и) | < е (Ь — а) (а и, и 4- Дм Р).
Так как е^>0 может быть выбрано сколь угодно малым, то тео-
рема 1 доказана.
Установив, таким образом, непрерывность интеграла (1) относи-
тельно параметра и, мы имеем возможность интегрировать функцию
9 (и) в отрезке (а, р) (или любой его части). Интеграл
J 9 (и) du = /(х, и) dxj du (4)
а а а
всегда имеет смысл (при нашем допущении о непрерывности функ-
ции /(х, и) в области е^). Подобно тому как для функциональных
рядов (§ 75) имеет существенное значение возможность «почленной»
интеграции, т. е. интеграции под знаком суммы, так и для функций
вида (1) очень важна возможность производить их интеграцию по и
под знаком интеграла по х; вопрос ставится, таким образом, о том,
будет ли интеграл (4) совпадать с интегралом
ь 3
J { J } dX’
a a
♦
484
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
[гл. 26
отличающимся от него только порядком производимых интеграций.
Вспомним, что совершенно подобным образом вопрос о почленной
интегрируемости функционального ряда
оо
2 м*)
*=1
в отрезке (а, Ь) есть вопрос о том, имеет ли место равенство
b оо оо Ъ
dx = 2 {J и. (х) dx},
a k — 1 k = 1 а
т. е. вопрос об изменении порядка операций суммирования по k и
интегрирования по х. Возможность интегрировать функцию ф (м) по и
под знаком интеграла по х равносильна, таким образом, независи-
мости результата последовательного интегрирования функции /(х, и)
по х и по и от порядка, в котором выполняются эти две операции.
Мы покажем сейчас, что для непрерывных функций этот вопрос
всегда решается положительно.
Теорема 2. Если функция f(x, и) непрерывна в прямоуголь-
нике <=$, то
3 в ь ъ р
j* ф(м)б/ц = У /(х, w)JxJ^w = J|J /(х, u)du}dx.
а а а а а
Доказательство. Пусть а^а' и
пусть т и М означают соответственно нижнюю и верхнюю грани
функции /(х, и) в прямоугольнике (a'^x^b9, ar^w^j3r). Тогда
мы имеем при
т(ЬТ — а!)^ J/(х, u)dx^M(b’— а!)
а'
и, следовательно, интегрируя по и в пределах от о! до |3',
р' ы
т(Ьт— а9) (₽' — j* /(x>
— a')(₽' — a')- (5)
Совершенно аналогичным путем мы убеждаемся, что и
ы Р'
т(У — ar) (Р' — аЭ У { J f (х> «) du} dx^M (b9 — а9) (|3' — а'). (6)
§ 109] ИНТЕГРАЛЫ С КОНЕЧНЫМИ ПРЕДЕЛАМИ 485
Разобьем теперь отрезок (а, Ь) на п частей с помощью точек
деления
a = xQ<^x1<^xi<^. ..<^хп = Ь9
а отрезок (а, р)— на т частей с помощью точек деления
а = н0<«1<н2<...<нт = ?.
Обозначим через ^ik = (xi — — uk_^ площадь прямоуголь-
ника х^ хxb uk_! ^u^uk и через tnik и Mik соответственно
нижнюю и верхнюю грани функции /(х, и) в этом прямоугольнике.
Неравенства (5) и (6), примененные к такому прямоугольнику, дают
uk xi
"likbik^ J* { j* f(x> u)dx}du^Mtkblk, (7)
uk — 1 xi— 1
xi uk
Mikbik^ J { j* /(*» u)du^dx^M{ll^lk (8)
xi — 1 ak— 1
Теперь заметим, что
8 b m uk n xi
/= J {j* f(x> u)dx}du= 2 J {2 J* /(x> U)dx}du =
a a k=lUfi_l i=l
n m uk xi
= 22 J* {J f^x'u)dx}du>
Oft-1 -4-1
и аналогично
b 3 n m xi uk
l’^= J { J f(x, u)du^dx= 2 2 j* { J f(x' u)dt$dx-
a a Z=1 k=l x/_i «fe—i
Применяя ко всем членам двойных сумм этих равенств соответственно
неравенства (7) и (8), мы находим:
п т пт
2 2 2 2Л1/‘Д{*’
Z=lft = l 1 = 1 k = \
пт пт
22 2 2^-
Z=lfe=l /=]£== 1
Таким образом, оба интеграла Z и Г, совпадение которых
мы должны доказать, заключены между теми же двумя границами;
486 ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ [ГЛ. 26
абсолютное значение разности/ — Г не может поэтому превосходить
расстояния между этими границами, т. е.
п т
1=1
Если предпринятое нами разбиение отрезков (а, Ь) и (а, (3) доста-
точно мелко (а ничто не мешает нам выбрать его сколь угодно
мелким), то в силу равномерной непрерывности функции /(х, и)
в прямоугольнике все разности Mik — mlk l^k^m)
будут меньше любого наперед заданного положительного числа е.
Поэтому
п т
|/—Г|^е 2Д« = е^ — аИ? — “)•
Z=1 /г=1
Так как е 0 здесь сколь угодно мало, а левая часть от е не зави-
сит, то 1 = Г и теорема 2 доказана.
Теперь мы обратимся к вопросу о дифференцировании функции
ф(м), определяемой интегралом (1). По аналогии с задачей о почлен-
ном дифференцировании бесконечных рядов здесь ставится вопрос
о дифференцируемости функции ф(м) в отрезке (а, р) и о возмож-
ности выразить ее производную в виде
или, как говорят, «дифференцировать под знаком интеграла». Подобно
тому как там дифференцируемость членов ряда является необходи-
мой предпосылкой, так и здесь мы должны, конечно, с самого начала
предположить существование и непрерывность (или по меньшей мере
df ля
интегрируемость по х) частной производной в прямоугольнике e/f.
Этого предположения, однако, и достаточно, как показывает сле-
дующая
Теорема 3. Если функция /(х, и) и ее частная производная
'^^ди непрерывны в прямоугольнике то функция ф (и), опре-
деляемая интегралом (1), дифференцируема в отрезке (а, Р) и
ь
(и) = J dx (а ₽). (9)
а
Доказательство. Положим
ъ
f d/(x, (asSM;Sp).
а
§ 109] ИНТЕГРАЛЫ С КОНЕЧНЫМИ ПРЕДЕЛАМИ 487
В силу теоремы 2 при
v b v
а а а
Ъ
= j* {f(x, v)—f(x, а)( </х = ф(-о) —ср(а).
а
Левая часть этого равенства, как интеграл непрерывной функции,
дифференцируема по верхнему пределу v, и производная ее равна
g(v) (теорема 1 § 50); таким образом, %>'(г0 существует и равна
g(v) для любого Этим теорема 3 доказана.
Во всем предшествующем мы всегда предполагали пределы а и b
интеграла (1) постоянными числами. Однако в приложениях часто
случается, что при различных значениях параметра и интегрировать
приходится в разных пределах, так что а и Ь становятся функциями
параметра и: а = а(и), b = b(u). Разумеется, такой интеграл
Ъ (и)
’!'(«)= j* /(-v, u)dx (10)
а (и)
подобно интегралу (1) представляет собой функцию параметра и.
Мы рассмотрим теперь некоторые свойства такой более общей
зависимости интеграла от параметра. При этом мы все время будем
предполагать, что функция /(х, и) непрерывна в прямоугольнике еЯ?,
а функции а (и) и b (и) непрерывны в отрезке (а, (3), причем
а^а(и) ^b, a^b(ii)^b
Прежде всего легко убедиться, что функция ф(п) непрерывна в от-
резке (a, Р). В самом деле, если и и м-|-Дм принадлежат этому
отрезку, то
&(в4~Де) Ь(и)
ф(и-|-Ди) — <р(и)= J* /(х, u-\-bu)dx— у/(х, u)dx.
а («4- Де) а (в)
Так как
Ъ (и 4- Д«)
j /(х, u-\-bu)dx —
а {и 4- Де)
а(е) &(е)
— J f(x, и Ли) dx j* /(х, и 4~ Дм) dx 4*
а (е4-Де) а (в)
Ь(е-{-Дв)
4- У /(•*> »4'Ди)^»
»(««)
488 ИНТЕГРАЛЫ КАК ФУНКЦИИ параметров (гл. 26
то отсюда
а (и)
ф(м4~Ам) Ф(м) = j* f(x> « + +
а(и-{-Ьи)
b(u+&u) b(u)
J f(x, u-\-ku)dx-\- j \f(x, иДи)—f(x, u)}dx. (11)
b(u) a(u)
При Дм->0 пределы последнего интеграла правой части остаются
постоянными, вследствие чего рассуждение, проведенное нами при
доказательстве теоремы 1, показывает, что он стремится к нулю.
Чго касается первых двух интегралов, то они, очевидно, по абсо-
лютной величине соответственно меньше, чем
М | а (и 4- Дм) — а (м) |, М | b (и 4- Дм) — b (м) |
(где М — верхняя грань функции |/(х, _у)| в прямоугольнике е^),
и потому в силу предположенной непрерывности функций а (и) и
Ь(и) также стремятся к нулю при Дц~>0. Таким образом,
ф (и 4" Ам) — ф (м) -> О (Ди -> 0) (а и р),
и следовательно, функция ф(м) непрерывна в отрезке (а, (3); имеет
место следующее обобщение теоремы 1.
Теорема 4. Если функция /(х, и) непрерывна в прямоуголь-
нике а функции а (и) и Ь (и) непрерывны в отрезке (а, (3),
причем
a^a(u)^b, a^b(u)^b (а и р),
то функция ф (и), определяемая интегралом (10), непрерывна в от-
резке (а, Р).
Допустим теперь, что функции а (и) и b (и) не только непрерывны,
но и дифференцируемы в отрезке (а, Р) и что функция /(х, и) имеет
в прямоугольнике непрерывную частную производную пока-
жем, что в этом случае функция ф(и) дифференцируема в отрезке
(а, Ь) и что ф'(м) выражается простой формулой, служащей непо-
средственным обобщением формулы (9).
Мы имеем:
ь(«4-дм) Ь(и)
(и 4- Ди) — <)/(и)= j f(x, u-[-&u)dx— j f(x, u)dx =
a(u4-bii\ a(u)
b(u) b(u)
= { j* f(x, u-\-&u)dx— J f(x, «)rfx|4“
a (u) a (u)
Aw) a(w-|-Aw)
4- j f(x, ii-\-ku)dx— j* f (x, tt-\-ku)dx. (12)
*(«) a (a)
§ 109] ИНТЕГРАЛЫ С КОНЕЧНЫМИ ПРЕДЕЛАМИ 489
Будем считать и постоянным и положим
ф(г/)= j* f(x, v)dx
а(а)
По теореме 3 функция ф(^) дифференцируема в отрезке (а, Р) и
&(й)
ф'(®)= J* — dx (asgt'sgp);
а (и)
в частности, при v — u
b{U)
f V^Ldx = 4'+ =
Д, “
b(«) b (u)
= lim | M + — j /(x> k)^}* (13)
Aa“*° a(«) a\U)
Это показывает, что первое слагаемое правой части равенства (1’2),
разделенное на Дм, при Дм->0 имеет пределом интеграл
Ъ(и)
СдНх^ах
J ди
а (и) t
Обратимся теперь ко второму слагаемому. По теореме о среднем
значении
&(«4-Аа)
J /(х, м-f- Дм)б/х=/(£, и Ди) [b {и 4- Дм) — 6(м)],
Ь(«)
где В заключено между b (и) и Ь(и-\-ки). Отсюда
Ь(вЦ-Да)
J а4-Ди)</х=/0, и-|-ДЦ/(ц + Д“>-*(ц).
д(«)
При Дм -> 0 второй множитель правой части стремится к V (м).
В первом же множителе м-4-Дм-->м, $->^(м), а потому в силу
непрерывности функции /(х, м) -
/(£, и + Ди) ->/[&(«), и].
Таким образом,
Ь(и4-Ди)
lim та I f^x> « + Д«Н*=/Р(“). и] У (и). (14)
Аи-° “ -4
490 ИНТЕГРАЛЫ КАК ФУНКЦИИ параметров [гл. 26
Совершенно аналогично мы имеем:
lim f /(х, bu)dx=f\a(u\ и] а'(и). (15)
Д«—>0 J ч
а {и)
Наконец, учитывая результаты (13), (14), (15), мы получаем из
равенства (12):
lim + Дм) - Ф («) =
д«-»о
Ь(а)
= Г dx-\-fU>(u), U]b' (и)—/[а(а), и] а'(и).
а (и)
Тем самым мы доказали дифференцируемость функции ^(м)
в точке и и нашли выражение производной </(и). Результат может
быть формулирован в виде следующего предложения.
Теорема 5. Если функция f(x, и) в прямоугольнике не-
прерывна и имеет непрерывную частную Производную по и, а функ-
ции а(и) и b (м) дифференцируемы в отрезке (а, р) и
a^a(u)^b, a^b(u)^b (а и р),
то функция ф(ц), определяемая интегралом (10), дифференцируема
в отрезке (а, (3) и
. Ъ(и)
Ф'(«) = f u\b’(u)-f[a(u), и}а'(и). (16)
а (и)
В частном случае, когда а {и) и b (и) постоянны в отрезке (а, р),
мы имеем аг (и) = ЬТ (и) = 0 и формула (16) обращается в формулу (9)
теоремы 3.
Упражнения к § 109 читатель найдет в задачнике Б. П. Деми-
довича, отдел VII, задачи 17, 18, 23.
§ ПО. Интегралы с бесконечными пределами
В предыдущем параграфе, рассматривая интегралы с конечными
пределами, зависящие от параметров, мы уже неоднократно указы-
вали на аналогию задач и рассуждений этой области с соответству-
ющей проблематикой теории бесконечных рядов. Однако в полной
мере эта аналогия раскрывается лишь при изучении зависящих от
параметров интегралов, имеющих бесконечные пределы, т. е. инте-
гралов вида
u)dx (1)
§ ПО]
ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМ’I ПРЕДЕЛАМИ
491
(как и в главе 25, мы для определенности ограничимся рассмотре-
нием интегралов с бесконечным верхние: пределом; разумеется, все
свойства таких интегралов по симметрии переносятся и на интегралы
с бесконечным нижним пределом, а затем и на интегралы, оба пре-
дела которых бесконечны). Теории таких интегралов, служащей, как
мы увидим дальше, основой для вывода большого числа важнейших
классических формул анализа, мы и посвятим настоящий параграф.
Допустим, что интеграл (1) сходится для всех значений пара-
метра и в некотором отрезке Величина его тогда есть
некоторая функция параметра и, определенная в отрезке (а, Р):
оо
j* f (х, и) dx = ер (н).
а
(2)
Подобно тому как в теории функциональных рядов (глава 19)
основную роль играло, как мы видели, понятие равномерной схо-
димости такого ряда, так и для интегралов вида (1) аналогичное
понятие приобретает фундаментальное значение. Если интеграл (1)
сходится в любой точке и отрезка (а, Р), то это означает, что для
любого е^> 0 и любой точки и отрезка (а, |3) можно указать такое
число До (зависящее от е и и), что при любом Д^Д0
оо
IP*
А
и) dx I 8.
(3)
Число Ао будет, вообще говоря, при данном е различно для различ-
ных и. Если для любого е О существует такое До, что при А Ао
неравенство (3) справедливо при любом и (а и |3), то говорят,
что интеграл (1) равномерно сходится в отрезке (а, Р).
Пример. Рассмотрим интеграл
оо
v sin х j
e~ —^~ dx»
где a^O. В конце § 66 мы видели, что
, 69х (a sin Ьх — b cos Ьх) . „
еах sm bx dx = —----- 2 _ру2--- + С,
где а и Ь — любые постоянные числа. В частности,
(asinx + cos х) । Г ( n
e~ax sm x dx =------------------------*--г — ф« (x) + C,
где функция Фа(х), очевидно, остается ограниченной при х^О,
a 2^0:
|Ф«(х)|<В (x2s0, aSsO),
492 интегралы как функции параметров [гл. 26
где В — постоянная. Интегрируя по частям*) мы находим поэтому
при а^>0:
а а
а
Так как правая часть не зависит от а и стремится к нулю при а->оо,
то интеграл /(а) сходится равномерно относительно параметра а на
полупрямой а 0.
Для рассматриваемого нами класса интегралов понятие равно-
мерной сходимости играет столь же большую роль, как и для функ-
циональных рядов. В этом мы убедимся теперь на целом ряде пред-
ложений, каждое из которых имеет в точности аналогичную теорему
в главе 19.
Прежде всего мы имеем удобный и простой признак сходимости,
аналогичный теореме 2 § 73:
Признак равномерной сходимости. Если существует
такая непрерывная функция F(x), что для всех достаточно боль-
ших х и для всех и в отрезке (а, р) |/(х, u)\^F(x)f и если
интеграл
оо
J F(x)dx
а
сходится, то интеграл (2) равномерно сходится в отрезке (а, (3).
Доказательство может быть проведено в точности аналогично
доказатеиьству теоремы 2 § 73 и опирается на неравенства
в в в
I f f(x, f |/(*> u)\dx^ f F(x)dx,
A A A
имеющие место при достаточно большом А и В^>А.
Подобно тому как равномерная сходимость ряда непрерывных
функций гарантирует нам непрерывность его суммы (теорема 1 § 74),
так и равномерная сходимость интеграла (2) влечет за собой (в случае
непрерывности функции f(x, и)) непрерывность выражаемой им функ-
ции параметра и:
*) Формула интеграции по частям применяется к интегралам с беско-
нечными пределами всякий раз, когда оба участвующих в ней интеграла схо-
дятся (при этом свободный от интегралов член обязательно стремится к опре-
деленному пределу, когда независимая переменная безгранично возрастает).
В этом мы непосредственно убеждаемся, написав формулу сначала для конеч-
ного промежутка интеграции (а, Ь) и заставляя затем о безгранично возрастать.
§ 110]
ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ
493
Теорема 1. Если функция /(х, и) непрерывна при а^х,
а и р, и интеграл (2) равномерно сходится в отрезке (а, р),
то функция ср (и) непрерывна в этом отрезке.
Доказательство вполне аналогично доказательству теоремы 1
§74. Пусть е^>0 сколь угодно мало; выберем Ло настолько боль-
шим, что А0^>а и
(4)
Так как в силу теоремы 1 § 109 интеграл
J /(х, u)dx
есть непрерывная функция от и в отрезке (а, Р), то при доста-
точно малом | Ди|
(5)
Но
<р(«4-д^) — ?(«)•={ j/(х, u-\~&u)dx— ( /(х, w)^J -F
а а
оо оо
4~ j*f(x, u-\-bu)dx— j*f(x, u)dx,
Aq Ao
откуда в силу (4) и (5), если | Ди | достаточно мало,
Ао А©
|ф(и-|-Д«) — ф(и) |^|J/(x, u-\-&u)dx—j*/(x, «)^*| +
a a
oo co
4-| j* f(x, н —Ди) rfx | —]—| J* У (x, и) dx | j + y = 8’
Ao Ao
Этим теорема 1 доказана.
Равномерная сходимость интеграла (2), будучи, таким образом,
достаточным условием непрерывности функции <?(«), не является,
как и в случае рядов, необходимой для этой цели. Однако сущест-
вует важный частный случай, когда она вместе с тем и необхо-
дима; имеет место следующее предложение, вполне аналогичное
теореме 2 § 74.
494
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
[гл. 26
Теорема 2. Если f(x, и) непрерывна и сохраняет постоян-
ный знак в области х^а, а а^ р, то из непрерывности функ-
ции 9 (а) в отрезке (а, Р) вытекает равномерная сходимость
интеграла (2).
Доказательство.* Допустим для определенности, что
/(х, а)^0 (х^а, а^х^р). Пусть а0— произвольная точка
отрезка (а, Р). Так как интеграл (2) сходится в точке а0, то
существует, сколь бы мало ни было е^>0, такое число Ао, что
со
f f(x, u№)dx<e; (6)
^0
при этом число Ао зависит от выбранной нами точки а0; но так
лг°
как функция 9(a) по предположению, а функция I /(х, u)dx по
а
теореме 1 § 109 непрерывны в отрезке (а, Р) то и функция
оо Ао
J /(х, а)^х = 9(а)—J /(х, u)dx
Ао а
непрерывна в отрезке (а, р); поэтому неравенство (6), будучи вы-
полненным в точке а0, необходимо должно выполняться и в неко-
торой окрестности этой точки. Таким образом, каждая точка а0
отрезка (а, Р) помещается в некотором отрезке, для всех точек
которого имеет место неравенство (6). Совокупность всех таких
отрезков, построенных для всех точек а0 отрезка (а, Р), покрывает
собой отрезок (а, Р). По лемме о конечном покрытии существует
конечная группа 8П 82, ..., 8Д отрезков этой системы, также по-
крывающая собой отрезок (а, Р). Каждому отрезку 8Z
соответствует такое число Az, что
со
J/(х, u)dx<^s
для всех точек и отрезка 8Z. Пусть А — наибольшее из чисел Аи
А2, ..., Ап; тогда в силу условия /(х, а)^0 (х^а, а^а^Р)
мы будем иметь:
00
J/(х, u)dx<^e
для всех точек а любого из отрезков 8Z, а следовательно, и для
всех точек и отрезка (а, Р), так как этот отрезок покрывается си-
§ 110]
ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ
495
стемой отрезков 8а, 8Л. Так как е^>0 произвольно мало,
то это и означает, что интеграл
со
J f(x, и) dx
а
равномерно сходится в отрезке (а, Р). Этим теорема 2 доказана.
Далее, по аналогии с почленной интегрируемостью равномерно
сходящегося функционального ряда имеет место следующее предло-
жение.
Теорема 3. При тех же условиях, что и в теореме 1,
а
Другими словами, при упомянутых условиях возможна переста-
новка порядка интеграций по х и и:
СО 3
du = J* | J /(х, и) du | dx,
а а
т. е. теорема 2 § 109 в случае равномерной сходимости
быть распространена на случай й = -)-оо.
Доказательство. Пусть число Ао а настолько
что
может
велико,
о
8
(7)
Мы
имеем:
а а
/(х, u)dx]du.
А
Но
в силу теоремы 2 § 109
з л
3 А А 8
= f(x, u)du}dx,
a a ~
а
и предшествующее равенство в силу оценки (7) дает:
е(Р —а)
| dx
496 ИНТЕГРАЛЫ КАК ФУНКЦИЙ ПАРАМЕТРОВ [гл. 26
при единственном условии А Ло; но это означает, что интеграл
оо 0
а а
сходится и равен 9 (w) du. Этим теорема 3 доказана.
а
Из этих двух интеграций, порядок которых может быть пере-
ставлен согласно теореме 3, только одна имеет бесконечный пре-
дел, другая же распространяется лишь на конечный отрезок. Для
приложений представляет, однако, большой интерес тот значительно
более трудный случай, когда обе интеграции имеют бесконечные
пределы. Типичным примером задач этого рода может служить
вопрос о том, при каких условиях
оо оо оо оо
f(x, и) du j dx = J f(x, и) dx J du. (8)
a a a a
Здесь мы не имеем возможности рассмотреть этот вопрос сколько-
нибудь полно. Мы ограничимся исследованием частного случая, ко-
торый нам понадобится в дальнейшем и в условиях которого мо-
гут быть легко установлены удобные для применения признаки
возможности перестановки (8); именно, мы допустим, что функция
/(х, и) во всей области х^а, w^a сохраняет постоянный знак;
для определенности мы предположим ее неотрицательной. Тогда
имеет место
Теорема 4. Если f (х, w)0 и непрерывна в области
х^а, и^а, если функции*)
оо оо
§ fdx, ty(x) = £fdu (9)
a a
непрерывны соответственно при и^а и х^а, и из двух инте-
гралов
оо оо
J ф (х) J 9 («) du
а а
какой-нибудь один сходится, то сходится и другой, и эти инте-
гралы равны между собою, т. е. имеет место равенство (8).
Доказательство. Заметим прежде всего, что из предполо-
женной нами непрерывности функций <р(а) и ф(х) в силу тео-
*) Здесь и в дальнейшем мы для краткости пишем f вместо /(х, у).
§ 116] ИНТЕГРАЛЫ С БЕСКОНЕЧНЫМИ ПРЕДЕЛАМИ
497
ремы 2 следует равномерная сходимость обоих интегралов (9) —
первого в любом конечном отрезке а^н^р и второго — в лю-
бом конечном отрезке а^х^Ь. Допустим для определенности,
что сходится интеграл
J ф (x)dx = r,
а
тогда требуется доказать, что интеграл
у (и) du
а
стремится к I при р —* оо, или, так как в силу теоремы 3
3 ОО ОО 3
Ф(и)du = \ f Гfdxjdu = J*fdu)dx,
a a a a
ЧТО
lim
3-* о
dx = I.
(10)
Пусть e — произвольное положительное число. Из предположен-
ной нами сходимости интеграла
оо
J ty(x)dx
а
следует существование такого числа Ь^>а9 что
ОО 00 оо
f Ф (х) dx = J f di^ dx s»
Ь Ь a
откуда в силу /(x, и)^0 и подавно при любом Р^>а
J f dx < s. (11)
ь 3
Выберем теперь число р столь большим, чтобы иметь:
оо
j (a*£x*£b)
3
32 А. Я. Хинчин
498
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ [ГЛ. 26
(это возможно в силу равномерной сходимости второго из инте-
гралов (9) в отрезке (а^х^Ь)). Тогда
Ь оо
dx<^e.
(12)
Сложение неравенств (11) и (12) дает:
j* { J f dii^ dx<^ 2е,
или, что то же,
I— У / duj dx 2е,
а а
если р достаточно велико. Ввиду произвольности е этим доказано
соотношение (10), а значит, и теорема 4.
Рассмотрим, наконец, вопрос о возможности дифференцирования
функции ф(и), определяемой интегралом (2), под знаком интеграла,
т. е. вопрос о том, при каких условиях функция ф(«) дифференци-
руема и
оо
ф'(н)=у2^20^ (а^«^?). (13)
а
Здесь имеет место предложение, полностью аналогичное соот-
ветствующей теореме о почленном дифференцировании функцио-
нальных рядов (теорема 3 § 75):
Теорема 5. Если в области х^а> функция
f(x, и) непрерывна и имеет непрерывную частную производную
df(x9 и)
и если интеграл
(14)
а
сходится равномерно в отрезке (а, ₽), то функция ?(м), опреде*
ляемая интегралом (2), дифференцируема в этом отрезке и
имеет место соотношение (13).
Доказательство. Положим для любого натурального числа
п
«₽»(«) = У/(•*> u)dx,
а
так что при /г—*оо мы имеем:
фя(и) —Ф(«) (a«S«sS?).
§ 111]
ПРИМЕРЫ
499
По теореме 3 § 109 функция %(«) дифференцируема в отрезке
(а, ?) и
п
а
равномерная сходимость интеграла (14) в отрезке (а, Р) означает
поэтому, что равномерно в этом отрезке
оо
Jdf(xt и) .
дй dx
(п —> оо).
а
В силу теоремы 3 § 75 мы заключаем отсюда, что производная
9r(w) в отрезке (а, [3) существует и совпадает с интегралом (14), что
и надо было установить.
Замечание. Мы ограничили рассмотрение обобщенных инте-
гралов, зависящих от параметров, случаем интегралов с бесконеч-
ными пределами. Однако все, что нами было установлено для этого
случая, в равной мере сохраняет силу и доказывается в точности
теми же методами и для второго типа обобщенных интегралов —
для интегралов от неограниченных функций. Мы не имеем здесь
возможности останавливаться даже на формулировках соответствую-
щих теорем; да вряд ли в этом есть и надобность, так как анало-
гия достаточно полна, чтобы можно было почти автоматически пе-
реносить любое рассуждение с одного случая на другой. Для чита-
теля было бы очень полезным упражнением самостоятельно
перенести определения всех понятий, формулировки и детальные
доказательства всех предложений настоящего параграфа на случай
интегралов от неограниченных функций.
§ 111. Примеры
Теория интегралов, зависящих от параметров, изложенная нами
в §§ 109 и ПО, имеет в анализе много разнообразных приложе-
ний. В ближайших двух параграфах мы рассмотрим несколько важ-
нейших примеров таких приложений. Часто бывает, что мы встре-
чаемся с интегралом, который сам никаких параметров не содержит,
но для нахождения его значения проще всего оказывается рассма-
тривать этот интеграл в связи с некоторым другим, зависящим от
параметра, и из свойств этого последнего интеграла находить зна-
чение данного. Несколько примеров этого рода мы рассмотрим в
настоящем параграфе.
Пример 1. Найти
1-е-*
t
cos t dt.
500 интегралы как функции параметров [гл. 26
Рассмотрим более общий интеграл
/(Х)= J ---------cost dt,
О
где X — любое неотрицательное число, так что
убедимся сначала, что интеграл I (X) сходится равномерно относи-
тельно X в отрезке O^X^l. Прежде всего, интегрирование в
любом конечном отрезке (0, а), например в отрезке (0, 1), не вы-
зывает сомнений, так как вследствие 0^1—подинте-
гральная функция остается равномерно ограниченной при /->0,
если 0 X 1.
Нам остается поэтому доказать, что интеграл
00 w
fl—*
I -------cos t dt
i
сходится равномерно относительно X в отрезке 0^Х^1. Но это
непосредственно вытекает из того, что 1) интеграл
y^dt
1
сходится (§ 107) и не зависит от X и 2) интеграл
1
сходится равномерно на полуоси Х^0; последнее доказывается в
точной аналогии с рассмотренным в § 110 примером интеграла
оо
J (Х=э0).
О
Итак, интеграл /(X) сходится равномерно в отрезке 0 X 1
и, следовательно, представляет собой непрерывную функцию от X
в этом отрезке. В частности, при Х->0
/(Х)->/(0) = 0,
что нам понадобится в дальнейшем.
Обозначим через /(/, X) подинтегральную функцию инте-
грала /(X). Так как
— x*cos
QK
ПРИМЕРЫ
501
§ 1И]
и потому интеграл
Гт-"
J оК
о
при любом Х^>0 равномерно сходится в
существует при любом Х^>0, и
Г (X) = J* и cos t dt
о
в силу теоремы 5 § 110. Но функция
отрезке f-^-,2xV то Г(Х)
(Х>0)
e“x/cos/, как мы знаем
(§ 66), имеет примитивную
x/(sintf — XcosO
1 + X2
стремящуюся к нулю при t—*оо. Поэтому при любом Х^>0
г п ч е~~и (sin t — X cbsZ) 00 X
ММ— 1 + >а 0 —Пр?
и, следовательно, ввиду /(0)=0
х х
Z(X) = /(X) — /(0) = J Г (х) dx = J dx = ± In (1 + X2),
О о
откуда, в частности,
/=/(1) = 1 1п2.
Пример 2. В § 107 мы доказали сходимость интеграла
оо
т f sinx ,
'=/ —
теперь мы поставим себе задачу найти его значение.
Рассмотренный нами в § ПО интеграл
= J e-^-^-dx (aS==0)
о
обращается в / при а = 0; в§ ПО мы видели, что интеграл /(а)
сходится равномерно на всей полупрямой а^О; в силу теоремы I
§ ПО функция /(а) поэтому непрерывна при a2s0; в частности,
1=1(0) = lim /(а).
«—i-o
502 интегралы как функции параметров [гл. 26
С другой стороны, дифференцирование интеграла /(а) по а под
знаком интеграла приводит к интегралу
оо
— J* е~ ах s*n х dx>
О
который, как легко видеть, сколь бы мало ни было е^>0, равно-
мерно сходится при а^е в силу признака § 110 (так как
|e“axsinx| В силу теоремы 5 § 110 поэтому при а^>0
существует Г (а) и
оо
/'(а) = — J е~°*sinxdx =
О
(последнее равенство устанавливается непосредственно, так как
примитивная Фа(х) известна (см. § ПО)). Отсюда, если учесть, что
7(a)-> 0 при а->оо*), интеграцией находим:
_/(а) = _ Гтт^=—2- + агс^а>
а
и следовательно, при а->0 в пределе
7(0) = /=^;
таким образом,
оо
f sin х , к
J —
о
и наша задача решена.
Далее, замечая, что интеграция по частям дает при а^>0
f f l=™”Ldx
J X x |o 1 J X»
о 0
и что
1 —cosx n
hm-------------------------------= 0,
x->0 x
мы при a —* оо находим в пределе
оо
JI — COS X < it
dx=2‘
0
oo
♦) Так как I — - I 1, то 11 (a) | fe~a*dx=J-.
§ Hl]
ПРИМЕРЫ
603
Это — также одна из очень важных формул интегрального исчисле-
ния; в отличие от предыдущего этот интеграл, очевидно, сходится
абсолютно.
Сделаем еще следующее замечание. При а^>0 замена перемен-
ной z = — дает:
я
оо ' оо
Jsin az . С sinx , it
0 0
tx X
при a< 0 подстановка z = — — дает:
о о
таким образом, интеграл
О
сходящийся при любом значении а, представляет собой разрывную
функцию от а:
+ - 2 (a>0),
/(a) = . It — 2" (a<0),
0 (a = 0).
Пример 3. Найдем теперь величину интеграла
оо
I— J е dxy
о
играющего большую роль во многих приложениях интегрального
исчисления (в частности, в теории вероятностей и математической
статистике). Замена переменной х = ut (где и 0 — постоянное
число) дает:
/= ^ue-^dt.
О
Отсюда
He-«s(i+/») d/} du = J е-«’ | J ue-“4‘4#} du —
0 0 0 0
= I^e~uidu = P. (1)
0
604
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
[гл. 26
Если в левой части этого равенства возможна перестановка порядка
интеграции, то мы получаем:
но
оо оо
яе-«’*(’+<•) dal Л;
оо
f «e-»’(i+«s)rfH=.
о
1
2(1+^)
е-И» (!+<’)
и = 4- оо
и = 0
1
2(1+<’) ’
и следовательно,
ОО
га 1 Г dt 1 , . 1°° тс
1 ~ 2 J 1 +<’ — 2 (arctS*) о — 4 >
о
откуда
и поставленная задача решена.
Нам остается только показать законность перемены порядка инте-
грации в левой части формулы (1). Это легко может быть сделано
на основании теоремы 4 § 110, все предпосылки которой в нашем
случае выполнены. В самом деле, полагая
не-“2 0 + *2) ==/(ц, Z),
мы имеем в области интеграции f(u, /)^0. Сходимость интеграла
j* { J/(и, t)du}df
о о
непосредственно нами доказана. Наконец,
J f(u, t)dt=e-aiJ ue-u2tidt = le~ai
о о
есть всюду непрерывная функция от w, а
— всюду непрерывная функция от 4
§ П2]
ИНТЕГРАЛЫ ЭЙЛЕРА
505
§ 112. Интегралы Эйлера
Интегралами Эйлера называются интегралы
1
Ъ(р, q) = f х^х(1 — x)q~l dx
(интеграл первого рода) и
Г (s) = J х^1 е~* dx
(интеграл второго рода) ♦). Первый из них представляет собой
функцию двух параметров р и q, а второй — функцию одного
параметра $. Оба интеграла определяют собой важные неэлементар-
ные функции, играющие значительную роль в приложениях различ-
ного рода. Поэтому их свойства много и детально изучались; в част-
ности, для них составлены подробные таблицы. В настоящем пара-
графе мы рассмотрим некоторые простейшие свойства этих функций.
1. Оба интеграла определяют, разумеется, соответствующие функ-
ции лишь для тех значений параметров, для которых они сходятся.
Поэтому мы должны прежде всего выяснить, каковы области сходи-
мости этих интегралов (т. е. множества тех значений параметров, для
которых они сходятся). В интеграле В(р, q) при q^A
подинтегральная функция непрерывна во всем промежутке интегра-
ции и существование интеграла не вызывает сомнений. Но если
подинтегральная функция становится, очевидно, неограничен-
ной в соседстве точки х = 0, а при q 1 то же самое наступает
в соседстве точки х = 1. В случае р 1 мы при х -> 0 имеем, каково
бы ни было q, (1—x)Q~l-+l, и значит,
Х^1 (1 _ х)9-1 ~ xp-i (х о).
В силу теоремы 3' § 108 мы знаем поэтому, что при р^О
(р——1) интеграл В(/?, q) будет расходиться; если же /?^>0
(р—1 —1), то поведение подинтегральной функции вблизи точки
х = 0 не препятствует сходимости интеграла. Аналогичным образом
поведение подинтегральной функции вблизи точки х=1 не препят-
ствует сходимости интеграла при и делает интеграл расходя-
щимся при q^.0. Мы приходим, таким образом, к выводу, что для
сходимости интеграла В(/?, q) - необходимо и достаточно иметь
р 0, q 0, что мы во всем дальнейшем и будем предполагать. Что
касается интеграла Г ($), то прежде всего наличие бесконечного проме-
жутка интеграции ни при каком значении s не препятствует сходимости
*) В (р, q) и Г (s) читаются соответственно так: «бета от р и д> и «гамма
от а».
506
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
[ГЛ. 26
интеграла, как мы видели в § 107. Но при подинтеграль-
ная функция не ограничена вблизи точки х = 0; так как при х->0
х5-1^* ~ ху~*,
то мы заключаем, как выше, что для сходимости интеграла Г (s)
необходимо и достаточно иметь s>0.
2. Убедимся теперь, что функция В (/?, q) непрерывна в любой
точке области сходимости интеграла, г. е. при любых р^>0, у^>0.
Это вытекает из того, что для любых положительных чисел /?0,
интеграл В (р, q) равномерно сходится в области р^р$> Ч^Чъ-
В самом деле, при р^р$> Ч^Чъ мы имеем, каково бы ни было х
в отрезке (0, 1),
хр~х (1—х)^-х (1—х)^”1 ,
а следовательно, при любом е 0
е е
f х?~х (1—х)^~х dx^ J х^~! (1—х)?»”1 dx (р^р^, Ч^Чь)>
о о
и аналогичное неравенство для промежутка интеграции (1—s, 1),
что и показывает равномерную сходимость интеграла В (/?, q} в области
р^р$, Ч^Чо (см- § 1Ю, признак равномерной сходимости и заклю-
чительное замечание).
Совершенно аналогичным образом доказывается равномерная схо-
димость интеграла Г (s) в области s0 So> где s0 и50 (so<C^o) —
любые положительные числа (для этого интеграла область равно-
мерной сходимости приходится в отличие от интеграла В (р, q)
ограничивать и сверху, так как наличие бесконечного предела делает,
как легко убедиться, сходимость неравномерной во всей области
s^s0). Следствием этого является непрерывность функции Г($) при
любом s^>0.
3. При s^>0 интеграция по частям дает:
Г -j- 1) = J xse~x dx = — xse~x |^° Н“ 5 j* xs~ie~x dx = $Г (s),
о о
так как xse~x обращается в нуль при х = 0 и стремится к нулю при
х->оо. Итак,
Г($+1) = яГ($) (s>0). (1)
Применяя это соотношение повторно, мы находим для любого нату-
рального числа п и для любого s^>n—1
Г($+1) = $(а— 1) ... ($ —л-|-1)Г($ — л4-1). (2)
§ 112] ИНТЕГРАЛЫ ЭЙЛЕРА 507
В частности, при s = n
Г(«+1) = л(л—1) . . 2- 1 -Г(1).
Но
Г(1) = Je~xdx=l,
О
и мы находим для целого п 1
Г (п 1) = л!
Эта замечательная формула важна главным образом тем, что она
дает простую аналитическую формулу для выражения п\*.
п\ — J хпе~х dx (//=1,2,...), (3)
о
пригодную и для /г = 0, если положить, как это обычно делается,
0!= 1. Но интеграл в правой части равенства (3) в отличие от выра-
жения п\ имеет смысл не только для целых //, но для любого
п — 1; естественно поэтому для не целых п — 1 определять
выражение п\ с помощью формулы (3); это дает для п\ аналитиче-
ское выражение в виде непрерывной функции от л, для целых п ^0
принимающей обычные значения.
Если s^>0 — не целое число, то найдется такое целое число
п 0, что п п 1; по формуле (2) тогда
Г($) = ($—l)(s — 2) ... — //)Г($— п);
так как 0<^$ — п<^1, то эта формула сводит изучение функции
Г (s) в отрезке (//, //-|-1) к исследованию ее поведения в отрезке
(0,1); а так как //^0— любое целое число, то мы видим, что, зная
течение функции Г($) в отрезке мы можем простым и
элементарным путем оценить ее и найти ее свойства и во всей области
s^>0. Все это является следствием основного «функционального
уравнения» (1), которому удовлетворяет функция Г($).
4. Формулы понижения аргумента, аналогичные формуле (1), легко
вывести и для функции В(/?, q). Пусть //^>0, ^^>0. Интеграция по
частям дает:
1
В(^4-1, ?4-l) = Jxp(l— x)qdx=
о
=[нт(1 -‘И 1»+?+1 / (l
о
508
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
[ГЛ. 26
а так как тождественно
хр+1 = хр — хр(1 —х),
то отсюда
q + 1)=^Л {ВО-J- 1, q)-В(^+ 1,
и, следовательно,
В(р + 1, 7+0=^7+1В(р+1) qy,
разумеется, имеет место и аналогичная формула, понижающая первый
аргумент:
В(р + 1, ?+l)=p-Tf+1B(Jp1 ?+1).
Применяя последнюю формулу к правой части предыдущей, мы
находим симметричную формулу:
В0>+1, ?+1) = 5-р-пИр_В(,. ?) (,>0, г>0). (3')
5. Теперь мы установим замечательную связь, имеющую место
между функциями В(/?, q) и Г($). Совершая в интеграле В(/?, q}
замену переменной интеграции
1
X-T+^’ •
, dz 1 — x
dx— z— x ,
oo
откуда
мы легко находим:
В(р, q)=$ (1^+9 (/г. (4)
О
С другой стороны, преобразование переменной х = --, гдеа^>0 —
постоянная, дает при s^>0
f х5"1 е~ах dx = ^ J z5"1 e~z dz = ; (5)
о о
поэтому при г^>0, /?^>0, q>0
f up+’-‘ е-“(1+г) du = + . (6)
§ П2]
ИНТЕГРАЛЫ ЭЙЛЕРА
609
Формулы (4) и (6) дают:
ГО>-|-?)В(р( ?)=]'Г0’ + ^)^^рТ-9(/г =
о
ир+9-1 £-«(!+*)
du\dz =
J { J г’"1 «7®-1 е"в< 1+г> du } dz. (7)
О о
Допустим сначала, что р 1 и #^>1; тогда легко убедиться, что
порядок интеграции в правой части этой формулы может быть из-
менен; с этой целью мы покажем, что здесь налицо все предпосылки
теоремы 4 § 110. В самом деле, обозначая через /(г, и) подин-
тегральную функцию, мы прежде всего видим, что она непрерывна
и неотрицательна в области интеграции. Далее, функция
оо оо
j7(*. u)du=Z^ ^u^-xe-^da==T{p + q}^
о о
(см. (6)) непрерывна при 0 z < -1- со, а функция
J f(z, и) dz = е~а и™-' f z*~l e~uz dz = е~а и™'1 =
О о
= Г(^)«р-1е"и (8)
(при интегрировании мы применили формулу (5)) непрерывна при
O^w^-J-co. В силу теоремы 4 § ПО поэтому из существования
интеграла в правой части (7) следует, что сходится и интеграл
J |J/(z, u)dz]du
и что эти два интеграла равны между собой, так что в силу фор-
мулы (8)
Г(/> + ^)В0’> q)=J[Jf(z, u)£te}dH=
О о
= J Г (7) и"-1 е-“ du — Г (/>) Г (?).
О
Таким образом, при любых р^>1, #^>1 мы имеем:
В(,. г>=^’. <»)
510
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ [ГЛ. 26
Пусть теперь р и q — любые положительные числа. Тогда в силу
доказанного мы имеем (так, как q -1- 1 1):
РГ„Д_1 п J- п —Г^+1)г(* + 1)
В(^ + 1’ «,+ 1)--r(p + <z + 2)-.
Выражая же здесь все значения функций В и Г с помощью формул
(1) и (3'), мы после очевидных сокращений приходим к формуле (9),
которая, таким образом, доказана для любых ^^>0.
Это важное соотношение прежде всего позволяет нам свести
изучение функции В (р, q) к исследованию функции Г (5), а в неко-
торых случаях, обратно, находить свойства функции Г($)из соот-
ветствующих свойств функции В (р, q).
В частности, если р и q — натуральные числа, из формулы (9)
следует
В(р. я)--
Пример 1. Для многих приложений представляется важным
знать величину
о° j
=^x~^e~xdx.
О
Замена переменной интеграции х—и* дает:
Г(у) = 2 Je-“’d«= (10)
О
(см. пример 3 § 111).
Пример 2. Теория интегралов Эйлера позволяет легко вычислять
часто встречающиеся в приложениях интегралы вида
it
^пт = J Sin" X COSW XdX,
О
где п и т — целые неотрицательные числа. Замена переменной
sin2x = w легко дает:
. J п — 1 т—\ , / II its
(1-и) 2 du=^^r-> ^L)=
о
§ ПЗ]
ФОРМУЛА СТИРЛИНГА
511
В этом выражении все аргументы функции Г — либо целые числа,
либо половины целых чисел. С помощью соотношений (1) и (10)
поэтому все три значения этой функции легко могут быть вычислены
во всех случаях.
§ 113. Формула Стирлинга
В § 112 мы нашли формулу
оо
п\= f х“ ё~х dx, (1)
о
которая в случае целого дает величине п\ простое аналити-
ческое выражение, а для других — 1 служит определением функ-
ции п\ Факториалы больших чисел очень часто играют значительную
роль и в теоретических исследованиях, и в практических расчетах;
а так как факториал большого числа является по своему определе-
нию сложной, неудобной для оценок конструкцией, не только точ-
ного значения, но и порядка величины которой мы непосредственно
находить не умеем, то для теории и практики очень важно иметь
при больших значениях п для величины п\ какое-либо простое, легко
доступное оценкам приближенное аналитическое выражение. Фор-
мула (1) сама по себе таким выражением служить не может, так как
для непосредственных оценок она недостаточно прозрачна. Однако,
основываясь на выражении (1), можно вывести для п\ удовлетворяю-
щую всем требованиям простую приближенную формулу. Этому
выводу и будет посвящен настоящий параграф. Вывод этот очень
поучителен; лежащая в его основе схема оценки интеграла (1) очень
часто применяется и в других задачах анализа.
В целях лучшей обозримости мы разобьем вывод на отдельные
этапы.
1. Прежде всего мы приведем интеграл (1) к более удобному
для наших целей виду с помощью замены переменной интеграции
х = л(1-]-*)> dx=ndz, z =
что дает:
п\ = пм ё~п j* { (1 + *)e~* \ndz-,
— i
мы положим во всем дальнейшем:
так что
со
512
ИНТЕГРАЛЫ КАК ФУНКЦИЙ ПАРАМЕТРОВ
[гл. 26
2. Для изучения поведения подинтегральной функции мы должны
теперь провести детальный анализ элементарной функции 9 (г). Так
как
Ф'(г) = —ге"г,
то функция 9 (г) возрастает при г<0и убывает при г^>0; в точке
г = 0 она имеет максимум, равный единице; 9(—1) = 0, а приг^>0
функция 9 (г) положительна и монотонно стремится к нулю при
г->оо; график функции 9 (г) схематически дается на черт. 69.
Далее, мы имеем:
In 9 (г) = In (1 -J--г) — z.
По формуле Тэйлора
In (1 -\-Z) = Z-у4"аг3>
где а — величина, зависящая от г и при г—>0 стремящаяся к опре-
деленному пределу, а следовательно, ограниченная. Отсюда
1п<р(г) = — у + аг3,
и следовательно,
п In <р (г) = — 4~ ал^3>
а значит,
_ nz2
{<f>(z)}n = e Зе^\ (3)
Вспомним теперь, что при /-*-0 бесконечно малая е*—1 эквива-
et___________________________1
лентна/, т. е. отношение —-— стремится к единице при /->0, так
что
где р остается ограниченной при /->0. Поэтому если лиг изме-
няются так, что лг3 —> 0, то
§113] ФОРМУЛА СТИРЛИНГА 613
где 7 — ограниченная величина при nz* —>0; таким образом, равен-
ство (3) дает при nz* —► 0:
_ nz2
{<?(z)}n = e 2 {1+viz3},
где у — ограниченная величина. Эго равенство дает нам нужную
оценку подинтегральной функции интеграла (2).
3. Наметим теперь план предстоящей нам оценки интеграла
оо
/(»)= (4)
— 1
Так как функция <р(г) равна единице при z = 0, а во всех других
точках промежутка интеграции заключена между 0 и 1 (см. черт. 69),
то при больших значениях п подинтегральная функция ничтожно мала
всюду за исключением небольшого отрезка, окружающего точку г = 0,
причем эта область сколько-нибудь заметных значений подинтеграль-
ной функции будет тем меньше, чем больше п. Отсюда, естественно,
возникает мысль выделить из промежутка интеграции маленький
отрезок (—X, X), окружающий точку г = 0, с достаточной точностью,
пользуясь малостью участвующих в интеграции значений z, опреде-
лить величину интеграла по этому отрезку, а затем с помощью уже
более грубых оценок показать, что интегралы, распространенные на
остальные участки общего интервала интеграции, ничтожно малы
сравнительно с найденной уже нами величиной интеграла по отрезку
(—X, X). Разумеется, число X должно при этом зависеть от л и стре-
миться к нулю при п —> оо.
Этим путем мы и пойдем. Пусть 6 означает любое постоянное
число, заключенное между х/з и */« (например, 6 = 2/5 или 0 = 8/12).
Расчет показывает тогда, что удобным значением для X будет
Х = л-А
Это значение мы и примем во всем дальнейшем. Таким образом, мы
разобьем весь промежуток интеграции (—1, на ТРИ части:
(— 1, —X), (—X, X) и (X, +оо); соответственно этому и интеграл (4)
разбивается на три слагаемых, каждое из которых мы будем оцени-
вать в отдельности.
4. Начнем с важнейшего интеграла
х
А(л)=
Во всем промежутке интеграции мы имеем:
|лг8|^лХ3=л,-зв-*0 (я-*оо),
33 А. Я. Хинчин
614
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
[ГЛ. 26
так как 6^>у, и следовательно, 1—30 <0. В силу 2 мы заклю-
чаем отсюда, что во всем промежутке (—X, X)
{?(•?) }" = <? Г {1+тлг3},
где величина 7 при /г-^оо остается равномерно ограниченной в отрезке
(-Х, X):
| 71 с (п-^схэ, | z | X),
где с — постоянное положительное число. Поэтому
I р I р +£°
pi (л)— i е 2 dz\ ^сп)3 J е 2 dz<^cnx~^ j е 2 dz.
— X — X — 00
Но
4-00 „-2 ___4-00 ,__00 ____
— оо — оо О г
(см. § 111, пример 3); поэтому при /г-^оо
|А(л)— f e~^dz\<сл1-зв^с = о(-ЬгУ (5)
I I ]/ п \у п J
Интеграл
j е 2 dz
отличается от вычисленного нами выше интеграла
nz2
2 dz
___ У 2~
/л
лишь на удвоенную величину интеграла
так как нижний предел последнего интеграла в силу Х=л~9 равен
п л 1 X
^2 и в СИЛУ ® \ ~2 ^езгРанично Растет вместе с я, то весь по-
следний интеграл бесконечно мал при л->ос, а вся правая часть
§ 113]
ФОРМУЛА СТИРЛИНГА
515
последнего равенства есть величина вида о
шение (5) дает:
. Поэтому соотно-
у-—— nz*
/Дл)—j^-l<2 f е-Чг±оЩ=оШ
4 4 Vk«/ \i<«/
или
1 \
Уп л
(6)
Таким образом, в отношении интеграла /, (п) наша цель дости-
гнута: мы представили его в виде суммы очень простого «главного
1/"
члена»~ и некоторого остаточного члена, относительно которого
известно только, что при /г->оо он бесконечно мал сравнительно
с главным членом.
5. Теперь мы оценим интеграл
—х
4(n)=J {?(z)}ndz.
— 1
Так как функция ср (г) в промежутке интеграции возрастает, то
4 (л) <{?(-*)}"( 1 - х) < {ф (- х)Г; (7)
но
Ф(-Х) = (1—Х)Л
1пф(— Х) = Х4-1п(1 — Х) = Х
л1"2’
2
п In <р (— X) <--------~
_J_ 1-29 __L х
{ср(— Х)}"<е 2я =е >
где т=1—26 ^>0. Но мы знаем (см. пример 7 в конце § 37), что,
как бы мало ни было т^>0, правая часть последнего равенства бес-
конечно мала, при я->оо, сравнительно с любой степенью числа п9
1 —
в частности, сравнительно с —— —п 2. Поэтому неравенство (7)
дает:
(8)
516
ИНТЕГРАЛЫ КАК ФУНКЦИИ ПАРАМЕТРОВ
[ГЛ. 26
6. Обращаемся, наконец, к интегралу
ОО
4(«)=J* {ф(4)}"^.
X
Здесь представляется удобным снова разбить промежуток интеграции
на две части:
4 оо
4 (л) = 1'3 (л) 4- Г3 («)=(* {ф (г)Г dz + J {ф (г)}” dz.
Ъ 4
На участке (X, 4) функция <p(z) убывает и потому нигде не пре-
восходит 9 (X), так что мы имеем:
4
4 (Л) = J* {ф (z)}a dz ==£ [9 (X)}” (4 - X) < 4 [<р (Х)}л. (9)
X
Но мы легко находим по формуле Тэйлора, что при п оо
1п<р(Х) = — 4- +о (Xs),
и значит, при достаточно большом п
1пф(Х)< —
откуда
1-26 т
пХ2 п____ п
|ф(Х)}Л<^е 3 =е 3 = е 3,
где т=1—26>0. Отсюда мы, как в 5, заключаем в силу (9), что
при п оо
Для оценки интеграла /3 (л) заметим, что при х^4, как легко под-
считать ♦), 1 -|- х ех/\ и следовательно, ср (х) е~ * х!\ Поэтому
1з(п)— I {ф(г)}пйг< I е 2 dx< I е 2 dx = - = o(-7=r) (11)
1 4 % \vn!
при л->оо. Из (10) и (11)
4 (л) = 73 (л) 4- /з (») = О
1
]Лл
(12)
*) Достаточно убедиться, что функция — 1 — х положительна при
х = 4 и возрастает при х 4.
§ 113]
ФОРМУЛА СТИРЛИНГА
617
7. Соотношения (6), (8) и (12) дают:
оо ___
/(л) = f {ф (*)Г dz = lt (я) + /, (я) 4- /, (я) = + о =
j Vп \ Vп /
= 4f[1+o(,)|.
Отсюда в силу (2) мы имеем:
п1=пп+,е~п^- [1 4- о(1)] = ппё~п /2ад [1 4-о (1)].
Наша цель достигнута. Сложная функция п\ приближенно пред-
ставлена нами с помощью простой и удобной аналитической формулы
Г (л 4" 1) = п\ = ппе~п [1 4- о (1)].
Это — одна из важнейших формул математического анализа, назы-
ваемая обычно формулой Стирлинга и имеющая очень боль-
шое число приложений. Относительно остаточного члена этой фор-
мулы нами установлено только, что при /г->оо он бесконечно мал
сравнительно с главным членом; иначе говоря, мы ставили себе за-
дачу выделить лишь главный член формулы Стирлинга, не задаваясь
вопросом об оценке остаточного члена. В приложениях (особенно
практического характера) часто требуется знание и этих оценок; они
могут быть получены без принципиальных затруднений на том же
пути, которым мы пришли к выражению главного члена; однако
расчеты пришлось бы вести для этого значительно детальнее, чего
мы в этой книге выполнить не можем.
Формулу Стирлинга часто пишут и в равносильном логарифми-
ческом виде
In Г (л 4" 1) =1п (л D = In л — n4“ylnn4-“2’ln2TC4'°(l)*
ГЛАВА 27
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
§ 114. Измеримые плоские фигуры
1. Введение. Подобно тому как понятия и методы дифференци-
ального исчисления, первоначально развитые нами для функций одной
независимой переменной, в дальнейшем были (гл. 22) весьма широко
распространены и на функции любого числа переменных, — так и
основные идеи интегрального исчисления могут быть естественно и
с большим практическим эффектом перенесены в область функций
многих переменных. Прежде всего это относится к центральной идее
интеграла как предела сумм определенного вида; именно эта идея,
как мы видели, возникает в первую очередь из запросов практики.
В настоящей главе мы рассмотрим, по необходимости весьма кратко,
основные вопросы, связанные с интегрированием функций двух и
трех переменных. Все, что будет нами установлено в этом направле-
нии, в основном без каких-либо принципиальных трудностей пере-
носится и на функции любого числа переменных.
В случае функций одной переменной областью интеграции обычно
служил отрезок или, в более сложном случае, группа отрезков. Когда
мы переходим к функциям двух переменных, областью интеграции,
естественно, становится плоская фигура. Даже если мы ограничимся
рассмотрением фигур самого простого вида, ограниченных простыми
замкнутыми кривыми, мы все же, как это непосредственно видно,
будем иметь дело с огромным разнообразием форм таких «областей
интеграции». Это многообразие, подобного которому мы совершенно
не имеем в случае функций одной переменной, делает необходимым,
прежде чем мы перейдем к двойным интегралам, предварительное
довольно детальное изучение некоторых свойств плоских фигур.
Этому изучению мы и посвятим настоящий параграф.
2. Плоские фигуры. В самом общем смысле мы будем называть
плоской фигурой любое множество точек плоскости. Какая-либо
точка плоскости А называется внутренней точкой фигуры
если она служит центром круга, все точки которого принадлежат
фигуре (черт. 70). Точка В, служащая центром круга, ни одна
§ 114] ИЗМЕРИМЫЕ ПЛОСКИЕ ФИГУРЫ 519
точка которого не принадлежит фигуре называется внешней
точкой этой фигуры. Наконец, точка плоскости, не являющаяся ни
внешней, ни внутренней точкой фигуры называется ее погра-
ничной точкой. Тацря точка С характеризуется, очевидно, тем,
что любой круг с центром в точке С содержит как точку, принад-
лежащую фигуре 2^, так и точку, ей не принадлежащую.
Из самого определения следует, что внутренняя точка фигуры
всегда принадлежит этой фигуре, внешняя же ее точка, напротив,
никогда не может принадлежать ей. Что касается пограничной точки,
то она может как принадлежать, так и не принадлежать фигуре
Так, если есть множество внутренних точек некоторого круга, то
ни одна из пограничных точек фигуры не принадлежит ей; если
же под мы будем понимать совокупность внутренних точек круга
и точек его окружности, то такая фигура
будет, напротив, содержать все свои погра- у
ничные точки. У \}С)
Совокупность всех пограничных точек У
данной фигуры (как принадлежащих, так и / z-x [
не принадлежащих ей) называется конту- \ J
ром (или границей) этой фигуры.
Фигуру, которая не содержит ни одной
из своих пограничных точек (и все точки Черт. 70.
которой, следовательно, внутренние), назы-
вают открытой областью; фигуру, которая содержит, на-
против, все свои пограничные точки, называют закрытой (или
замкнутой) областью. Если <^, & соответственно озна-
чают множества всех внутренних, внешних и пограничных точек
некоторой фигуры о?, то, как читатель легко убедится самостоя-
тельно, o/ft и —всегда открытые, а еТ5, и — за“
крытые области.
Лемма 1. Прямолинейный отрезок АВ, соединяющий внутрен-
нюю точку А с внешней точкой В фигуры содержит по край-
ней мере одну пограничную точку этой фигуры.
Доказательство. Условимся называть любой прямолинейный
отрезок нормальным, если из его двух концов один служит внут-
ренней, а другой — внешней точкой фигуры е^“. Отрезок АВ норма-
лен согласно предпосылкам леммы; если его середина не есть погра-
ничная точка фигуры то, очевидно, из двух половин этого от-
резка одна будет нормальной. К этой половине мы снова применим
то же рассуждение, и так далее. При этом либо мы рано или поздно
встретимся с тем, что середина разделяемого отрезка будет погра-
ничной точкой фигуры (и тогда лемма будет доказана), либо мы
получим стягивающуюся последовательность нормальных отрезков,
Тогда общая точка D всех этих отрезков (лемма 1 § 18), очевидно,
будет обладать тем свойством, что любой круг с центром в D со-
держит бесчисленное множество нормальных отрезков, а значит.
520 ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ [гл. 27
содержит как точки, принадлежащие фигуре так и точки, ей
не принадлежащие. Но это означает, что D есть пограничная точка
фигуры Таким образом, лемма доказана.
3. Мера плоских фигур. В главе 12 мы определили площадь для
криволинейных трапеций и фигур, составленных из криволинейных
трапеций. Теперь нам необходимо построить измерение площадей на
более общей основе. Чтобы отличить наше новое определение пло-
щади от прежнего, мы будем теперь говорить не о площади, а
омере плоских фигур. При этом, желая сделать наше новое опре-
деление обобщением прежнего, мы должны озаботиться тем, чтобы
для фигур, площадь которых может быть вычислена согласно нашему
прежнему определению, мера действительно всегда существовала и
/ совпадала с этой прежде опреде-
V-—, ленной площадью.
Пусть нам дана произвольная
/ ограниченная плоская фигура <2^~.
Z/)/ — Проведем на данной плоскости
два семейства взаимно параллель-
ных прямых, как показано на
’ черт. 71. Прямые каждого из двух
/ // семейств расположены так, что
' расстояние между двумя сосед-
Черт. 7L ними прямыми всюду одно и то же.
Очевидно, что проведенная нами
сеть прямых делит плоскость на равные между собой параллело-
граммы, которые мы будем называть ячейками этой сети; при этом
мы всегда будем мыслить все точки контура такого параллелограмма
включенными в состав соответствующей ячейки, так что каждая ячейка
представляет собой закрытую область. Диаметром ячейки служит,
очевидно, большая диагональ параллелограмма. Эту величину, оди-
наковую для всех ячеек, мы будем называть параметром данной
сети <5 и обозначать через р(5) или просто р.
По отношению к фигуре ячейки сети S делятся, вообще го-
воря, на три категории: внутренние, все точки которых являются
внутренними точками фи гуры внешние, все точки которых—внешние
точки фигуры наконец, все остальные ячейки мы называем по-
граничными (по отношению к фигуре на черт. 71 заштриховано
по одной ячейке каждого из трех типов).
Лемма 2. Каждая пограничная ячейка содержит по меныией
мере одну пограничную точку фигуры
Доказательство. В самом деле, иначе каждая точка данной
ячейки — либо внутренняя, либо внешняя (относительно о^"), причем
эти точки не могут быть все внутренними или все внешними, так
как тогда ячейка была бы также внутренней или внешней. Таким
образом, данная ячейка должна содержать внутреннюю точку А и
внешнюю точку В фигуры Отрезок АВг целиком принадлежащий
§ 114] ИЗМЕРИМЫЕ ПЛОСКИЕ ФИГУРЫ 521
данной ячейке, в силу леммы 1 содержит пограничную точку, чем
лемма 2 и доказана.
Пусть Is (е^) означает сумму площадей всех внутренних ячеек
сети S (относительно фигуры о^~). Разумеется, эта сумма площадей
различна, вообще говоря, для различных сетей 5; однако множество
значений величины Is(<^) для всевозможных сетей, очевидно, огра-
ничено сверху, так как фигура будучи по предположению огра-
ниченной, целиком находится внутри некоторого круга С, и величина
какова бы ни была сеть S, не превосходит площади этого
круга; поэтому существует верхняя грань /(е^) всех величин).
Теорема 1. IsI(^) при р(S)-► 0.
Утверждение теоремы 1 мы, как обычно, понимаем так: для лю-
бого е^>0 найдется такое 8 0, что /s(o^r)^>/(o^r) — е для любой
сети S с параметром р<^8.
Доказательство. Так как /(о^) есть верхняя грань чисел
Is(dF~), то при любом s 0 найдется такая сеть 50, для которой
Эту сеть мы будем считать закрепленной до конца доказательства.
Рассмотрим какую-либо внутреннюю ячейку Д сети So. Эта ячейка
представляет собой некоторую закрытую область; с другой стороны,
контур & фигуры также есть, как мы знаем, некоторая закры-
тая область. Области А и S не имеют общих точек, так как все
точки ячейки Д — внутренние точки фигуры е^. В силу теоремы 4
§ 87 расстояние между областями Д и поэтому положительно.
Это рассуждение может быть проведено для любой из внутренних
ячеек Д сети Se. Если 8 означает наименьшее из получаемых таким
образом расстояний, то, очевидно, любая точка любой внутренней
ячейки сети 50 отстоит от контура фигуры не менее чем на 8.
Пусть теперь 5—любая сеть, у которой р(5)<^8, и пусть А —
любая точка любой внутренней ячейки сети 50. А есть внутренняя
точка фигуры и должна входить поэтому в некоторую либо
внутреннюю, либо пограничную ячейку сети 5; но в пограничную
она входить не может, так как тогда она отстояла бы в силу леммы 2
меньше чем на 8 от контура фигуры Таким образом*, любая
точка А любой внутренней ячейки сети So обязательно принадлежит
некоторой внутренней же ячейке сети S. Отсюда
при единственном условии, что для сети S мы имеем р 8. Этим
теорема 1 доказана.
Совокупность внутренних ячеек любой рассматриваемой нами сети
прямых, очевидно, целиком принадлежит фигуре <з^~. Если же мы
к внутренним ячейкам присоединим еще пограничные ячейки той же
сети, сумму площадей которых мы будем обозначать через ЛХ*2^)»
522
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
то мы, очевидно, получим фигуру, которая, наоборот, будет содер-
жать в себе все точки фигуры Ясно поэтому, что если фигуре
dT можно разумным образом приписать некоторую определенную
площадь, то эта площадь при любой сети S должна быть заключена
между и Is + Ks С2^)- Но мы только что доказали, что
при р -> 0 величина Isf®^) всегда стремится к определенному пре-
делу. Если поэтому к тому же пределу стремится и охватывающая
фигуру площадь Is (з^ ) -р Ks то нам естественно считать
этот предел площадью или, как мы предпочитаем теперь говорить,
мерой фигуры ; сама фигура в этом случае называется и з-
меримой. Так как 7$(е^) —► /(о^) во всех случаях (теорема 1), то
для измеримости фигуры необходимо и достаточно иметь:
(р->0),
т. е. сумма площадей пограничных ячеек должна стремиться
к нулю вместе с параметром сети.
Мерой фигуры в этом случае служит определенная нами выше
величина
4. Свойства измеримых фигур. Суммой двух пло-
ских фигур и 2 называется совокупность точек, принадлежа-
щих по меньшей мере одной из этих фигур; аналогичным образом
определяется сумма любого числа фигур. Пересечением или
общей частью фигур и зЯ^ называется совокупность
точек, принадлежащих как так и эт0 определение также
без всяких изменений распространяется на пересечение любого числа
фигур.
Теорема 2. Если фигуры <&\ и % измеримы, то и фигура
измерима; если при этом фигуры и не имеют
общих внутренних точек, то
Доказательство. 1) Каждая точка, внутренняя для одной из
фигур и будет, очевидно, внутренней и для фигуры -|~
-|- з^2- Поэтому пограничная точка А фигуры -j- не может
быть внутренней ни для ни для Но она не может быть и
внешней для обеих фигур, так как тогда, очевидно, она была бы
внешней и для фигуры Следовательно, точка А должна
быть пограничной по меньшей мере для одной из фигур и
Но тогда и каждая ячейка любой сети £, пограничная относительно
должна быть пограничной либо для либо для 2»
это дает для любой сети S:
Ks i + Ks ) + Ks
Но так как фигуры и измеримы, то Ksi^i) и Ks(^\)
§ И4]
ИЗМЕРИМЫЕ ПЛОСКИЕ ФИГУРЫ
523
стремятся к нулю при р->0; последнее неравенство показывает по-
этому, что и
(р-^0),
а это в свою очередь означает измеримость фигуры
2) Пусть теперь фигуры и qF\ не имеют общих внутренних
точек. Рассмотрим какую-либо внутреннюю ячейку Д произвольной
сети S относительно фигуры Очевидно, ячейка Д не может
быть внешней для обеих фигур <&~х и так как тогда она была бы
внешней и для <^~х Таким образом, ячейка Д должна быть либо
внутренней, либо пограничной по меньшей мере для одной из фигур
и вследствие чего
Is + <^) sc Is (^) + Ks (^) + Is (^) 4- Ks (^). (1)
Таккако^~1 и q^~<> не имеют общих внутренних точек, то совокупность
ячеек, внутренних либо дляр либо для имеет площадь i) 4"
4“ Is а так как каждая из таких ячеек б^дет, очевидно, внутрен-
ней и Для фигуры j 4- g>F"2, то
Is i) 4" Is 2) Is 1 4" a)- (2)
Из (1) и (2)
is 1) 4" is 2) is 14“ & 2) Is 1) 4~ Ks 1) 4“
4~ is 2) 4" Ks 2)-
Делая сеть S все более мелкой и замечая, что при этом
Is 1)> Is 1 2)» Is 1 4“ ъ)~+1 1 4" г)>
Ks (^2)-* О,
мы в пределе находим:
I \ + ^г^ = 1 i) 4" I 2)»
что и надо было доказать.
Очевидно, чго теорема 2 с помощью простой индукции непосред-
ственно распространяется на любое число слагаемых.
Теорема 3. Пересечение qF\ q? \ двух измеримых фигур также
есть измеримая фигура.
Доказательство. Пусть А — любая пограничная точка фи-
гуры Легко видеть, что тогда точка А должна быть погранич-
ной и по меньшей мере для одной из фигур о?~х и в самом деле,
точка А не может быть внешней ни для п ни для 2, так как
тогда она была бы внешней и для х<^~%, но она не может быть и
внутренней для обеих фигур, так как тогда она была бы внутренней
и для qF\q?\. Итак, пограничная точка Л фигуры qF~xq?~% должна быть
пограничной либо для либо для а следовательно, для любой
сети S ячейка, пограничная относительно 1qF'2, должна быть погра-
ничной либо относительно либо относительно 2; эго дает;
К$ 2) Ks i) 4~ Ks г)-
524 ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ [гл. 27
В силу измеримости j и правая часть стремится к нулю при
р —> 0; то же самое, значит, имеет место и для левой части, а это и
означает, что фигура измерима.
Теорема 3, очевидно, также непосредственно распространяется на
пересечение любого числа измеримых фигур.
Теорема 4. Пусть (8) означает совокупность точек пло-
скости, отстоящих менее чем на 8 от контура плоской фигуры
Тогда, для того чтобы фигура была измеримой, необходимо
и достаточно; чтобы, как бы мало ни было е^>0, множество
orf (8) при достаточно малом 8 содержалось в конечной группе
параллелограммов, сумма площадей которых меньше чем е.
Доказательство. 1) Необходимость. Пусть фигура
измерима и 5—сеть прямых, для которой р настолько мало, что
пусть 8 — нижняя грань расстояний всех внутренних и внешних ячеек
сети 5 от контура фигуры о^(8^>0 в силу теоремы 4 § 87). Точки
множества orf (8) не могут тогда содержаться ни во внутренних, ни
во внешних ячейках сети 5, так что множество оЛ (8) целиком со-
держится в пограничных ячейках этой сети, сумма (о^) площадей
которых меньше чем е.
2) Достаточность. Если для сети S мы имеем р8, то все
пограничные ячейки этой сети входят целиком в множество (8);
поэтому, если выполнено условие теоремы 4, то, как бы мало ни
было е 0, при достаточно малом р
откуда и следует измеримость фигуры
Теорема 4 имеет ряд важных следствий. Пусть измеримая фи-
гура разделена на части произвольной формы, которые мы по-
прежнему будем называть ячейками и от которых мы будем требо-
вать только, чтобы они были измеримыми фигурами и не имели по-
парно общих внутренних точек. Пусть р(7) означает наибольший
из диаметров ячеек разбиения Т фигуры Определение внутренних
и пограничных ячеек остается прежним (т. е. ячейка называется вну-
тренней, если все ее точки — внутренние для фигуры и погра-
ничной в противном случае). Через 1т (^) мы будем обозначать сумму
мер внутренних ячеек разбиения Т (относительно фигуры а /(q^~)
попрежнему будет означать меру фигуры е^"'.
Теорема 5. Если фигура & измерима и разбивается на из-
меримые ячейки, то при р -> 0
Подробнее это означает: при любом е^>0 найдется такое 8^>0,
что при единственном условии р(7^<^8 мы будем иметь:
§ 114] ИЗМЕРИМЫЕ ПЛОСКИЕ ФИГУРЫ 525
Доказательство. При р(Г)<^8 любая точка любой погра-
ничной ячейки разбиения Т принадлежит множеству (6) теоремы 4,
и значит, совокупность всех пограничных ячеек содержится, если 6
достаточно мало, в конечной группе параллелограммов, сумма пло-
щадей которых меньше чем е. Поэтому сумма мер пограничных ячеек
меньше чем е *). Но сумма мер всех ячеек (внутренних и погранич-
ных) равна 7(теорема 2); поэтому сумма мер внутренних
ячеек отличается от /(оЯ^) меньше чем на е, что и доказывает
теорему 5.
5. Примеры измеримых фигур. Мы покажем теперь, что изме-
римостью обладают широкие классы более или менее простых фигур
и что для тех из них, площади которых мы уже прежде умели нахо-
дить теми или другими специальными приемами, мера совпадает
с площадью.
Лемма 3. Пусть функция у=f(x) непрерывна в отрезке (а, Ь)
и пусть при любом 8 О оЛ (8) есть множество точек плоскости,
отстоящих менее чем на 8 от кривой у — /(х) (а х Ь). Тогда,
сколь бы мало ни было е 0, множество (8) при достаточно
малом 8 может быть покрыто конечной группой прямоугольников,
сумма площадей которых меньше чем е.
Доказательство. Разобьем отрезок (а, Ь) на п равных частей
длины - ° = 8, и пусть п столь велико, что колебание функции/(х)
в любом отрезке длины ^8 не превосходит е. Пусть точки деления
будут а = х0 <ZXi < ... <^хп = Ь, так что хк — хл_1 = 8(1
Обозначим через Mk и mk наибольшее и наименьшее значения
функции /(х) в отрезке (x^_n xk) длины 8, так что Mk — mk^e
(черт. 72).
Пусть MN означает участок xk_} ^x^xk кривой y=f (х). Тогда
очевидно, что всякая точка плоскости, отстоящая менее чем на 8 от
дуги MN, должна лежать 1) внутри полосы xk_x— 8<^х<^хл-|“8
и 2) внутри полосы mk — 8 <^у Mk + 8 и, следовательно, — внутри
прямоугольника (хл-1 — 8 <^х<^х/г^-8, mk — & 8) пло-
щади
38 (Mk — mk 4- 28) 38 (е + 23);
сумма же площадей таких прямоугольников, построенных для всех
k (1 k п), не превосходит 38 (е 28) п = 3 (Ь — а) (е 4~ 28), и зна-
чит, сколь угодно мала при достаточно малом е и достаточно боль-
♦) Строго говоря, для обоснования этого утверждения надо еще пока-
зать, что: 1)если измеримая фигура t составляет часть измеримой фигуры
то I(&~8), и 2) мера параллелограмма равна его площади. Первое из
этих утверждений непосредственно вытекает из определения меры, как чита-
тель без труда найдет самостоятельно. Второе же, также почти очевидное,
будет доказано немного ниже (теорема 6).
526
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
шом л. Так как эти прямоугольники в своей совокупности покрывают
множество (8), то лемма 3 доказана.
Пусть теперь фигура имеет своим контуром замкнутую кривую,
распадающуюся на конечное число участков, на каждом из которых
эта кривая может быть представлена либо уравнением видаy=f(x),
либо уравнением вида х = у(у). Применяя тогда к каждому участку
лемму 3, мы видим, что и множество orf (8), построенное для всего
контура фигуры <з^”, при достаточно малом 8 может быть покрыто
конечной группой прямоугольников со сколь угодно малой суммой
площадей. В силу теоремы 4 это дает следующую теорему:
Теорема 6. Если контур фигуры распадается на конеч-
ное число частей, каждая из которых может быть выражена
уравнением одного из двух видов y=f(x), х = у(у) (где fu у—
непрерывные функции), то
фигура измерима.
В частности, измеримы-
ми будут все криволиней-
ные трапеции, площади ко-
торых мы учились находить
в главе 12, и для каждой
такой трапеции ее мера со-
впадает с ее площадью, опре-
деляемой методами главы 12.
В самом деле, из теоремы 6
вытекает прежде всего изме-
римость каждого много-
угольника. В частности, лю-
бой прямоугольник будет
измеримым, и следовательно,
для определения его меры
мы можем выбирать сети прямых любых направлений; беря эти пря-
мые параллельными сторонам данного прямоугольника, мы непо-
средственно видим, что мера прямоугольника совпадает с его эле-
ментарно определяемой площадью. Отсюда непосредственно вытекает
в силу теоремы 2, что то же самое справедливо для любой фигуры,
составленной из конечного числа прямоугольников. Но именно та-
кими фигурами иллюстрировались в главе 12 «верхние суммы» 5 (Г)
и «нижние суммы» s(T) данного разбиения Т. Таким образом, мера
криволинейной трапеции (объемлемой первой из этих фигур и объ-
емлющей вторую) при любом разбиении Т заключена между $(7)и
S(T). А так как то же самое справедливо и для площади этой кри-
волинейной трапеции, то разность между мерой и площадью по абсо-
лютной величине не превосходит S(T') — s(T), и значит, в случае
непрерывной функции /(х) равна нулю, так как разность S(T)—s(T)
при надлежаще выбранном разбиении Т может быть сделана сколь
угодно малой.
§ 115] ОБЪЕМЫ ЦИЛИНДРИЧЕСКИХ ТЕЛ 527
Рассмотрим, наконец, кривую, выражаемую параметрическими
уравнениями
х = У = (3)
где функции ф и ф непрерывны и имеют непрерывные производные
на некотором участке (f0, изменения параметра /, и допустим,
что ни в одной точке этого участка мы не имеем одновременно
ф'(/) = ф'(/) = 0. Пусть t — любая точка участка (/0, и пусть для
определенности q>' (/) 0; будучи непрерывной, функция $ (t) тогда
сохраняет постоянный знак в некоторой окрестности точки /, а зна-
чит, функция x = q>(t) непрерывна и монотонна в некотором отрезке,
окружающем точку Z; но в таком случае, как мы знаем (§ 23), t на
этом участке является однозначной функцией от х, а потому и у = ф (/)
будет однозначной функцией от х на этом участке кривой. Та-
ким образом, каждую точку участка можно окружить
таким участком, на котором кривая (3) может быть выражена
либо уравнением вида j/=/j(x), либо уравнением видах=/2(.у)
(причем функции и /2 непрерывны на соответствующих уча-
стках).
Если мы применим к совокупности таких отрезков теорему о ко-
нечном покрытии (лемма 2 § 18), то мы непосредственно убеждаемся,
что кривая (3) слагается из конечного числа участков, на каждом из
которых она может быть представлена уравнением одного из двух
типов j/=/1(x) и x—f%(y) (с непрерывными j\ и /2). В силу тео-
ремы 6 это приводит к следующему предложению:
Теорема 7. Пусть контур фигуры распадается на ко-
нечное число частей, каждая из которых выражается уравнениями
вида (3), где функции ф(/) и ф(/) обладают на соответствующем
участке непрерывными производными, не обращающимися одновре-
менно в нуль. Тогда фигура измерима.
§ 115. Объемы цилиндрических тел
Как мы указывали в главе 12, в случае функций одной перемен-
ной основной задачей, стимулировавшей создание и развитие инте-
грального исчисления, была задача вычисления площадей плоских
фигур, ограниченных кривыми произвольного вида; и на примере
этой задачи мы в свое время впервые подошли к идее интеграла.
Для функций двух переменных совершенно аналогичную роль играет
задача вычисления объемов тел, ограниченных поверхностями произ-
вольного вида. И в этой задаче элементарная геометрия учит нас
немногому; кроме многогранников (т. е. тел, ограниченных исключи-
тельно плоскостями), она рассматривает лишь объемы тел, в состав
границы которых входят (иногда наряду с частями плоскостей) части
сферических (шаровых), конических и цилиндрических поверхностей.
Мы начнем с того, что попытаемся установить определение и создать
528
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
натную плоскость XOY, нам
должая его до встречи с
прямых представляет собой
метод вычисления объема для тел, ограниченных поверхностями в ши-
рокой степени произвольного вида.
Как в случае площадей мы в самом начале исследования (см. гл. 12)
свели общую задачу к вычислению площадей фигур некоторого спе-
циального типа (криволинейных трапеций), так и здесь мы сосредо-
точим наше внимание на вычислении объемов тел некоторой спе-
циальной формы, которые мы будем называть «цилиндрическими»
телами. Легко усмотреть, что любое тело более или менее простого
вида можно разложить на небольшое число таких цилиндрических
тел и что поэтому, умея находить объемы цилиндрических тел, мы
без затруднений сумеем вычислить объем и любого не слишком
сложно ограниченного тела.
Пусть на некоторой плоскости, которую мы примем за коорди-
задана измеримая фигура & (черт. 73).
Пусть, с другой стороны, нам дана в
пространстве некоторая простирающая-
ся над фигурой поверхность, кото-
рую каждая прямая, параллельная оси
OZ, пересекает не более чем в одной
точке; уравнение такой поверхности
может быть написано в виде
-г=/(х, у), (1)
где мы будем предполагать функцию
/(х, у) положительной и непрерывной
в некотором прямоугольнике, охваты-
вающем фигуру Восставим теперь
в каждой точке контура фигуры
перпендикуляр к плоскости ХОК, про-
поверхностью (1). Совокупность этих
‘ тогда цилиндрическую поверхность,
образующие которой параллельны оси OZ. Полученное нами, таким
образом, тело, ограниченное снизу фигурой с боков — только
что описанной цилиндрической поверхностью, а сверху — поверх-
ностью (1), мы и будем называть цилиндрическим телом; опре-
деление и способ вычисления объема такого тела составят собой
задачу настоящего параграфа. Очевидно, эта задача вполне аналогична
задаче о площади криволинейной трапеции. Усложняющим элементом
является главным образом то, что криволинейная трапеция у нас
всегда была снизу ограничена просто отрезком, в то время как нижней
границей цилиндрического тела может служить измеримая фигура
произвольной формы. Однако это осложнение вызывается самой при-
родой двумерного континуума: в то время как на прямой (т. е. в одно-
мерном континууме) имеется только одна простейшая форма изме-
римой фигуры — отрезок, на плоскости мы даже при желании огра-
ничиться лишь простейшими фигурами сразу сталкиваемся с беско-
§ 115] Объемы цилиндрических тел 529
нечным разнообразием форм таких фигур» Это и делает в двумерном
случае предпочтительным с самого начала рассматривать в качестве
«области интеграции» произвольную измеримую фигуру.
Это же различие сказывается немедленно, как только мы присту-
паем к реализации нашего плана—- определению объема цилиндри-
ческого тела по аналогии с определением площади криволинейной
трапеции. Там мы начинали с разбиения отрезка (а, Ь), ограничи-
вавшего данную трапецию снизу, на произвольные частичные отрезки,
которые мы называли «ячейками» выбранного разбиения. Здесь мы,
естественно, начнем с произвольного разбиения фигуры & на частич-
ные фигуры, которые мы также будем называть ячейками. Но какую
форму целесообразно придать этим ячейкам? В нашем случае мы,
очевидно, имеем здесь несравненно большие возможности выбора,
чем прежде. Вспомним, однако, что в нашем прежнем случае в наших
интересах оказалось по возможности ничем не ограничивать выбор
ячеек, так чтобы наши рассуждения действительно могли охватывать
всевозможные разбиения данного отрезка. Поэтому мы и здесь по-
стараемся по возможности ничем не стеснять нашего выбора. Мы,
естественно, потребуем, чтобы каждая ячейка имела некоторую опре-
деленную площадь, т. е. была измеримой фигурой; далее, мы, есте-
ственно, допустим, что две различные ячейки не должны иметь
общих внутренних точек; во всем остальном размеры, форма и взаим-
ное расположение ячеек могут быть выбраны произвольно. Обозначим
ячейки данного разбиения Т области & в каком-нибудь порядке
через Д,, Д2, ... , Дд; пусть Дл одновременно означает и меру ячейки
того же наименования.
Теперь выберем в каждой ячейке Дл произвольную точку ($л, т^).
Произведение
f$k, (2)
выражает объем прямого цилиндра, имеющего основанием ячейку Дл,
а высотой — величину /(^, /]*)• Если ячейка Дл мала, то в силу не-
прерывности функции /(х, у) значения этой функции в различных
точках ячейки Д^ будут мало отличаться друг от друга, и значит,
в частности, мало отличаться от величины f(lk, Если мы мы-
сленно вырежем из нашего цилиндрического тела узкий цилиндриче-
ский столбик, расположенный над ячейкой Д^, то нам поэтому предста-
вляется очевидным, что объем этого столбика будет мало отличаться
от объема прямого цилиндра с основанием ДА и высотой f(tk, у]*),
т. е. от величины (2). А если все ячейки малы, то объем всего цилин-
дрического тела, равный сумме объемов всех таких столбиков, должен
мало отличаться от суммы
п
ъ)Д*- (3)
k=\
34 А. Я. Хинчия
530 ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ [гл. 27
Мы еще раз должны подчеркнуть, что во всем этом остаются про-
извольными и предпринятое нами разбиение Т фигуры & (лишь
бы ячейки были измеримы и достаточно малы), и выбор точек
(^, в различных ячейках.
Теперь уже очевидно, что в дальнейшем мы должны выбирать
разбиение 7* все более и более «мелким». Но что это значит? Вспомним,
что в нашем прежнем случае мы оценивали «мелкость» разбиения Т
малостью величины 1(Т) наибольшей из его ячеек. Аналогично мы
должны, конечно, поступить и здесь. Но каким числом следует из-
мерять размер ячейки? Легко видеть, что мера ячейки не подходит
для этой цели; в самом деле, мы ведь стремились выбирать ячейки
малыми для того, чтобы любые две точки одной и той же ячейки
лежали близко друг к другу; но малая мера ячейки еще не гаранти-
рует нам этого ее свойства (стбит представить себе ячейку в виде
очень растянутого прямоугольника). Вспомним теперь, что мы назы-
вали диаметром плоской фигуры верхнюю грань взаимных расстояний
всевозможных пар ее точек. Поэтому малость диаметра ячейки
действительно необходима и достаточна для того, чтобы взаимное
расстояние двух произвольных ее точек было мало. Если мы обозна-
чим через d(l) наибольший из диаметров ячеек данного разбиения Т,
то «мелкость» этого разбиения удобно, следовательно, измерять и
оценивать малостью величины d(T). Переменное разбиение Т мы,
естественно, назовем «безгранично мельчающим» тогда и только
тогда, если </(Т)->0.
Все дальнейшее представляется уже совершенно ясным по полной
аналогии с определением площади криволинейной трапеции. Если
при безграничном мельчании разбиения Т и при произвольном выборе
точек ($£, т)л) в соответствующих ячейках сумма (3) стремится к пре-
делу V, не зависящему ни от выбора производимых разбиений Т,
ни от выбора точек (^, ^) в ячейках каждого разбиения, то мы
называем этот предел V объемом данного цилиндрического тела
и пишем:
п
lim (4)
Из сказанного ясно, что точный смысл этой записи (в полном
согласии с принятым нами общим пониманием предельного перехода,
§ 15) состоит в следующем: сколь бы мало ни было s 0, найдется
такое 8^>0, что при любом разбиении 7, у которого d(T)<^8, и
при любом выборе точек (^, т^) в ячейках этого разбиения будет
иметь место неравенство
п
I v|<e.
*=1
§ 116]
ДВОЙНОЙ ИНТЕГРАЛ
531
Таким образом, определение объема цилиндрического тела нами
установлено. Что касается аппарата для фактического вычисления
этого объема, то предшествующее определение, будучи вполне кон-
структивным, формально такой аппарат дает; однако в практическом
отношении аппарат этот по своей сдожности способен дать нам еще
много меньше, чем тот, который был получен нами ранее в связи
с определением площади криволинейной трапеции. Поэтому и здесь,
как там, мы должны считать, что создание полноценного, практически
годного аппарата для вычисления объемов тел у нас еще впереди.
Разумеется, предшествующие рассмотрения еще ничего не говорят
нам о том, при каких условиях предел, о котором идет речь в опре-
делении объема цилиндрического тела, действительно существует и
обладает необходимой независимостью от элементов построения.
Рассмотрение этого круга вопросов нам поэтому также еще предстоит
в дальнейшем.
§ 116. Двойной интеграл
Подобно тому как мы имели это в одномерном случае (гл. 14),
можно было бы и здесь перечислить большой ряд задач геометрии
и физики, решение которых приводится к вычислению пределов вида
(4) § 115 (масса неоднородной тонкой пластинки, центры тяжести
и моменты инерции таких пластинок и т. д. *)). Поэтому здесь, как
и там, возникает необходимость изучения общих свойств таких пре-
делов и создания практически пригодных приемов их вычисления.
Мы, естественно, начнем с установления терминологии и системы
обозначений. Если предел вида (4) § 115 для данной функции/(х, у)
и данной измеримой фигуры существует, то этот предел назы-
вают двойным интегралом функции / (х, у), распро-
страненным на «область интеграции» и обозначают
через
j* j*/(х, j/)do или Jу/(х, у) dxdy.
& &
В первом из этих обозначений символ dv («элемент площади») должен
напоминать о происхождении интеграла путем предельного перехода
от «интегральных сумм»
п
fe=l
Мы знаем, что форма ячеек при этом произвольна; чаще всего ока-
зывается наиболее удобным выбирать ячейки в виде прямоугольников
♦) Мы рассмотрим некоторые из таких задач в § 120.
532 ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ [гл. 27
со сторонами, параллельными координатным осям; интегральные суммы
получают тогда вид
п
^)дхд^>
Л=1
и указанное нами выше второе обозначение двойного интеграла, кото-
рым мы преимущественно будем пользоваться в дальнейшем, имеет
своей целью напоминать об этом способе происхождения. Разумеется,
смысл обоих обозначений в точности одинаков.
Функцию /(х, у) в случае существования интеграла называют
интегрируемой в области При этом от функции /(х, у)
заранее не требуется в сущности ничего, кроме того, чтобы она
была определена в каждой точке области интеграции и ограничена
в этой области. В частности, мы не обязаны считать ее непрерывной;
она может принимать и отрицательные значения (в этих более общих
случаях, разумеется, теряется та простая геометрическая интерпре-
тация двойного интеграла, с которой мы имели дело в § 115).
Как и в одномерном случае, при построении теории двойного
интеграла существенную помощь оказывают понятия верхних и ниж-
них сумм, которые строятся аналогично одномерному случаю (§ 47).
Пусть М и т означают соответственно верхнюю и нижнюю грани
функции /(х, у) в области &. Пусть мы произвели произвольное
разбиение Т этой области с (измеримыми) ячейками Д1? Д2, ... , Дп
и пусть Mk и mk означают соответственно верхнюю и нижнюю грани
функции /(х, j/) в ячейке Дл. Составим тогда суммы
п п
$т= 2 ж*д*> st= 2
£=1
которые, очевидно, однозначно определяются выбранным разбиением Т
и которые мы, как прежде, будем называть соответственно верх-
ней и нижней суммами этого разбиения. Эти суммы обладают
всеми свойствами верхних и нижних сумм одномерного случая (§ 47,
свойства 1°—4°); все доказательства остаются прежними, и только
ячейки Дл являются теперь измеримыми плоскими фигурами. Вместо
длины b — а отрезка (а, Ь) мы теперь всюду должны ставить пло-
щадь D области того же наименования. В доказательстве 3° следует
отметить, что ячейки ДА/ являются измеримыми фигурами на осно-
вании теоремы 3 § 114.
Как и в случае одномерного интеграла, условимся называть вели-
чину &k = Mk— mk колебанием функции /(х, у) в ячейке Дл
разбиения Т. Снова легко убедиться, что простое соотношение
п
ST-ST=^^k^0 ,[d(T)^0] (1)
§ 116]
ДВОЙНОЙ ИНТЕГРАЛ
533
служит необходимым и достаточным условием интегрируемости функ-
ции /(х, у) в области Доказательство проводится совершенно
аналогично одномерному случаю (§ 48).
» Важнейшим следствием этого критерия интегрируемости является,
как и в одномерном случае, интегрируемость всех непрерывных функ-
ций. Функция f(x,y), непрерывная в ограниченной закрытой области &,
как мы знаем (§ 88), равномерно непрерывна в этой области. От-
сюда, если d(T) достаточно мало, колебание функции /(х, у)
в любой ячейке Д* разбиения Т будет меньше сколь угодно малого
наперед заданного положительного числа е; но из этого следует, что
при достаточно малом d(T)
п п
2 2 д*=е£);
Л=1 £=1
так как е^>0 произвольно мало, то имеет место соотношение (1) и
функция /(х, у) интегрируема в области
В случае простых (однократных) интегралов мы видели, что на-
личие у ограниченной функции конечного числа точек разрыва не
мешает ее интегрируемости (§ 48, теорема 4). Можно было бы и
здесь аналогичным образом показать, что ограниченная функция
/(х, у) интегрируема в любой области в которой все ее точки
разрыва расположены на конечном числе линий достаточно про-
стого типа. Однако мы на этом останавливаться не будем.
Двойные интегралы обладают рядом простейших свойств, вполне
аналогичных соответствующим свойствам простых интегралов; до-
казательства этих свойств, в большинстве очень несложные, также
протекают вполне аналогично соответствующим доказательствам для
простых интегралов. Поэтому мы можем ограничиться здесь простым
перечислением важнейших из этих свойств, предоставляя доказа-
тельства их читателю ♦).
1°. Если функции (х, у) и /2 (х, у) интегрируемы в области &,
то и сумма их интегрируема в этой области и
f f [/1 (*> У) + fi {X, y)]dxdy —
= -V) dxdy-\- J J /, (x, y) dx dy.
2°. Если k — любое постоянное число и функция f(x,y) интегрируе-
ма в области S,toh функция kf(x,y) интегрируема в этой области и
Jj* &/(х, y)dxdy = k j* J/(х, y)dxdy.
& &
*) Напомним, что областью интеграции во всем дальнейшем может быть
любая измеримая плоская фигура,
884
ДВОЙНЫЕ Й ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
Если функция /(х, _у) интегрируема в каждой из областей «SF,
то она интегрируема и в области х если при этом
и <Ж2 не имеют общих внутренних точек, то
3°.
и ^4,
области
п /(х, y)dxdy = JJ f (х, у) dx dy 4- JJ f (x, y)dxdy.
^,+^4
1
функции (х, у) и /2 (*» У) интегрируемы в области &
4°.
и если
Если
в каждой точке этой области /, т0
J J /1 О > У) dx dy^ J J /s (x, у) dx dy.
& &
Если функция /(x, у) интегрируема в области то функ-
5°.
ция |/(х, у)\ также интегрируема в этой области и
| JJ^х> dxdy JJ \f^x’ y^dxdy-
& &
6°. Если функция /(x, j/) интегрируема в области и если
в каждой точке этой области у)^М, то
mD j* J f (х, у) dx dy MD,
где D означает меру области SS?.
7° (Теорема о среднем значении). Если функция /(х, у) непре-
рывна в закрытой области 2^, а эта область «связна», т. е. любые
две ее точки могут быть соединены ломаной линией, целиком при-
надлежащей области то в этой области найдется такая точка
(£, Tj), что
JJ/O> J') dxdy=f$, т])£).
Для доказательства надо соединить ломаной линией, лежащей
в области точки, в которых функция / (х, у) принимает свое
наибольшее значение М и свое наименьшее значение т. Вдоль этой
ломаной можно тогда рассматривать / как непрерывную функцию
какого-либо подходящим образом выбранного параметра К (можно,
например, определить X как длину участка ломаной от начальной
точки до данной). К этой непрерывной функции, значения которой
в концах данного отрезка изменения параметра равны соответственно Л4
и /п, мы можем применить теорему 3 § 23; так как в силу 6°
§ 116]
ДВОЙНОЙ ИНТЕГРАЛ
535
то на проведенной ломаной (и значит* в области найдется
точка (Е, 7j), в которой
]" (/(*, У) <‘У‘1у,
что и надо было доказать.
Отметим, наконец, одно важное следствие теоремы 5 § 114, ко-
торое нам не раз пригодится в дальнейшем. Пусть функция /(х, у)
интегрируема в области интеграл ее определяется как предел
сумм вида
k
по всем ячейкам Дл данного разбиения Т области при условии,
что наибольший диаметр ячейки стремится к нулю. Среди ячеек Дл
мы различаем внутренние и пограничные; условимся обозначать
через 21 суммирование по всем внутренним и через 2з —по всем
пограничным ячейкам данного разбиения, так что
к
И
2д*=Хд*+2л-
k
Если означает верхнюю грань функции |/(х, j)| в области
то
т1*)д*|^Р'ХДа=1,'(2д*—21д*)-
к
Но теорема 5 § 114 утверждает, что при безграничном мельчании
разбиения
2л^2д*-
к
(последняя сумма есть, конечно, просто мера области ^); поэтому
при О
и следовательно,
f f /(X, у) dxdy = \im У f(tk, Д*==Нт ’te) д*-
536
.ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
Теорема. Если функция f (х, у) интегрируема в области
&, то
f f у) dxdy = lira У f$k, ^)Д*,
d(T)-*Q
где сумма 2i распространяется только на внутренние ячейки
разбиения Т.
Примечание. Доказанная теорема остается верной и в том
случае, если в сумму 21 мы условимся включать наряду со всеми
внутренними ячейками и некоторые (какие угодно) из пограничных
ячеек (сумма будет тогда охватывать остальные пограничные
ячейки). Доказательство остается неизменным.
§ 117. Вычисление двойных интегралов с помощью двукратного
простого интегрирования
Мы уже заметили, что данное нами определение двойного инте-
грала указывает вместе с тем и способ его вычисления, но что
способ этот по своей громоздкости очень ограничен в конкретных
применениях. Мы должны поэтому заняться вопросом о том, как
можно практически подойти к задаче вычисления данного двойного
интеграла. В подавляющем большинстве случаев такое вычисление осу-
ществляется посредством редукции двойного интегрирования к двум
последовательным простым (т. е. однократным) интеграциям. Основы
этого общего приема мы и изложим в настоящем параграфе.
Пусть закрытая область (измеримая фигура) на которую рас-
пространяется данный двойной интеграл, имеет такую форму, что
всякая прямая, параллельная одной из координатных осей, пересе-
кает ее контур не более чем в двух точках (черт. 74; этим требо-
ванием мы исключаем из рассмотрения области, подобные изобра-
женной на черт. 75; но такую область, если она достаточно проста,
всегда можно разбить на части, имеющие требуемую форму, как это
показывают пунктирные линии на черт. 75); исключение допускается
§ 117] ВЫЧИСЛЕНИЕ ДВОЙНЫХ ИНТЕГРАЛОВ С ПОМОЩЬЮ ДВУКРАТНЫХ 537
лишь для самой левой и самой правой из этих прямых: каждая из
них может иметь с границей области & целый отрезок общих точек
(на черт. 74 так ведет себя крайняя правая прямая).
Мы будем предполагать функцию /(х, у) непрерывной в обла-
сти Тогда интеграл
= ]*]*/(*» У') dxdy
заведомо существует и (в силу последней теоремы предыдущего
параграфа, см. примечание) равен пределу при б/(7)~>0 сумм вида
(где — координаты точки, произвольно выбираемой в ячейке
разбиения Г, и сумма распространяется на все внутренние ячейки и
любое число пограничных ячеек этого разбиения); предел этот не
зависит ни от выбора разбиений Г, ни от выбора точек (5Л,
в ячейках этих разбиений. Поэтому, чтобы получить нужную нам
редукцию вычисления интеграла I к последовательному отысканию
двух простых интегралов, мы можем выбирать разбиения Т и точки
(5fe, в ячейках этих разбиений наиболее удобным для этой цели
образом, лишь бы только rf(T)—>0.
Пусть е^>0 задано произвольно; тогда при достаточно малом;
8^>0 мы будем иметь:
Ъ)Д*|<е (О
для любого разбиения Т, у которого т/(Т)<^8 (и при любом выборе
точек (Вл, т^) в ячейках этого разбиения). Выберем теперь такое
разбиение некоторым совершенно определенным образом. Напишем
соответственно в виде у = (х) и у = (х) уравнения верхней и
нижней частей контура области & (черт. 74) и допустим, что эти
две функции непрерывны в отрезке (а, Ь) между крайними абсцис-
сами точек области . Тогда в силу теоремы о равномерной непре-
рывности найдется такое что при а^х' <^х” и
|х' — х"|</20 мы будем иметь:
j 91 (*') - 91 (*") I < 4 ’ I I < 4 ♦ <2>
Разобьем теперь отрезок (а, Ь) с помощью точек деления
а = х0, Хр хп = Ь
на столь большое число равных частей, чтобы иметь
х^ «^*—1 Ч С J ^0
538
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
и одновременно А <3/2. Через каждую точку деления проведем
прямую параллельно OY. Совокупность этих прямых разобьет об-
ласть & на вертикальные полосы (черт. 76). Дальнейший выбор
ячеек разбиения мы будем производить в каждой такой полосе
в отдельности.
На черт. 77 изображена одна из таких вертикальных полос, за-
ключенная между прямыми x = xi и х = хм. Пусть Л4, и тх со-
ответственно означают наибольшее и наименьшее значения функции
9, (х) в данной полосе, а ТИ2 и /и2 имеют аналогичное значение для
функции qp2(x). Так как А<А0, то из неравенств (2) следует
м,—«1<|, Afg—(з)
Проведем в нашей полосе (черт. 77) прямые, параллельные ОХ
на высотах /zz2, Л42, ти Afj (мы допустим для простоты, что ТИ2 <Г^)
а участок оси OY
разобьем на равные части, и через
каждую точку деления также про-
ведем прямую, параллельную ОХ.
Черт. 76.
Этими прямыми заключенная в данной полосе часть области раз-
бивается на части, которые мы и будем считать ячейками нашего
разбиения Т. При этом мы не определили еще, на сколько равных
частей должен быть разбит отрезок М^^у^т^ сейчас мы обра-
тимся к этому вопросу.
В каждой построенной нами таким путем в данной полосе ячейке
Д* мы выберем ^ = xz (и значит, одно и то же для всех ячеек
данной полосы), в то время как числа т]л могут быть выбраны про-
извольным образом. Самая нижняя ячейка данной полосы содержится
в прямоугольнике с измерениями А<у и /И2 — т2<у и’ зна"
чит, имеет диаметр, не превосходящий у/h? -|~ (Л42 — т2)2 < -^= < 8.
» V 2
То же самое, очевидно, имеет место и для самой верхней ячейки.
Что касается остальных ячеек данной полосы, то все они будут
§ 117] ВЫЧИСЛЕНИЕ ДВОЙНЫХ ИНТЕГРАЛОВ С ПОМОЩЬЮ ДВУКРАТНЫХ 539
прямоугольниками и диаметр каждой из них будет меньше, чем 8,
если мы разобьем отрезок на достаточно большое
число (равных) частей. Из этих прямоугольников верхний и нижний
будут, очевидно, пограничными, а остальные — внутренними ячейками
нашего разбиения.
Часть интегральной суммы
2/&>
k
распространенная на прямоугольные ячейки выбранной нами полосы,
может быть записана в виде
т — I
2 f^xi> yi)hh’>
z = o
где hf — расстояние между двумя соседними точками деления от-
резка (Л42, mJ, a yt — произвольное число, заключенное между
двумя такими соседними точками деления.
Но сумма
т — 1
f(xt, у^Н
1 = 0
при Л'->0 имеет пределом интеграл
mi
f{xit y)dy.
Поэтому при достаточно малом h' мы будем иметь:
т — 1 /«1
I 2 f(xt' y^hh' — h j j)<rj<Ae. (4)
1 = 0 ма
Но так как
m-i =£ Af,, wi2 q>2 (xz) =s= iW2,
то из неравенств (3) следует
—wij<y, Л12—
а потому
<Pi <*/) mt
I J f(Xi, y}dy— j* f(Xi, =
(^) ^2
Mg <P1
= | j* f(Xi, y)dy+ J f(xit y)dy =
?8 mi
540
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
где р. — верхняя грань функции |/(х, у)| в области Из (4) по-
этому следует
т-1 <Р1 (•*,-)
| ^Xl' yi)hh’ — h J /(*z> J0<y|<Ae + M<2As>
I = 0 cp- (APj)
так как ничто не препятствует нам с самого начала выбрать
До сих пор мы рассматривали часть интегральной суммы, рас-
пространенную на прямоугольные ячейки одной выбранной нами верти-
кальной полосы. Суммируя полученный результат по всем таким
полосам, мы находим:
n-i <₽i(*p
J Д')<у|<2Аел = 2е(А —а),
i «0 <р8 (ар*.)
где сумма 21 распространяется на все внутренние и некоторое число
пограничных ячеек данного разбиения.
Положим теперь
<F1Pp)
<Р2 (АР)
/(х, у) dy = F(x)
(а х £),
так что F (х) — непрерывная функция от х в отрезке (а, Ь) (см. тео-
рему 4 § 109). Тогда последнее неравенство можно записать в виде
п — 1
1/ с**, -на) д* — 2F ^‘+i—j <2s —а)-
/ = 0
Но сумма
п — 1
i = 0
Ь
— х,) j* F (х) dx
а
при h -> 0; можно поэтому с самого начала взять h столь малым,
чтобы эта сумма отличалась от интеграла
/? Ь <pi (АР)
F(x)rfx = j> |
а а <р2 (ар)
меньше чем на е. Тогда последнее неравенство дает:
ь
£,№ vu)A*-tp(x)</X;<S|l+2(A — а)|. (5)
а
J f (х> У) dy | dx
§ 117] ВЫЧИСЛЕНИЕ ДВОЙНЫХ ИНТЕГРАЛОВ С ПОМОЩЬЮ ДВУКРАТНЫХ 541
Наконец, как мы видели, все ячейки описанного нами разбие-
ния Т имеют диаметр меньший, чем 8, вследствие чего имеет место
неравенство (1). Но из (1) и (5) следует
ь
|/—j*F(x)(Zx|<2e(l 4-й — а),
а
Так как е сколь угодно мало, а левая часть последнего неравен-
ства от е не зависит, то она равна нулю, и мы находим:
д ср! (X)
f (х, У) dx dy = J { J f{x, y)dy^dx. (6)
& a <P2 (*)
Этот результат и был целью наших рассуждений. Мы видим, что
двойной интеграл непрерывной функции может быть вычислен с по-
мощью двух последовательных простых (однократных) интеграций.
В правой части формулы (6) внутренний интеграл имеет строение,
с которым мы встречались в § 109: переменная х играет в нем
роль параметра, т. е. сохраняет постоянное значение при проведении
интегрирования; от этого параметра х зависит не только подинте-
гральная функция, но и оба предела интеграции. Таким образом,
весь этот внутренний интеграл представляет собой некоторую непре-
рывную функцию переменной х, которую затем и надлежит интегри-
ровать по х в пределах от а до Ь.
Разумеется, координаты х и у во всем этом рассуждении совер-
шенно равноправны, и мы можем, если эго почему-либо удобнее,
интегрировать сперва по х, а затем по для этого мы должны
наметить точки контура области в которых ордината у прини-
мает наименьшее значение у = с и наибольшее значение y = d\ эти
две точки делят контур на две части — правую с уравнением
x = ty1(y) и левую с уравнением х = ф2(3/)- В точности подобно
предыдущему мы находим тогда:
d (j)
y)dxdy=^ { J / (x, y) dx ] dy. (7)
с фа (у)
Разумеется, выполнение двух требуемых простых интеграций не
всегда бывает легко. Однако принципиально мы свели задачу вычи-
сления двойного интеграла к задаче, которую мы уже давно и все-
сторонне изучили, и потому можем считать нашу цель достигнутой.
Заметим еще, что, располагая для решения нашей задачи двумя
равноправными формулами (6) и (7), мы можем, конечно, в каждом
отдельном случае выбирать ту из них, которая окажется удобнее;
этот вопрос решается в зависимости как от природы функции
/(х, у), так и от формы области
542
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
Пример. Трехгранная призма, образующие которой парал-
лельны оси OZ, имеет своим основанием в плоскости XOY треуголь-
ник с вершинами в точках А (0, 1), В(1, 0), С(—1, 0). Найти
объем части этой призмы, заключенной между плоскостью XOY и
ние АВС призмы, изображенное на черт. 79. Уравнения прямых АС
и АВ будут соответственно
х=у—1, х=1—
поэтому мы для искомого объема
получаем выражение
Здесь внутренний интеграл
'?у Г 2
J (х8 + j’) dx = [j’x + |^_ (= 2у« (1 - у) + (1 — у)*,
и мы получаем:
V = j { 2у* (1 —у) +1 (1 - у)9} dy.
о
Дальнейшие вычисления, очевидно, не представляют затруднений.
Другие весьма полезные упражнения см. в задачнике Б. П. Де-
мидовича, отдел VIII, задачи 7—15, 17, 23.
§ 118] ЗАМЕНА ПЕРЕМЕННЫХ В ДВОЙНОМ ИНТЕГРАЛЕ 543
§ 118. Замена переменных в двойном интеграле
Мы знаем, каким мощным орудием вычисления простых (одно-
кратных) интегралов служит преобразование переменной интеграции
(достаточно вспомнить, например, рационализацию интегралов ирра-
циональных и трансцендентных функций, проведенную нами
в главе 17 на большом числе примеров, охватывавших целые классы
функциональных зависимостей). Располагая широким произволом
в выборе проводимого преобразования, мы в большом числе слу-
чаев можем с помощью этого метода заменить подинтегральное
выражение другим, легче поддающимся интеграции.
Нам предстоит теперь выработать аналогичный метод для двой-
ных интегралов. Мы увидим, что и здесь возможен простой прием
преобразования переменных интеграции, часто значительно облегчаю-
щий вычисление или оценку интеграла.
Пусть нам дан двойной интеграл
]*]*/(*, y)dxdy, (1)
где функция /(х, у) непрерывна в закрытой области SS?.
Рассмотрим наряду с плоскостью ху другую плоскость uv и
в ней — некоторую область Пусть преобразование переменных
х = х(ц, г/), у—у (и, ti), (2)
где функции х (и, v)9 у (я, г/) определены, непрерывны и имеют не-
прерывные частные производные в области переводит эту об-
ласть в область & плоскости ху (как это было нами подробно рас-
смотрено в § 105). Мы допустим, что устанавливаемое соотноше-
ниями (2) преобразование области в область & взаимно одно-
значно, т. е. что каждая точка (х, у) области & служит образом
только одной точки (w, v) области эта точка (м, v) дается
«обратным» преобразованием
и — и(х, у), v = v(x, у), (3)
в котором функции и (х, у) и v (х, у) мы предполагаем также не-
прерывными и имеющими непрерывные частные производные в об-
ласти Так как при этом (см. § 105)
Р(ц, v) D(x,
D (х, у) * D (и, v) ’
то оба определителя отличны от нуля в соответствующих областях.
Нашей целью будет выразить интеграл (1), распространенный на
область плоскости ху, в виде некоторого двойного интеграла,,
распространенного на область плоскости uv.
544
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
С этой целью рассмотрим разбиение Т области производи-
мое двумя семействами прямых, соответственно параллельных осям
ОХ и ОК; пусть при этом расстояние h между двумя соседними
прямыми одинаково для обоих семейств, так чго внутренние ячейки
разбиения Т будут квадратами со стороной h. Этому разбиению
соответствует определенное разбиение Т области , ячейки кото-
рого будут, вообще говоря, иметь криволинейные контуры. Возьмем
какую-либо внутреннюю ячейку (квадрат) Д^ разбиения Т в обла-
сти & с вершинами в точках (xki yk), (xk-\-h, yk), (xk, л +
(xk-[~ht yk-[-h); преобразование (3) ставит ей в соответствие неко-
торую ячейку Дй разбиения Тг в области . Убедимся прежде
всего, что каждая такая ячейка представляет собой измеримую
фигуру.
Контур ячейки Д* разбивается на четыре части, соответственно
четырем сторонам квадрата Д* *). Рассмотрим какую-нибудь одну из
этих четырех частей, например ту, которая является образом сто-
роны xk^ x^xk -[-А, У=Ук квадрата Дл. Эта часть, очевидно,
выражается параметрическими уравнениями
и = и{х, yk), v = v(x, yk) (xk^x^xk-\-k),
ди dv z , ч
производные и в промежутке (xk, xk-\~h) непре-
их их
и не могут одновременно обратиться в нуль, так как в этом
. , D(u, v)
обращался бы в нуль и определитель что, как мы
, (X, у)
причем
рывны
случае
видели, невозможно. Так Как это же справедливо, очевидно, и для
любой из трех остальных частей контура ячейки Дл, то эта ячейка
в силу теоремы 7 § 114 представляет собой измеримую фигуру.
д;
В § 105 мы видели, что отношение -т— площадей двух ячеек
k
при h->0 имеет своим пределом абсолютную величину определителя
Р(и, у)
D{xt у)
в точке (xk, yk\f таким образом, при h->0
Отсюда, обратно,
д*=|^7)|д* + °(д^
(4)
*) Здесь и в дальнейшем для строгого обоснования наших рассуждений
Мы должны были бы доказать, что при взаимно однозначном и взаимно не-
прерывном преобразовании одной области в другую граница первой области
переходит в границу второй. Это предложение действительно справедливо,
но доказательство его выходит за рамки нашего курса.
§ 118] ЗАМЕНА ПЕРЕМЕННЫХ В ДВОЙНОМ ИНТЕГРАЛЕ 545
где а* —► О при h —> 0, а определитель Остроградского должен быть
взят в точке [uk = u(xki yk), vk = v(xk, ячейки Д^. Помножим
равенство (4) на f (xk, yk) и просуммируем его по всем внутренним
ячейкам области «^:
=Х/(Хй> М (5)
Будем теперь безгранично уменьшать число Л, а следовательно, и
наибольший диаметр h j/2 ячеек ДЛ разбиения Т. В силу заключи-
тельной теоремы § 116 левая часть последнего равенства будет при
этом иметь пределом интеграл (1). Обратимся к исследованию правой
части и начнем с ее второго слагаемого. В § 105 мы видели, что
при h 0 числа стремятся к нулю равномерно относительно по-
ложения квадрата ДЛ в области таким образом, каково бы ни
было е^>0, при достаточно малом h мы будем иметь | a| е во
всех членах суммы Л)а*Дл> вследствие чего, если h доста-
точно едало,
I Ук) а*ДЛ I < е Si \f(xk, yk) I Д* sg p-eD,
где означает верхнюю грань функции |/(х, _у)1 в области <^. Так
как е сколь угодно мало, то при h-+0
lim 21/(х, Л)®Л=0.
Обратимся, наконец, к первой сумме правой части равенства (5).
Полагая для краткости
Р У)—j(u гА
£>(и, v)~ V)
и замечая, что
xk = x(uL, vk), yk=y(uk, vk),
мы можем записать эту сумму в виде
Z1/ [х(и , vk\ у (ик, ?»*)] I j(uk,vk) I Дь (6)
причем сумма распространяется на все ячейки Д^ области d^', соот-
ветствующие внутренним ячейкам Д^ области &. Но при преобра-
зовании (3) контур области переходит в контур области и
обратно (см. сноску на стр. 544). Отсюда вытекает, что внутренние
ячейки одной области должны соответствовать внутренним ячейкам
другой, а пограничные — пограничным. Сумма (6), распространенная
на ячейки области , соответствующие внутренним ячейкам области Ж,
тем самым распространяется просто на все внутренние ячейки области
При Л->0 наибольший диаметр этих ячеек (в силу равномерной
непрерывности функций и(х>у\ стремится к нулю, и
35 А. Я. Хинчин
646
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
сумма (6) в силу последней теоремы § 116 имеет пределом двойной
интеграл *)
J J f [х (н> У (и> ^)] I v) I du dv.
(7)
Таким образом, возвращаясь к соотношению (5) и переходя в нем
к пределу при h 0, мы приходим к формуле
J J f(x, y)dxdy— § § f[x (и, v), у (и, г/)] | J(u> v) | du dv, (8)
где
J (и, v) =
дх
ди
ду
ди
дх
dv
ду
dv
и где есть область плоскости uv, при преобразовании х = х(и, v),
у = у(и, v) переходящая в область плоскости ху. Это и есть
формула замены переменных в двойных интегралах, которую мы
стремились получить. Мы видим, что она вполне аналогична соот-
ветствующей формуле замены переменной в простых (однократных)
интегралах
ъ р
p(x)rfx = j/[? (/)]?'(/) Л,
а а
где отрезок преобразованием x = <^(t) переводится в от-
резок а^х^Ь. Роль производной $ (t) играет в формуле (8) оп-
ределитель J, точнее — его абсолютное значение. Как и в случае
простых интегралов, формула (8) имеет своей основной целью пре-
образование интегралов к виду, более удобному для вычислений
или оценок; однако здесь вступает в силу и некоторый новый мо-
мент, отсутствующий в случае однократных интегралов: применение
формулы (8) очень часто имеет своей целью упрощение не только
вида подинтегральной функции, но и формы области интеграции;
если область по сравнению с областью & имеет более простую
форму, то тем самым интеграл существенно упрощается, и это упро-
щение настолько важно, что ради его достижения иногда выгодно
пойти даже на некоторое усложнение подинтегральной функции.
Пример. Наиболее часто встречающимся типом преобразования
переменных в двойном интеграле является переход от прямоугольных
*) Мы опускаем здесь доказательство того, что вместе с областью и
область является измеримой фигурой.
§ 118]
ЗАМЕНА ПЕРЕМЕННЫХ В ДВОЙНОМ ИНТЕГРАЛЕ
547
координат (х,.у) к полярным (г, 9); формулы преобразования в про-
стейшем случае имеют вид
x = rcos9, j/ = rsin<p,
откуда
j_D(xf у)_ cos? —rsin? _
9) sin^ rcos^p
Общая формула получает вид
J J f(x> y)dxdy=^ r sin 9] r dr dtp.
(9)
Особенно удобно ее применение в часто встречающемся случае,
когда область & есть круг с центром в начале координат:
, (10)
очевидно, в этом случае область есть прямоугольник 0 г а9
Интегрировать по прямоугольнику, разумеется, значи-
тельно проще, чем по кругу; та редукция к двум простым интегра-
циям, которую мы рассматривали в § 117, в случае круга (перемен-
ные х, у) дает пределы интеграции
а У а2 — х2
— а -/а2 —х2
в случае же прямоугольника (переменные г, 9) — постоянные пределы:
а 2тс
О О
что во многих задачах значительно упрощает вычисления *).
Пусть, например, надо вычислить интеграл
1= Г f e-^-y^dxdy,
где есть круг (10). Формула (9) дает:
/
е~ r2r dr dtp,
*) То обстоятельство, что определитель Остроградского г в центре круга
обращается в нуль, не мешает, как можно было бы показать, применимости
формулы (9).
548 ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ [гл. 27
где — прямоугольник В силу результатов
§ 117 поэтому
1= J | f re- r2 dr J dy = 2z J re- r2 dr —
0 G 0
= 2k [—-^-е-г2Ма = тс(1 —e-"2).
\ 2 ] |o v J
Пусть читатель попытается вычислить тот же интеграл в прямо-
угольных координатах и убедится, что на этом пути встают значи-
тельные трудности.
Дальнейшие упражнения см. в задачнике Б. П. Демидовича, от-
дел VIII, задачи 34—36, 39, 40, 47, 49, 51, 53, 54, 86, 87.
§ 119. Тройные интегралы
Как мы убедились на протяжении предшествующих параграфов,
переход от простых интегралов к двойным, несмотря на всю тесноту
имеющихся аналогий, все же вызвал по необходимости более деталь-
ное изучение областей интеграции — мы были вынуждены опираться
на общую теорию измерения плоских фигур. Построение такой тео-
рии, проведенное нами в § 114, потребовало некоторых усилий;
однако усилия эти щедро окупаются не только простотой и стро-
гостью последующего построения теории двойных интегралов; еще
значительнее тот факт, чго § 114 целиком и почти без всяких
изменений может быть перенесен на измерение множеств в прост-
ранстве любого числа измерений и что, следовательно, построен-
ная нами там теория может служить базой для интегралов любой
кратности.
Чтобы построить теорию измерения множеств в трехмерном про-
странстве, надо шаг за шагом проследить определения и выводы
§ 114; необходимые при этом изменения будут состоять в самооче-
видной замене сети прямых — сетью плоскостей, параллелограммов —
параллелепипедами, кругов — шарами и т. д.; в большинстве же своем
выводы § 114 сохраняются без всяких изменений.
Тройным интегралом
j* J j*/(х, у, z)dxdydz9
где —любое ограниченное измеримое множество трехмерного про-
странства, а /(х, у, z) — определенная в области функция, назы-
вают предел суммы
§ 119]
ТРОЙНЫЕ ИНТЕГРАЛЫ
549
распространенной на все ячейки некоторого разбиения Т области
где (£*, С*) — произвольная точка ячейки Д^; этот предел бе-
рется в предположении, чго наибольший диаметр ячеек разбие-
ния Т стремится к нулю и не должен зависеть ни от произво-
димых разбиений Т, ни от выбора точек (^, С*) в ячейках этих
разбиений.
Все содержание § 116 переносится на тройные интегралы без
всяких изменений. Практически вычисление (или оценка) тройного
интеграла чаще всего производится сведением тройной интеграции
к выполнению трех последовательных простых (одномерных) инте-
граций, аналогично тому, как мы имели это в § 117 для двойных
интегралов. Мы находим для областей достаточно простой формы
M1W Ф1(х, J)
jjj f(x> у, z)dx dydz=§ { J [ j* f(x> У* ?)dz]dyj dx. (1)
а <р8(дс)
Здесь внутренний интеграл берется по г, а х и у служат парамет-
рами; пределы этого интеграла представляют собой соответственно
нижнюю и верхнюю грани значений величины z в области при
заданных х и у; таким образом (стоящий в квадратных скобках)
внутренний интеграл есть некоторая функция от х и у; эта функция
далее интегрируется по у, причем х играет роль параметра; преде-
лами этой интеграции служат грани qpj (х) и (х) величины у
области при заданном значении х; результатом этой второй
интеграции служит некоторая функция от х (помещенная в фигур-
ных скобках); наконец (третья интеграция), эта функция интегри-
руется по х, причем пределами служат грани величины х во всей
области “У5. Разумеется, выбранный нами порядок интеграций мо-
жет быть заменен любым другим (с соответствующим изменением
пределов интегрирования), и этим произволом в выборе порядка
интеграций в каждом отдельном случае надлежит пользоваться
с целью наибольшего упрощения всей последовательности опе-
раций.
Если обозначить в правой части формулы (1) внутренний инте-
грал через Ф (х, у), то вся эта правая часть получит вид
Ь <рх (х)
]{ J
а ср2 (х)
dx,
что согласно § 117 равно
[ f Ф(х, У) dxdy,
550
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
где & — проекция пространственной области на плоскость XOY.
Таким образом, формула (1) дает:
Ф1 З')
у, z)dxdy J /(х, у, z)dz}dxdy. (2)
Фа (*».?)
Мы видим, что тройная интеграция может быть также сведена
к последовательному выполнению одной простой и одной двойной
интеграции.
Для того чтобы привыкнуть по геометрически заданной области
интеграции быстро определять пределы всех трех простых инте-
гралов правой части формулы (1), а также и для решения обратной
задачи — определения вида области по заданным пределам простых
интегралов — требуется довольно значительная практика. Поэтому
хорошие сборники задач по интегральному исчислению содер-
жат значительное число примеров этого рода, своеобразных в том
отношении, что для решения их не надо не только производить
каких-либо интеграций, но даже и знать вида подинтегральной
функции.
Наконец, для тройных интегралов имеет место и формула пре-
образования переменных, аналогичная формуле (8) § 118. Если пре-
образование
и = и(х, у, г), v = v(x, у, г), w = w(x, у, z) (3)
взаимно однозначно отображает область пространства xyz на
область б^/Эг пространства uvw, то при соблюдении обычных требо-
ваний непрерывности и условия мы имеем:
f(x> z)dxdydz =
x (и, v9 w), у (и, v, w), z (w, v, w) ] | J\ du dv dw,
где
dx dx dx
du dv dw
j D(x, v, z) dy dy dy
D (u, v, w) du dv dw
dz djr dz^
du dv dw
— определитель Остроградского преобразования
х = х(и, v, w)9 у=у(и, v, ш), z = z(u, v, w),
§ 120]
ПРИЛОЖЕНИЯ
551
обратного преобразованию (3). Вывод этой формулы (на котором мы
здесь останавливаться не можем) может быть проведен в тесной
аналогии с выводом формулы (8) § 118, если мы предварительно
убедимся, что в трехмерном случае (аналогично двумерному) абсо-
лютная величина определителя Остроградского получает геометри-
ческую интерпретацию как своеобразный «коэффициент расширения»
при преобразовании тел бесконечно малых размеров.
Как и в двумерном случае, одним из наиболее часто встречаю-
щихся типов преобразований переменных в тройном интеграле яв-
ляется переход от прямоугольных координат к сферическим:
где
0^г<^4“°°>
X = r COS 9 COS ф,
у = r cos^sintp,
z = г sin 9,
Тс I тс
0 ф 2 тс.
Мы легко находим:
I D (х, у, z) I
I & (П Ф) I
= r2 cos 9,
и формула преобразования получает вид
J^j* У* z)dxdydz =
/(г cos9 cos ф, г cos9 sin ф, rsin9)r2cos9^r^9flty.
Особенно удобным обычно бывает это преобразование в случае,
когда в первоначальном интеграле областью интеграции служит шар
х2 -|-J/2 •2'2 а*'>
в этом случае областью V*', очевидно, будет прямоугольный парал-
лелепипед 0 г а, —’ ~ 9 у , 0 ф 2тс.
Упражнения к § 119 см. в задачнике Б. П. Демидовича, отдел VIII,
задачи 148—150, 158, 159.
§ 120. Приложения
В этом параграфе мы кратко рассмотрим несколько приложений
двойных и тройных интегралов к вопросам геометрии и статики.
1. Площадь поверхности. Вопрос о величине площади того или
иного участка кривой поверхности средствами элементарной геомет-
рии решается лишь в немногих частных случаях. Общая постановка
задачи требует привлечения методов интегрального исчисления. Мы
652
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
увидим, что при решении этой задачи двойной интеграл призван
играть роль, аналогичную той, какую выполняет обыкновенный ин-
теграл при решении вопроса о длине дуги кривой линии (§ 52).
Пусть мы имеем участок кривой поверхности, пересекаемый не
более чем в одной точке любой прямой некоторого данного напра-
вления, которое мы примем за направление оси OZ. На этом участке
данная поверхность может тогда быть выражена уравнением вида *
z=f{x, у), (1)
где мы будем предполагать функцию /(х, у) непрерывной и имею-
щей непрерывные частные производные по х и у. Пусть проекция
данного участка поверхности (1) на плоскость XOY есть некоторая
измеримая фигура
Как мы знаем (§ 99), поверхность (1) при сделанных нами отно-
сительно функции /(х, у) допущениях имеет в каждой точке дан-
ного участка касательную плоскость и нормаль; если мы обозначим
через у острый угол, образуемый этой нормалью с осью OZ, то
cosy
1
(2)
Наша задача, как обычно в геометрических приложениях мате-
матического анализа, состоит прежде всего в том, чтобы определить
самое понятие площади участка кривой поверхности, а затем создать
инструмент для вычисления этой площади. С этой целью мы пред-
примем произвольное разбиение Т области & на ячейки, к которььм
мы будем предъявлять только обычные общие требования: каждая
ячейка должна быть измеримой фигурой и две различные ячейки
не должны иметь общих внутренних точек. В каждой ячейке Д^
выберем произвольную точку (£л, т^) и восставим в этой точке пер-
пендикуляр к плоскости XOY, который пересечет поверхность (1)
в точке Mk(lki Q, где qqj. В этой точке Mk проведем
к поверхности (1) касательную плоскость. Вб-лизи точки Mk течение
этой касательной плоскости близко к течению самой поверхности (1);
непосредственное наглядное представление говорит нам поэтому, что
если диаметр ячейки Дл очень мал, то мера sk проектирующегося
в ячейку Дл участка поверхности (1) должна быть очень близка
к мере проектирующегося в ту же ячейку участка проведенной
нами касательной плоскости. Суммируя это приближенное равенство
по всем ячейкам, мы приходим к заключению, что при малых диа-
метрах ячеек естественно считать меру (площадь) всего интересую-
щего нас участка поверхности (1) ^эта мера равна близкой
к сумме k
2S; (з)
k
§ 120]
ПРИЛОЖЕНИЯ
553
если поэтому эта последняя сумма при безгранично уменьшающихся
диаметрах ячеек с греми гея к некоторому пределу, то мы, естественно,
принимаем этот предел за меру (площадь) интересующего нас участка
поверхности (1).
Убедимся теперь, чго предел суммы (3) при безграничном мель-
чании разбиения Т в наших предположениях действительно всегда
существует независимо от предпринимаемых разбиений и от выбора
точек (^, в ячейках Дл. Вспомним с этой цел^ью, что предста-
вляет собой величина а/г. Мы произвольным образом выбрали
в ячейке Д* точку (^, ^), положили /(^, = и в точке
поверхности (1) провели касательную плоскость к этой
поверхности; ak означает меру того участка этой плоскости, проек-
цией которого на плоскость XOY служит ячейка Дл. Так как угол
между этими двумя плоскостями, очевидно, равен рассмотренному
нами выше углу у, то в силу общего правила, связывающего пло-
щадь проектируемой фигуры с площадью ее проекции *), мы должны
иметь:
ДА = oncost,
где угол у берется, разумеется, для точки Mk; отсюда в силу (2)
°*=ЕБГт = ъ)
и следовательно,
2 °*=2 Дй.
k k
л /
и в силу результатов § 116 вытекает поэтому, что рассма-
Но это есть сумма в точности того вида, какие мы рассматривали
в § 116; из сделанного нами допущения о непрерывности функций
д2.
дх
триваемая нами сумма при безграничном мельчании разбиения Т
имеет, своим пределом двойной интеграл
&
(4)
*) «Площадь проекции равна площади проектируемой фигуры, умножен-
ной на косинус угла между содержащими их плоскостями». Это правило
в элементарной геометрии доказывается для фигур, площадь которых может
быть определена в пределах этой науки. Мы же применяем это правило
к более общему случаю. В сущности, мы опираемся на следующее предло-
жение: «если проекция данной фигуры измерима, то измерима и сама эта
фигура, и мера проекции равна мере проектируемой фигуры, умноженной
на косинус угла между содержащими их плоскостями». Это общее правило
легко вытекает из вышеприведенного правила элементарной геометрии, но мы
не можем здесь подробнее останавливаться на этом вопросе.
554
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
который мы и должны в силу принятого нами определения считать
выражением площади S интересующего нас участка поверхности (1).
Из общей теории двойного интеграла (§ 116) следуют при этом все
необходимые требования независимости получаемого предела от эле-
ментов построения (т. е. от выбора разбиений Т и выбора точек
*)*) в ячейках).
Представляет интерес сопоставить формулу (4) с формулой
выражающей длину L дуги плоской кривой д/=/(х), заключенной
между х = а и х = Ь, и обратить внимание на далеко идущую ана-
логию этих формул.
Пример. Найти поверхность S шара радиуса а. Поместим
начало прямоугольной системы координат в центре шара, так что
верхняя полусфера будет выражаться уравнением
z = у/ а* — х2 — _у2;
за область & принимаем экваториальный круг х2-]-Фу2 = а2. Мы
легко находим:
dz __________х______ dz _____________у_____
_ у а2 — х2—у2 9 &У а2 — х2—у2 9
откуда
1+/^У+№У =___________а1___
~ \dxj '\dyj а2 — х2—у29
и формула (4) дает для площади полусферы:
S а ff
2 JJ
х2 + У2 а2
или, переходя к полярным координатам (х = г cosqp, y = r sinqp),
2тс a a
2 J J у a2 — r2 J у a2 —r2
0 0 0
S = 4tuz2
— формула, хорошо известная из элементарной геометрии.
Дальнейшие упражнения см. в задачнике Б.’ П. Демидовича, от-
дел VIII, задачи 107, 109, 110, 118.
§ 120]
ПРИЛОЖЕНИЯ
555
Установленное нами определение площади поверхности страдает
тем недостатком, что оно зависит от выбора системы координат
(т. е. от выбора той плоскости, на которую проектируется данный
участок поверхности). Можно было бы непосредственно показать,
что эта зависимость — только кажущаяся (т. е. что площадь остается
той же самой при любом другом направлении проектирования, лишь
бы каждая проектирующая прямая попрежнему пересекала данный
участок поверхности не более чем в одной точке); можно было бы
и заменить данное нами определение другим, более сложным, но
которое вообще не зависит уже ни от каких элементов произвола.
Однако оба пути слишком сложны, чтобы мы могли здесь на них
остановиться.
Если тот участок, площадь которого мы хотим найти, ни при
каком выборе координатных осей не позволяет выразить одну из
координат в виде однозначной функции двух других (такова, на-
пример, всякая замкнутая поверхность), то часто удается разбить
этот участок на конечное число частей так, чтобы для каждой
части такое выражение было возможно (при этом, вообще говоря,
направление проектирования приходится выбирать различным для
различных участков). В этом случае мы полагаем площадь всего
данного участка равной сумме площадей составляющих его «про-
стейших» частей.
2. Интегралы, распространенные на участок поверхности.
В § 52 мы, установивши определение длины дуги кривой, ввели
понятие «интеграла, распространенного на данный участок кривой».
Аналогичным образом можно, установив определение площади
участка кривой поверхности, ввести понятие «двойного интеграла,
распространенного на данный участок поверхности», представляющее
собой естественное обобщение обычного двойного интеграла, рас-
пространенного на ту или другую плоскую область.
Пусть <3— участок поверхности того типа, который мы рас-
сматривали в конце п. 1, и пусть F(x, у, z)— функция, непре-
рывная в некоторой пространственной области, содержащей внутри
себя участок 3?. Разобьем участок 3? произвольным образом на части
(«ячейки»), каждая из которых имеет определенную площадь,
и выберем в каждой ячейке ak произвольную точку (xki yki zk).
Если сумма
k
при безграничном мельчании дробления (т. е. когда наибольший из
диаметров ячеек стремится к нулю) стремится к определенному пре-
делу и если этот предел не зависит ни от предпринимаемых раз-
биений участка 3\ ни от выбора точек (хЛ, yk, zk), то мы называем
этот предел двойным интегралом функции F(x,y,z),
556
ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ
[гл. 27
распространенным на данный участок данной по-
верхности, и обозначаем его через
F(x, у, z)d<3.
Введенное таким образом понятие находит себе много прило-
жений, аналогичных тем, в которых применяется интеграл, распро-
страненный на данный участок кривой. В § 54 мы с помощью
такого интеграла выразили массу материализованной кривой, плот-
ность которой известна в каждой ее точке. Совершенно аналогичным
образом решаются задачи о массе, электрическом заряде и т. п.
для материализованного участка поверхности. Рассмотрим, например,
заряженный электричеством проводник, заряд которого распределен
по его поверхности с (поверхностной) плотностью р(х, yf z). Тогда,
как читатель без затруднений убедится самостоятельно, на участок
этой поверхности будет приходиться заряд, равный
j* J Р {х, у, z) dt.
3. Масса неоднородного тела. В качестве простейшего примера
применения тройного интеграла рассмотрим вопрос об определении
массы неоднородного физического тела по его плотности. Если
данное тело однородно, . т. е. плотность его р одна и та же во
всех точках, то масса М тела равна произведению плотности р на
объем V тела. Если тело неоднородно, то плотность его р = р (х, _у, z)
различна в различных его точках. Разобьем данное тело произ-
вольным образом на ячейки, и пусть d(T)— наибольший диаметр
ячейки при данном разбиении Г. Возьмем какую-нибудь ячейку Д^
и выберем в ней произвольную точку *t\k, Сл). Мы предположим,
что функция р (х, у, z) непрерывна в пределах данного тела. Если
тогда диаметр ячейки ДА очень мал, то значения плотности р в раз-
личных точках будут очень близки друг к другу, и в частности
близки к р (Вл, 7^, СД Естественно поэтому считать, что масса ячей-
ки будет близка к той массе, которую она имела бы, если бы она
была однородной с плотностью р (£л, r\ki т. е. близка к величине
?(£*> Qa*;
масса же всего тела должна быть близкой к сумме
k
распространенной на все ячейки тела. Но, как мы видели в § 119,
эта сумма при б/(Г)->0 стремится к определенному пределу, кото-
рый мы обозначили через
Р (-£> У> г) dx dy dz,
§ 120] приложения 557
где —область трехмерного пространства, занимаемая данным
телом. Этот предел мы и принимаем, естественно, как выражение
массы М данного тела:
Л4 = Р г) dx йУ dz-
4. Координаты центра, тяжести и моменты инерции тела.
Аппарат двойного интегрирования позволяет легко решить задачу
определения координат центра тяжести и моментов инерции для
плоских пластинок, а аппарат тройного интегрирования — для про-
странственных тел. Мы ограничимся рассмотрением случая про-
странственного тела, так как для плоских пластинок все рассуж-
дения и все результаты полностью аналогичны тем, какие мы будем
иметь в трехмерном случае.
Мы снова разобьем тело на ячейки с малыми диаметрами и
в каждой ячейке Дй выберем произвольную точку r\ki СД Если
мы заменим каждую ячейку Дй материальной точкой с массой
•*!*>
помещенной в точке ($*, СД то данное тело заменится системой
конечного числа материальных точек, по своим статическим свой-
ствам близкой к этому телу. Но для такой системы материальных
точек координаты центра тяжести будут:
2 Р 2i T^f
k’ . k Ji
k k k
Поэтому в качестве координат центра тяжести данного тела мы,
естественно, принимаем пределы х, у, z этих трех выражений при
rf(7“)->0, соответственно равные
I I I x p (x, y, z) dx dy dz
__ w___________________________________
J* J J P У* dx dy dz
J J J 2 P -У» 2) dx dy dz
I I I P (*> У> z) dx dy dz
У Р (*, У* z) dx dy dz
J j* J P -У» dx dy
x=i№xpdxdydz’ y==^
558 ДВОЙНЫЕ И ТРОЙНЫЕ ИНТЕГРАЛЫ [гл. 27
или, обозначая через М массу данного тела,
Jур dx dy dz,
~z=irS^z?dxdydz
(где для краткости мы под интегралами пишем р вместо р (х, у, г)).
В частности, если данное тело однородно (г. е. р постоянно в пре-
делах тела), то Af = pV, и
х = -~г у У У х dx dy dz, у '= у У у у dx dy dz,
^V^^dxdydz.
Переходя теперь к моментам инерции данного тела, мы снова
сначала заменим его в порядке приближения вышеописанной систе-
мой из конечного числа материальных точек. Для такой системы
момент инерции относительно плоскости XOY будет:
k
и аналогично для двух других координатных плоскостей. Момент
инерции относительно оси ОХ будет:
k
и аналогично для двух других координатных осей. Наконец, момент
инерции приближенной системы относительно начала координат О
будет:
+ + ’lb С*)Дь
k
Рассуждая в точности, как при определении координат центра
тяжести, мы находим, что момент инерции данного тела относи-
тельно плоскости XOY равен
Мху — j* j* j* z3p (x, у, г) dx dy dz
и аналогично для двух других координатных плоскостей. Подобным
§ 120] приложения 559
же образом момент инерции данного тела относительно оси ОХ
равен
Мх = f f f С2*+•?*)₽(•*, У> z)dxdydz.
Наконец, относительно начала координат О момент инерции
данного тела будет:
мо= J j J (х2+j2 + г2) р (х, у, z) dx dy dz.
Упражнения см. в задачнике Б. П. Демидовича, отдел VIII,
задачи 191, 193, 200, 201.
ГЛАВА 28
КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
§ 121. Определение плоского криволинейного интеграла
В главе 26 мы изучали интегралы вида
ь
y)dx,
а
где переменная у играет роль параметра, т. е. сохраняет при
интеграции постоянное значение. Непосредственным обобщением
этой роли переменной у будет тот случай, когда в пределах инте-
грации (т. е. при а^х^Ь) величина у задается как некоторая
функция от х, j/ = <p(x), так что подинтегральная функция при-
нимает вид /[х, 9(х)]. Если, как мы будем предполагать, функции
/(х, у) и 9(х) непрерывны в соответствующих областях, то и
функция /[х, ср (х)] непрерывна в отрезке а^х^Ь и существо-
вание интеграла
ь
J/k, ^{x)]dx (1)
а
не вызывает сомнений.
Обозначим соответственно через А и В начальную и конечную
точки кривой у = ср(х) в отрезке (а, Ь) (черт. 80). Тогда интеграл (1)
называют криволинейным интегралом функции f(х, у),
взятым по х на криволинейном участке АВ, и обозна-
чают так:
J/k, y)dx’, (2)
АВ
это обозначение надо понимать именно так, что у должно быть
заменено той функцией от х, графиком которой служит криволи-
нейный участок АВ. В частности, если у при интеграции сохраняет
постоянное значение _у0 (случай интеграла, зависящего от пара-
метра), то интеграл (2) берегся по прямолинейному участку
§ 121] ОПРЕДЕЛЕНИЕ ПЛОСКОГО КРИВОЛИНЕЙНОГО ИНТЕГРАЛА 561
У=Уь (fl ^х^ Ь) и точки А и В соответственно имеют коорди-
наты (a, _у0) и (Ь, yj.
Введенное, таким образом, понятие криволинейного интеграла
по участку плоской кривой не содержит в себе, очевидно, ничего
нового, если не считать принятого нами соглашения обозначать
интеграл (1) символом (2). Заметим еще, что в этом обозначении
существенным является направление (от А к В), в котором про-
бегается кривая АВ; в самом деле, мы имеем по определению
символа (2)
а Ъ
J/U, y)dx= § f[x, cp(x)]dx = — j f [х, ср (х)] dx =*
BA b a
= — С/(-V, y)dx,
AB
т. e. при изменении направления кривой, вдоль которой берется
интеграл, он меняет знак на обратный.
Это первоначальное определение криволинейного интеграла
очень ограничено в своих применениях, так как на участок АВ
налагается весьма стеснительное требова-
ние— на его протяжении у должно быть
однозначной функцией от х (или, выра-
жаясь геометрически, любая прямая, парал-
лельная оси OY, должна пересекать этот
участок не более чем в одной точке). В
приложениях часто приходится вести инте-
грацию по участкам более сложной формы;
в частности, для многих вопросов механики — -
и физики важно уметь интегрировать по
простейшим замкнутым кривым, заведомо Черт. 80.
не удовлетворяющим условиям рассмотрен-
ного простейшего случая. Мы должны поэтому обратиться к отыска-
нию такого аналитического инструмента, который позволил бы нам
распространить понятие криволинейного интеграла на более широ-
кий класс случаев.
Вернемся с этой целью к рассмотренному нами простейшему
случаю и предположим, что функция ф(х), графиком которой
служит криволинейный участок АВ, не только непрерывна в от-
резке (а, Ь), но и имеет в нем непрерывную производную. Разобьем
дугу АВ на части («ячейки») с помощью точек деления ..., Ап
и обозначим через kk длину участка Ak^Ak данной кривой. Мы
знаем (§ 52), что может быть выражена интегралом
> ____________
h = J /1 + ф’4
36 А. Я. Хинчин
562 криволинейные интегралы [гл. 28
где xk^ и xk означают соответственно абсциссы точек Ak_x и Ak
кривой АВ. По теореме о среднем значении мы можем написать
(3)
где Lk — xk— xk_lf a — некоторая точка отрезка (xk_lt xk).
Заметим еще, что так как </(£*) есть тангенс угла ал, образуемого
касательной к кривой АВ в точке x = lk с положительным направ-
лением оси ОХ, то
1 Ц- (tk) = sec2 —
I Т \ к COS2
и соотношение (3) дает:
Xftcosat = AA,
где мы должны считать cosa^^>0, что равносильно соглашению
подразумевать под ал острый угол между касательной и осью ОХ
(или, что то же, направлять касательную в сторону возрастающих х).
Такой выбор направления касательной необходим, если мы хотим,
чтобы Х^соза^ и по знаку совпадало с Дл, так как при сделанном
нами предположении а b мы имеем Дл = xk — xk^ 0. Если бы мы
имели а^>Ь, то для любого k было бы Д*<^0, а значит, сохране-
ние соотношения Хд,со8ал = ДА требует, чтобы было cos ал<^0; угол
ал в этом случае пришлось бы брать тупым, т. е. выбирать на
касательной направление в сторону убывающих х. Таким образом,
во всех случаях направление касательной должно быть выбрано
в соответствии с движением по кривой от А к В, независимо от
того, происходит ли это движение слева направо или справа налево.
Составим теперь распространенную на все ячейки сумму
2/cosaA • ХА = ’’I*) Лл> (4)
k k
где в каждом члене — ср ($Л). Будем делать наше разбиение уча-
стка АВ все более мелким, заставляя наибольшую из длин (а зна-
чит, и подавно — наибольшую из длин Д*) стремиться к нулю. Так как
функция f[x, ф(х)] в силу принятых нами допущений непрерывна
в отрезке (а, Ь), то правая часть равенства (4) будет при этом
иметь пределом интеграл
ь
?(*)] dx,
а
который мы условились обозначать через
f/(x, y)dx
АВ
§ 121] ОПРЕДЕЛЕНИЕ ПЛОСКОГО КРИВОЛИНЕЙНОГО ИНТЕГРАЛА 563
и называть криволинейным интегралом функции /(х, у), взятым
вдоль кривой АВ. К этому же пределу стремится, следовательно,
и левая часть равенства (4), т. е. мы имеем:
Г fix, y)dx = \im cosa* (5)
AB k
Если мы условимся обозначать вообще через a = a(x, у) угол,
образуемый касательной в точке (х, у) кривюй АВ с положительным
направлением оси ОХ, то мы будем иметь a% = a(^, т^); сумма
в правой части равенства (5) тогда может быть написана в виде
7i*)c°sa(^>
k k
где F[x, 9(x)]=/[x, ?(x)] cosa [x, qp (x)] — непрерывная функция
от x в отрезке (a, Ь). Но кривая y = q(x) на отрезке (а, Ь)
спрямляема в силу сделанного нами предположения о непрерывности
производной ф'(х); а для спрямляемых кривых сумма вида
k
где (Sfc, — любая точка участка Х^, стремится при безграничном
мельчании дробления к определенному пределу (§ 52), который мы
условились обозначать через
f F(x, y)dX
АВ
и называть интегралом функции F(x, у), взятым вдоль кривой АВ.
Таким образом, в нашем случае
Я? (U1 cosa ф0J] 'кк -> J* f(x, у) cosa (х, у) dl.
k АВ
Сопоставляя же это с соотношением (5), мы находим:
Г f (•*, У) dx = f / (х, у) cos а (х, у) d\. (6)
АВ АВ
В этом равенстве левая часть есть криволинейный интеграл, рас-
пространенный на участок АВ, в том смысле, как мы его определили
в начале настоящего параграфа; правая же часть представляет собой
«интеграл вдоль кривой ЛВ», как мы его определяли в § 52. Это
последнее определение принципиально отличается от первого, так
как оно конструктивно, в нем интеграл определяется прямо как
564 криволинейные интегралы [гл. 28
результат определенной конструкции, как предел сумм определен-
ного вида. Мы можем, таким образом, смотреть на соотношение (6)
как на новое, конструктивное определение криволинейного интеграла.
Заметим еще, что а(х, у) здесь означает угол, образуемый с поло-
жительным направлением оси ОХ касательной к кривой АВ в точке
(х, у), проведенной в том направлении, которое соответствует
движению от Л к В (т. е. cosa(x, j/)^>0 при а<^Ь и cos а (х, j/)<^0
при а^>Ь).
Пока все это касается лишь простейшего случая, когда данная
кривая может быть на участке АВ выражена уравнением вида
j/ = cp(x). Если это не так, то интеграл в левой части равенства (6)
не имеет смысла, так как на кривой АВ одному значению х соот-
ветствует, вообще говоря, несколько
значений у. Однако дело обстоит
иначе с интегралом в правой части
) этого равенства. То конструктивное
/ I — определение, которое мы дали этому
Д интегралу в § 52, не зависит от воз-
fr / ] можности представления кривой АВ
( уравнением вида j/ = cp(x); оно без
/ всяких изменений сохраняет силу и в
более общих условиях, в частности —
для любой «гладкой» кривой АВ, В
таких более общих случаях направле-
Черт. 81. ние от А к В, в котором мы проходим
данную кривую, вообще говоря, уже не
будет всегда направлением слева направо (или всегда справа налево);
на разных участках кривой АВ эго направление может быть раз-
личным (черт. 81), так что угол а(х, у) будет то острым, то тупым,
и соответственно cosa(x, у) — то положительным, то отрицательным.
Разумеется, в подинтегральной функции правой части равенства (6)
мы при этом попрежнему для определения угла а в каждой точке
проводим касательную в направлении движения от А к В,
Эти соображения, естественно, приводят к мысли определять
криволинейный интеграл
/(х, у) dx
ав
с помощью равенства (6) во всех тех случаях, когда интеграл,
стоящий в правой части этого равенства, существует; мы только
что указали, что такое расширение понятия криволинейного инте-
грала позволяет интегрировать по более широкому классу кривых;
в частности, этот расширенный класс охватывает собой и простейшие
замкнутые кривые — окружность, эллипс и т. п.
Принимая общее определение криволинейного интеграла с помощью
формулы (6), мы как будто отождествляем понятие криволинейного
§ 121] ОПРЕДЕЛЕНИЕ ПЛОСКОГО КРИВОЛИНЕЙНОГО ИНТЕГРАЛА 565
интеграла с понятием некоторого «интеграла вдоль спрямляемой
кривой ЛВ», установленным нами в § 52. Однако это все же не
совсем так. Дело в том, что в нашем прежнем определении инте-
грала
F (х, у) d\,
взятого вдоль спрямляемой кривой #, подинтегральная функция
должна была зависеть только от точки (х, у) кривой у нас же
в правой части формулы (6) подинтегральная функция f (х, у) cos а (х, у),
кроме х и у, существенным образом зависит еще и от направления,
выбираемого нами на касательной к кривой АВ в точке (х, у). При
изменении этого направления cosa(x, у), а следовательно, и вся
подинтегральная функция, меняет знак. Определенный нами прежде
«интеграл вдоль кривой #» не зависел от того, в каком направ-
лении проходится эта кривая; в сущности, выбор этого направления
не имел для такого интеграла, по самому его определению, никакого
смысла^ Совершенно иначе обстоит дело для интеграла в правой
части формулы (6). Установив на кривой АВ определенное направ-
ление, например от Л к В, мы тем самым устанавливаем и опреде-
ленное направление на касательной к этой кривой в каждой ее
точке; тем самым cosa(x, у), а значит, и вся подинтегральная
функция, получает уже в точке (х, у) совершенно определенное
значение, и наш интеграл становится «интегралом вдоль кривой АВ».
Если мы изменим направление на кривой АВ, то подинтегральная
функция изменит знак в каждой точке, а потому изменит знак и
весь интеграл. Таким образом, для криволинейного интеграла
J/(х, у) dx = — J/(х, у) dx,
ВА АВ
и причина этого различия знаков, как мы видим, заключается в том,
что формула (6) определяет J fdx и j* fdx с помощью двух раз-
АВ ВА
личных «интегралов вдоль кривой АВ».
И в криволинейных интегралах ту кривую, по которой ведется
интеграция, часто обозначают одной буквой, например но такое
обозначение не указывает нам направления, выбранного на этой
кривой, и в таких случаях это направление всегда должно быть
особо оговорено, без чего интеграл не имеет определенного смысла.
Впрочем, если кривая имеет концы А и В, то все же чаще
обозначают ее через АВ или ВА, соответственно выбираемому
направлению. Если же кривая # замкнута и концов не имеет, то
в простейших случаях она делит плоскость на две части — внутреннюю
И внешнюю. В этих случаях принято называть прямым такой
566
КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
[гл. 28
обход кривой #, при котором внутренняя часть все время остается
влево от пути, и обратным — обход в противоположном направ-
лении. Если криволинейный интеграл обозначен через
J F (х, у) dx,
i
где — замкнутая кривая, то при отсутствии указаний на направ-
ление обхода принято всегда считать, что имеется в виду прямой
обход этой кривой; этого правила и мы будем держаться в даль-
нейшем.
Само собой разумеется, что все, сказанное нами в этом пара-
графе по поводу интегралов вида
f /(х, y)dx,
АВ
переносится без всяких изменений на интегралы вида
> У) dy.
АВ
Если участок АВ, по которому берется интеграл, может быть вы-
ражен уравнением вида
то мы полагаем по определению
d
(X, y)dy=$ / [ф (у), .у] dy.
АВ с
Аналогично формуле (6) мы доказываем затем, что в этом «про-
стейшем» случае
J / (х, у) dy = J / (х, у) sin a dk (7)
АВ АВ
(так как для острого угла 0, образуемого касательной к кривой
АВ с осью OY, очевидно, cos 0 = sin а), и принимаем эту формулу
в качестве определения ее левой части всякий раз, когда ее правая
часть имеет смысл. При этом, разумеется, направление касательной
(а следовательно, и знак sin а) в каждой точке выбирается в соот-
ветствии с направлением, принятым на самой кривой АВ,
В приложениях часто приходится иметь дело с суммами вида
f Р(х, y)dx-\- j* Q(x, y)dy,
ДВ AB
§ 122] РАБОТА ПЛОСКОГО силового ПОЛЯ 567
слагаемые которых отличаются друг от друга как подинтеграль-
ными функциями, так и переменными интеграции, но берутся вдоль
одной и той же кривой АВ. Такую сумму принято записывать в
виде
j* [Р (•*» У) dx + Q (X, у) dy],
или, еще короче,
§ (Pdx-]-Qdy).
g
В силу формул (6) и (7) мы при этом имеем:
j* (Pdx-^- Q dy) = J (Pcos a-j- Qsina)^. (8)
Упражнения к § 121 см. в задачнике Б. П. Демидовича, от-
дел VIII, задачи 293, 295, 299.
§ 122» Работа плоского силового поля
Криволинейные интегралы имеют большое число приложений в
геометрии, физике и технике. Прежде чем итти дальше, мы рас-
смотрим теперь в качестве примера одно из важнейших .и вместе
с тем наиболее типичных приложений этого рода.
В § 45 мы уже рассматривали вопрос о работе переменной
силы в случае прямолинейного движения материальной точки; теперь
мы рассмотрим ту же задачу в предположении, что точка движется
вдоль некоторой плоской кривой.
Пусть на материальную точку, находящуюся в некотором месте
(х, У) данной плоскости, действует сила F, величина и направле-
ние которой однозначно определяются координатами х и у того
места, в котором помещена данная материальная точка. Таким
образом, с каждой точкой плоскости (или некоторой ее части)
связан определенный вектор F, выражающий собой силу, кото-
рая действует на находящуюся в данном месте материальную точ-
ку. Совокупность таких векторов называют плоским силовым
полем, определенным в данной ~ плоскости (или некоторой ее
части).
Пусть теперь материальная точка проходит участок АВ неко-
торой гладкой кривой в плоскости, в которой задано силовое поле F.
Мы ставим себе задачу найти работу, производимую при этом пере-
мещении силами данного поля. Для определения силового поля
удобнее всего задать вектор силы F его компонентами Р(х, у) и
Q(x, у) по направлению осей ОХ и ОУ; эти две функции мы
568 криволинейные интегралы [гл. 28
будем считать непрерывными в некоторой области, содержащей
внутри себя кривую АВ.
Разобьем путь АВ материальной точки на малые участки
(ячейки) Хп Х2, Уп и выберем в каждой ячейке произвольную
точку Ak (xk, yk). Обозначим через Fk вектор силы, действующей
в точке Afe, и через |Ffe| — абсолютную величину этого вектора.
Пусть, далее, c?k означает угол, образуемый вектором Fk с каса-
тельной к кривой АВ в точке Aki направленной в сторону движе-
ния (или, что то же, с вектором скорости движущейся точки в
точке Afe). Если бы участок имея ту же длину, был прямоли-
нейным и имел направление только что упомянутой касательной,
а действующая на протяжении этого участка сила была на нем по-
стоянной и выражалась вектором Fk, то работа такой силы при
прохождении точкой участка по правилам элементарной физики
была бы равна произведению
I Fk ! cos?* • X*.
Если ячейка \k мала, а вектор F и направление касательной к кри-
вой АВ с изменением положения точки меняются непрерывно, то
это произведение может служить приближённым выражением ра-
боты сил поля при перемещении движущейся точки вдоль ячейки Xfe.
А так как мы, естественно, считаем, что работа поля на всей кри-
вой АВ равна сумме его «элементарных» работ на отдельных
ячейках, то для величины этой полной работы мы получаем в ка-
честве приближенного значения сумму
п
\Fk |cosq?A • Хл>
причем приближение будет тем более точным, чем меньше размеры
(диаметры) ячеек Xfe. Мы знаем (§ 52), что при безграничном мель-
чании разбиения участка АВ эта сумма стремится к определенному
пределу, не зависящему ни от производимых разбиений, ни от вы-
бора точек (xk, yk) в ячейках; этот предел мы, естественно, и будем
считать точным выражением искомой работы поля на всем участке АВ
данной кривой. Предел такой суммы при этих условиях мы согла-
сились обозначать через
J |F| cos^pflfX,
АВ
где | F | cos ф означает проекцию вектора силы, действующей в точке
(х, у) кривой АВ, на направление пути в этой точке. Но по пра-
вилам векторной алгебры проекция вектора на любое направление
равна сумме проекций его компонент на то же направление; поэтому
если мы обозначим через а = а(х, у) угол, образуемый с положи-
§ 123]
ФОРМУЛА ГРИНА
569
тельным направлением оси ОХ вектором скорости движущейся точки
в точке (х, у), то мы буде^ иметь:
|F|cos? = P(x, y)cosa-|- Q(x, y)sina,
что дает для работы поля на участке АВ выражение
или, в силу формулы (8) § 121,
чем поставленная задача и решается полностью. Мы видим при этом,
что связанные с этой задачей физические представления находят
себе четкую математическую формализацию именно в терминах уста-
новленного нами общего понятия криволинейного интеграла.
§ 123. Формула Грина
В приложениях играют особо важную роль криволинейные ин-
тегралы, берущиеся вдоль замкнутых кривых; в настоящем и сле-
дующем параграфах мы специально займемся такими интегралами.
При этом в качестве путей интеграции мы будем рассматривать
только гладкие кривые, не пересекающие самих себя; такая- кришя1,,
как мы уже заметили, всегда делит плоскость на две части»—внеш-
нюю и внутреннюю. Обозначая такой контур через <5?, мы. под ин*
тегралом
(Pdx-[- Q dy),
как это было нами принято выше, всегда будем понимать интеграл*
в котором кривая X обходится в «прямом» направлении, т. е. так,,
чтобы внутренняя часть плоскости все время оставалась влево от.
линии движения (черт. 82). Противоположное направление обхода:
мы будем называть «обратным». _
Рассмотрим в плоскости XOY область &, ограниченную сверху*
и снизу соответственно кривыми у=^х(х) и j/=93(x), а с боков —
прямыми х = а и х = Ь (черт. 83). В частности, эти две прямые
(или одна из них) могут стягиваться в точки, так что кривые
у = ух(х) и у = ^(х) смыкаются при х = а и х = Ь\ функции
9, (х) и (х) мы будем предполагать непрерывными в отрезке (а, Ь).
Пусть Р(х, у) — функция, непрерывная и обладающая непрерывными
570
КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
[гл. 28
частными производными внутри и на границе области Мы знаем
из предыдущей главы, что
при этих условиях двойной интеграл
существует и может быть
ь
представлен в виде
<₽i С*)
а <р2(х)
Внутренняя интеграция (по у) здесь, как обычно, ведется в предпо-
ложении, что х сохраняет постоянное значение; но в таком случае,
очевидно,
«pit»
f дР (х, у)
J ду
dy — P [х, ф, (х)] — Р [х, фа (х)],
<₽2(*)
и мы находим:
ь
b
J J ^~dxdy==§ p^x> j plx> %
a a
Каждый из интегралов правой части представляет собой, согласно
первоначальному определению § 121, криволинейный интеграл функ-
ции Р(х, у); первый берется вдоль участка DC кривой y = cpt(x),
а второй — вдоль участка АВ кривой у = ^(х). Мы можем поэтому
записать
f J "Зу йх^У — J ? (х> ^dx — § Р (х, у) dx =
DC АВ
=— f Р(х, y)dx— j* Р(х, y)dx-
QD АВ
(1)
§ 123]
ФОРМУЛА ГРИНА
571
Заметим теперь, что интеграция функции Р(х, у) по х вдоль лю-
бого из прямолинейных участков AD и ВС (в любом направлении)
дает нуль; в самом деле, интегралы вдоль этих участков не могут
быть определены в первоначальном смысле § 121, так как вдоль
этих участков у не является однозначной функцией от х; но рас-
ширенное определение § 121 к ним вполне применимо и дает для
обоих интегралов значение нуль, так как, очевидно, cosa = 0 на
всем протяжении каждого из этих участков.
Учитывая это, мы можем переписать формулу (1) в виде
JJ —J Pdx— ^Pdx— § Р dx— ( Pdxt
AB BC CD DA
или
J J ^-axdy=— f P(x,y)dx, (2)
& X
где- X— контур области проходимый соответственно нашему
общему соглашению в прямом направлении.
Представим себе теперь, что во всем предшествующем перемен-
ные х и у обменялись ролями; вместо формы черт. 83 область &
должна тогда иметь форму, изображенную на черт. 84. Пусть
Q(x, у) — функция, непрерывная и обладающая непрерывными част-
ными производными в этой новой области &. Пусть читатель, про-
ведя все расчеты в полной аналогии с
теми, которые мы только что проделали,
самостоятельно убедится, что таким обра-
зом мы приходим к соотношению
Г
d
dxdy = § Q (х, у) dy, (3)
аналогичному соотношению (2), но отли-
чающемуся от него знаком правой части. —-------—-------------
Это отличие, на первый взгляд могущее °
показаться странным, обусловлено тем, Черт. 84.
что при выборе определенного направ-
ления обхода замкнутых кривых взаимное расположение координат-
ных осей теряет свою симметрию; продвигаясь в прямом направле-
нии вдоль окружности с центром в начале координат (черт. 85),
мы, чтобы перейти от положительного направления оси ОХ к поло-
жительному направлению оси OY, должны описать дугу в 90°,
тогда как обратный переход требует прохождения дуги в 270°
(или дуги в 90° в обратном направлении).
572
КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
[гл. 28
Пусть теперь область имеет форму, отвечающую усло-
виям как черт. 83, так и черт. 84 (этому требованию удовлетво-
ряет любой круг, эллипс, прямоугольник, а также любая фигура
более общего типа, изображенная на черт. 86). Если тогда
Черт. 86.
Р(х, У)> Q(x> У)— функции, непрерывные и обладающие непре-
рывными частными производными внутри и на границе области
то имеют место оба соотношения (2) и (3).
Вычитая (2) из (3) почленно, мы находим:
<~-\dxdy = J (Pdx-\-Qdy).
(4)
Это чрезвычайно важное соотношение, устанавливающее связь
между некоторым двойным и некоторым криволинейным интегралом
и имеющее очень большое число прило-
имеет место для каждой
жений, называют обычно формулой
Грина. Мы доказали эту формулу для
областей несколько специального вида.
Однако формула Грина легко может быть
распространена и на значительно бо-
лее широкий класс областей. В самом
деле, рассмотрим какую-либо ограничен-
ную простым (гладким и не пересекаю-
щим самого себя) контуром область &
(черт. 87) и проведем гладкую кривую
делящую эту область на две области &\
и Допустим, что формула Грина (4)
из областей , и Выпишем эту фор-
мулу для этих двух областей и сложим почленно две написанные
формулы. Тогда в левой части мы получим двойной интеграл
§ 123]
ФОРМУЛА ГРИНА
573
в правой же части мы будем иметь сумму двух криволинейных ин-
тегралов, взятых соответственно вдоль контуров областей 37t и ^2
в прямом направлении. Стрелки на черт. 87 показывают, что кри-
вая £ в этих двух интегралах проходится в противоположных на-
правлениях, вследствие чего соответствующие части интегралов
взаимно уничтожаются; остающиеся же части интегралов, очевидно,
дают в сумме один интеграл, взятый в прямом направлении вдоль
контура 3? области мы убеждаемся, таким образом, что если
формула Грина имеет место для областей 37 Y и ^2, то она спра-
ведлива и для области . Повторяя это рассуждени’е, мы легко'
видим, что этот результат остается в силе и в том случае, если
область 37 разбивается проведенными кривыми на любое числом
областей, для каждой из которых имеет место формула Грина..
В частности, следовательно, эта формула справедлива не только*
для областей специального вида, для кото-
рых мы ее первоначально доказали, но и
для всякой области, которая проведением
надлежащих кривых может быть разбита на
конечное число областей этого вида. А это
дает, как легко видеть, уже очень широ-
кий класс плоских областей. В частности,
формула Грина может иметь место и для
так называемой «многосвязной» области, об-
ладающей «дырами» (черт. 88), т. е. огра-
ниченной не одной, а несколькими замкну-
тыми кривыми, если такая область представ-
ляет собой сумму областей рассмотренного
Черт. 88.
нами выше простого >
типа. Криволинейный интеграл в правой части формулы Грина пред-
ставляется в этом случае как сумма интегралов по внешнему кон-
туру области 37 и контурам всех «дыр», причем каждый из этих:
контуров проходится в прямом направлении, т. е. так, чтобы область 3>
все, время оставалась по левую сторону линии обхода.
Наконец, можно было бы доказать, чго формула Грина приме-
нима и к любой области, ограниченной гладкой замкнутой кривой.
Для этого сначала надо показать, чго область, ограниченная, много-
угольником (ломаным контуром), всегда является суммой областей}
рассмотренного нами выше простейшего типа, так чго формула
Грина применима к любому многоугольнику. После этого мы впи-
сываем в данный гладкий контур ^многоугольник с весьма малыми
сторонами, применяем к нему формулу Грина и, заставляя длины
сторон многоугольника безгранично убывать, показываем предель-
ном переходом, что соотношение, выражаемое формулой Грина,,
остается в силе и для данной области, ограниченной гладким кон-
туром. На деталях доказательства мы здесь останавливаться не можем..
w Упражнения к § 123 см. в задачнике Б. П. Демидовича, от-
дел VIII, задачи 341, 342.
574
КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
[гл. 28
§ 124. Применение к дифференциалам функций
двух переменных
Независимо от своего значения для многих вопросов физики
формула Грина оказывается полезной и при решении ряда задач
самого математического анализа. Одно из важнейших ее приложе-
ний этого рода мы рассмотрим в настоящем параграфе.
Пусть Р(х, у) и Q (х, у) снова означают две функции, непре-
рывные и обладающие непрерывными частными производными в не-
которой области & плоскости ху. Чтобы не осложнять изложения
деталями, не относящимися к существу дела, мы во всем дальней-
шем допустим, что как область &, так и все другие области,
с которыми мы встретимся в настоящем параграфе, представляют
собой открытые (т. е. состоящие только из внутренних точек)
области, односвязные (т. е. лишенные «дыр») и ограниченные про-
стыми (не пересекающими самих себя) гладкими контурами.
Мы знаем (§ 90), что если выражение
Р(х, y)dx-\-Q(x, y)dy (1)
служит в области & дифференциалом некоторой функции F(x, у),
то всюду в этой области
ftp 3F
/>(*, J) = £, = (2)
обратно, из соотношений (2) в силу предположенной непрерыв-
ности функций Р и Q следует, что функция F (х, у) имеет в
области & дифференциал, выражающийся формулой (1). Естественно,
что для ряда вопросов анализа представляет существенный интерес
иметь критерий, позволяющий судить, будет ли выражение (1) в
данной области дифференциалом некоторой функции двух перемен-
ных или нет. Мы теперь увидим, что с помощью формулы Грина
легко установить очень простое необходимое и достаточное для
этой цели условие, которому должны удовлетворять функции Р и Q;
точнее говоря, мы выведем даже не одно, а три таких необходимых
и достаточных условия (разумеется, равносильных между собой, но
выражающихся в разных терминах).
Теорема. Каждое из четырех утверждений:
1° выражение Pdx-\-Qdy есть в области & дифференциал
некоторой функции F(x, у);
2° в области & всюду 4~" —
оу ох
3° криволинейный интеграл
§(Pdx + Qdy),
взятый по любой замкнутой гладкой кривой, лежащей целиком
внутри области &, равен нулю,
§ 124] ПРИМЕНЕНИЕ К ДИФФЕРЕНЦИАЛАМ ФУНКЦИЙ ДВУХ ПЕРЕМЕННЫХ 575
4° криволинейный интеграл
f (Pdx-\-Qdy)
Л АВ
зависит лишь от точек А и В области & и не зависит от того
соединяющего эти точки пути, по которому он берется, лишь бы
этот путь был гладкой кривой и протекал целиком внутри
области &,
— имеет своим следствием три остальных.
Эта теорема, в частности, показывает, что любое из трех усло-
вий 2°, 3°. и 4° может служить необходимым и достаточным при-
знаком того, что выражение Pdx-\-Qdy в области & есть диффе-
ренциал некоторой функции F(x, у); как мы увидим, доказатель-
ство теоремы позволит нам вместе с тем и найти выражение этой
функции F(x, у) в тех случаях, когда она существует.
Для доказательства мы установим четыре вспомогательных пред-
ложения, совокупность которых будет равносильна доказываемой
теореме.
Лемма 1. Из 1° следует 2°.
Доказательство. Из Pdx-\~Q dy = dF следует
отсюда
Р=”
дх 1
ду
дР _ d2F ар _ d*F
ду дхду ’ дх дудх ’
дР И ду dQ дх непрерывны, то правые
части этих
так как функции
равенств равны между собой; следовательно, равны и левые части,
и лемма 1 доказана.
Лемма 2. Из 2° следует 3°.
Доказательство. Пусть S — замкнутая гладкая кривая,
протекающая целиком внутри области S. Применим формулу Грина
к области Д, ограничиваемой кривой S. Так как всюду в области &
, дР дО
мы имеем по предположению, то левая часть формулы
Грина обращается в нуль и мы получаем:
(Pdx-\-Qdy) — Q,
что и надо было установить.
Лемма 3. Из 3° следует 4°.
Доказательство. Соединим точки А и В области & какими-
либо двумя гладкими путями St и целиком протекающими в
области S и не пересекающимися между собой (черт. 89). Тогда
576
КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
[гл. 28
путь Л?! от А до В и путь X* от В до А, взятые вместе, образуют
гладкую замкнутую кривую; в силу наших предпосылок поэтому
G^i) (^з)
J + j* (Pdx^-Qdy) = Q,
АВ BA
а так как
(^) (^)
f (Р dxQ dy) = — f (Pdx+Qdy),
BA AB
TO
(Pdx-\-Q dy)= f (Pdx + Q dy\,
AB AB
этим лемма 3 доказана для взаимно непересекающихся путей. Но
если пути Xt и Х9 пересекают друг друга (черт. 90), то соединим
точки А и В третьим гладким путем Х31 также протекающим в
области S и не пересекающимся ни с Хи ни с Jf2 *). Тогда по
доказанному интеграл по пути будет совпадать как с интегра-
лом по пути Х19 так и с интегралом по пути следовательно,
эти два интеграла должны совпадать между собой, и лемма 3 до-
казана.
Лемма 4. Из 4° следует 1°.
Доказательство. Рассмотрим в области & постоянную
точку Л(х0, j/0) и другую точку В(х, .у), координаты которой мы
будем считать переменными величинами, так что точка В может
*) Здесь мы допускаем для простоты, что такой путь Х$ существует.
Что это не всегда так, показывает случай, изображенный на черт. 91.
§ 124] ПРИМЕНЕНИЕ К ДИФФЕРЕНЦИАЛАМ ФУНКЦИЙ ДВУХ ПЕРЕМЕННЫХ 577
пробегать всю область <3?. Так как мы предполагаем интеграл
§(Pdx-}-Qdy)
АВ
независимым от того соединяющего точки А и В пути, по кото-
рому он берегся (лишь бы этот путь был гладкой кривой и лежал
внутри то при закрепленном положении точки А этот инте-
грал зависит только от положения точки В, т. е. является одно-
значной функцией В(х, у) ее координат. Мы теперь убедимся, что
в любой точке области
^ = Р, ^ = Q,
дх ду
и следовательно, в силу непрерывности функций Р и Q,
dF = Pdx-\-Qdy,
чем лемма 4 и будет доказана.
dF
Докажем, например, соотношение -^- = Р. Пусть В(х, у) — лю-
бая (внутренняя) точка области если \h\ достаточно мало, то
точка C(x-[-h, у) также будет точкой области Соединим
точки А и В любым гладким путем, целиком лежащим внутри
продолжая этот путь до точки С прямолинейным отрезков ВС, мы
получаем (очевидно, также гладкий) путь АВС, соединяющий точку А
с точкой С и целиком лежащий внутри области (черт. 92). Мы
имеем:
F(x, j) = J(Prfx + Q<y),
АВ
F(x-\-h,y) = [ {Pdx-\-Qdy) —
ABC
= § (Pdx-\-Qdy)-\- (P dx У Qdy),
AB BC
37 А. Я. Хинчин
578 КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ [гл. 28
откуда
F(x Ц-Z?, у) — F(x, у) = J (Pdx-{-Qdy) = j* Pdx,
вс вс
так как*)
Г Qdy = Q.
вс
Но по теореме о среднем значении
J Pdx = hP$, у),
ВС
где х<^\<^х -\-h. Поэтому мы находим:
F(x + ft, y) — F(x,
а так как при /г->0 мы имеем и так как функция Р непре-
рывна в точке В(х, у), то отсюда
g = P(X, У\,
совершенно аналогично доказывается и соотношение
U = у),
чем доказательство леммы 4 завершено.
Леммы 1—4 в своей совокупности, очевидно, равносильны фор-
мулированной нами выше основной теореме, доказательство которой,
таким образом, также завершено.
Упражнения к § 124 см. в задачнике Б. П. Демидовича, отдел VIII,
задачи 300, 302, 305, 308.
§ 125. Пространственные криволинейные интегралы
Понятие криволинейного интеграла естественно и без всяких за-
труднений распространяется на случай, когда интеграция ведется
вдоль пространственной кривой. В простейшем случае, когда про-
странственная кривая на данном участке АВ может быть выражена
уравнениями вида
j/ = cp(x), г = ф(х) (а^х^Ь или а^х^Ь),
*) В силу горизонтальности пути ВС; формально это можно обосновать
так же, как при выводе формулы Грина мы показали, что криволинейный
интеграл по х вдоль вертикального участка равен нулю.
§ 125] ПРОСТРАНСТВЕННЫЕ КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ 679
где функции ф(х) и ф(х) непрерывны в отрезке (а, Ь), мы пола-
гаем по определению
ь
J Р (х, у, г) dx = J F [х, ср (х), ф (х)] dx;
АВ а
отсюда, в частности, следует, как и в случае плоских кривых,
J F(x, у, z)dx =— f F(x, у, z)dx.
ВА АВ
Это первоначальное определение, пригодное лишь для участков
простейшей формы, в дальнейшем может быть расширено аналогично
тому, как мы поступали в случае плоских кривых.
Предполагая, что функции 9(х) и ^(х) имеют в отрезке (а, Ь)
непрерывные производные, мы снова разбиваем дугу АВ на «ячейки»
представляющие собой теперь малые дуги пространственной кривой.
Мы имеем (§ 53):
хь
J /l+T'8(x) + ^(x)dx,
xk—\
где х^ и xk — абсциссы концов ячейки Хл.
Обозначая через а = а(х, у, г) угол, образуемый касательной
к кривой АВ в точке (х, у, г) с положительным направлением
оси ОХ (причем направление касательной выбирается соответственно
движению от А к В), мы имеем (§ 98)
. 1
cos а — ± .........,
Ю + (х) + <Ь'2 (х)
причем на участке мы имеем знак «-)-», если xk^>xk_}i и знак «—»
в противном случае. Отсюда рассуждение, в точности аналогичное
проведенному нами для плоских кривых в § 121, легко приводит
нас к заключению, что в случае простейшего участка АВ имеет
место формула
J F(x, у, z)dx = j* F(x, у> г) cos а (х, у, z)dX,
АВ АВ-
аналогичная формуле (6) § 121. И здесь, как там, интеграл, стоящий
в правой части, получает конструктивное определение (как предел
суммы определенного вида) и может иметь смысл и в случае более
сложной формы участка АВ (в частности, во всех случаях, когда
этот участок может быть разбит на конечное число простейших, что
охватывает собой наиболее простые замкнутые кривее; интеграл
получает, очевидно, смысл и в более общем случае, когда АВ есть
произвольная гладкая кривая, подобно тому как мы установили это
680 • криволинейные интегралы [гл. 28
в § 121 для плоских кривых). Поэтому и здесь мы можем рассма-
тривать полученную формулу как определение стоящего в ее левой
части пространственного криволинейного интеграла. Для простейших
участков это определение всегда совпадает с тем, которое было
дано ранее.
Разумеется, все сказанное относится и к интеграции по перемен-
ным у и z. Если Р, Q и Р— три непрерывные функции от х, у и z
в некоторой пространственной области, содержащей внутри себя
кривую Х = АВ, то аналогично формуле (8) § 121 мы имеем:
(Pdx-\-Qdy R dz) = J (Р cos а Ц- Q cos р R cos 7)
X X
где а, р и 7 — углы, образуемые касательной к кривой X в точке
(х, _у, z) с положительными направлениями координатных осей,
причем направление касательной должно быть взято в соответствии
с выбранным направлением на кривой X.
Так как физические процессы, связанные с существованием сило-
вого поля, развертываются в большинстве случаев не на плоскости,
а в трехмерном пространстве, то вполне естественно, что работу сил
поля нам желательно уметь находить при движении точки вдоль
любой гладкой пространственной кривой (предполагая, конечно, и
само данное поле распределенным в пространстве или некоторой его
части). Если вектор поля в точке (х, у, z) трехмерного простран-
ства задается своими компонентами Р(х, у, z), Q (х, у, z), R (х, у, z),
то мы в точности тем же путем, как это было сделано в § 122 для
плоского поля, можем легко показать, что работа W сил поля, про-
изведенная при перемещении точки вдоль кривой АВ, выражается
криволинейным интегралом
f (Pdx -j- Q dy Ц- R dz).
AB
Наконец, аналогично плоскому случаю, криволинейные интегралы
вдоль пространственных кривых играют важную роль в вопросе о том,
при каких условиях выражение
Р (х> У, z)dx-}-Q (х, у, z)dy-\-R (х, у, z) dz
служит дифференциалом некоторой функции Г(х, у, z) трех пе-
ременных. Для пространственных областей достаточно простой
формы здесь имеет место предложение, полностью аналогичное
теореме § 124 и состоящее в равносильности следующих четырех
утверждений;
1°, выражение Pdx-\-Qdy-\- Rdz есть в области диффе-
ренциал некоторой функции F(x, у, z);
§ 125] ПРОСТРАНСТВЕННЫЕ КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ 581
2°^ всюду в области имеют место равенства
dP_dQ dP__dR dQ_dR.
ду дх 9 dz dx 9 dz dy 9
3°, криволинейный интеграл
J (Pdx-\-Qdy + Rdz),
взятый по любой замкнутой гладкой кривой, целиком лежащей
внутри области равен нулю*,
4°, криволинейный интеграл
J (Р dx 4- Q dy 4- R dz)
AB
зависит лишь от точек А и В и не зависит от того соединяю-
щего эти точки пути, по которому он берется, лишь бы этот
путь был гладкой кривой, целиком лежащей внутри области
Чтобы установить эту равносильность, надо поочередно доказать
четыре леммы, полностью аналогичные леммам 1—4 § 124. Форму-
лировки этих лемм непосредственно ясны, и мы их здесь приводить
не будем. Читатель найдет без всяких затруднений, что предложения,
аналогичные леммам 1, 3 и 4 § 124, доказываются в точности подобно
тому, как это сделано там; дело обстоит иначе с предложением,
аналогичным лемме 2: доказать, что из 2е* следует 3°", путем, ана-
логичным доказательству леммы 2 § 124, мы пока, не можем, так
как для пространственных криволинейных интегралов мы не распо-
лагаем формулой, аналогичной формуле Грина для плоских инте-
гралов. В настоящей главе вывод такой формулы был бы и невоз-
можен, так как сама эта формула требует знакомства е новым поня-
тием поверхностного интеграла, которое будет введено в следующей
главе. Там же мы вернемся к этому вопросу, и на основе формулы,
которая для пространственных криволинейных интегралов служит
аналогом формулы Грина, завершим доказательство равносильности
утверждений 1°'—4°', доказав то единственное звено в цепи наших
лемм («из 2™ следует З0'»), которого нам не удалось установить здесь.
Упражнения к § 125 см. в задачнике Б. П. Демидовича, отдел VIII,
задачи 326, 328, 335.
Г Л А В A 29
ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
§ 126. Простейший случай
В § 121 мы пришли к идее криволинейного интеграла путем
естественного расширения понятия интеграла, зависящего от пара-
метра (или, в пространственном случае, от двух параметров). Если
мы будем отправляться от двойного интеграла, содержащего пара-
метр, то аналогичное расширение непосредственно приведет нас к важ-
ному понятию поверхностного интеграла, которому и будет посвя-
щена настоящая глава.
Рассмотрим поверхность, в некоторой области !3? значений х и у
(эту область & в данный момент можно представлять себе любой
измеримой фигурой) выражаемую уравнением
*=/(*, у\ (1)
где функция /(х, у) непрерывна в области Обозначим через
участок поверхности (1), который проектируется на область & пря-
мыми, параллельными оси OZ. Пусть F(x, у> г)— функция, непре-
рывная в некоторой области трехмерного пространства, содержащей
внутри себя весь участок поверхности (1). Если считать число г
постоянным, то двойной интеграл
J J F (х, у, г) dx dy
&
будет содержать z как параметр и будет, очевидно, функцией этого
параметра. Мы можем, однако, стать на более общую точку зрения,
считая z любой функцией от х и у, непрерывной в области
пусть это будет, например, функция /(х, у}\ тогда данный интеграл
получает вид
j’j’Ffx, у, f(x, y)]dxdy,
&
где подинтегральная функция непрерывна в области так что
существование интеграла не вызывает сомнений. Такой интеграл
§ 126] ПРОСТЕЙШИЙ СЛУЧАЙ 583
называют поверхностным интегралом функции F(х, у, z)
по участку S? поверхности (1) и обозначают через
JJ* F(x, у, z)dxdy;
индекс при интеграле как раз указывает, что величина z при
интеграции должна рассматриваться как функция переменных хиу,
определяемая уравнением (1) той поверхности, часть которой соста-
вляет собой участок <§?. В частности, если z в области & есть
величина постоянная (исходный пункт нашего расширения), то
эго означает, что поверхность (1), *по участку которой ведется
интеграция, представляет собой плоскость, параллельную плоско-
сти XOY, и поверхностный интеграл обращается в обыкновенный
двойной интеграл.
Допустим теперь, что функция /(х, у) в области & не только
непрерывна, но и имеет непрерывные частные производные. Разобьем
участок <§? данной поверхности на части («ячейки») малых диа-
метров *). Площадь ячейки того же наименования выражается,
как мы видели в § 120, двойным интегралом
°* = J J = J J Vх 1 + Л2 (х, У) + fy (х, у) dx dy,
дл дл
где означает проекцию ячейки на плоскость XOY, а у —
острый угол, образуемый нормалью к данной поверхности в точке
[х, Л f(x> -У)1 с положительным направлением оси OZ. По теореме
о среднем значении (§ 116) мы имеем:
Д*
а, = ——-
Л cos Tfc ’
где yk — значение угла у в некоторой точке (xk, yk, zk) ячейки
Составим теперь сумму
У F (хк, yk, zk) cos • <3k =2 F [Хц, yk, f (xk, Л)] ДА
к к
по всем ячейкам участка так как в силу наших предположений
F[x, у, f(x, _у)] есть непрерывная функция от х и у в области^/,
то правая часть этого равенства на основании результатов главы 27
*) Здесь и во всем дальнейшем мы, чтобы не осложнять изложения дета-
лями, не имеющими прямого отношения к существу излагаемых идей, пред-
полагаем эти ячейки, а также и все дальнейшие области, с которыми нам
придется встречаться, односвязными фигурами, ограниченными контурами
достаточно простой формы, чтобы к ним можно было применять все нужные
нам понятия и результаты, установленные нами ранее.
584 ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ [гл. 29
будет при безграничном мельчании производимого разбиения иметь
пределом двойной интеграл
F[x, У* f(x> y)]dxdy,
$
который есть не что иное, как определенный нами выше поверхно-
стный интеграл
F (х, у, г) dx dy.
Этот поверхностный интеграл может, таким образом, рассматри-
ваться как предел суммы
У F(xk, Ук> zk)cos lk • °k = У-7-- F^Xkt yk’ °*
" ^V^+fx2(xktyk)+fy4xktyk)
при безграничном мельчании производимого разбиения. Но пределы
сумм вида
k
где ст* — площади ячеек, на которые разбит участок <=?*, a (xk, yk, zk) —
произвольная точка ячейки aki мы рассматривали в § 120, п. 2 и
условились называть такой предел интегралом функции ф(х, у, г),
распространенным на участок S? данной поверхности, и обозначать
его через
Таким образом, в нашем случае мы имеем:
F(x, у, z)dxdy = j* [F(x, у, г)соьу(х, у, z)di =
= f f У’ z>d9 (2)
Эта формула в точности аналогична формуле (6) § 121 и
играет в теории поверхностных интегралов ту же роль, как фор-
мула (6) § 121 в теории криволинейных интегралов. Прежде всего,
уже в рассматриваемом нами простейшем случае она дает для поня-
тия поверхностного интеграла новое определение, конструктивное
по своей природе (ибо правая часть формулы (2) определяется как
результат некоторой конструкции — предел сумм определенного вида).
Далее, как мы скоро увидим, формула (2), аналогично формуле (6)
§ 121, составляет собой основание значительного расширения поня-
§ 126]
ПРОСТЕЙШИЙ СЛУЧАЙ
585
тия поверхностного интеграла за пределы того простейшего случая,
который мы рассматриваем в настоящем параграфе.
Само собой разумеется, что имеют место аналогичные определе-
ния и соотношения в случаях, когда интеграция ведется по паре
переменных (х, г) или (у, г); надо только, чтобы выбранный уча-
сток S? поверхности мог быть выражен соответствующим уравне-
нием, аналогичным уравнению (1). В приложениях очень часто при-
ходится встречаться с суммами трех интегралов, распространенных
на один и тот же участок S?но ведущихся по разным парам пере-
менных.
Пусть Р(х, у, г), Q(xt у, *г), /?(х, у. г) — три функции, не-
прерывные в некоторой области трехмерного пространства, содер-
жащей внутри себя участок S?. Пусть а. = а.(х, у, г), р = р (х, у, г),
Y = Y(x, у, г) — углы, соответственно образуемые нормалью к дан-
ной поверхности в точке (х, у, г) участка с положительными
направлениями осей OX. OY и OZ, и пусть направление этой нор-
мали может быть выбрано так, что на участке S? углы а, р, у—
острые. Сумму интегралов
J J* Р(х, у. г) dy dz-j-Q(x, у. z)dzdx-\-
4- R (x, у. г) dx dy
принято записывать в виде одного интеграла
(Р dydz-\-Qdzdx-\-R dx dy);
если выбранный участок 3? таков, что на его протяжении каждая
из трех координат является однозначной, обладающей непрерывными
частными производными, функцией двух других, то на основании
предыдущего мы, очевидно, имеем:
Р cos а tZo,
j* Rdxdy = J RcosydQ,
и следовательно,
cosa Q cos ? 4" Я cos Т)
586 ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ [гл. 29
§ 127. Общее определение поверхностного интеграла
Установленное в начале § 126 простое определение поверхно-
стного интеграла
JJ* F(x, у, z)dxdy (1)
существенным образом предполагает, что на участке S? данная по-
верхность может быть выражена уравнением вида (1) § 126, т. е.
что каждая прямая, параллельная оси OZ, пересекает участок S? не
более чем в одной точке. Это ограничение очень стеснительно для
приложений, где чаще всего приходится брать интегралы по замкну-
тым поверхностям, заведомо не удовлетворяющим поставленному
требованию. Мы должны поэтому, отправляясь от рассмотренного
в § 126 простейшего случая, искать такого расширения понятия
поверхностного интеграла, которое позволило бы охватить и нужные
в приложениях более сложные случаи.
Плодотворную отправную точку для такого рода расширений дает
нам формула (2) § 126. Средняя часть этой формулы по своему
определению не связана с каким-либо специальным видом участка & ,
и в частности, например, полностью сохраняет смысл и для доста-
точно простых замкнутых поверхностей. Если, таким образом, в про-
стейшем случае соотношение (2) § 126 было нами доказано как
теорема, то в более сложных случаях мы можем рассматривать
первое равенство формулы (2) § 126 как определение интеграла,
стоящего в его левой части. Мы получаем таким путем возмож-
ность определить интеграл (1) для любого участка <& , на котором
имеет смысл интеграл, стоящий в средней части формулы (2) § 126.
А это дает уже очень значительное расширение, вполне достаточное
для большинства приложений.
Однако, чтобы это расширенное определение было однозначным,
необходимо и для участков более общей формы точно указать зна-
чение угла у(х, у, г) в средней части формулы (2) § 126; предпо-
лагая, что у всегда означает угол, образуемый нормалью к данной
поверхности с положительным направлением оси OZ, мы должны,
следовательно, установить определенное направление нормали в каж-
дой точке данной поверхности (что равносильно, разумеется, выбору
знака при cosy). В простейшем случае мы условились всегда считать
нормаль направленной в положительную сторону оси OZ, т. е. брать
угол у острым (cosy^>0). Такое соглашение там представлялось
естественным (в сущности, даже единственно возможным), так как
cosy впервые появлялся в наших рассуждениях в роли отношения двух
площадей. Легко, однако, видеть, что в случае участков более общей
формы сохранение этого соглашения оказалось бы неудобным для
большинства реально встречающихся задач.
§ 127]
ОБЩЕЕ ОПРЕДЕЛЕНИЕ ПОВЕРХНОСТНОГО ИНТЕГРАЛА
587
Представим себе, например, что S?есть поверхность шара. Тогда
для нормали в точках верхнего полушария нам пришлось бы выби-
рать направление наружу, а в точках нижнего полушария — внутрь
сферы; при переходе через экватор выбираемое направление должно
было бы скачком меняться на прямо противоположное (черт. 93).
Легко предвидеть, что определение, связанное с таким выбором на-
правления нормали, во многих случаях будет стоять в противоречии
со смыслом поставленной реальной задачи и потому создаст ненуж-
ные осложнения при ее решении. Поэтому мы введем другое согла-
шение о направлении нормали, свободное от этого недостатка.
Чтобы сделать это новое определение более конкретным, вер-
немся сначала в виде примера к случаю, когда S? есть поверхность ша-
ра. Непосредственно ясно и полностью подтвер-
ждается историей науки, что в большинстве при- '
кладных задач, связанных с интегралами вида (2)
§126, в этом случае наиболее целесообраз-
ным будет направлять нормаль либо всюду на-
ружу, либо всюду внутрь сферы, т. е. иметь
дело, как говорят, либо повсюду с внешней, либо
повсюду с внутренней нормалью. Выберем для оп-
ределенности внешнюю нормаль, т. е. условимся,
что у в интеграле (2) § 126 означает угол, обра-
зуемый внешней нормалью к сфере & в точке
(х, у, z) с положительным направлением оси OZ.
Тогда угол 7 будет острым для точек верхнего
полушария dr t, прямым для точек экватора и тупым
него полушария Поэтому если под I | F dxdy и | I F dx dy
понимать поверхностные интегралы по «простейшим» участкам 3?,
и ©/%, определенные в смысле § 126, то при нашем новом пони-
мании угла у
Черт. 93.
для точек ниж-
F cos 7 dz = J j Fdxdy,
S?i
Fcos7rfo = — | | Fdxdyt
так что согласно расширенному определению поверхностного инте-
грала (формула (2) § 126)
Fcos76/a= I Г Fcos76fa-(' | I Fcos7da =
X к
= j* j* Fdxdy — j* PFdxdy (2)
588
ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
[гл. 29
(где, напоминаем, оба интеграла правой части определены в перво-
начальном смысле § 126). При этом наше определение угла у таково,
что нормаль во всех точках сферы направлена наружу, так что
cos у > О в точках верхнего полушария и cos у < 0 в точках нижнего
полушария. Про так определенный интеграл (2) говорят, что он
распространен на внешнюю сторону сферы S?. Конечно, мы могли бы
условиться брать для всех точек сферы и внутреннюю нормаль вместо
внешней; тогда мы получили бы интеграл (2), распространенный на
внутреннюю сторону сферы S?; так как при переходе от внешней
к внутренней нормали cosy в каждой точке поверхности S? меняет
знак, то и наши два интеграла только знаком будут отличаться друг
от друга.
Еще более просто обстоит дело в случае, когда участок S? имеет
форму, подробно рассмотренную нами в § 126, т. е. выражается
уравнением вида (1) § 126. Мы выбирали нормаль направленной
кверху (cosy^>0) и доказывали, что
f f F dxdy= f f Fcosy^a.
С нашей новой точки зрения мы теперь скажем про этот последний
интеграл, чго он распространен на верхнюю сторону участка 3?.
Напротив, если мы условимся всюду направлять нормаль книзу,
интеграл
F cos у rfa (3)
изменит знак на противоположный; это будет интеграл, распростра-
ненный на нижнюю сторону участка 3?. Мы видим, что запись (3)
сама по себе еще ничего не говорит о том, на какую сторону по-
верхности 3? распространяется интеграция; это всякий раз необхо-
димо особо указывать.
Обратимся теперь к общему случаю. Будет ли 3? замкнутой по-
верхностью (подобно сфере) или участком, имеющим определенный
контур (край), мы в большинстве случаев легко различаем две «сто-
роны» этой поверхности, подобно тому как мы видели это в двух
рассмотренных нами примерах. Задать определенную сторону поверх-
ности — это значит задать в каждой точке этой поверхности опре-
деленное направление нормали.
Если определенная сторона поверхности выбрана, то поверхност-
ный интеграл
^Fdxdy,
§ 127]
ОБЩЕЕ ОПРЕДЕЛЕНИЕ ПОВЕРХНОСТНОГО ИНТЕГРАЛА
589
распространенный на эту сторону поверхности, по определению
равен интегралу
а,
где у есть угол, образуемый выбранным направлением нормали с по-
ложительным направлением оси OZ.
Однако если мы хотим охватить нашим определением достаточно
широкий класс поверхностей, мы все же должны несколько подроб-
нее остановиться на вопросе о том, что представляют собой в общем
случае две «стороны» поверхности, о которых мы только что гово-
рили; вопрос этот даже в элементарных случаях может представить
известные трудности.
Допустим, что интересующая нас поверхность (или участок по-
верхности) S? имеет в каждой точке касательную плоскость, напра-
вление которой непрерывно меняется при непрерывном перемещении
точки по поверхности. Выше мы сказали, что для выбора определен-
ной стороны нашей поверхности достаточно выбрать в каждой ее
точке определенное направление нормали. Однако если мы станем
выбирать это направление в различных точках поверхности неза-
висимо друг от друга, то мы, вообще говоря, не получим ничего
полезного, так как при таком выборе угол у может оказаться всюду
разрывной функцией положения точки, так что наши интегралы,
содержащие cosy, окажутся не имеющими никакого смысла. Как эти
формальные соображения, так и непосредственное наглядное пред-
ставление ясно говорят нам, что для нас может иметь значение только
такой выбор направления нормали в различных точках данной по-
верхности, при котором это направление непрерывно изменяется,
когда точка непрерывно движется по поверхности; другими словами,
мы требуем, чтобы угол у был непрерывной функцией координат
той точки, к которой он относится.
Возьмем теперь произвольную точку А поверхности S?, прове-
дем в этой точке нормаль к поверхности и выберем на этой нор-
мали какое-нибудь определенное из двух возможных направлений.
Будем перемещать точку А по поверхности следуя по любому
непрерывному пути, и при этом в каждой точке, через которую мы
проходим, приписывать нормали к поверхности то из двух возмож-
ных направлений, с которым мы nOL непрерывности приходим в нее,
следуя по нашему пути. Допустим, что, пройдя таким образом неко-
торый путь, мы возвращаемся в точку А. С каким направлением
нормали мы в нее придем — с тем ли, с которым мы из нее вышли,
или с противоположным ему? Легко видеть, что как в двух рас-
смотренных нами выше примерах, так и в подавляющем большинстве
других, какие мы сумеем придумать., мы всегда будем возвращаться
в точку А с тем же самым направлением нормали, с каким мы из
590 ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ [гл. 29
нее вышли (при этом предполагается, что пройденный нами путь не
пересекает края поверхности Однако это правило все же имеет
место не для всех поверхностей; так, рассмотрим известную «ленту
Мёбиуса», модель которой получится, если вырезать из бумаги пря-
моугольник abed (черт. 94) и, перекрутив его, склеить сторону ad
со стороной Ьс так, чтобы а совпало с с, a d—с Ь. Легко убе-
диться, что, выбрав на этой ленте произвольную точку А и пробе-
жав, отправляясь от нее, вдоль всей ленты вышеописанным образом,
мы вернемся в А не с исходным, а с противоположным ему напра-
влением нормали. В дальнейшем мы совершенно исключим из рас-
смотрения такие (почти не встречающиеся в прикладных задачах)
поверхности и будем, следовательно, предполагать, что, какую бы
исходную точку мы ни выбрали и какой бы непрерывный, не пересе-
кающий края поверхности путь, отправляясь от нее, ни прошли,
мы, изменяя непрерывно направление нормали, вернемся в исходную
точку с тем же направлением нормали,
1 , , • „ с с каким мы из нее вышли.
При этих условиях, как легко видеть,
достаточно выбрать направление нормали
" J в одной какой-нибудь точке А поверх-
ности чтобы оно стало однозначно
Черт. 94. определенным и во всех других точках
этой поверхности. В самом деле, если
В — любая другая точка поверхности, то два любых пути и Х^
ведущих от точки А к точке В, приведут к одному и тому же
направлению нормали в точке В, так как иначе, выйдя из точки В
и пройдя сначала путь Хг в обратном направлении (до точки А),
а затем путь X* в прямом направлении, мы вернулись бы в точ-
ку В с направлением нормали, противоположным тому, с кото-
рым мы из нее вышли; эго же, по нашему предположению, невоз-
можно.
Таким образом, для поверхностей рассматриваемого нами типа
выбор направления нормали в одной какой-нибудь точке однозначно
определяет ее направление во всех точках поверхности, т. е. одно-
значно определяет сторону поверхности; выбирая в данной точке
противоположное направление нормали, мы тем самым меняем ее
направление и во всех других точках данной поверхности и пере-
ходим, таким образом, на другую ее сторону. Поэтому поверхности
рассматриваемого нами типа называют двусторонними (в от-
личие от односторонних, примером которых может служить
лента Мёбиуса).
После этих уточнений мы можем вернуться к определению
интеграла, взятого по данной стороне поверхности. Пусть 3? — дву-
сторонняя поверхность (или участок такой поверхности), на которой
мы выбрали определенную сторону. Пусть 7 = 7 (х, у, г) означает
угол, образуемый с положительным направлением оси OZ тем на-
§ 127] ОБЩЕЕ ОПРЕДЕЛЕНИЕ ПОВЕРХНОСТНОГО ИНТЕГРАЛА 591
правлением нормали к поверхности <5? в точке (х, у, г), которое
определяется выбранной нами стороной этой поверхности; тогда мы
полагаем по определению
F cos 7 da,
где предполагается, что интеграл в правой части существует и опре-
деляется как предел определенного вида сумм, подробно описанных
нами в § 126. Это обозначение не содержит в себе никакого ука-
зания на выбираемую сторону поверхности S?\ такое указание
должно, следовательно, быть всякий раз добавляемо особо. Впрочем,
в случае, когда поверхность S? замкнута, имеется обычай (которого
и мы в дальнейшем будем держаться) понимать написанный интеграл
как интеграл по внешней стороне этой поверхности, считая, таким
образом, у углом, образуемым внешней нормалью к поверхности
с положительным направлением оси OZ.
Интересно еще посмотреть, как связывается эго расширенное
определение поверхностного интеграла с тем первоначальным опре-
делением для простейшего случая, которое мы ввели в § 126. Пусть
поверхность (как это бывает в большинстве реально встречаю-
щихся случаев) может быть разложена на конечное число «простей-
ших» участков <^j, ©/%, ... , е/%, т. е. таких, каждый из которых
может быть выражен уравнением вида (1) § 126. Согласно нашему
расширенному определению тогда интеграл по данной стороне по-
верхности S? равен сумме интегралов по той же стороне составляю-
щих ее участков, так как, очевидно,
п
Feos у da.
Но на каждом участке интеграл по выбранной нами стороне
поверхности совпадает с интегралом, определенным в § 126, если
cos у 0, т. е. если выбранная сторона поверхности о?? на участке
является верхней} в противном же случае эт{< два интеграла
имеют одинаковую абсолютную величину, но противоположные знаки.
Таким образом, интеграл по даннрй стороне поверхности равен ал-
гебраической сумме интегралов по составляющим ее простейшим
участкам, если определять эти интегралы согласно § 126; при этом
интегралы по участкам, где выбранная сторона поверхности <§?
оказывается верхней, следует брать со знаком «-]-», а инте-
гралы по участкам, где эта сторона оказывается нижней, — со зна-
ком «—».
Наконец, все, сказанное нами относительно интегралов по пере-
менным (х, у\ остается, очевидно, в силе для пар (г, х) и (у, г).
592 ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ [гл. 29
Для интегралов по данной стороне двусторонней поверхности S?
мы находим общую определяющую формулу
JJ* (Р dy dz 4" Q dz dx -|- R dx dy) =
= (Pcosa4-QcosP4'^cosT)^a> (4)
где P, Q, R — непрерывные функции от x, yf z в некоторой про-
странственной области, содержащей внутри себя поверхность 3?, а
а, р, у — углы, образуемые соответственно с положительными на-
правлениями осей OX, OY и OZ тем направлением нормали к поверх-
ности S? в точке (х, у, z), которое определяется выбранной нами
стороной этой поверхности.
На всем дальнейшем протяжении этой главы мы будем понимать
встречающиеся поверхностные интегралы как интегралы, распростра-
ненные на определенную сторону данной поверхности согласно
только что установленному определению.
Сделаем еще одно последнее замечание, имеющее целью предот-
вратить некоторые смешения. В § 120 мы определили понятие инте-
грала
§ У, (5)
распространенного на дачный участок <§? поверхности. Это поня-
тие представляло естественную аналогию с понятием обыкновенного
двойного интеграла, распространенного на некоторый участок пло-
скости: так же как там, для построения интеграла (5) участок 3?
разбивался на ячейки, площадь каждой ячейки умножалась на зна-
чение функции 9 в какой-либо точке этой ячейки и затем нахо-
дился предел суммы всех таких произведений. Интеграл (5) возни-
кал, таким образом, как результат хорошо знакомой нам конструкции,
типичной для всех задач интегрального исчисления.
В настоящем же параграфе мы определили понятие поверхност-
ного интеграла
^F(x, у, z)dxdy, (6)
распространенного на определенную сторону данной поверхно-
сти S?. Возникает вопрос, в каком отношении стоят друг к другу эти
два типа интегралов. Ответ на этот вопрос с полной ясностью вы-
текает из всего предшествующего. Символы (5) и (6) имеют раз-
личный смысл; в то время как интеграл (5) зависит только от уча-
стка S? и вида функции 9 и совершенно не зависит от выбора
§ 128]
ФОРМУЛА ОСТРОГРАДСКОГО
593
«стороны» поверхности, интеграл (6) меняет знак при изменении
выбираемой стороны поверхности; только после того, как эта сто-
рона выбрана, интеграл (6) получает определенное значение; мы
можем, таким образом, сказать, что символ (6) определяет собой два
различных интеграла в зависимости от выбора той или другой сто-
роны поверхности S*.
Упражнения к § 127 см. в задачнике Б.П. Демидовича, отдел VIII,
задачи 403, 405.
§ 128. Формула Остроградского
В § 123 мы вывели важную в теоретическом и прикладном от-
ношении формулу Грина, связывающую двойной интеграл, распро-
страненный на плоскую область, с некоторым криволинейным инте-
гралом, взятым по контуру этой области. Соответствующая, не менее
важная формула для трехмерного пространства была впервые уста-
новлена М. В. Остроградским; эта формула связывает тройной инте-
грал, распространенный на данную область трехмерного простран-
ства, с некоторым поверхностным интегралом, берущимся по внеш-
ней стороне границы этой области.
Пусть мы имеем область трехмерного пространства, ограни-
ченную замкнутой поверхностью Допустим сначала, что эта
поверхность имеет простейшую возможную для замкнутой поверх-
ности форму: каждая прямая, параллельная одной из координатных
осей, пересекает ее не более чем в двух точках, так что, в частно-
сти, 3? распадается на две части — «верхнюю» и «нижнюю», —
соответственно выражающиеся уравнениями г=/1(х, у) и г =
=/2 (х> УУ мы допустим, что функции /j и /2 непрерывны и обла-
дают непрерывными частными производными по х и у. Пусть, на-
конец, функция R (х, у, г) определена и непрерывна вместе со своей
дР
частной производной в некоторой пространственной области, со-
держащей внутри себя область Рассмотрим тройной интеграл
ev-
Согласно формуле (2) § 119 он может быть представлен в виде
<g) fa (*> У)
где означает проекцию области на плоскость XOY. Но
A
J dz =±= R [х, у, ft (х, у)] — R [х, у, ft (х, j)];
fa
88 А. Я. Хиячин
594
ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
[гл. 29
поэтому мы получаем:
= J J R [X, У, ft (х, j)] dx dy— J J R [x, y, ft (x, _y)] dx dy.
Рассмотрим первый из этих двух интегралов. По самому опреде-
лению поверхностного интеграла этот первый интеграл представляет
собой интеграл функции R (х, у, г), взятый по верхней части
S?1[г=/1(х, J/)] поверхности <s^, и притом по верхней стороне
поверхности которая совпадает с внешней стороной поверхно-
сти S?. Подобным же образом второй интеграл правой части есть
интеграл функции 7?(х, у, г), взятый по верхней стороне нижней
части [^ — А (х, _у)] поверхности sZ; но в таком случае, как
мы знаем, этот же интеграл, взятый с обратным знаком (а в нашей
формуле он как раз и фигурирует со знаком «—»), будет интегра-
лом функции R по нижней стороне поверхности опять-таки
совпадающей с внешней стороной поверхности <§?. Таким образом,
мы получаем:
R dx dy,
где в правой части первый интеграл берется по верхней стороне
поверхности а второй — по нижней стороне поверхности
так как в обоих случаях интеграция ведется по внешней стороне
поверхности то сумма интегралов правой части может быть заме-
нена одним интегралом, взятым по внешней стороне всей поверхно-
сти и мы получаем простое соотношение
ш dx dy dz = j* j* A? dx dy = JJ R cos 7 da;
S? о/
(1)
второй и третий члены этих равенств представляют собой интегралы
по внешней стороне поверхности <§?. Это соотношение выведено
нами для таких замкнутых поверхностей S?, которые пересекаются
не более чем в двух точках каждой прямой, параллельной оси OZ;
легко, однако, убедиться, что оно остается верным и в значительно
более широком классе случаев. С этой целью заметим прежде всего,
что соотношение (1) остается в силе и в том случае, когда в состав
поверхности S? кроме S? х и входит еще цилиндрический уча-
сток с образующими, параллельными оси OZ (черт. 95); в са-
§ 128]
ФОРМУЛА ОСТРОГРАДСКОГО
695
мом деле, в точках участка о?** нормаль к поверхности, очевидно,
образует прямой угол с осью OZ, cos у — 0, и мы имеем:
R cos у do = О,
так что попрежнему
j R dx dy j* j* R dx dy =
1 S?3
Rdxdy— J J Rdx dy,
2
а потому сохраняет силу формула (1).
Во вторую очередь мы покажем, что если область разделяется
какой-либо проведенной внутри нее поверхностью # на две части
и к каждой из которых применимо соотношение (1), то это
соотношение имеет место и для всей области В самом деле, мы,
очевидно, имеем:
где и е/% означают соответственно замкнутые поверхности, огра-
ничивающие области и и где каждый из двух последних
интегралов берется по внешней стороне соответствующей поверхно-
сти. Но состоит из некоторой части поверхности S? и разде-
ляющей поверхности & (черт. 96), а — из дополнительной части
596
ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
[гл. 29
поверхности S? и той же разделяющей поверхности таким обра-
зом, последняя сумма интегралов может быть представлена как сумма
интеграла по внешней стороне поверхности и двух интегралов
по разделяющей поверхности «г; из этих двух интегралов один бе-
рется по той стороне поверхности «л, которая является внешней для
области а другой — по той, которая является внешней для
очевидно, что это — две противоположные стороны поверхности
вследствие чего сумма взятых по ним интегралов обращается в нуль,
и мы находим:
ИУ dx dy dz — J7 R dx dy,
‘У3 &
что мы и хотели установить.
С помощью доказанной теоремы мы, очевидно, можем значительно
расширить круг приложений формулы (1), так как большинство
пространственных областей, с которыми приходится иметь дело
в приложениях, проведением надлежащих разделяющих поверхностей
может быть разбито на ряд областей той простейшей формы, для
которой мы первоначально вывели формулу (1).
Разумеется, все сказанное относится в равной мере и к случаям,
когда вместо пары переменных (х, у) выбирается пара (у, z) или
(z, х). Если Р=Р(х, у, z), Q = Q(x, у, z), R = R(x, у, z) пред-
ставляют собой функции, непрерывные и обладающие непрерывны-
ми частными производными в некоторой области трехмерного про-
странства, содержащей внутри себя область 0V>, ограниченную по-
верхностью 3?, то дл5? весьма широкого класса таких областей мы
находим;
т
= (Р dy dz -|- Q dz dx R dx dy), (2)
где интеграл в правой части берется по внешней стороне поверхно-
сти . Очевидно, мы можем записать это соотношение и в виде
Ш(£+£+")™=
= ^J(Pcosa-|-QcosP4-/?cos7)rfa, (3)
где a, Р и у соответственно означают углы, образуемые внешней
нормалью к поверхности <§? в точке (х, у, г) с осями OX, OY
и OZ.
§ 128]
ФОРМУЛА ОСТРОГРАДСКОГО
597
Формула (2) (или (3)) и представляет собой формулу Остроград-
ского, о которой мы говорили выше *). Она имеет очень большое
значение для многих разделов физики, так как по существу является
одним из важнейших предложений теории поля, к чему мы еще вер-
немся. Здесь же мы воспользуемся еще формулой Остроградского
для доказательства одной теоремы, важной для целого ряда фи-
зических задач; эта теорема вполне аналогична соответствующему
предложению, доказанному нами в § 124 с помощью формулы
Грина. •
Теорема. Для того чтобы интеграл
(Pcosa-|~QcosP4”^ cosy) da,
взятый по любой **) замкнутой поверхности , лежащей внутри
области равнялся нулю, необходимо и достаточно, чтобы
в каждой внутренней точке области *1? выполнялось соотношение
дх^ ду + dz ~ °* W
Доказательство. Достаточность условия (4) непосредственно
видна из формулы (3). Чтобы убедиться в его необходимости, допу-
стим, что в некоторой внутренней точке А области например,
dP , dQ j dR п
dx * dy dz
В силу предположенной непрерывности частных производных это не-
равенство будет тогда выполняться также внутри и на границе не-
которого шара Ъ с центром в А, целиком лежащего внутри области
вследствие чего
V
Но тогда формула (3) показывает, что для поверхности шара &
J J (Р cos cl + Q cos P 4- R cos y) da 0.
Этим наше утверждение доказано полностью.
Упражнения к § 128 см. в задачнике Б. П. Демидовича, отдел VIII,
задачи 415, 416, 423, 424.
*) Иногда ее называют формулой Гаусса или Гаусса-Остроградского.
♦♦) Имеются в виду, конечно, поверхности, для которых имеет место
формула Остроградского; впрочем, теорема остается верной и при значи-
тельном сужении класса поверхностей о/; мы можем, например, считать, что
речь идет только о сферических поверхностях.
598
ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
[гл. 29
§ 129. Формула Стокса
Формула Остроградского, выведенная нами в предыдущем пара-
графе, может рассматриваться как аналог формулы Грина при
переходе от плоскости к трехмерному пространству. Теперь мы пе-
реходим к выводу другой, не менее важной формулы, представ-
ляющей собой прямое обобщение формулы Грина на случай, когда
плоская фигура Заменяется участком кривой поверхности. Эта
формула связывает интеграл, взятый по определенной стороне
некоторого участка S? поверхности, ограниченного замкнутым
контуром «5?, с некоторым пространственным криволинейным ин-
тегралом, взятым по этому контуру, т. е. решает для кривой по-
верхности ту же задачу, какая для плоскости решается формулой
Грина.
Пусть сначала данная поверхность на участке S? выражается
уравнением z=f{x, у); относительно функции /, так же как и
относительно вводимых ниже функций Р, Q, R переменных х, у, z,
мы сделаем обычные предположения в смысле их непрерывности и
дифференцируемости. Мы начнем с рассмотрения пространственного
криволинейного интеграла
J у, z)dx, (1)
X
взятого по контуру <3? участка проходимому в прямом направ-
лении (т. е. так, что наблюдателю, движущемуся по верхней сто-
роне участка S?\ этот участок представляется остающимся слева от
его пути). Пусть проекцией участка S? на плоскость XOY служит
плоская область «7, контур которой мы обозначим через тогда
интеграл (1) можно представить и в виде плоского криволиней-
ного интеграла
[ Р[Х, у, f(x, y)]dx, (2)
£
i
взятого по контуру в самом деле, пусть # есть участок контура
выражающийся уравнением
у = ф (х) (а х Ь\,
тогда служит ортогональной проекцией на плоскость XOY неко-
торого участка X9 контура X, очевидно, выражаемого уравнениями
д/ = ?(х), г=/[х, ф(х)],
§ 129]
ФОРМУЛА СТОКСА
599
и мы по первоначальному определению криволинейных интегралов
имеем:
ь
J Р (х, у, г) dx = j* Р {х, ф (х), f [х, ? (X)]} dx,
X’
ъ
Р[х, у, /(X, y)\dx = f Р{х, 9(х), fix, cp(x)]\dx;
правые, а значит, и левые части этих равенств совпадают между
собой, что доказывает наше утверждение для «простейших» участ-
ков и предполагая, что контур <5? (а следовательно, и /*)
может быть разбит на конечное число таких простейших участков,
мы непосредственно видим, что в этом случае
j*P(x, у, z)dx= j* Р[х, у, /(х, y)]dx; (3)
X £
это равенство имеет место и в более общих случаях, на чем мы,
однако, останавливаться не будем.
С другой стороны, рассмотрим интегралы
дР о
-т- cos В da,
oz ‘
(4)
взятые по верхней стороне поверхности причем углы у и опре-
деляются обычным образом. В силу формул § 99 мы имеем:
где знаменатель должен иметь в обоих случаях один и тот же знак;
так как мы выбрали верхнюю сторону поверхности то в нашем
случае cos у 0 и радикал надо брать положительным; впрочем,
независимо от этого мы имеем:
cos В = — ~ cos т,
dy *
600
ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
[гл. 29
вследствие чего формулы (4) дают:
& s?
Подинтегральная функция последнего интеграла, если заменить в ней
z через /(х, у), будет, очевидно, равна
{?[*> у, f{x, .у)]};
поэтому в силу самого определения поверхностного интеграла для
простейшего случая (§ 126) последний интеграл может быть записан
в виде двойного интеграла
J J Р [*, У, Дх, Д')]} dx dy,
и мы находим:
J J (ly dx dy — S dx dz} = J j* 57 y> ^x‘ dx dy' (5)
S? a
Сопоставляя формулы (3) и (5), мы непосредственно видим, что
правые части их на основании формулы Грина (§ 123) отличаются
друг от друга только знаком. Поэтому то же самое имеет место и
для левых частей, и мы находим:
j*j* ^dxdz — ^dxdy}~ J* p(x’ -y> ?)dx. (6)
Здесь интеграл в левой части берется по верхней стороне поверх-
ности а интеграл в правой части — в таком направлении, чтобы
наблюдатель, движущийся по верхней стороне при этом движе-
нии оставлял участок S? по левую руку. Если мы переменим как
выбранную сторону о/*7, так и направление обхода контура то
обе стороны равенства (6) переменят знак, так что равенство это
сохранится; легко видеть, что при этом снова наблюдатель, стоя-
щий на выбранной (на этот раз — нижней) стороне участка и дви-
жущийся по контуру X в новом, измененном направлении, будет
видеть участок остающимся по его левую руку. Это правило
имеет, таким образом, вполне общий характер и однозначно опре-
деляет направление движения по контуру X, как только выбрана
определенная сторона поверхности (и обратно).
§ 129] ФОРМУЛА СТОКСА 601
Формула (6), подобно формулам Грина и Остроградского, обла-
дает тем свойством, чго если участок S? проведенной на нем линией
разделен на два участка о7\ и для каждого из которых эта
формула верна, то она остается верной и для всего участка (до-
казательство проводится в точности, как для формулы Грина, и может
быть предоставлено читателю). С помощью этого свойства справед-
ливость формулы (6) (как и в случаях формул Грина и Остроград-
ского) может быть установлена для широкого класса участков S?.
Круговая перестановка букв х, у, z, с одной стороны, и Р, Q,
R— с другой—дает нам наряду с формулой (6) еще две формулы:
^3xdydx~ ^dydz} = j* У’ Z>idy'
J.f ^>dzdy~ 7fxdzdx) = $ R(x’ y>z)dz-
Наконец, складывая все три формулы между собой, мы приходим
к общей формуле Стокса
W+(f -%}*>*+ (S-£W=
= ^{Pdx-\-Qdy-\-Rdz), (7)
которая и была целью нашего вывода.
Эта формула, как мы уже говорили, служит обобщением формулы
Грина: если S? есть участок плоскости ХОГ, то, как нетрудно ви-
деть, формула Стокса обращается в формулу Грина, которая, таким
образом, действительно является ее частным случаем.
Из многочисленных применений формулы Стокса мы приведем
здесь только одно. В § 125 у нас осталась недоказанной следующая
лемма: если в каждой точке некоторой области трехмерного
пространства имеют место равенства
дР dQ dQ dR dR dP
dy ~ dx ’ dz = dy ’ ~dx ~ ~dz 9 ' '
то криволинейный интеграл
j* (P dxQ dyR dz),
X
взятый no любой замкнутой гладкой кривой X, целиком лежащей
внутри области равен нулю. Из формулы Стокса непосредственно
602 поверхностные интегралы [гл. 29
вытекает доказательство этого предложения, если только (что мы
должны предположить) для каждой замкнутой кривой X в области
существует поверхность S?, имеющая своим контуром кривую X
и такая, что для нее имеет место формула Стокса (в подавляющем
большинстве реально встречающихся случаев эти условия оказываются
выполненными) *). В самом деле, из условий (8) вытекает тогда, что
для любой замкнутой кривой Х> лежащей внутри области левая,
а значит, и правая часть формулы Стокса равна нулю, чем нужная
нам лемма и доказана.
§ 130. Элементы теории поля
Совокупность механических и физических приложений теории
криволинейных и поверхностных интегралов имеет своей математи-
ческой основой некоторую общую схему, которую обычно называют
теорией поля. Элементы этой теории в сущности уже изложены нами
в нескольких последних главах. Однако для большинства понятий и
соотношений теории поля механика и физика с полным основанием
предпочитают другую, более наглядную терминологию; вместе с тем
эти понятия и соотношения формулируются обычно в приложениях
в векторной форме; это делаег их одновременно более простыми,
более наглядными и более удобными для большинства задач меха-
ники и физики. Поэтому мы теперь в кратком очерке соберем важ-
нейшие из этих понятий и связывающих их соотношений, придавая
им векторную форму и тем самым делая их более доступными на-
глядному представлению **).
1. Скалярные и векторные поля. Величины, с которыми
имеют дело механика и физика, в основе делятся на две группы:
скаляры, т. е. величины, исчерпывающая характеристика которых
дается их числовыми значениями (плотность, температура, электри-
ческий потенциал), и векторы, для полной характеристики кото-
рых, кроме числового значения, необходимо указать еще направле-
ние (скорость, ускорение, сила). Физика имеет дело, правда, и с ве-
личинами, описание которых еще более сложно; однако мы здесь
такими величинами заниматься не будем.
Компонентой вектора по какой-либо оси (направленной
прямой) называется, как известно, проекция вектора на эту ось. Ве-
*) Укажем все же простой пример случая, где нужной поверхности S?
не существует. Пусть кривая X есть окружность радиуса 1, а область —
совокупность точек пространства, отстоящих от этой окружности не более
чем на у (поверхность такой области называют «тором»). Тогда, очевидно,
вообще не существут такой поверхности, которая целиком принадлежала бы
области и в то же время имела своим контуром окружность X.
**) Мы предполагаем при этом, что читатель знаком с элементами век-
торной алгебры.
§ 130] ЭЛЕМЕНТЫ ТЕОРИИ ПОЛЯ 603
личины, являющиеся векторами, в дальнейшем будут печататься
жирным шрифтом. Числовое значение (неотрицательное) вектора F
мы будем обозначать через |F|, а компоненты его по осям координат
соответственно через Fx, Fv и Fz.
Если мы имеем скалярную величину F, определенную в каждой
точке пространства или некоторой его части, то совокупность этих
значений величины F называют скалярным полем. Задание
скалярного поля, очевидно, ничем по существу не отличается от за-
дания некоторой функции F(x, у, г) координат точки. Мы имеем
дело с векторным полем, если в каждой точке пространства
или некоторой его части определен (по величине и направлению)
вектор F; для этого, как известно, достаточно определить в каждой
такой точке три компоненты Fx, Fy и Fz вектора F; таким обра-
зом, задание векторного поля равносильно заданию трех функ-
ций Fx(x, у, г), Fy(x, у, z) и Fz(x, у, z) координат точки про-
странства.
2. Поверхности уровня и градиент скалярного
поля. Пусть в пространстве или некоторой его части задано ска-
лярное поле F(x, у, z); мы всегда будем предполагать, чго функция F
имеет в данной части пространства непрерывные частные производ-
ные первого порядка. Уравнение
F(x, у, z) = C,
где С—любое постоянное число, определяет собой, вообще говоря,
некоторую поверхность, которую мы будем называть поверх-
ностью уровня данного скалярного поля; каждому значению С
соответствует определенная поверхность уровня; непосредственно
ясно, что через каждую точку данной части пространства проходит
одна и только одна поверхность уровня данного поля, так что, в ча-
стности, две различные поверхности уровня не могут иметь общих
точек (пересекаться).
Мы знаем (§ 91), что скорость изменения функции F(x, у, z)
в данной точке (х, у, z) по данному направлению к измеряется (по
абсолютной величине и по знаку) производной D\F функции F по
этому направлению; эта производная (§ 91) выражается формулой
' D*F=scostt+^cosp+£COST1
где а, р и у означают углы, соответственно образуемые направле-
нием к с положительными направлениями осей OX, OY и OZ.
Рассмотрим теперь наряду со скалярным полем F(x, у, z) век-
торное поле О(х, у, z), определяемое соотношениями
г дР r dF г дР
°у=Ъ’
604 поверхностные интегралы [гл. 29
так что
10<x,,,.)!=K(g)’+o+(g’.
Вектор G(x, у, z) называется градиентом скалярного поля F
(в данной точке (х, _у, г)) и обозначается grad F. По известным пра-
вилам векторной алгебры величина
D\F= Qx cos а Gy cos р -j- G2 cos у
есть проекция вектора О на направление X, т. е.
DkF—\G\ cos (О, X),
где (О, X) означает угол, образуемый направлением градиента G
с данным направлением X.
Если мы будем сравнивать между собой быстроту | DKF | изме-
нения функции F по различным направлениям X в одной и той же
точке (х, у, z), то последнее равенство показывает, что эта быстрота
будет наибольшей, когда |cos(G, X) | = 1, т. е. когда направление X
совпадает с направлением градиента (или противоположно ему). Та-
ким образом, направление градиента для каждой точки есть на-
правление быстрейшего изменения данного скалярного поля; эта
наибольшая быстрота изменения измеряется величиной
I г\—л/~(dF\*.(dF\*.(dF\*
о dF dF dF
Заметим, наконец, что, так как пропорциональны
(§ 99) направляющим косинусам нормали к поверхности F(x, у, z)~
— С в точке (х, _у, г), то направление градиента совпадает с на-
правлением нормали к поверхности уровня, проходящей через дан-
ную точку. Величина же |G| = |gradF| градиента измеряется абсо-
лютным значением производной функции F по направлению нормали
к dF
к поверхности уровня; обозначая эту производную через , мы имеем
таким образом:
^radFl=l-KI-
3. Расхождение (дивергенция) векторного поля
и поток сквозь данную поверхность. Пусть в простран-
стве или некоторой его части задано векторное поле F(x, у, z).
В приложениях играет важную роль величина
дх 1 ду 1 dz ’
называемая расхождением или дивергенцией векторного
поля F в точке (х, у, z). В данной точке расхождение поля пред-
§ 130]
ЭЛЕМЕНТЫ ТЕОРИИ ПОЛЯ
605
ставляет собой скалярную величину, а совокупность его значений
в рассматриваемой части пространства образует скалярное поле.
Мы обращаемся теперь к определению очень важного для меха-
нических и физических приложений понятия потока данного век-
торного поля' сквозь данную поверхность. Чтобы сделать это по-
нятие более наглядным, мы начнем с гидродинамической модели.
Пусть выбранная нами часть пространства заполнена движущейся
жидкостью; возьмем в этой пространственной области некоторую
двустороннюю поверхность S?, все равно — замкнутую или ограни-
ченную каким-либо контуром, и выберем на этой поверхности какую-
либо определенную сторону в смысле § 127. Пусть da— элемент
(очень малая площадка) поверхности Если в данный момент вре-
мени скорость течения жидкости в какой-либо точке элемента da
выражается вектором F, то количество жидкости, которое протечет
сквозь этот элемент за малый промежуток времени dt в направлении,
указываемом выбранной стороной поверхности, будет, очевидно,
равно (с точностью до бесконечно малых высших порядков) коли-
честву жидкости, которое может поместиться в цилиндре, имеющем
своим основанием площадку da, а образующими — прямолинейные
отрезки, параллельные вектору F и имеющие длину \F\dt. Объем
такого цилиндра равен, очевидно, \Fn\dtda, где Fn — проекция век-
тора F на то направление нормали к поверхности da, которое соот-
ветствует выбранной нами стороне этой поверхности. Поэтому масса
жидкости, протекающая за время dt сквозь элемент da, может быть
записана в виде
pFn dt da,
где р — плотность жидкости и где мы считаем массу протекающей
жидкости положительной или отрицательной, смотря по тому, течет
ли жидкость в выбранном нами направлении (Fn 0) или в обратном
(Fn<^0). Масса жидкости, протекающей через площадку da в еди-
ницу времени, будет поэтому:
а масса жидкости, протекающей в единицу времени через всю по-
верхность oF, выразится поверхностным интегралом
М = f f pFn da.
Если мы обозначим через а, р, у углы, составляемые выбранным
нами направлением нормали к поверхности 3? с положительными
направлениями координатных осей, то, очевидно, мы будем иметь по
правилам векторной алгебры:
рп=рх cos а -|- Fs cos Р -|- Ft cos у,
606
ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
[гл. 29
и величина М (если считать для простоты р постоянным) может быть
записана в виде
(Fx cos a -J- Fy cos р -|- Fz cos 7) do.
По причинам, которые теперь нам понятны, поверхностный ин-
теграл
cos а Fy cos р -(- Fz cos у) da = J j*
распространенный на определенную сторону поверхности назы-
вают потоком векторного поля F(x, у, z) сквозь по-
верхность S? в направлении, определяемом выбранной нами сто-
роной этой поверхности. В предыдущем мы не раз встречали
интегралы этого типа. Таким интегралом является, например, по-
верхностный интеграл в формуле Остроградского (3) (§ 128), если
понимать в нем (что, конечно, всегда возможно) Р, Q и 7? как ком-
поненты Fx, Fv, Fz некоторого вектора F по координатным осям;
если мы еще обратим внимание на то, что в левой части формулы (3)
§ 128 подинтегральная функция, очевидно, будет в этом случае
представлять собой расхождение вектора F, то вся формула Остро-
градского может быть записана в виде
JJJ Fdxdydz= JJ Fndv,
одновременно очень простом и чрезвычайно выразительном. Содер-
жанием этой формулы в ее векторном понимании является, таким
образом, утверждение, что поток векторного поля изнутри замкнутой
поверхности равен интегралу расхождения этого поля по области,
ограничиваемой данной поверхностью. В частности, теорема, дока-
занная нами* в конце § 128, получает следующую формулировку:
для того чтобы поток данного векторного поля сквозь любую
замкнутую поверхность в данной области равнялся нулю, не-
обходимо и достаточно, чтобы расхождение этого поля тожде-
ственно обращалось в нуль в области
4. Циркуляция векторного поля. Вихревой век-
тор. Потенциальное поле. Убедимся теперь, что и фор-
мула Стокса (§ 129) получает простую и удобную векторную ин-
терпретацию. В правой части этой формулы ((7) § 129) стоит
интеграл
f (Pdx ~[-Qdy-\-Rdz),
§ 130] ЭЛЕМЕНТЫ ТЕОРИИ ПОЛЯ 607
который мы согласно § 125 можем представить в виде
J (Р cos а Q cos b -|- R cos с) dX,
X
где а, Ь, с означают углы касательной к кривой X с положитель-
ными направлениями осей координат. Если мы введем в рассмотрение
векторное поле F(x, у, г) с компонентами
Fx = P9 Fy = Q, Fz — Rt (1)
то подинтегральная функция, очевидно, обращается в проекцию Ft
вектора F на направление касательной к кривой <3? в данной ее
точке, и наш интеграл может быть записан в виде
х
Такой интеграл называют циркуляцией векторного поля F
вдоль замкнутого пути разумеется, Ft представляет собой проек-
цию вектора F на касательную к кривой X в направлении обхода
этого контура.
Обратимся теперь к левой части формулы (7) § 129. Мы знаем
на основании формулы (4) § 127, что эта левая часть может быть
представлена в виде
f f f/d/? dQ\ . fdP dR\ Q . [dQ dP\ ) ,
J J W-^)cosa + U-^) cos₽ + (^—^)cos4rf0’
где углы a, p, у имеют обычное значение (направление нормали
должно, конечно, соответствовать выбранной стороне поверхности
в свою очередь хорошо известным образом согласованной с направле-
нием обхода контура 3? в правой части формулы). Наряду с век-
торным полем F(x, у, z) с компонентами (1) введем теперь одно-
значно определяемое им другое, векторное поле С(х, у, г), компо-
нентами которого служат функции
с __dFz____dFy r _____dFx___dFz r _____dFy___dFx t
x dy dz 9 у dz dx 9 z dx dy 9
вектор С, играющий важную роль в гидродинамике, называется
вихревым вектором или ротором данного поля F, а сово-
купность его значений — вихревым полем (относительно поля F).
Вихревой вектор С часто обозначают через rotF («ротор вектора F»).
В этих обозначениях последний интеграл может быть записан в виде
| С (Сх cos a Су cos р -j" Cz cos 7) da = | I Cn da,
608 поверхностные интегралы [гл. 29
где Сп — проекция вихревого вектора C=rotF на то направление
нормали к поверхности которое соответствует выбранной нами
стороне этой поверхности. Таким образом, формула Стокса может
быть записана в виде
где выбираемая сторона поверхности S? и направление обхода кон-
тура X согласованы между собой известным нам правилом § 129.
Векторная интерпретация этой формулы состоит, таким образом,
в том, что поток вихревого поля С сквозь данную поверхность
ограниченную контуром 3?, равен циркуляции данного векторного
поля F вдоль этого контура (причем направление потока и на-
правление обхода контура 3? должны быть определенным образом
согласованы между собой).
В качестве примера общих теорем теории поля приведем еще
формулировку в векторной терминологии дой леммы, которую мы,
пользуясь формулой Стокса, доказали в конце § 129: если в неко-
торой области &JF пространства векторное поле F таково, что
соответствующее вихревое поле отсутствует (т. е. rotF=0
в каждой точке области СТ>), то циркуляция поля F обращается
в нуль вдоль любой замкнутой кривой, могущей служить конту-
ром поверхности, целиком лежащей внутри области Обратная
теорема также справедлива, как это легко следует из лемм, форму-
лированных в конце § 125.
Если для данного векторного поля F вихревой вектор rotF об-
ращается в нуль в каждой точке некоторой пространственной обла-
сти то это значит, что в этой области
dFx _ dFy dFx _ dFz dFy _ dFz .
dy dx 9 dz dx 9 dz dy ’
в силу же лемм § 125 эти условия необходимы и достаточны для
того, чтобы выражение
Fx dx 4- Fy dy 4- Fz dz
было дифференциалом некоторой функции U(x, у, z), т. е. чтобы
существовала такая функция U, для которой
____р dU_____р dU_____р , zq\
dx~r*> dy~ry> dz~r^
Если такая функция существует, ее называют потенциалом или
потенциальной функцией поля F, а самое поле F—по-
тенциальным полем. Наконец, если выполняются соотношения
(2), то это, очевидно, значит, что вектор F представляет собой
§ 130]
ЭЛЕМЕНТЫ ТЕОРИИ ПОЛЯ
609
градиент скалярного поля, определяемого функцией U. Таким обра-
зом, из всего предшествующего вытекает, что потенциальное поле,
безвихревое поле (т. е. такое, для которого вихревой вектор тожде-
ственно обращается в нуль) и поле градиента (F=g^dU) пред-
ставляют собой совпадающие понятия (по крайней мере для областей
достаточно простой формы). В частности, мы имеем для любого
скалярного поля £7(х, у, z)
rot grad £7=0.
Упражнения к § 130 см. в задачнике Б. П. Демидовича, отдел VIII,
задачи 436, 438, 439, 452, 468, 483.
ЗАКЛЮЧЕНИЕ
Краткий исторический очерк
I
На протяжении XVII столетия запросы практики, связанные с раз-
витием общественных и хозяйственных отношений и обусловленные
техническим прогрессом во всех видах человеческой деятельности,
поставили перед математиками большое число новых задач. Среди
этих задач, возникавших преимущественно в областях геометрии
и механики, быстро выделилась обширная группа таких, которые
принципиально отличались от ббльшей части предшествующей мате-
матической проблематики и для решения которых требовалось соз-
дание совершенно новых методов. Естественно, что на этот круг
задач сразу устремились усилия наиболее выдающихся умов эпохи.
Тот новый момент, который отличал задачи этой области от всего
предшествующего, не мог еще, разумеется, в то время быть осознан
с полной отчетливостью сколько-нибудь широкими кругами ученых.
Сейчас мы видим его с ясностью, не допускающей никаких сомне-
ний: новая проблематика объединялась требованием такого изучения
реально встречающихся величин, при котором в центр внимания
ставятся не отдельные значения этих величин в тот или другой момент
процесса, а самый характер изменения этих величин в данном
явлении.
Как это обычно бывает при возникновении новых областей мате-
матической науки, методы решения новых задач постепенно рожда-
лись и укреплялись в процессе исследования отдельных конкретных
вопросов, общие же их черты, составляющие собой теоретические
основы данной научной области, намечались и выяснялись сравнительно
медленно и могли быть осознаны в своей полноте лишь после того,
как было решено большое число таких конкретных задач. С нашей,
современной точки зрения мы теперь ясно видим, что большинство
задач, о которых здесь идет речь, группировалось около тех двух цент-
ральных проблем, которые мы теперь называем проблемой дифференци-
рования и проблемой интегрирования функций: В обоих случаях
основным понятием вновь создающейся науки было понятие функции,
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
611
т. е. величины, изменяющейся в точной зависимости от изменения
некоторых других величин. Таким образом, с методологической сто-
роны требования, предъявляемые жизнью к новому учению, полностью
соответствовали диалектическим принципам познания природы: изуче-
нию величин не в их мгновенном состоянии, а в процессе их изме-
нения, и не в отрыве друг от друга, а в тесной взаимной зависи-
мости. Энгельс совершенно правильно указывал позднее, что вместе
с переменной величиной как основным объектом исследования в мате-
матику вошли движение и диалектика.
Основные контуры первых разделов нового учения, над созданием
которого работали почти все крупнейшие ученые XVII столетия,
наметились достаточно отчетливо лишь в самом конце века и нашли
себе выражение в фундаментальных трудах Ньютона и Лейбница.
Появление этих трудов обычно и считают датой рождения дифферен-
циального и интегрального исчисления. Ньютон и Лейбниц незави-
симо друг от друга и на несколько различной методологической
основе, обобщая исследования своих многочисленных предшествен-
ников, дали первые достаточно общие и стройные изложения нового
учения. Важнейшей заслугой обоих великих ученых справедливо
признается то, что в их. изложении впервые центральное место
принадлежало той связи между дифференцированием и интегрирова-
нием функций (§ 50), которая показывает взаимно обратный характер
этих двух основных операций математического анализа и которая
исторически стала с этого момента главной движущей пружиной
дальнейшего развития всей этой научной области. Им же принадлежит
введение в математику бесконечных рядов, быстро сделавшихся важ-
нейшим орудием исследования в математическом анализе.
II
С XVIII столетия начинается быстрое развитие дифференциального
и интегрального исчисления, сопровождающееся как созданием новых
обширных научных областей внутри самой математики (дифферен-
циальные уравнения, вариационное исчисление, позднее — интеграль-
ные уравнения, общий функциональный анализ и т. д.), так и мощным
проникновением методов «анализа бесконечно малых» во всё расши-
ряющийся круг прикладных областей. Можно без преувеличения
сказать, что за всю свою историю математика не знала другой эпохи,
когда в столь короткий исторический срок на ее долю выпало бы
такое количество фундаментальных достижений, в своей совокупности
радикально изменивших ее лицо и безгранично расширивших ее про-
блематику.
В самой области дифференциального и интегрального исчисления
создаются теоремы о средних значениях, в соединении с развитием идеи
бесконечного ряда приводящие к разложению функций в ряды, в первую
очередь — степенные и создающие возможность точного исследования
612 КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
этих разложений. Быстро расширяются приемы интегрирования функ-
ций, подвергаются систематическому исследованию новые трансцен-
дентные функции, порождаемые процессом интеграции, в частности,
изучается ряд важнейших функций, определяемых с помощью интегра-
лов, зависящих от параметров (см. начало главы 26). Идеи диффе-
ренциального и интегрального исчисления все шире и глубже рас-
пространяются на функции нескольких переменных. Невозможно пере-
числить имена хотя бы только крупнейших математиков, принимавших
участие в этом развитии. Все же надо отметить, что за первый период
новой эпохи заметно выделяется творчество двух великих ученых —
Эйлера и Лагранжа, — которые явились основоположниками боль-
шого числа новых направлений, оказавшихся наиболее актуальными
в дальнейшем развитии анализа. Петербургский академик Л. Эйлер
известен не только как автор ряда специальных исследований
(«подстановки Эйлера», § 63, «эйлеровы интегралы», § 112, теорема об
однородных функциях, § 93 и др.), но и как один из творцов теории
дифференциальных уравнений и вариационного исчисления; он же
расширил и систематизировал введенную Ньютоном идею бесконеч-
ного ряда и впервые выдвинул важнейшее понятие аналитической
функции; наконец, труды Эйлера содержат и большое число весьма
разнообразных прикладных задач, к решению которых он применял
новые методы. Лагранжу принадлежит открытие фундаментальной
роли «теорем о средних значениях» и первое систематическое исполь-
зование их, в частности — оценка остаточного члена ряда Тэйлора,
а также вообще систематическое выдвижение степенных рядов как
основного аппарата исследования функций; далее, им впервые были
изложены элементы вариационного исчисления как систематически
построенной самостоятельной ветви математического анализа, с введе-
нием понятия вариации и установлением формальных правил варьиро-
вания. Но самым значительным творением Лагранжа в новой области
было создание «аналитической механики» — систематическое построе-
ние основ теоретической механики методами анализа бесконечно малых.
Это был первый систематический труд в этой области, ставший воз-
можным после исследований Эйлера; вместе с тем он отличался
такой законченностью, что и до настоящего времени сохраняет свое
основоположное значение, несмотря на дальнейшее значительное
развитие механики.
Вслед за механикой, а отчасти и параллельно с нею, методы ана-
лиза бесконечно малых стали быстро проникать как в другие раз-
делы математики (геометрию), так и во все расширяющийся круг при-
кладных областей. Среди приложений, для которых применение новых
методов оказалось позднее особенно плодотворным, следует в первую
очередь отметить целый ряд разделов математической физики (тео-
рия теплоты, акустика, электродинамика, теория диффузии и много
других) и математическую теорию вероятностей (Бернулли, Муавр,
Лаплас). Этот процесс постепенного овладения с помощью методов
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
613
математического анализа длинным рядом областей теоретического
и прикладного знания неуклонно продолжался и в течение всего
XIX столетия; он продолжается и в наши дни, когда круг приложений
дифференциального и интегрального исчисления настолько расши-
рился, что с основами этого учения для своих практических целей
теперь должен быть знаком каждый инженер. Прослеживая историю
этих постепенных завоеваний метода бесконечно малых, мы с полной
ясностью видим и основную причину столь победоносного развития.
Она бесспорно заключается в том, что этот метод, удовлетворяя
требованиям диалектико-материалистической теории познания, создает
такой математический аппарат, который по своей форме наилучшим
возможным образом способен охватить основные черты большинства
явлений внешнего мира.
III
Если, таким образом, уже на протяжении XVIII века конкретные
достижения метода бесконечно малых являют собой внушительную,
небывалую по своему богатству картину, то совершенно иначе обстоит
дело с задачей логического обоснования нового учения. Здание диф-
ференциального и интегрального исчисления, включая его многочис-
ленные приложения, строилось так стремительно и с таким голово-
кружительным успехом, что его строителям нехватало времени для
ревизии и укрепления фундамента. А между тем как раз с основа-
ниями математического анализа дело обстояло весьма неблагопо-
лучно. Та логическая база, на которой мы строили наш курс, во
всем основном была создана уже в XIX столетии; даже та элемен-
тарная теория пределов, с которой мы ознакомились в главе 2 и кото-
рую нам в двух последующих главах пришлось уточнять и достраи-
вать, чтобы довести ее до уровня требований современной науки, —
даже эта несовершенная теория в XVIII веке была еще неизвестна.
Это была своеобразная картина: ни одно из самых основных поня-
тий анализа не было определено сколько-нибудь точно; вопрос о том,
что такое бесконечно малая величина, подвергался бесчисленным
дискуссиям, с точки зрения логического обоснования совершенно
бесплодным, так как в большинстве случаев ни одна из спорящих
сторон не могла предложить нечего, кроме смутных, ни к чему не
обязывающих образов. Так же обстояло дело с понятиями непрерыв-
ности, дифференциала, производной, интеграла. Представьте себе
только задачу — научить всем этим понятиям человека, не знакомого
с идеей предела, — и вам сразу станет ясно, что вы не сможете дать
ему ничего, кроме описаний, которые не будут претендовать' ни на
какую точность *).
*) Надо все же заметить, что у отдельных наиболее сильных умов пони-
мание новых идей в некоторых пунктах приближалось к современному.
614
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
В наши дни мы считаем первым основным понятием дифферен-
циального исчисления понятие производной; дифференциал же в нашем
понимании является понятием вторичным, определяемым через произ-
водную. В XVIII же столетии, наоборот, первичным и основным, как
правило, считалось понятие дифференциала (хотя уже у Ньютона,
а еще более у Эйлера и Лагранжа, мы встречаем концепции, более
близкие к современному пониманию). Что же наши предшественники
мыслили под именем дифференциала? Если у есть непрерывная функ-
ция от х, то с уменьшением Ах становится сколь угодно малым
и Ьу, причем каждому значению Дх соответствует совершенно оп-
ределенное значение Д_у. Представляли себе дело так, что в самый
последний момент, перед тем как обратиться в нули, Дх и Ьу при-
нимают свои «последние» значения, которые меньше всех других их
возможных значений, и все же еще не нули. Эти-то значения и назы-
ваются бесконечно малыми приращениями или дифференциалами вели-
чин х и у и обозначаются через dx и dy, их отношение у' = ^
(делить можно, так как dx еще не нуль!) называется производной^
по х. Таким образом, дифференциалы понимались не как перемен-
ные, а как постоянные величины, а производная — не как предел
отношения переменных приращений, а как реальное отношение двух
постоянных приращений. В связи с этим и общее понятие бесконечно'
малой величины приобретало те же черты: бесконечно малую пред-
ставляли себе как последний этап уменьшающейся величины, как
такое ее значение, которое меньше всех других значений и за кото-
рым следует уже только нуль, само же оно все же отлично от нуля.
Эго, таким образом, постоянная величина, не допускающая дальней-
шего уменьшения; поэтому такие величины часто называли также
«неделимыми». В полном соответствии с этим интеграл мыслился не
как предел суммы безгранично возрастающего числа безгранично
убывающих слагаемых, а как реальная сумма бесконечного множе-
ства таких «неделимых». Та же причина — отсутствие точной кон-
цепции предельного перехода — заставляла смотреть на сумму беско-
нечного ряда как на результат реального сложения бесконечного
множества слагаемых. Разумеется, такое понимание суммирования
рядов не давало возможности сколько-нибудь точно определить поня-
тие сходимости; безответственное оперирование рядами, сходимость
которых не установлена, было одним из важнейших зол той мате-
матической эпохи, приводившим нередко к парадоксам и прямым
ошибкам.
То, что вся эта система воззрений не могла быть сохранена, так
как при любой попытке точного формулирования обнаруживала внут-
ренние логические противоречия, — в наши дни ясно, конечно, каж-
дому. Однако и математики XVIII столетия, по крайней мере многие
из них, ясно понимали недоброкачественность логической базы, на
которой строилось новое учение. В отличие от нас они не могли
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК 615
только противопоставить этой базе ничего более прочного. Время
от времени публиковались сочинения, в которых господствующие
логические основания математического анализа подвергались суровой
критике, а подчас — насмешкам и издевательствам. Однако конкрет-
ные завоевания нового учения были так многочисленны и так значи-
тельны, что все сомнения подобного рода не могли остановить могу-
чего творческого порыва строителей новой научной области. Они
продолжали быстро строить здание, откладывая пересмотр и укреп-
ление фундамента до более подходящего времени. Исторически
характерен для настроений этого рода известный призыв Даламбера:
«идите вперед, уверенность придет к вам позже».
IV
Эта уверенность действительно пришла, но пришла уже в XIX
столетии, когда многие из наиболее насущных назревших вопросов
самого анализа и его важнейших приложений были в основном раз-
решены. Это, с одной стороны, позволяло не гак торопиться, как
прежде, и уделить некоторую долю усилий пересмотру основ; с дру-
гой стороны, возросшая научная зрелость новой теории, как это
всегда бывает, стимулировала критические тенденции и делала
создавшееся в логических основаниях анализа положение долее
нетерпимым.
В двадцатых годах XIX века появляются курсы (в первую очередь
«Курс анализа» Коши), в которых математический анализ уже систе-
матически строится на новой базе — на идее предельного перехода
в ее современном понимании. С первых шагов мы встречаемся здесь
уже со строгим определением таких понятий, как бесконечно малая
величина, непрерывность, дифференциал и интеграл; сумма бесконеч-
ного ряда трактуется уже как предел частичных сумм, а не как
результат сложения бесконечного множества чисел, что делает воз-
можным точное определение сходимости и строгий запрет пользова-
ния расходящимися рядами. Впервые дается доказательство существо-
вания интеграла и решения дифференциального уравнения. Как и
всегда в подобных случаях, нельзя, конечно, считать эту перестройку
основ единоличным делом Коши; для новых идей назрело время, они
стали насущной необходимостью, они формировались в нужном
направлении у многих выдающихся умов эпохи. За несколько лет
до появления «Курса» Коши чешский философ-математик Больцано
получил ряд результатов, предвосхищающих многое из того, что мы
находим у Коши, и, в частности, содержащих вполне современное
точное определение непрерывности, а также первый пример непре-
рывной функции, нигде не имеющей производной. В создании строгой
теории бесконечных рядов одновременно с Коши фундаментальные
результаты были получены Абелем. Несомненно, однако, что в своем
«Курсе» Коши впервые опубликовал большой, объемлющий все
616 КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
основные вопросы трактат по анализу бесконечно малых, построен-
ный на новой логической базе; эта книга на долгое время стала
образцом для других трактатов, посвященных тому же предмету.
Впрочем, концепции Коши в последующие десятилетия потребовали
все же еще отдельных уточнений и даже исправлений; так, например,
у Коши отсутствует понятие равномерной сходимости ряда; в его
курсе доказывается (неверная, как мы знаем) теорема о том, что
сумма сходящегося ряда функций, непрерывных в некотором отрезке,
всегда также непрерывна в этом отрезке. Сама идея предела, в прин-
ципе оставшаяся неизменной до наших дней, потребовала все же
в дальнейшем тех более четких формулировок, которые были нами
указаны в §§ 14, 15 и затем использованы на всем протяжении нашей
книги.
Однако самым крупным событием в истории логического обосно-
вания математического анализа после эпохи Коши несомнейно яви-
лось создание общей теории вещественных чисел в семидесятых
годах XIX века. Необходимость в построении такой теории в эти
годы ощущалась с такой же острогой, с какой в начале века мате-
матики чувствовали необходимость разобраться в точном смысле
идеи бесконечно малой величины. В главе 4 мы подробно показали,
почему обоснование математического анализа не может быть завер-
шено без общей теории континуума; там же мы наметили один из
простейших способов построения такой теории. В 70-х годах про-
шлого столетия одновременно появилось несколько таких теорий;
все они были вполне удовлетворительны, каждая из них имела свои
преимущества, и в формально-логическом смысле они были в основ-
ном равносильны между собой. Среди творцов этих теорий следует
в первую очередь назвать имена Вейерштрасса, Дедекинда и Кантора.
Теория вещественных чисел не может, конечно, рассматриваться
как глава математического анализа. Построение ее есть дело теории
чисел и теории множеств. Однако числа образуют собой ту среду,
в которой живут и развиваются все понятия математического ана-
лиза, и потому невозможно полноценное обоснование анализа до тех
пор, пока свойства этой среды не будут изучены до конца. Поэтому
только после создания законченной общей теории континуума мате-
матический анализ обретает свое современное лицо.
V
Само собой разумеется, что параллельно с ревизией и укрепле-
нием фундамента продолжалось и продолжается до сих пор и по-
строение самого здания математического анализа. В течение первой
половины XIX столетия внимание ученых еще сильно привлечено
к задачам интегрального исчисления. Исследование вопросов инте-
грируемости в элементарных функциях; изучение новых трансцен-
дентных функций, определяемых как примитивные элементарных
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
617
(в частности, алгебраических) функций или с помощью интегралов,
зависящих от параметров; завершение общей теории многомерных
(кратных) интегралов и ряд других задач подвергается тщательному
изучению.
Однако, начиная со второй половины прошлого столетия, центр
тяжести научных интересов аналитиков все более и более переме-
щается в сторону высших разделов анализа, прежде всего — теории
дифференциальных уравнений, задачи которой и в настоящее время
занимают центральное место в аналитической проблематике. К этому
в конце века прибавляется совсем новая область — теория интеграль-
ных и интегродифференциальных уравнений, сразу привлекшая к себе
значительное внимание главным образом благодаря возможности
многочисленных практических приложений. Наконец, вариационное
исчисление, систематически развивавшееся с начала XVIII века,
в последние десятилетия все более и более рассматривается как
частная задача новой, весьма широкой и важной научной области —
функционального анализа, — общее развитие которой привлекает
к себе все больший и больший интерес. >
Если, таким образом, под именем математического анализа по-
нимать не только дифференциальное и интегральное исчисление, но
и всю совокупность встающих над ними высших разделов аналити-
ческой науки, то горизонты этой науки расширяются безгранично,
и вряд ли когда-либо можно будет говорить об исчерпании ее про-
блематики, так как история показывает, что в математическом ана-
лизе, раньше чем завершается один круг проблем, над ним неизменно
встает ряд других, требующих безотлагательного внимания.
VI
С XIX столетия в работу над развитием математического анализа
включаются русские математики — сначала отдельные ученые, а за-
тем и мощные математические школы. Вклад нашей отечественной
науки в это дело на протяжении XIX и первой половины XX сто-
летия настолько значителен, что, несомненно, заслуживает отдельного
обзора, тем более, что творения русских ученых в этой области,
независимо от своей крупной научной ценности, отмечены, как мы
увидим, и особым стилем, заметно отличающим их от работ зару-
бежных математиков.
Наш великий геометр Н. И. Лобачевский, как известно, вопро-
сами математического анализа почти не занимался; тем более заме-
чательно, что ему принадлежат высказывания, по своей глубине и
значительности превосходящие воззрения специалистов его эпохи.
Так, современное определение понятия функциональной зависимости,
которое обычно связывают с именем Дирихле и которое создалось
в результате победы реалистического, содержательного подхода над
формалистическим (см. § 4), несколькими годами ранее было с полной
618 КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
отчетливостью высказано Лобачевским *); в его формулировке ясно
подчеркивается, что для наличия функциональной зависимости вели-
чины у от величины х важно лишь, чтобы каждому значению вели-
чины х соответствовало определенное значение величины у, неза-
висимо от того, каким способом задается это соответствие. Но
это и есть идея определения Дирихле в ее чистом виде.
В нашем курсе мы дважды встречались с именем выдающегося
русского математика. М. В. Остроградского; кроме найденного им
замечательного приема интеграции рациональных функций (§ 61) и
его знаменитой формулы, выражающей тройной интеграл, распро-
страненный на некоторую трехмерную область, через двойной инте-
грал, взятый по поверхности этой области ♦*), Остроградскому при-
надлежит и целый ряд других результатов фундаментального значе-
ния в интегральном исчислении; в частности, им впервые были до-
казаны формулы преобразования переменных в многомерных инте-
гралах и выявлена та роль, которую в таких преобразованиях играют
так называемые «функциональные определители» или «якобианы»
(это название происходит от имени немецкого математика Якоби,
изучавшего свойства таких определителей уже после упомянутых
открытий Остроградского, к сожалению, оставшихся необнародован-
ными)***).
Остроградскому принадлежат также глубокие и важные исследо-
вания в аналитической механике и в вариационном исчислении. Ха-
рактерным для стиля всех его работ (кроме перечисленных областей,
он занимался еще баллистикой, небесной механикой, теорией веро-
ятностей, теорией алгебраических функций и др.) является сочетание
глубокого интереса к прикладным знаниям и стремления ставить ма-
тематические задачи возможно более широко, в весьма общей форме,
подходя всегда к их решению с безукоризненной строгостью.
Около середины XIX столетия начинают появляться исследования
величайшего русского аналитика П. Л. Чебышева. Чебышев принад-
лежал к числу тех математиков, которые с одинаковым интересом
и одинаковым успехом работают в самых различных областях мате-
матической науки. Он занимался вопросами интегрального исчисления,
приближения функций многочленами, интерполяции различного рода,
теории чисел, теории вероятностей и теории механизмов; и почти
в каждой из этих областей он создал новые мощные методы, при-
менение которых на много десятилетий стало благодарным поприщем
для трудов его учеников и последователей. Его учение о прибли-
жении функций многочленами развилось к настоящему времени в боль-
*) См. Б. В. Гнеденко, Очерки по истории математики в России,
Гостехиздат, 1946, стр. 96.
**) М. В. Остроградский решил эту задачу для пространства любого числа
измерений, т. е. установил общую формулу, сводящую вычисление л-кратного
интеграла к вычислению (п—1)-кратного интеграла.
***) В тексте книги мы называли их «определителями Остроградского»*
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
619
шую и самостоятельную математическую дисциплину — «конструк-
тивную теорию функций». Его работы по теории вероятностей со-
вершенно преобразили лицо этой науки, впервые указав ей общую
проблематику и создав методы решения этих общих задач. В теории
чисел Чебышев, с одной стороны, впервые после долгого застоя про-
двинул значительно вперед вопрос о распределении простых чисел
в натуральном ряду, а с другой — положил начало постановке и
решению неоднородных задач теории диофантовых приближений,
в обоих случаях открывая грядущим поколениям такое поле деятель-
ности, которое не исчерпано и до настоящего времени. Работы Че-
бышева по теории механизмов до сих пор не утратили своего зна-
чения как для теории, так и для практики. В интересующей нас
области математического анализа Чебышеву принадлежит ряд иссле-
дований по очень трудным вопросам интегрируемости в элементарных
функциях, в частности — знаменитая теорема об интегрировании би-
номиальных дифференциалов (§ 64). Кроме того, Чебышевым опубли-
ковано несколько важных работ по интегрированию рациональных
функций, по приближенному вычислению интегралов, по интерполи-
рованию и по так называемой «проблеме моментов».
Для научного стиля работ Чебышева характерна прежде всего
неразрывная близость их устремлений к запросам практики. В своей
статье «Черчение географических карт» Чебышев писал: «Сближение
теории с практикою дает самые благотворные результаты, и не одна
только практика от этого выигрывает; сами науки развиваются под
влиянием ее: она открывает им новые предметы для исследования,
или новые стороны в предметах давно известных». Лучшим приме-
ром, иллюстрирующим этот тезис Чебышева, может служить тот факт,
что к созданию общих основ теории приближения функций много-
членами он был приведен необходимостью решить одну конкретную,
практически важную задачу из области теории механизмов. Однако
этот же пример ярко рисует нам и вторую основную черту научного
творчества Чебышева. Чутко прислушиваясь к запросам практики, Чебы-
шев почти никогда не подходил к выдвигаемым ею задачам с намерением
найти решение только одного данного узкого вопроса. Напротив, он
всегда стремился ставить такие задачи в возможно более общей форме;
целью его всегда являлось создание возможно более широкой мате-
матической теории, охватывающей, кроме данной задачи, еще большое
число других, ей подобных. Вся история развития математической
науки показывает, что именно этот путь служения целям практики
является наиболее плодотворным для всех математических дисциплин.
Чебышев создал первую в России крупную математическую школу,
которая вскоре приобрела выдающееся мировое значение. Блестящая
плеяда непосредственных учеников Чебышева (Золотарев, Ляпунов,
Марков и др.) частью продолжала исследования в указанных им на-
правлениях, а частью устремилась на завоевание новых научных об-
ластей. Для истории математического анализа и его физических при-
620
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК
ложений наиболее важными являются замечательные работы А. М. Ля-
пунова. Ляпунов создал в анализе новое течение, возникшее из задач
механики и математической физики, но быстро получившее самостоя-
тельное математическое значение. Основными объектами его иссле-
дований были, с одной стороны, условия равновесия жидких тел
(важные для обоснования формы небесных тел), а с другой — вопросы
устойчивости или неустойчивости равновесия и движения механи-
ческих систем. В ту эпоху (примерно на рубеже XIX и XX столетий)
эти вопросы вообще привлекали значительное внимание; в частности,
Ляпунов работал параллельно со знаменитым французским ученым
Пуанкаре, занимавшимся теми же проблемами. Очень интересно от-
метить различия в стиле исследований этих двух ученых, так как
они характерны для всей русской математической школы в противо-
положность многим западноевропейским школам. Пуанкаре при реше-
нии физических задач часто допускал нестрогие рассуждения и, сам
сознавая это, утверждал, что «в механике нельзя требовать такой же
строгости, как в чистом анализе». В противоположность этому Ля-
пунов при решении тех же задач требовал абсолютной непреложности
рассуждений, говоря*): «непозволительно пользоваться сомнительными
суждениями, коль скоро мы решаем определенную задачу, будь то
задача механики или физики — все равно, которая поставлена совер-
шенно определенно с точки зрения анализа. Она становится тогда
задачей чистого анализа и должна трактоваться как таковая». Есте-
ственно, что при таком различии основной установки результаты Ля-
пунова носят значительно более законченный и фундаментальный
характер, чем достижения французского ученого.
Ляпунов дал первое доказательство очень важной теоремы о замкну-
тости тригонометрической ортогональной системы (§ 83). В области
приложений анализа ему принадлежит первое доказательство так на-
зываемой «центральной предельной теоремы» теории вероятностей,
до сих пор являющейся важнейшим результатом в этой ветви мате-
матики. Доказательство это проведено новым, вполне оригинальным
методом, общие основы которого были разработаны лишь много
позднее и который вообще оказался одним из самых действенных
методов аналитической теории вероятностей.
Особняком от школы Чебышева стоит научное творчество С. В. Ко-
валевской. Среди ее работ две имеют фундаментальное значение; одна
из них принадлежит теории дифференциальных уравнений, другая
посвящена механической задаче о движении твердого тела с непо-
движной точкой. Ковалевская работала преимущественно за границей,
так как в царской России ей как женщине нельзя было получить нужных
условий для научной работы. Тем не менее все ее научное творчество
отмечено типическими чертами русской математической школы. Мы
*) См. Записки Академии наук по физико-математическому отделению,
8 серия, 1905 г., т. 17, № 38, стр. 1—32.
КРАТКИЙ ИСТОРИЧЕСКИЙ ОЧЕРК 621
видим здесь ту же безукоризненную актуальность тематики, тот же
живой интерес к прикладным наукам, ту же широту и общность
в постановке задач и те же жесткие требования строгости матема-
тических рассуждений, которые характерны для Чебышева и всех
его учеников и которые придают всей русской математической школе
своеобразный монументальный стиль, не свойственный в такой мере
ни одной из западноевропейских школ.
Следующее поколение школы Чебышева работало уже частично
в советский период. К этому поколению принадлежат такие виднейшие
представители математического анализа, как В. А. Стеклов и С. Н. Берн-
штейн, значительно обогатившие сокровищницу анализа в области
дифференциальных уравнений, конструктивной теории функции и
ряда других разделов, в том числе и в прикладных областях —
математической физике и теории вероятностей.
Общий расцвет наук в СССР после Великой Октябрьской со-
циалистической революции поднял на значительно более высокую
ступень и работу в области математического анализа, притом как
в количественном, так и в качественном отношении. Наука, и в том
числе математическая наука, числит сейчас в своем составе много
больше работников, чем до революции; с другой стороны, правильное
и компетентное руководство планированием научной работы, науч-
ными учреждениями и научными изданиями, а также тщательная,
планомерная и высокоавторитетная подготовка научной смены обеспе-
чивают качественное повышение научных исследований. Советский
отряд работников математического анализа, руководимый в первую
очередь нашими академиками (С. Н. Бернштейн, М. В. Келдыш,
Н. М. Крылов, М. А. Лаврентьев, И. Г. Петровский, В. И. Смирнов,
С. Л. Соболев), числит за собой уже длинный ряд достижений перво-
степенного значения. Верный славным традициям русской математики
и воодушевленный желанием отдать все силы служению Родине и
советскому народу, он уверенно идет к новым большим завоеваниям.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Абсолютная сходимость интеграла 466
— — ряда 304
Алгебраическая функция 25
Альтернирующие ряды 302
Бесконечно большая величина 36
Бесконечно малая величина 29
----высшего (низшего, одинако-
вого) порядка 48
Бесконечное произведение 311
Биномиальные дифференциалы 276
Векторное поле 603
Вещественные числа 70
Вихревое поле 607
Вихревой вектор 607
Внешняя точка плоской фигуры 519
Внутренняя точка плоской фигуры 518
Возрастание и убывание функций 165
Главная линейная часть приращения
функции 132
Гладкая кривая 232, 234
Градиент 604
Грани ограниченного множества 79
Граница плоской фигуры 519
График функции 21
Двойной интеграл 531
Двумерный континуум 380
Двусторонний предел функции 62
Диаметр области 381
Дивергенция векторного поля 604
Дифференциал функции двух пере-
менных 391
---- одной переменной 132
Дифференциалы высших порядков
142
Дифференцируемость функции двух
переменных 394
---- одной переменной 133
----трех переменных 395
Длина дуги плоской кривой 226, 228
---- пространственной кривой 234
Закон движения 107
Закрытая область 380, 519
Замена переменной в интеграле 185
— переменных в двойном интеграле
543
Замкнутость ортогональной системы
369
Измеримость плоской фигуры 522
Инвариантность первого дифферен-
циала 137
Интеграл 200
—, распространенный на участок кри-
вой 233, 235
—,--------поверхности 555
— с бесконечными пределами 461
Интегральные суммы 201
Интегральный логарифм 481
— признак сходимости рядзв 470
Интегралы от неограниченных функ-
ций 474
— Эйлера 505
Интегрирование алгебраической
суммы 181
— биномиальных дифференциалов 276
— дифференциалов, содержащих по-
казательную функцию 282
— по частям 181
— простых дробей 264
— тригонометрических дифферен-
циалов 278
Интегрируемость функции двух пере-
менных 532
Интервал сходимости степенного
ряда 335
Иррациональные числа 69
Колебание функции в отрезке 204
Конечное покрытие 78
Континуум 70
Контур плоской фигуры 519
Коэффициенты Фурье 361
Кривизна плоской кривой 428
Криволинейный интеграл 560
---пространственный 579
Критерий интегрируемости 204
— существования предела 82
— сходимости бесконечного произ-
ведения 315
Круг кривизны 431
Логарифмическая функция 26
Локальное свойство 88
Локальный экстремум 168, 412
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
623
Максимум функции 168
Мера плоских фигур 522
Метод Остроградского интегрирова-
ния рациональных дробей 267
— подстановки в интегрировании
функций 186
Минимум функции 168
Многочлен 23
Многочлены Бернштейна 353
Направление выпуклости(вогнутости)
кривой 425
Натуральные логарифмы 121
Независимая переменная 15
Неопределенный интеграл 175
Неправильная рациональная дробь
257
Непрерывность суммы функциональ-
ного ряда 324
— функции в отрезке 89
---- в точке 86
— — нескольких переменных 379
Неявная функция 401, 434
Область интеграции 531
— определения функции 17
— сходимости, расходимости ряда 318
---- степенного ряда 336
Обобщенный тригонометрический ряд
376
Обратная функция 96
Обратные тригонометрические функ-
ции 26
Объем тела вращения 242
Ограниченная величина 34
Ограниченное множество чисел 78
Однородная функция 403
Односторонний предел функции 58
Односторонняя непрерывность 89
Операции над бесконечно малыми
величинами 33
Определенный интеграл 200
Определитель Остроградского 443
Ортогональность функций 358
Основная переменная процесса 54
Остаток ряда 288
Остаточный член формулы Тэйлора
159
Открытая область 380, 519
Первообразная функция 175
Переменная величина 12
Плоские фигуры 518
Площадь криволинейной трапеции
191
— поверхности 551
Поверхности уровня 603
Поверхностный интеграл 583
Поверхность тела вращения 242
Пограничная точка плоской фигуры
519
Подинтегральная функция 201
Подинтегральное выражение 201
Подстановки Эйлера 274
Показательная функция 25
Последовательность чисел 56, 57
Потенциал векторного поля 608
Поток векторного поля сквозь по-
верхность 605
Почленное дифференцирование рядов
332
—- интегрирование рядов 328
— сложение и вычитание рядов 291
Правило Лопиталя 150
Правильная рациональная дробь 257
Предел переменной величины 39, 55,
61
— последовательности 57
Пределы интеграции 201
Приближение в среднем 367
Приближенное вычисление интегра-
лов способом парабол 253
---------- трапеций 249
Признак сходимости рядов Даламбера
296
------- Дирихле 305
-------Коши 295
-------Раабе 299
Примитивная функция 175
Принцип сравнения рядов 294
Производная 114
— алгебраической суммы 115
— в данном направлении 396
— логарифма 120
— неявной функции 401
— обратной функции 122
— показательной функции 123
— произведения 116
— сложной функции 121
— степени 114
— степенной функции 123
— частного 117
Производные высших порядков 139
— обратных тригонометрических
функций 124
— тригонометрических функций 118
Промежуток интеграции 201
Равномерная непрерывность функции
одной переменной 97
-------двух переменных 385
— сходимость интеграла 491 ♦
--- последовательности 324
---степенного ряда 339
— — функционального ряда 320
Равносильные бесконечно малые 48
624
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Радиус кривизны 431
— сходимости степенного ряда 335
Разложение рациональной дроби на
простые 262
Разрывность функции 87
Расстояние взаимное двух областей
384
— точки от области 381
Расходимость последовательности 57
— ряда 287
Расхождение векторного поля 604
Рационализация подинтегрального вы-
ражения 271
Рациональная дробь 257
— функция 24
Рациональные числа 64
Ротор векторного поля 607
Ряд Маклорена 343
— Тэйлора 345
— Фурье 361
Ряды многочленов 349
Свойства интеграла 209, 218
— определителей Остроградского
446
Связь интеграла с примитивной функ-
цией 213
Скалярное поле 603
Скорость равномерного изменения
105
Сложная функция 91
Соприкасающийся круг 431
Спрямляемая кривая 230, 234
Стационарная точка 169, 413
Степенная функция 24
Степенной ряд 333
Стягивающаяся последовательность
отрезков 77
--- областей 382
Сумма бесконечного ряда 287
Сходимость интегралов неограничен-
ных функций 474
---с бесконечными пределами
461
— последовательности 57
— ряда 287
- Фурье 373
Теорема Вейерштрасса 352
— Дирихле-Ляпунова 369
— Коши 148
— Лагранжа 146
— Лейбница об альтернирующих ря-
дах 302
Теорема о среднем значении для
двойных интегралов 534
------------- интегралов 220
— Ролля 145
Точка непрерывности, разрыва функ-
ции 88
— перегиба 426
— сходимости, расходимости ряда
318
Трансцендентная функция 25
Тригонометрические функции 26
Тригонометрический многочлен 363
— ряд 357
Уравнение касательной к плоской
кривой 417
---к пространственной кривой 420
--- плоскости к поверхности 424
— нормали к плоской кривой 417
--- к поверхности 424
— нормальной плоскости к простран-
ственной кривой 421
Ускорение 139
Условная сходимость ряда 304
Условный экстремум 453
Форма Коши остаточного члена ряда
Тэйлора 160
— Лагранжа остаточного члена ряда
Тэйлора 160
Формула Грина 572
— Лейбница 141
— Маклорена 157
— Остроградского 596
— Стирлинга 517
— Стокса 601
— Тэйлора 156
---для функции двух переменных
410
Функциональная зависимость 15
Функциональный ряд 317
Функция 17
— Дирихле 19
Целая рациональная функция 23
Центр кривизны 431
Циркуляция векторного пбля 607
Частичные суммы ряда 287
Частные производные 388
---высших порядков 404
Числовая плоскость 378
Эквивалентные бесконечно малые 48
Экстремум функции 168, 412
Элементарные функции 23
Опечатки
Страница Строка ; Напечатано Должно быть
129 4 св. lim, tg ср Дх->0 lim tg ср Дх—>0
185 7 » v — ех, v = ex v( = ех, v = ех
200 1,5, 7 и 8 сн. S' S
346 12 сн. 1 S(4> (X) 1 s{n> (х)
442 7 св. /к», Лк)] fix», fl (х0)]
А. Я» Хинчин. „Краткий курс математического анализа®.