Текст
                    УДК 517
ББК 22.16
И 46
Учебник удостоен
государственной премии СССР за 1980 год
ИЛЬИН В. А., ПОЗНЯК Э. Г. Основы математического анализа:
В 2-х ч. Часть I: Учеб.: Для вузов. — 7-е изд. — М.: ФИЗМАТЛИТ, 2005. —
648 с. — (Курс высшей математики и математической физики). — ISBN
5-9221-0536-1.
Один из выпусков «Курса высшей математики и математической физики»
под редакцией А.Н.Тихонова, В.А.Ильина, А.Г.Свешникова. Учебник создан на
базе лекций, читавшихся авторами в течение ряда лет на физическом факульте-
факультете и факультете вычислительной математики и кибернетики Московского госу-
государственного университета. Книга включает теорию вещественных чисел, теорию
пределов и непрерывности функций, дифференциальное и интегральное исчис-
исчисление функций одной переменной, теорию числовых рядов, дифференциальное
исчисление многих переменных. Воспроизводится с 5-го изд. A998 г.).
Для студентов высших учебных заведений, обучающихся по специальности
«Физика» и «Прикладная математика».
Ил. 117.
Учебное издание
ИЛЬИН Владимир Александрович,
ПОЗНЯК Эдуард Генрихович
ОСНОВЫ МАТЕМАТИЧЕСКОГО АНАЛИЗА
Часть I
Серия «Курс высшей математики и математической физики»
Редактор Д.А. Миртова
Оригинал-макет: Ст.Ю. Мельников
ЛР №071930 от 06.07.99
Подписано в печать 01.09.04. Формат 60x90/16. Бумага офсетная №1.
Печать офсетная. Усл. печ. л. 40,5. Уч.-изд. л. 43,4. Заказ №
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997 Москва, Профсоюзная ул., 90
E-mail: fizmat@maik.ru, fmlsale@maik.ru
http://www.fml.ru
Отпечатано с готовых диапозитивов
в ППП «Типография «Наука»
121099, Москва, Шубинский пер., 6
ISBN 5-9221-0536-1
7859221П 0536 1
ISBN 5-9221-0536-1
© ФИЗМАТЛИТ, 2004, 2005


ОГЛАВЛЕНИЕ Предисловие к седьмому изданию ..................... 15 Предисловие к пятому изданию ....................... 16 Предисловие к первому изданию ...................... 17 Глава 1. Предварительные сведения об основных понятиях математического анализа ................. 19 § 1. Математические понятия, возникающие при описании дви- движения ................................. 19 § 2 Мгновенная скорость и связанные с ней новые математические понятия ................................ 22 § 3 Задача о восстановлении закона движения по скорости и свя- связанная с ней математическая проблематика ........... 29 § 4 Проблемы, возникающие при решении задачи о вычислении пути 31 § 5 Заключительные замечания .................... 35 Глава 2. Теорим вещественных чисел ............... 37 § 1. Вещественные числа ......................... 37 1. Свойства рациональных чисел C7). 2. Об измерении отрезков числовой оси C9). 3. Вещественные числа и правило их сравне- сравнения D2). 4. Приближение вещественного числа рациональными числами D5). 5. Множества вещественных чисел, ограниченные сверху или снизу D6). § 2 Арифметические операции над вещественными числами. Основные свойства вещественных чисел ............. 50 1. Определение суммы вещественных чисел E0). 2. Определе- Определение произведения вещественных чисел E3). 3. Свойства веще- вещественных чисел E3). 4. Некоторые часто употребляемые соот- соотношения E5). § 3. Некоторые конкретные множества вещественных чисел .... 56 Дополнение 1. О переводе чисел из десятичной системы счисления в двоичную и из двоичной системы в десятичную ........ 57 1. Перевод чисел из десятичной системы счисления в двоич- двоичную E7). 2. Перевод чисел из двоичной системы счисления в десятичную E9). Дополнение 2. Об ошибках в округлении чисел в системах счисления с четным и нечетным основаниями ................ 59
ОГЛАВЛЕНИЕ Глава 3. Предел последовательности ............... 61 § 1. Числовые последовательности ................... 61 1. Числовые последовательности и операции над ними F1). 2. Ограниченные и неограниченные последовательности F2). 3. Бесконечно большие и бесконечно малые последовательности F3). 4. Основные свойства бесконечно малых последовательно™ стей F5). § 2. Сходящиеся последовательности и их основные свойства ... 67 1. Понятие сходящейся последовательности F7). 2. Основные свойства сходящихся последовательностей F9). 3. Предельный переход в неравенствах G1). § 3. Монотонные последовательности .................. 73 1. Определение монотонных последовательностей G3). 2. При™ знак сходимости монотонной последовательности G3). 3. Неко- торые примеры сходящихся монотонных последовательностей G5). 4. Число е G8). § 4. Некоторые свойства произвольных последовательностей и чи- числовых множеств ........................... 79 1. Подпоследовательности числовых последовательностей G9). 2. Предельные точки последовательности (81). 3. Существо- Существование предельной точки у ограниченной последовательности (82). 4. О выделении сходящейся подпоследовательности (85). 5. Необходимое и достаточное условие сходимости последова- последовательности (87). 6. Некоторые свойства произвольных числовых множеств (90). Дополнение 1. Теорема Штольца .................... 93 Дополнение 2. О скорости сходимости последовательности прибли- приближающей у/а .............................. 96 Глава 4. Понмтие функции. Предельное значение функции. Непрерывность ........................ 100 § 1. Понятие функции .......................... 100 1. Переменная величина и функция A00). 2. О способах задания функции A02). § 2. Понятие предельного значения функции ............. 103 1. Определение предельного значения функции A03). 2. Ариф- Арифметические операции над функциями, имеющими предельное значение A06). 3. Сравнение бесконечно малых и бесконечно больших функций A07). § 3. Понятие непрерывности функции .................110 1. Определение непрерывности функции A10). 2. Арифметиче- Арифметические операции над непрерывными функциями A12). 3. Слож- Сложная функция и ее непрерывность A12). § 4. Некоторые свойства монотонных функций ............113 1. Определение и примеры монотонных функций A13). 2. Поня- Понятие обратной функции. Монотонные функции, имеющие обрат- обратную A14). § 5. Простейшие элементарные функции ................117 1. Рациональные степени положительных чисел A18). 2. Пока- Показательная функция A20). 3. Логарифмическая функция A23).
ОГЛАВЛЕНИЕ 4. Гиперболические функции A25). 5. Степенная функция с любым вещественным показателем а A26). 6. Тригонометриче- Тригонометрические функции A28). 7. Обратные тригонометрические функции A32). § 6. Предельные значения некоторых функций ............ 133 1. Предварительные замечания A33). 2. Предельное значение функции (sin ж)/ж в точке ж = 0 (первый замечательный пре- предел) A24). 3. Предельное значение функции A + 1/ж)ж при ж —»¦ —>- оо (второй замечательный предел) A35). § 7. Непрерывность и предельные значения некоторых сложных функций ................................ 138 1. Непрерывность и предельные значения некоторых сложных функций A38). 2. Понятие элементарной функции. Класс эле- элементарных функций A42). § 8. Классификация точек разрыва функции ............. 143 1. Точки разрыва функции и их классификация A43). 2. Ку- Кусочно непрерывные функции A45). Дополнение. Доказательство утверждения из п. 6 § 5 ........ 146 1. Доказательство единственности A46). 2. Доказательство су- существования A49). Глава 5. Основы дифференциального исчисления ...... 156 § 1. Производная. Ее физическая и геометрическая интерпретация 156 1. Приращение аргумента и функции. Разностная форма усло- условия непрерывности A56). 2. Определение производной A57). 3. Производная с физической точки зрения A58). 4. Производная с геометрической точки зрения A59). 5. Правая и левая про- производные A60). 6. Понятие производной векторной функции A60). § 2. Понятие дифференцируемости функции ............. 162 1. Понятие дифференцируемости функции в данной точке A62). 2. Связь между понятиями дифференцируемости и непрерывности функции A63). 3. Понятие дифференциала функции A64). § 3. Правила дифференцирования суммы, разности, произведения и частного ............................... 166 § 4. Вычисление производных степенной функции, тригонометри- тригонометрических функций и логарифмической функции .......... 168 1. Производная степенной функции с целочисленным показа- показателем A68). 2. Производная функции у = sin ж A69). 3. Про- Производная функции у = cos ж A70). 4. Производные функций у = tgx л у = ctg# A70). 5. Производная функции у = loga ж @ <аф 1) A71). § 5. Теорема о производной обратной функции ............ 171 § 6. Вычисление производных показательной функции и обратных тригонометрических функций ................... 173 1. Производная показательной функции у = аж @ < о / 1) A73). 2. Производные обратных тригонометрических функций A73).
ОГЛАВЛЕНИЕ § 7. Правило дифференцирования сложной функции ........ 175 § 8. Логарифмическая производная. Производная степенной функ- функции с любым вещественным показателем. Таблица производ- производных простейших элементарных функций ............. 177 1. Понятие логарифмической производной функции A77). 2. Производная степенной функции с любым вещественным по- показателем A78). 3. Таблица производных простейших элемен- элементарных функций A78). § 9. Инвариантность формы первого дифференциала. Некоторые применения дифференциала .................... 179 1. Инвариантность формы первого дифференциала A79). 2. Формулы и правила вычисления дифференциалов A81). 3. Ис- Использование дифференциала для установления приближенных формул A82). § 10. Производные и дифференциалы высших порядков ....... 183 1. Понятие производной п~го порядка A83). 2. п-е производные некоторых функций A84). 3. Формула Лейбница для n-й произ- производной произведения двух функций A85). 4. Дифференциалы высших порядков A86). §11. Дифференцирование функции, заданной параметрически . . . 188 Глава 6. Неопределенный интеграл ................ 190 § 1. Понятие первообразной функции и неопределенного интеграла 190 1. Понятие первообразной функции A90). 2. Неопределенный интеграл A91). 3. Основные свойства неопределенного инте- интеграла A92). 4. Таблица основных неопределенных интегралов A93). § 2. Основные методы интегрирования ................. 196 1. Интегрирование заменой переменной (подстановкой) A96). 2. Интегрирование по частям A99). Глава 7. Комплексные числа. Алгебра многочленов. Инте- Интегрирование в элементарных функцимх ........ 203 § 1. Краткие сведения о комплексных числах ............. 203 § 2. Алгебраические многочлены .................... 207 § 3. Кратные корни многочлена. Признак кратности корня . . . . . 210 § 4. Принцип выделения кратных корней. Алгоритм Евклида . . . 212 1. Принцип выделения кратных корней B12). 2. Нахождение наибольшего общего делителя двух многочленов (алгоритм Ев- Евклида) B13). § 5. Разложение правильной рациональной дроби с комплексными коэффициентами на сумму простейших дробей .........215 § 6. Разложение алгебраического многочлена с вещественными ко™ эффициентами на произведение неприводимых вещественных множителей ..............................217 § 7. Разложение правильной рациональной дроби с вещественными коэффициентами на сумму простейших дробей с вещественны- вещественными коэффициентами ......................... 220 § 8. Проблема интегрирования рациональной дроби .........225
ОГЛАВЛЕНИЕ § 9. Метод Остроградского ........................ 228 § 10. Интегрирование некоторых иррациональных и трансцендент- трансцендентных выражений ............................ 231 1. Интегрирование некоторых тригонометрических выражений B31). 2. Интегрирование дробно линейных иррационально™ стей B34). 3. Интегрирование биномиальных дифференциалов B35). 4. Интегрирование квадратичных иррациональностей по- посредством подстановок Эйлера B36). 5. Интегрирование ква- квадратичных иррациональностей другими способами B39). § 11. Эллиптические интегралы ..................... 245 Глава 8. Основные теоремы о непрерывных и дифференци- дифференцируемых функцимх ...................... 247 § 1. Новое определение предельного значения функции ....... 247 1. Новое определение предельного значения функции. Его экви- эквивалентность старому определению B47). 2. Необходимое и до- достаточное условие существования предельного значения функ- функции (критерий Коши) B50). § 2. Локальная ограниченность функции, имеющей предельное зна- значение .................................. 252 § 3. Теорема об устойчивости знака непрерывной функции . .... 254 § 4. Прохождение непрерывной функции через любое промежуточ- промежуточное значение ............................. 255 1. Прохождение непрерывной функции через нуль при смене знаков B55). 2. Прохождение непрерывной функции через лю- любое промежуточное значение B56). § 5. Ограниченность функции, непрерывной на сегменте ...... 256 § 6. Точные грани функции и их достижение функцией, непрерыв- непрерывной на сегменте ............................ 257 1. Понятие точной верхней и точной нижней граней функции на данном множестве B57). 2. Достижение функцией, непре- непрерывной на сегменте, своих точных граней B58). § 7. Возрастание (убывание) функции в точке. Локальный макси- максимум (минимум) ............................ 260 1. Возрастание (убывание) функции в точке B60). 2. Локальный максимум и локальный минимум функции B61). § 8. Теорема о нуле производной .................... 262 § 9. Формула конечных приращений (формула Лагранжа) ..... 263 § 10. Некоторые следствия из формулы Лагранжа .......... 264 1. Постоянство функции, имеющей на интервале равную нулю производную B64). 2. Условия монотонности функции на ин- интервале B65). 3. Отсутствие у производной точек разрыва 1-го рода и устранимого разрыва B67). 4. Вывод некоторых нера- неравенств B68). §11. Обобщенная формула конечных приращений (формула Коши) 269 § 12. Раскрытие неопределенностей (правило Лопиталя) ....... 270 1. Раскрытие неопределенности вида 0/0 B70). 2. Раскрытие неопределенности вида оо/оо B72). 3. Раскрытие неопределен- неопределенностей других видов B74).
10 ОГЛАВЛЕНИЕ § 13. Формула Тейлора .......................... 275 § 14. Различные формы остаточного члена. Формула Маклорена . . 278 1. Остаточный член в форме Лагранжа, Коши и Пеано B78). 2. Другая запись формулы Тейлора B80). 3. Формула Маклорена B81). § 15. Оценка остаточного члена. Разложение некоторых элементар- элементарных функций ............................. 281 1. Оценка остаточного члена для произвольной функции B81). 2. Разложение по формуле Маклорена некоторых элементар- элементарных функций B82). § 16. Примеры приложений формулы Маклорена ...........285 1. Алгоритм вычисления числа е B85). 2. Реализация алгорит- алгоритма вычисления числа е на электронной машине B86). 3. Ис- Использование формулы Маклорена для асимптотических оценок элементарных функций и вычисления пределов B87). Дополнение. Вычисление элементарных функций .......... 290 1. Вычисление логарифмической и обратных тригонометри™ ческих функций B90). 2. Вычисление тригонометрических функций, показательной функции и гиперболических функций B93). Глава 9. Геометрическое исследование графика функции. Нахождение максимального и минимального зна- значений функции ........................ 300 § 1. Участки монотонности функции. Отыскание точек экстремума 300 1. Отыскание участков монотонности функции C00). 2. Отыска- Отыскание точек возможного экстремума C01). 3. Первое достаточное условие экстремума C01). 4. Второе достаточное условие экс- экстремума C03). 5. Экстремум функции, недифференцируемой в данной точке. Общая схема отыскания экстремумов C06). § 2. Направление выпуклости графика функции ........... 308 § 3. Точки перегиба графика функции ................. 310 1. Определение точки перегиба. Необходимое условие перегиба C10). 2. Первое достаточное условие перегиба C13). 3. Второе достаточное условие перегиба C14). 4. Некоторые обобщения первого достаточного условия перегиба C15). § 4. Третье достаточное условие экстремума и перегиба ....... 315 § 5. Асимптоты графика функции ................... 318 § 6. Схема исследования графика функции .............. 320 § 7. Отыскание максимального и минимального значений функции. Краевой экстремум .......................... 323 1. Отыскание максимального и минимального значений функ- функции C23). 2. Краевой экстремум C25). Глава 10. Определенный интеграл ................ 327 § 1. Интегральные суммы. Интегрируемость ............. 327 § 2. Верхние и нижние суммы ...................... 330 1. Понятие верхней и нижней сумм C30). 2. Свойства верхних и нижних сумм C31).
ОГЛАВЛЕНИЕ 11 § 3. Необходимое и достаточное условие интегрируемости ..... 335 § 4. Некоторые классы интегрируемых функций ........... 337 1. Свойство равномерной непрерывности функции C37). 2. Лемма Гейне-Бореля. Другое доказательство теоремы о рав- равномерной непрерывности C40). 3. Интегрируемость непрерыв- ных функций C41). 4. Интегрируемость некоторых разрывных функций C42). 5. Интегрируемость монотонных ограниченных функций C44). § 5. Основные свойства определенного интеграла .......... 344 § 6. Оценки интегралов. Формулы среднего значения ........ 347 1. Оценки интегралов C47). 2. Первая формула среднего значе- значения C50). 3. Первая формула среднего значения в обобщенной форме C50). 4. Вторая формула среднего значения C51). § 7. Существование первообразной для непрерывной функции. Основные правила интегрирования ................ 352 1. Существование первообразной для непрерывной функции C52). 2. Основная формула интегрального исчисления C54). 3. Замена переменной под знаком определенного интеграла C56). 4. Формула интегрирования по частям C57). 5. Остаточный член формулы Тейлора в интегральной форме C58). Дополнение 1. Некоторые важные неравенства для сумм и интегра- интегралов ................................... 360 1. Вывод одного предварительного неравенства C60). 2. Нера- Неравенство Гёльдера для сумм C61). 3. Неравенство Минковского для сумм C62). 4. Интегрируемость произвольной положитель- положительной степени модуля интегрируемой функции C62). 5. Неравен- Неравенство Гёльдера для интегралов C63). 6. Неравенство Минков- Минковского для интегралов C65). Дополнение 2. Доказательство утверждения из п. 4 § 6 ....... 368 Г л а в а 11. Геометрические и физические приложения опре- определенного интеграла ................... 368 § 1. Длина дуги кривой .......................... 368 1. Понятие плоской кривой C68). 2. Параметрическое задание кривой C69). 3. Понятие пространственной кривой C72). 4. По- Понятие длины дуги кривой C72). 5. Достаточные условия спрям- спрямляемости кривой. Формулы для вычисления длины дуги кри- кривой C77). 6. Дифференциал дуги C81). 7. Примеры вычисления длины дуги C82). § 2. Площадь плоской фигуры ..................... 383 1. Понятие квадрируемости плоской фигуры. Площадь квадри- руемой плоской фигуры C83). 2. Площадь криволинейной тра- трапеции C86). 3. Площадь криволинейного сектора C87). 4. При- Примеры вычисления площадей C88). § 3. Объемы тел и площади поверхностей ............... 390 1. Понятие кубируемости и объема C90). 2. Кубируемость неко- некоторых классов тел C90). 3. Примеры вычисления объемов C92). 4. Площадь поверхности вращения C93). § 4. Некоторые физические приложения определенного интеграла 395 1. Масса и центр тяжести неоднородного стержня C95). 2. Ра-
12 ОГЛАВЛЕНИЕ бота переменной силы C97). Дополнение. Пример неквадрируемой фигуры ............ 397 Г л а в а 12. Приближенные методы вычисления корней ура- уравнений и определенных интегралов ......... 402 § 1. Приближенные методы вычисления корней уравнений ..... 402 1. Метод «вилки» D02). 2. Метод касательных D03). 3. Метод хорд D04). 4. Метод итераций (последовательных приближе- приближений) D05). 5. Обоснование метода касательных D08). 6. Обос- Обоснование метода хорд D12). § 2. Приближенные методы вычисления определенных интегралов 414 1. Вводные замечания D14). 2. Метод прямоугольников D16). 3. Метод трапеций D20). 4. Метод парабол D22). 5. Заключи™ тельные замечания D25). Глава 13. Теория числовых рядов ................. 426 § 1. Понятие числового ряда ....................... 426 1. Ряд и его частичные суммы. Сходящиеся и расходящиеся ряды D26). 2. Критерий Копти сходимости ряда D29). 3. Два свойства, связанные со сходимостью ряда D31). § 2. Ряды с положительными членами ................. 432 1. Необходимое и достаточное условие сходимости ряда с по™ ложительными членами D32). 2. Признаки сравнения D32). 3. Признаки Даламбера и Коши D36). 4. Интегральный признак Коши-Маклорена D39). 5. Признак Раабе D42). 6. Отсутствие универсального ряда сравнения D44). § 3. Абсолютно и условно сходящиеся ряды .............. 445 1. Понятия абсолютно и условно сходящегося ряда D45). 2. О перестановке членов условно сходящегося ряда D47). 3. О пе- перестановке членов абсолютно сходящегося ряда D50). § 4. Арифметические операции над сходящимися рядами ...... 453 § 5. Признаки сходимости произвольных рядов ............ 454 1. Признак Лейбница D55). 2. Признак Дирихле™Абеля D57). § 6. Бесконечные произведения ..................... 460 1. Основные понятия D60). 2. Связь между сходимостью бес- бесконечных произведений и рядов D62). Дополнение 1. Вспомогательная теорема для п. 3 § 2 ........ 466 Дополнение 2. Разложение функции sin ж в бесконечное произве- произведение .................................. 467 Дополнение 3. Обобщенные методы суммирования расходящихся рядов .................................. 470 1. Метод Чезаро (или метод средних арифметических) D71). 2. Метод суммирования Пуассона-Абеля D72). Глава 14. Функции нескольких переменных .......... 475 § 1. Понятие функции нескольких переменных ............ 475 1. О функциональных зависимостях между несколькими пере- переменными величинами D75). 2. Понятия евклидовой плоскости и евклидова пространства D76). 3. Понятие функции двух и трех переменных D77). 4. Понятия m-мерного координатного про-
ОГЛАВЛЕНИЕ 13 странства и m-мерного евклидова пространства D78). 5. Мно- Множества точек m-мерного евклидова пространства Ет D80). 6. Понятие функции т переменных D82). § 2. Предельное значение функции нескольких переменных .... 483 1. Сходящиеся последовательности точек в m-мерном евкли- довом пространстве Ет. Критерий Коши сходимости после- последовательности D83). 2. Некоторые свойства ограниченных по- последовательностей точек в m-мерном евклидовом пространстве D85). 3. Понятие предельного значения функции нескольких переменных D86). 4. Бесконечно малые функции D88). 5. Необ- Необходимое и достаточное условие существования предельного зна- значения функции (критерий Коши) D88). 6. Повторные предель- предельные значения D89). § 3. Непрерывные функции нескольких переменных ......... 490 1. Определение непрерывности функции нескольких пере- переменных D90). 2. Основные свойства непрерывных функций нескольких переменных D94). § 4. Производные и дифференциалы функции нескольких перемен- переменных ................................... 497 1. Частные производные функции нескольких переменных D97). 2. Понятие дифференцируемости функции несколь- нескольких переменных D99). 3. Понятие.дифференциала функции нескольких переменных E05). 4. Дифференцирование сложной функции E05). 5. Инвариантность формы первого дифферен- дифференциала E09). 6. Производная по направлению. Градиент E10). § 5. Частные производные и дифференциалы высших порядков . . 513 1. Частные производные высших порядков E13). 2. Дифферен- Дифференциалы высших порядков E18). 3. Формула Тейлора для функ- функции т переменных с остаточным членом в форме Дагранжа E24). 4. Формула Тейлора с остаточным членом в форме Пеа- но. E27) § 6. Локальный экстремум функции т переменных .........531 1. Понятие экстремума функции т переменных. Необходимые условия локального экстремума E31). 2. Достаточные условия локального экетремума E33). 3. Случай функции двух перемен- переменных E40). 4. Пример исследования функции на экстремум E42). § 7. Градиентный метод поиска экстремума сильно выпуклой функ- функции ................................... 543 1. Выпуклые множества и выпуклые функции E44). 2. Суще- Существование минимума у сильно выпуклой функции и единствен- единственность минимума у строго выпуклой функции E51). 3. Поиск минимума сильно выпуклой функции E56). Дополнение. О выборе оптимального разбиения сегмента для при- приближенного вычисления интеграла ................ 565 Г л а в а 15. Теорим неявных функций и ее приложения . . . 568 § 1. Понятие неявной функции ..................... 568 § 2. Теорема о существовании и дифференцируемости неявной функции и некоторые ее применения ............... 569 1. Теорема о существовании и дифференцируемости неявной
14 ОГЛАВЛЕНИЕ функции E69). 2. Вычисление частных производных неявно за- заданной функции E75). 3. Особые точки поверхности и плоской кривой E78). 4. Условия, обеспечивающие существование для функции у = /(ж) обратной функции E79). § 3. Неявные функции, определяемые системой функциональных уравнений ............................... 580 1. Теорема о разрешимости системы функциональных уравне- уравнений E80). 2. Вычисление частных производных функций, неяв- но определяемых посредством системы функциональных — уравнений E86). 3. Взаимно однозначное отображение двух множеств тв-мерного пространства E86). § 4. Зависимость функций ........................ 587 1. Понятие зависимости функций. Достаточное условие незави- независимости E87). 2. Функциональные матрицы и их приложения E90). § 5. Условный экстремум ......................... 594 1. Понятие условного экстремума E94). 2. Метод неопреде- неопределенных множителей Лагранжа E97). 3. Достаточные условия E98). 4. Пример F00). Дополнение. Замена переменных .................... 602 Г л а в а 16. Некоторые геометрические приложения диффе- дифференциального исчисления ................ 606 § 1. Огибающая и дискриминантная кривая однопараметрического семейства плоских кривых ..................... 606 1. Предварительные замечания F06). 2. Однопараметрические семейства плоских кривых. Характеристические точки кривых семейства F09). 3. Огибающая и дискриминантная кривая од- однопараметрического семейства плоских кривых F11). 4. Огиба- Огибающая и дискриминантная поверхность однопараметрического семейства поверхностей F14). § 2. Соприкосновение плоских кривых .................615 1. Понятие порядка соприкосновения плоских кривых F15). 2. Порядок соприкосновения кривых, являющихся графиками функций F17). 3. Достаточные условия соприкосновения по- порядка п F19). 4. Соприкасающаяся окружность F21). § 3. Кривизна плоской кривой ...................... 622 1. Понятие о кривизне плоской кривой F22). 2. Формула для вычисления кривизны F24). § 4. Эволюта и эвольвента ........................ 627 1. Нормаль к плоской кривой F27). 2. Эволюта и эвольвента плоской кривой F28). Приложение. Дальнейшее развитие теории веще- вещественных чисел .......................... 632 1. Полнота множества вещественных чисел F32). 2. Аксиома™ тическое введение множества вещественных чисел F36). 3. За- Заключительные замечания F41). Предметный указатель ............................ 642
ПРЕДИСЛОВИЕ К СЕДЬМОМУ ИЗДАНИЮ Особенностью этого учебника, отличающей его от других учебников по математическому анализу, является концепция по- построения теории предельного значения и непрерывности функ- функции только на основе определения предела функции по Гейне (через предел последовательности). При этом введение вто™ рого эквивалентного определения предела функции по Коши (на «eS языке»), часто трудно воспринимаемого студентами первых курсов, откладывается до главы 8. После многих лет преподавания математического анализа возникло намерение изменить указанную концепцию, что в по- последние годы воплощается при чтении лекционных курсов. Однако многие математики, использующие этот учебник, в беседе со мной не советовали мне этого делать, убеждая меня в том, что тем самым я испорчу хорошо зарекомендовавший себя учебник. Учитывая это мнение и тот факт, что эта книга рекомендо™ вана Ученым Советом МГУ к изданию в серии «Классический университетский учебник», приуроченный к 250™летию МГУ, я решил сохранить в этом издании указанную концепцию из- изложения. Сентябрь 2004 г. В. А. Ильин
ПРЕДИСЛОВИЕ К ПЯТОМУ ИЗДАНИЮ Первая часть «Основ математического анализа» в настоя- настоящем издании повторяет текст четвертого переработанного и до- дополненного издания, которое содержит целый ряд улучшающих и углубляющих изложение изменений, возникших в результате чтения одним из авторов лекций на факультете вычислитель- вычислительной математики и кибернетики Московского государственного университета. Наиболее существенные из этих изменений относятся к изло- изложению приближенных методов вычисления определенных ин- интегралов, к выводу формулы Тейлора с остаточным членом в форме Пеано (как в одномерном, так и в многомерных случа- случаях) , к теории отыскания локальных экстремумов и точек переги- перегиба графика функции, к изложению градиентного метода поиска экстремума сильно выпуклой функции. Со времени выхода в свет первого издания книга стала основ™ ным учебником во многих вузах и университетах. Несмотря на то, что общий тираж предыдущих изданий превысил 240 тысяч экземпляров, книга превратилась в библиографическую ред™ кость. В целях ускорения выпуска книги текст пятого издания перепечатывается стереотипно с четвертого издания. Июнь 1998 г. В. А. Ильин
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ В основу настоящей книги положены лекции, читавшиеся ав- торами на физическом факультете МГУ в течение ряда лет. При написании книги авторы стремились к систематичности изложения и к выделению важнейших понятий и теорем. Теоре- мы, играющие особо важную роль, в тексте названы основными. Авторы стремились также не формулировать новых понятий и теорем задолго до их непосредственного использования. Порядок расположения материала в книге соответствует установившемуся на физическом факультете МГУ плану чтения курса лекций. В частности, изложению систематического курса в настоящей книге предшествует глава 1 — «Предварительные сведения об основных понятиях математического анализа». В этой главе рассматриваются некоторые важные физические за- задачи и обсуждаются математические средства, необходимые для их решения. Таким путем выясняется тот круг вопросов и по- понятий, с которым придется иметь дело в курсе математического анализа. Опыт чтения лекций показывает, что такое предвари- предварительное выяснение вопросов, которым посвящен курс анализа, существенно облегчает студентам усвоение абстрактных мате- математических понятий. Возросшая роль вычислительной математики и приближен- приближенных методов также нашла свое отражение в книге. Именно по- поэтому авторы стремились там, где это возможно, к алгоритмич- ности изложения доказательств теорем и проводимых вычисле- вычислений. В частности, в гл. 12 в первую очередь подчеркнута ал- алгоритмическая сторона приближенных методов вычислений и лишь затем дано обоснование этих методов. Кроме основного материала, авторы сочли возможным вклю- включить в книгу некоторые дополнительные вопросы, напечатанные мелким шрифтом. При написании этой книги авторы использовали некоторые методические приемы из курса лекций Н. В. Ефимова и из из- известных книг Э. Гурса, Ш. Ж. Валле-Пуссена и Ф. Франклина.
18 ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Авторы считают своим приятным долгом выразить глубокую благодарность А. Н. Тихонову за многие ценные идеи и указания и огромную помощь, оказанную на всех этапах написания этой книги. Авторы также глубоко благодарны И. А. Шишмарёву, работа которого по редактированию этой книги способствовала значи™ тельному ее улучшению. Авторы искренне благодарят Н. В. Ефимова, Л. Д. Кудряв- Кудрявцева и особенно А. А. Самарского за большое количество ме- методических предложений, Б. М. Будака и С. В. Фомина за про- просмотр отдельных глав и сделанные ими замечания, Б. Химченко, П. Заикина и А. Золотарева за помощь при подготовке рукописи к печати. 1965 г. В. Ильин, Э. Позняк
ГЛАВА 1 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ОСНОВНЫХ ПОНЯТИЯХ МАТЕМАТИЧЕСКОГО АНАЛИЗА § 1. Математические понмтим, возникающие при описании движения 1. Математика изучает количественные отношения и про- пространственные формы окружающего нас мира. Элементарная математика ограничивается лишь первона™ чальным изучением количественных отношений и простран- пространственных форм, ибо она имеет дело в основном с постоянны- постоянными величинами и с простейшими геометрическими фигурами (треугольниками, окружностями и т. п.). Понятий и методов элементарной математики оказывается недостаточно для описа- описания механического движения и других протекающих во време- времени процессов. Выясним, какие новые математические понятия необходимы для этого 1). 2. Со всяким процессом связано представление о переменной величине , т. е. о такой величине, которая в условиях данно- данного процесса принимает различные значения. Более того, всякий процесс характеризуется по меньшей мере двумя переменными величинами, изменение которых взаимосвязано. Рассмотрим, например, механическое движение материаль- материальной точки по прямой линии. Это движение представляет собой процесс изменения положения точки на прямой линии с тече- течением времени. С указанным процессом связаны две переменные величины — время и путь, пройденный точкой от начала от- отсчета. Для характеристики рассматриваемого движения нужно ) При этом мы не будем стремиться к точным формулировкам, а поста- постараемся лишь выяснить тот круг вопросов, с которым нам в дальнейшем придется иметь дело.
20 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 знать, на каком расстоянии от начала отсчета находится точка в каждый данный момент времени, т. е. нужно знать зависи- зависимость путщ пройденного точкой, от времени. В механике та- такую зависимость называют законом движения. Иными слова™ ми, закон движения представляет собой правило, посредством которого каждому значению времени х ставится в соответствие определенное значение пути у, пройденного точкой за время х. Такого рода зависимости между двумя переменными ж и у, при которых каждому значению переменной х ставится в соот- соответствие определенное значение переменной у, встречаются не только при рассмотрении механического движения материалы ной точки, но и при описании других физических процессов. Абстрагируясь от конкретного физического содержания пере- переменных ж и у, мы приходим к одному из важнейших математи- математических понятий — понятию функции1). Если известно правило^ посредством которого каждому значению переменной х ставится в соответствие определен- определенное значение переменной у, то говорят^ что переменная у яв- является функцией переменной х. При этом переменная х называется аргументом рассматри- рассматриваемой функции, а соответствующее данному х значение пере- переменной у называется частным значением функции в точке х. Для обозначения функции используются следующие символы: у = у(х) или y = f(x). В последнем обозначении буква /, называемая характери- характеристикой функции, символизирует указанное выше правило. Ес- Если рассматриваются разные функции, то для обозначения их характеристик употребляются разные буквы. Подчеркнем, что для обозначения аргумента и функции вовсе не обязательно упо- употреблять буквы х и у. Например, запись S = h(t) означает, что переменная S является функцией аргумента t, причем характе™ ристика этой функции обозначена буквой h. Как переменная величина, так и функция обычно характери- зуются различными численными значениями. Поэтому углубле- углубление представлений об этих понятиях тесно связано с необходи™ мостью развития теории вещественных чисел2). ) Введение в математику понятия функции связывают с именем велико- великого английского ученого И. Ньютона A642-1727). ) Следует отметить, что понятие функции и понятие числа относятся к так называемым начальным понятиям. Каждое из начальных понятий может быть разъяснено, но всякая попытка дать определение начального понятия сводится к замене определяемого понятия ему эквивалентным. С начальными понятиями читатель знаком из элементарного курса. К началь- начальным понятиям относятся, например, понятия прямой линии и плоскости.
§ 1 ПОНЯТИЯ, ВОЗНИКАЮЩИЕ ПРИ ОПИСАНИИ ДВИЖЕНИЯ 21 Рассмотрим несколько примеров функций. 1) Известно, что путь 5, пройденный первоначально непо™ движной материальной точкой при падении под действием силы тяжести за время t определяется формулой S = gt2/2. Эта формула и представляет собой правило, посредством кото- которого каждому значению переменной t ставится в соответствие значение переменной S, т. е. определяет S как функцию аргу- мента t. 2) По закону Кулона два разноименных единичных заряда, находящихся на расстоянии г друг от друга, притягиваются с силой F = с/г2, где с — некоторая константа. Эта формула также представляет собой правило, посредством которого каждому значению пере™ менной г ставится в соответствие значение переменной F, т. е. определяет F как функцию аргумента г. В указанных двух примерах правило сопоставления аргумен™ та и функции задавалось при помощи формулы. Такой способ задания функции называется анали- тическим. Наряду с этим способом существу- существуют и другие способы задания функ- функции. Отметим некоторые из них. В практике физических измерений весь- весьма употребителен табличный способ задания функции, при котором вы- выписываются в виде таблицы значе- значения аргумента и соответствующие им рис i i значения функции. Часто зависимость между аргументом и функцией задается посредством графика, который, например, снимается на осциллографе. Такой способ задания функции называется графическим1). 3. Потребности физики иногда приводят к необходимости изучения функции y = f(%I аргумент х которой сам предста- представляет собой некоторую функцию х = ip(t) нового аргумента t. В таком случае говорят, что у представляет собой сложную функцию аргумента t, a x называют промежуточным аргумен™ том. Эту сложную функцию можно записать в следующем виде: ПФ)] Рассмотрим следующий пример. Пусть материальная точка М равномерно вращается по окружности радиуса R с угловой скоростью ш (рис. 1.1). Пай™ Подробнее о способах задания функции см. гл. 4.
22 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 дем закон движения проекции у этой точки на некоторую ось Of/, лежащую в плоскости окружности и проходящую через ее центр О. При этом будем считать, что в момент времени t = О точка М находится на оси Оу. Обозначим через у координату рассматриваемой проекции на оси Of/, а через ж угол LMOy. Очевидно, что у = Rcosx. С другой стороны, поскольку точка движется по окружности с угловой скоростью шив момент вре- времени t = 0 находится на оси Of/, то х = ujt. Таким образом, у представляет собой сложную функцию аргумента t: у = i?cosx, где х = cdi, или у = R cos uot. Заметим, что движение по закону у = R cos oof в механике называют гармоническим колебанием. § 2. Мгновенная скорость и связанные с ней новые математические понятия 1. Пусть функция у = f(x) представляет собой закон движе- движения материальной точки по оси Оу. Для характеристики дви- движения важную роль играет понятие средней скорости. Вычис- Вычислим среднюю скорость vcp движущейся точки за промежуток времени от х до х + А ж, где х — фиксированный момент време- времени, Ах — некоторое приращение времени. Поскольку в момент времени х движущаяся точка находится на расстоянии f(x) от начала отсчета, а в момент времени х + Ах — на расстоянии / (х + А ж), то путь А у, пройденный точкой за время А ж, равен А У = f(x + А х) ~ fix)- Поэтому средняя скорость -уср равна _ Ау _ /(х + Ад)-/(ж) Так как момент времени х фиксирован, то из последней фор™ мулы видно, что vCp является функцией аргумента Ах. Для характеристики неравномерного движения, наряду со средней скоростью, большую роль играет понятие мгновенной скорости в данный момент времени х. Мгновенной скоростью (или просто скоростью) в момент времени х называется число, к которому приближается значение средней скорости когда промежуток времени Ах стремится к нулю. Физическое понятие мгновенной скорости является источ- источником важного математического понятия производной. Абстра- Абстрагируясь от конкретного физического смысла функции у = = /(ж), мы будем называть производной этой функции в фик™ сированной точке ж предел, к которому стремится дробь —^ = = ^ -^—^^ при Дж, стремящемся к нулю.
§ 2 МГНОВЕННАЯ СКОРОСТЬ 23 Операцию нахождения производной принято называть дифференцированием. Производная функции у = f(x) в данной фиксированной точке обозначается символом у'{х) или f'{x). Используя известный символ для обозначения предела, можно записать н( ч r Ay r f(x + Ax)-f(x) fix) = lim -г-^- = lim ^ -г-1—i^^. Аж-iO А ж Аж^О А ж Рассмотрим некоторые примеры. 1) Вычислим мгновенную скорость материальной точки, па™ дающей под действием силы тяжести. Поскольку закон движе- движения этой точки определяется функцией S = gi2/2, то путь A S, пройденный точкой за промежуток времени от t до t + A t, равен Поэтому средняя скорость за тот же промежуток времени равна Следовательно, мгновенная скорость v в фиксированный мо- момент времени t равна v= lim ф? = lim (gt+^-At) =gt. At^O At At^O V5 2 J a Фактически мы вычислили производную функции S = gt /2, так что мы можем записать Sf = gt. 2) Вычислим производную функции у = жп, где п — целое положительное число. Фиксируя х и беря произвольное А ж, по- получим, используя бином Ньютона, Ау = (х + Дж) -хп = пхп^Ах + ^Ихп~2(АхJ + • • • + (Axf. Поэтому средняя скорость —^™ изменения функции у = /(ж) на участке от х до х + А ж равна |1 = пж-1 + w(w-1}^-2(A х) + ¦ ¦ ¦ + (А ж)"-1. Zk Ж А Следовательно, производная в данной фиксированной точке х равна у'= lim L ^ Мы видим, что для вычисления производных фундаменталь- фундаментальную роль играет понятие предела функции. Уточнение этого по- понятия в первую очередь связано с необходимостью более деталь- детального выяснения самого понятия функции, переменной величины и вещественного числа.
24 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 2. Сейчас мы убедимся, что в процессе вычисления произ™ водных простейших функций возникают новые математические вопросы. Займемся вычислением производной функции у = sin ж. Фик™ сируя ж и беря произвольное А ж, получим А у = sin(# + Аж)- sin ж = 2 cos I x + ^^ 1 sin —. Отсюда + _ j -±-L2. Таким образом, для вычисления производной функции у = sin ж в точке х нужно найти следующий предел: г Ау г \ ( . Ах\ sin(Ax/2)l (л л, lim -т-^-= lim cos ж + ™ -7Т--7™ . A.1) Аж^оАж ДЖ^О L V 2 / (А ж/2) j v ; Естественно ожидать, что при фиксированном х lim cos(x + —^)=cosx. Однако не всякая функция у = f(x) обладает свойством lim cos(x + —^)=cosx. A.2) Фактически это свойство означает, что когда аргумент функции стремится к числу ж, то соответствующее значение этой функ™ ции стремится к числу /(ж). Функции, обладающие таким свой- свойством, называются непрерывными (в точке ж). Понятие непре- рывности функции является одним из важнейших математиче- математических понятий. Для вычисления предела A.1), кроме предела A.2), нужно вычислить еще предел lim ^[Ax/?. A.3) д^0 (А ж/2) v J Этот предел играет важную роль в математическом анализе. Его часто называют первым замечательным пределом. Доказы- Доказывается, что этот предел равен единице, и поэтому предел A.1) равен cos ж. Итак, (sin ж)' = cos ж. В качестве второго примера вычислим производную функции у = logaa;. Фиксируя ж > 0 и беря произвольное А ж (такое, что ж + А ж > 0), получим Д У = 1оёа(х + Ах) ~ %аЖ = loga (l + ^
§ 2 МГНОВЕННАЯ СКОРОСТЬ 25 Отсюда Ау _ 1 , (л Дж\_ 1\х 1 Л.Дж\1_11 [Л.Дж\^1 Таким образом, для вычисления производной функции у = = = Ioga ж к в точке ж нужно найти предел Г Ж "I lim —^ = lim -loga 1 + . A.4) Рассмотрим предел при х —>• 0 выражения, стоящего в квадрат- квадратных скобках. Он сводится к пределу [(^] (при Л = Этот предел также играет важную роль в математическом ана- анализе. Его часто называют вторым замечательным пределом. Доказывается, что этот предел существует. Следуя Эйлеру1), число, равное этому пределу, обозначают буквой е 2), т. е. = e. A.5) Вернемся к вычислению предела A.4). Аргументом логарифма Г Ж I в формуле A.4) служит величина f 1+—-1 х , стремящаяся, [V х J \ согласно A.5), к е при Да; -^ 0. Если логарифмическая функция \ ( Ах\> Аж непрерывна, то loga A+—J стремится к loga e при Аж-> —> 0. Таким образом, для нахождения предела A.4) нужно обос™ новать непрерывность логарифмической функции и использо- использовать предел A.5). Предполагая, что это сделано, мы получим, что предел A.4) равен - loga е. Итак, \/ 1 (loga х) = - loga e. Здесь мы не будем вычислять производных других простейших элементарных функций: у = cos ж, у = tgx, у = ctgx, у = = arcsinx, у = агссовж, у = arctgx, у = arcctgx, у = а ж у = ж¦ , где а — любое число. При вычислении производных этих функ- функций не возникает никаких новых трудностей, кроме указанных 1) Леонард Эйлер A707^1783) — великий математик, член Петербургской Академии наук, большую часть жизни провел в России, по происхождению швейцарец. ) В § 16 гл. 8 будет указан способ вычисления числа е с любой степенью точности. Там же приведен результат вычисления числа е на электронно- вычислительной машине с точностью до 590 знаков после запятой.
26 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 выше. Именно, для вычисления производных всех простейших элементарнв1х функций потребуется лишь их непрерывность и два замечательных предела. Приведем таблицу производных простейших элементарных функций: 1°. (xa)f = axa^1J a — любое число. 2°. (loga ж)' = - loga е, в частности, если а = е, то (loge ж);=-. 3°. (ax)f = a^loggtt, в частности, если а = е, то (ex)f = ех. 4°. (sin ж)' = cos ж. 5°. (cos ж)' = — sin ж. 6°. (tgx)' = ^-. 2 }. (arcsin#V = 9°. (arccoso;)' = — 10°. 11°. 3. Для вычисления производных широкого класса функций следует присоединить к указанной выше таблице производных правило дифференцирования сложной функции^ а также правила дифференцирования суммы^ разности, произведения и частного функций. Сформулируем правило дифференцирования сложной функции у = /(ж), где х = (f(t). Для нахождения производной y'(t) сложной функции у = = f[<p(t)] no аргументу t в данной точке t следует: 1) вычис- вычислить производную (ff(t) функции х = ip(t) в точке t; 2) вы- вычислить производную ff(x) функции у = f(x) в точке ж, где х = (f(t); 3) перемножить указанные производные. Таким об- образом, производная сложной функции у = f[(f(t)] может быть найдена по формуле yf(t) = ff(x)ipf(t). Следующие рассуждения разъясняют сформулированное правило. Придадим аргументу t в точке t произвольное приращение At ф 0. Этому прираще- приращению соответствует приращение Ах = (p(t + At) — ip(t) функции х = (f(t). Полученному приращению Ах соответствует прира™ щение Ay = f(x + А ж) — /(ж) функции у = /(ж) в точке ж. Опуская случай А ж = 0, рассмотрим отношение А г/ _ А г/ Аж
МГНОВЕННАЯ СКОРОСТЬ 27 Поскольку lira —— = (pr(t), lim —^ = f'(x) и из существования первого из этих пределов ясно, что при At-~>0 и Аж-fO1), то lim —^ существует и равен /;(x)c//(t), т. е. f/(t) = ff(x)(pf(t). Приведем теперь правила дифференцирования суммы, раз- разности, произведения и частного (в предположении, что и(х) и v(x) имеют производные): [и(х) ± v(x)]f = uf(x) ± vf(x), [u(x)v(x)]f = u(x)vf(x) + u'(x)v(x), [u(x) uf(x)v(x) — u(x)vf(x) v(x) \ v2(x) Покажем, например, как можно вывести вторую из этих фор™ мул. Придадим аргументу х произвольное приращение Аж ^ О, которому соответствует приращение Ау функции у = u(x)v(x) Ay = u(x + Ax)v(x + Аж)~ u(x)v(x) = = и(х + Ax)[v(x + Аж)- v(x)] + v(x)[u(x + Ai)™ u(x)] = = u{x + Ax)Av + v(x)Au. Таким образом, Aw / . Л \ Аг; . / \Au " q I I rp _J_ /\ rp 1 ^^^^ _J_ q ч I rp 1 ^^^^ Аж Аж Аж Так как существуют пределы lim —— = и'{х) и Mm —— = = г?;(ж) и из существования первого из этих пределов ясно, что lim и(х + А ж) = к (ж), то lim —^ существует и равен А^О А^оАж 1|(ж)'У/(ж) + v(x)v!(x). Рассмотрим несколько примеров применения указанных правил. 1) Вычислим производную функции у = си(хI где с — неко- некоторая постоянная. Легко проверить, что производная постоян- постоянной равна нулю. Поэтому по формуле дифференцирования про- произведения получим [cii(x)]; = си'{х). 2) Вычислим производную функции у = tgx. Так как tgx = sin ж , I 1 , то по формуле дифференцирования частного получим , у (sin ж)' cos ж — smx(cosx); 1 X) — - COS2 Ж ) Если знаменатель дроби, имеющей предел, стремится к нулю, то и числитель этой дроби стремится к нулю.
28 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 3) Вычислим производную функции, описывающей гармони™ ческие колебания, у = Acos{u)t + S), где А, ш и 8 — постоянные. Будем рассматривать эту функцию как сложную функцию ви- вида у = A cos ж, где у = u)t + 8. По правилу дифференцирования сложной функции получим y'(t) = (A cos x)'(u)t + 8)f = -(Asinx)a;, где х = u)t + 8. Поэтому yf(t) = —Аи) sin(o;t + E). 4) Вычислим производную функции у = aarctgt. Будем рас- рассматривать эту функцию как сложную функцию вида у = ах, где х = arctg t. По правилу дифференцирования сложной функ- функции получим yf(t) = (ax)/(arctgt)/ = (axlogea) где ж = arctg t. Поэтому gty = 1+t2 Сформулированные выше правила дифференцирования и табли- таблица производных представляют собой основной аппарат той части математического анализа, которую обычно называют дифферен- дифференциальным исчислением. Таким образом, одной из важных за- задач дифференциального исчисления является обоснование всех формул таблицы производных и правил дифференцирования суммы, разности, произведения, частного и сложной функции. 4. Выясним геометрический смысл производной. С этой целью рассмотрим график функции у = f(xI) (рис. 1.2). Пусть точка М на графике функции соответствует фиксированному значению аргумента ж, а точка Р — значению х + А ж, где Ах — некоторое приращение аргумента. Прямую МР будем называть секущей. Обозначим через ip(Ax) угол, который образует эта секущая с осью Ох (очевидно, что этот угол зависит от Ах). Касательной к графику функции у = f(x) в точке М будем называть предельное положение секущей МР при стремлении точки Р к точке М по графику {илщ что то эюе самое^ при Ах —>• 0). Из рис. 1.2 ясно, что Так как при Дж -> 0 секущая МР переходит в касательную, то lim tgip(Ax) =ig(fo, ) Графиком функции у = /(ж) называется геометрическое место точек плоскости, для каждой из которых ордината есть значение у этой функции, соответствующее абсциссе х.
3 ВОССТАНОВЛЕНИЕ ЗАКОНА ДВИЖЕНИЯ ПО СКОРОСТИ 29 где щ — угол, который образует касательная с осью Ох. С дру™ гой стороны, lim tgcpiAx) = lim l'ff \ Следовательно, f'{x) = tg</?o- Тангенс угла наклона прямой к оси О ж называют угловым коэффициентом этой прямой. Таким образом, производная ff(x) равна узловому коэффициенту каса- тельной к графику функции у = f(x) в точке М. Ay=f(x+Ax)-f(x) N ф(Аж) х х+Ах х Рис. 1.2 § 3. Задача о восстановлении закона движения по скорости и связанная с ней математическая проблематика Рассмотрим следующую физическую задачу. Пусть для любого момента времени х задана мгновенная скорость f(x) движущейся по оси Оу материальной точки и известно положе- положение уо этой точки в начальный момент времени х = xq. Требу- Требуется найти закон движения этой точки. Поскольку мгновенная скорость f(x) является производной функции у = F(x), определяющей закон движения материаль- материальной точки по оси Оу, то задача сводится к разысканию по данной функции f(x) такой функции F(x), производная Ff(x) которой равна f(x). Отвлекаясь от конкретного физического смысла функций f(x) и F(x), мы придем к математическим понятиям первообраз- первообразной и неопределенного интеграла. Первообразной функции }'{х) называется такая функция F(x), производная Ff(x) которой равна f(x). Очевидно, что если функция F(x) является первообразной функции /(ж), то и функция F(x) + G, где С — любая посто- постоянная, также является первообразной функции f(x) (ибо про- производная постоянной С равна нулю).
30 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 Можно доказать, что две любые первообразные одной и той же функции /(ж) отличаются на постоянную. Таким образом, если функция F(x) является одной из первообразных функ- функции /(ж), то любая первообразная функции /(ж) имеет вид F(x) + С*, где С — постоянная. Совокупность всех первообразных одной и той же функ- функции /(ж) называется неопределенным интегралом от функции /(ж) и обозначается символом J f(x)dx. Следовательно, если F(x) — одна из первообразных функ- функции /(ж), то Вернемся к решению поставленной выше физической зада- задачи. Интересующий нас закон движения точки, имеющей мгно- мгновенную скорость /(ж), определяется функцией у = F(x) + С, где F(x) — некоторая первообразная функции /(ж), а С — неко- некоторая постоянная. Для определения постоянной С воспользуем- воспользуемся тем, что у = уо в начальный момент времени ж = жо, т. е. у о = F(xq) + G, откуда С = у о — F(x®). Таким образом, интере- интересующий нас закон движения имеет вид y = F(x)+yo-F(xo). Рассмотрим некоторые физические и математические приме- примеры. 1) Пусть мгновенная скорость материальной точки, движу- движущейся по оси 0у, имеет вид /(ж) = cos ж. Требуется найти закон движения этой точки, если в начальный момент времени ж = жо точка занимает положение у = у® на оси Оу. Из таблицы произ- производных ясно, что одной из первообразных функции /(ж) = cos ж является функция F(x) = sin ж. Следовательно, искомый закон движения имеет вид у = sin ж + С. Из условия у = у® при ж = жо находим С = уо ~~ sin^o, т. е. окончательно получим закон движения в виде у = sin ж + у® — i 2) Найти / 2 dx. Из таблицы производных ясно, что од- 1 ной из первообразных функции /(ж) = является функция X —г" X F(x) = аг^§ж. Следовательно, /» / ^ж = arctg ж + С. J 1 + X2 В предыдущем параграфе мы выписали таблицу производи пых элементарных функций. Учитывая, что каждая формула
§ 4 ЗАДАЧА О ВЫЧИСЛЕНИИ ПУТИ 31 Ff(x) = f(x) этой таблицы приводит к соответствующей фор™ муле J f(x)dx = F(x) + С, мы получим следующую таблицу неопределенных интегралов: 1°. Jxadx = ^^ + С (аф -1). С. ge 4°. J sin ж dx = — cos ж + С. 5°. J cos xdx = sin ж + G. f COSZ X dx = — ctg x + С. dx ' i si ^=^ = arcsina: + G. 9°. /rT^? = arctgx + a J i + ж Эта таблица вместе с правилами интегрирования (которые здесь не приводятся) представляет собой важный вычисли- вычислительный аппарат той части математического анализа, которую обычно называют интегральным исчислением. Однако для вычисления многих неопределенных интегралов этого аппарата оказывается недостаточно. Возникает проблема о существовании первообразной (и неопределенного интеграла) у произвольной функции /(ж), непрерывной в каждой точке ж. В следующем параграфе мы укажем другой подход к задаче об интегрировании функции, который позволяет решить эту проблему. Здесь же мы сразу отметим, что существуют непрерывные (в каждой точке ж) функции (например, у = cos ж2), первообраз- первообразные которых существуют, но не могут быть представлены с по- помощью конечного числа операций сложения, вычитания, умно- умножения, деления и образования сложных функций от простейших элементарных функций, перечисленных нами в п. 2 § 2. § 4. Проблемы, возникающие при решении задачи о вычислении пути 1. Пусть функция f(x) представляет собой скорость движе™ ния материальной точки по оси Оу. Для простоты будем счи™ тать, что все значения функции f(x) неотрицательны. Требуется
32 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 вычислить путь, пройденный материальной точкой за промежу™ ток времени от х = а до х = Ь. Для решения задачи 1) разобьем рассматриваемый промежу- промежуток времени на малые промежутки, ограниченные моментами а = xq < х\ < Х2 < • • • < хп = Ь. Естественно считать, что на каждом промежутке от Xk-i до х^ скорость f(x) меняется мало. Поэтому приближенно эту скорость молено считать на указан- указанном промежутке постоянной и равной, например, /(ж&). В таком случае путь, пройденный материальной точкой за время Ах^ = = Xk — Xk-ii приближенно равен /(ж/е)Аж/е, а путь 5^, пройден™ ный точкой за время от а до Ь, приближенно равен Sba и /(Ж1)Дsi + f(x2)Ax2 + ¦¦¦ + f(xn)Axn. A.6) Естественно ожидать, что при уменьшении всех промежут- промежутков времени А х^ мы будем получать все более и более точное значение пути S^. Точное значение пути S^ мы получим, перейдя в сумме A.6) к пределу при стремлении всех Аж^ к нулю (при этом, конечно, число слагаемых в сумме A.6) будет неограничен- неограниченно возрастать). Употребляя символ предела, мы можем записать следующую формулу: Sba= lim [f(Xl)AXl + f(x2)Ax2 + -- + f(x,,)&xn]. A-7) При этом вопрос о том, что мы понимаем под пределом написан- написанной суммы, конечно, требует выяснения. Тем самым мы еще раз убеждаемся в необходимости углубления и развития понятия предела. В математике предел A.7) называется определенным интегралом от функции f(x) в пределах от а до b и обознача™ ется символом ъ О a— хп=Ь i= / Hx)dx. Рис. 1.3 Сумма A.6) представляет собой сумму площадей прямоуголь- прямоугольников, основаниями которых служат отрезки Ах^ а высотами f(xk). Иными словами, эта сумма равна площади изображенной на рис. 1.3 ступенчатой фигуры (эта ступенчатая фигура на чер- чертеже обведена жирной линией). Естественно ожидать, что при стремлении к нулю длин всех отрезков А х^ площадь указанной ступенчатой фигуры будет стремиться к площади заштрихован- ) Связь этой задачи с задачей, рассмотренной в предыдущем параграфе, будет выяснена ниже.
ЗАДАЧА О ВЫЧИСЛЕНИИ ПУТИ 33 ной на чертеже криволинейной фигуры, лежащей под графиком функции у = f(x) на отрезке от а до Ь. Эту криволинейную фи- фигуру часто называют криволинейной трапецией. Таким образом, определенный интеграл равен площади указанной криволиней- криволинейной трапеции. Конечно, проведенные нами рассуждения носят предвари- предварительный характер. В частности, требует выяснения само поня- понятие площади криволинейной трапеции и вообще площади плос- плоской фигуры. 2. Мы видим, что с понятием определенного интеграла тесно связаны две важные задачи: физическая задача о вычислении пути и геометрическая задача о вычислении площади плоской фигуры. В связи с этим является важным вопрос о способах вычисления определенного интеграла. Обозначим через F(x) опре- yi деленный интеграл от функции f(x) в пределах от а до ж, т. е. положим F(x) = f f(x)dx. fix) х х+Ах Ь х Рис. 1.4 С геометрической точки зре- зрения, этот интеграл равен площа- площади криволинейной трапеции, ле- лежащей под графиком функции у = f(x) на отрезке от а до х. На рис. 1.4 эта трапеция обведена жирной чертой. Используя на- наглядные геометрические соображения, покажем, что введенная функция F{x) является одной из первообразных функции /(ж), т. е. убедимся в том, что Ff(x) = f(x). Пусть Ах — некоторое приращение аргумента х. Очевидно, разность F(x + А х) — F(x) равна площади заштрихованной на рис. 1.4 «узкой» криволи- криволинейной трапеции. Площадь этой трапеции при малом Ах мало отличается от площади f(x)A x прямоугольника с основанием Ажи высотой f(x). Отсюда ясно, что при малом Ах отношение F(x + Ax)-F(x) A8) Ах ^ ' } мало отличается от высоты f(x) указанного выше прямоуголь- прямоугольника. Так как предел при Аж->0 дроби A.8) равен производной F;(x), то Ff(x) = f(x). Итак, функция F(x) является одной из первообразных функции f(x). Следовательно, любая первооб- первообразная Ф(х) функции f(x) имеет вид х Ф(х) = F(x) + C= f f(x) dx + С. A.9) 2 В.А. Ильин, Э.Г. Позняк, часть I
34 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 Конечно, приведенные рассуждения и вытекающая из них формула A.9) справедливы, вообще говоря, не для всякой функ™ ции f(x). Нетрудно убедиться в справедливости формулы A.9) для любой непрерывной (в каждой точке х) функции f(x). Тем самым установление формулы A.9) решает проблему существо- существования первообразной (и неопределенного интеграла) у любой непрерывной в каждой точке х функции f{x). Установим теперь с помощью той же формулы A.9) связь ь между определенным интегралом J f(x)dx и любой первооб™ разной Ф(х) функции f(x). Полагая в формуле A.9) последо™ вательно х = ашх = Ьш учитывая очевидное из наглядных геометрических соображений равенство j f(x)dx = получим а Ф(а) = Г f(x) dx + C = С, Ф(Ь) = Г f(x) dx + С. Поэтому о / A.10) Формула A.10) является одной из основных формул интеграль™ ного исчисления и называется формулой Ньютона-Лейбница1). Эта формула сводит вопрос о вычислении определенного ин- интеграла к вопросу о вычислении первообразной (или неопреде- неопределенного интеграла). Обоснование формулы Ньютона-Лейбница является одной из важных задач математического анализа. Для приближенного вычисления определенных интегралов су- существует ряд способов, простейший из которых основан на за- замене этого интеграла суммой A.6). Эти способы и соотношение A.9) дают возможность приближенно вычислять и неопределен- неопределенные интегралы, и, в частности, позволяют вычислить первооб- первообразную любой непрерывной (в каждой точке х) функции f(x). В качестве примера вычислим площадь Si, заключенную между графиком функции у = sin ж на отрезке от 0 до тг и 7Г осью Ох (рис. 1.5) 2). В силу сказанного выше S\ = jslnxdx. о 1) Готфрид Вильгельм Лейбниц — немецкий философ и математик A646^ 1716). 2) Вычисление этой площади средствами элементарной математики при™ водит к большим трудностям.
ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 35 Так как одной из первообразных функции f(x) = sin ж является функция Ф(х) = ^cosx, то по формуле A.10) получим УГ Г S\ = I ^inxdx = (— costt) — (— cosO) = 2. Вычислим теперь площадь S2 фигуры, отсекаемой от пара™ болы у = х2 прямой, проходящей через две точки Mi (а, а2) и М2(Ь^Ь2) этой параболв! (рис. 1.6) г). Искомая площадь S2 рав- равна разности площадей прямолинейной трапеции АМ1М2В и за- заштрихованной на чертеже криволинейной трапеции, т. е. ь {Ь2 + а2){Ь - а) _ Ь3 -а3 _ (Ъ - аK 3 а о Ух 6 У^ t/=sm х ж х Рис. 1.5 М2[Ь}Ь2) А(а,0) 01 В(Ь,0) х Рис. 1.6 § 5. Заключительные замечания Дифференциальное и интегральное исчисления составляют основу математического анализа, создание которого является одним из величайших достижений человеческого разума. Вве- Введение в математику понятий переменной величины и функции позволило перейти от решения отдельных разрозненных физи- физических и геометрических задач к созданию общих методов реше™ ния этих задач. Развитие дифференциального и интегрального исчислений оказало огромное влияние на общий прогресс науки и техники. Дальнейший прогресс науки и техники тесно связан с мате- математизацией наших представлений о природе, с развитием но- ) Эта задача средствами элементарной математики была решена вели- великим древнегреческим ученым Архимедом (III в. до н. э.).
36 ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ ГЛ. 1 вых направлений в математике. Можно с уверенностью ска™ зать, что математизация наших представлений, точная количе- количественная формулировка закономерностей, широкое использова- использование вычислительных методов и электронно-вычислительных ма- машин (ЭВМ) составляют основной стержень современного есте- естествознания. Внедрение вычислительных методов и использование ЭВМ, как правило, снимают вопросы трудоемкости и сложности вы- вычислений1). При этом возникает целая серия математических проблем, к числу которых относятся вопросы разработки алго- алгоритмов2) вычислений, служащих источником составления про- программ для ЭВМ, разработка проблем теории управления, тео- теории оптимальных процессов, математической логики и теорети- теоретической кибернетики. Наша дальнейшая задача будет заключаться в построении аппарата математического анализа. Мы рассмотрим также и некоторые приложения этого аппарата к разработке численных алгоритмов. Проведенное выше предварительное рассмотрение ставит пе- перед нами следующие первоочередные вопросы: 1. Уточнение понятий вещественного числа, переменной ве- величины и функции. 2. Определение и развитие понятия предела функции и свя- связанного с ним понятия непрерывности функции. 3. Обоснование формул и правил дифференциального и ин- интегрального исчислений. 4. Построение теории определенного интеграла как предела сумм специального вида и развитие методов вычисления опре- определенного интеграла. 5. Выяснение некоторых геометрических понятий (площади плоской фигуры, длины дуги и т. д.). г) Современные ЭВМ в несколько минут производят вычисления, для проведения которых человеку потребовалась бы целая жизнь. ' ) Алгоритм (или алгорифм) — система вычислений, выполняемых по строго определенным правилам, приводящая после какого-либо числа ша- шагов к решению поставленной задачи.
ГЛАВА 2 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ Из элементарного курса читатель имеет представление о вещественных числах и о том, что они необходимы, например, для измерения отрезков и промежутков времени. Для углубле- углубления наших представлений о важнейших математических поня- понятиях — понятиях переменной величины, функции и предела — требуется дальнейшее развитие теории вещественных чисел. Рассмотрим, например, физическую переменную величину — время. Для сравнения между особой различных промежутков времени нам необходимо уметь сравнивать между собой ве- вещественные числа. Иными словами, мы должны установить правило, позволяющее выяснить, какое из двух данных веще- вещественных чисел является большим. Практика последователь- последовательных измерений времени приводит к необходимости определе- определения операций сложения и умножения вещественных чисел и выяснения свойств этих операций. Отметим также, что выясне™ ние основных свойств вещественных чисел необходимо для об- обоснования применимости к этим числам правил элементарной алгебры. § 1. Вещественные числа 1. Свойства рациональных чисел. Напомним, что раци- рациональным числом называется число, представимое в виде от- отношения двух целых чисел г). Из элементарного курса извест™ ны определения операций сложения и умножения рациональных чисел, правило сравнения этих чисел и их простейшие свойства. Здесь мы перечислим основные свойства рациональных чисел, вытекающие из соответствующих свойств целых чисел. Фундаментальную роль среди свойств играют три правила: ) Одно и то же рациональное число представимо в виде отношения раз- тт 12 3 личных целых чисел. Например, — = — = — = ... 2 4 6
38 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 правило сравнения и правила образования суммы и произведения. I. Любые два рациональных числа а и Ъ связаны между со- собой одним и только одним из трех знаков >, < или =, причем если а > Ь, то Ъ < а. Иными словами, существует правило^ по- позволяющее установить^ каким из указанных трех знаков свя- связаны два данных рациональных числа. Это правило называется правилом сравнения1). П. Существует правило, посредством которого любым двум рациональным числам а и Ъ ставится в соответствие опреде- определенное рациональное число с, называемое их суммой и обозна- обозначаемое символом с = а + Ь2). Операция нахождения суммы называется сложением. III. Существует правило, посредством которого любым двум рациональным числам а и Ъ ставится в соответствие определенное рациональное число с, называемое их произведе- нием и обозначаемое символом с = аЬ3). Операция нахождения произведения называется умно- умножением. Перечислим теперь основные свойства, которым подчинены указанные три правила. Правило сравнения рациональных чисел обладает следую- следующим свойством: 1°иза>ЬиЬ>с вытекает^ что а > с (свойство тран- транзитивности знака >); из а = Ь и Ь = с вытекает^ что а = с (свойство транзитивности знака =). Правило сложения рациональных чисел обладает, следующи- следующими свойствами: 2° а + Ь = Ь + а (переместительное свойство); 3° (а + Ь) + с = а + (Ь + с) (сочетательное свойство); 4° существует рациональное число 0 такое^ что а + 0 = а для любого рационального числа а (особая роль нуля); 1) Правило сравнения рациональных чисел формулируется так: два mi m2 неотрицательных рациональных числа а = и о = связаны тем же П\ П2 знаком, что и два целых числа т\П2 и гп2П\\ два неположительных рани™ ональных числа а и Ь связаны тем же знаком, что и два неотрицательных числа | Ь | и | а |; если а — неотрицательное, а Ь — отрицательное рациональ- рациональное число, то а > Ь. ) Правило образования суммы рациональных чисел а = и о = П\ П2 , mi rri2 + определяется посредством формулы 1 = П\ П2 П\П2 3) Правило образования произведения рациональных чисел определяется mi wi2 mim2 посредством формулы = . 711 П'2 П\П2
§ 1 ВЕЩЕСТВЕННЫЕ ЧИСЛА 39 5° для каждого рационального числа а существует проти- воположное ему число а1 такое^ что а + а1 = 0. Правило умножения рациональных чисел обладает следую™ щими свойствами: 6° ab = Ьа (переместительное свойство); 7° (ab)c = а(Ьс) (сочетательное свойство); 8° существует рациональное число 1 такое^ что а Л = а для любого рационального числа а (особая роль единицы); 9° для каждого рационального числа а, отличного от нуля^ существует обратное ему число а1 такое^ что аа1 = 1. Правила сложения и умножения связаны следующим свой- свойством: 10° {а + Ъ)с = ас + Ъс (распределительное свойство умножения относительно суммы). Следующие два свойства связывают знак > со знаком ело™ жения и умножения: 11° из а > b вытекает^ что а + с > b + с; 12° иза>Ъис>0 вытекает^ что ас > 6с. Особая роль принадлежит последнему свойству: 13° каково бы ни было рациональное число а, можно число 1 повторить слагаемым столько раз, что полученная сумма пре- превзойдет а1). Перечисленные 13 свойств обычно называют основны- основными свойствами рациональных чисел, ибо все дру- другие алгебраические свойства этих чисел, относящиеся к ариф- арифметическим действиям и к сочетанию равенств и неравенств, могут быть извлечены как следствие из указанных основных свойств. Так, например, из этих свойств вытекает часто используе™ мое в дальнейшем свойство, позволяющее почленно складывать неравенства одного знака: если а > b ш с > d, тоа + с>Ь + й. В самом деле, из неравенств аУЬшсУёжш свойств 11° и 2° вытекает, что а + е>Ь + еи6 + с>6 + б?, а из последних неравенств и из свойства 1° вытекает, что а + с > 6 + d. 2. Об измерении отрезков числовой оси. Из элементар™ ного курса известно, что два отрезка могут быть соизмеримыми (когда отношение их длин выражается рациональным числом) и несоизмеримыми (примером несоизмеримых отрезков могут служить диагональ и сторона квадрата). Удобно сразу же ввести в рассмотрение числовую ось. Число- Числовой осью мы будем называть прямую, на которой выбраны опре- определенная точка О (начало отсчета), масштабный отрезок ОЕ 1) Это свойство часто называют аксиомой Архимеда.
40 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 (длину его мы считаем равной единице) и положительное на™ правление (обычно от О к ?). Естественно, возникает задача о возможности поставить в соответствие каждой точке М числовой оси некоторое число, выражающее длину отрезка ОМ. Это число мы будем считать положительным, если М и Е лежат по одну сторону от О, и отрицательным — в противном случае. Прежде всего заметим, что каждому рациональному числу соответствует на числовой оси определенная точка. В самом деле, из элементарного курса известно, как построить отрезок, длина которого составляет - часть длины масштабного отрез- отрезка ОЕ (п — любое целое положительное число). Стало быть, мы можем построить отрезок Рщ (Р^ГлГУ^ АВ^ Длина которого относит- \ п) 1\п) ся к длине масштабного от™ резка САЬ, как —, где т и п — Рис 2 1 ^ любые целые положительные числа. Считая, что точка Е лежит правее точки О (рис. 2.1) и от- отложив отрезок АВ вправо (влево) от точки О, мы получим точку л/г / л /г \ . т ( т ikf I (ikf2), соответствующую рациональному числу + — ( ^^ Вместе с тем существование несоизмеримых отрезков позво- позволяет утверждать, что не все точки числовой оси соответству- соответствуют рациональным числам. Естественно, возникает потребность расширить область ра™ циональных чисел и ввести в рассмотрение такие числа, которые соответствовали бы всем точкам числовой оси и позволяли бы измерить при помощи do ci\ масштабного отрезка ОЕ "q ' ' ' ' ' ' ' ' lg ж' ' ' ' ' *р1и^ любой отрезок. Мы опишем специаль- Рис> 2.2 ный процесс измерения отрезка ОМ числовой оси и покажем, что этот процесс позволяет поставить в соответ- соответствие любой точке М этой оси некоторую вполне определен- определенную бесконечную десятичную дробь. Пусть М — любая точка числовой оси. Ради определенности предположим, что М (как и Е) лежит правее точки О (рис. 2.2). Будем измерять отрезок ОМ при помощи масштабного от- отрезка ОЕ. Прежде всего выясним, сколько раз целый отре™ зок ОЕ укладывается в отрезке ОМ. Могут представиться два случая: 1. Отрезок ОЕ укладывается в отрезке ОМ целое число а® раз с некоторым остатком NM^ меньшим ОЕ (см. рис. 2.2). В
§ 1 ВЕЩЕСТВЕННЫЕ ЧИСЛА 41 этом случае целое число а® представляет собой приближенный результат измерения по недостатку с точностью до единицы. 2. Отрезок ОЕ укладывается в отрезке ОМ целое число а® + 1 раз без остатка. В этом случае число а® также предста™ вляет собой приближенный результат измерения по недостатку с точностью до единицы, ибо отрезок ОЕ укладывается в отрез™ ке ОМ а® раз с остатком NM^ равным ОЕ1). Выясним теперь, сколько раз — часть масштабного отрез- отрезка ОЕ укладывается в остатке NM. Снова могут представиться два случая. 1) — часть отрезка ОЕ укладывается в отрезке NM целое число а\ раз с некоторым остатком РМ, меньшим — части от- отрезка ОЕ (см. рис. 2.2). В этом случае рациональное число а®^ а\ представляет собой результат измерения по недостатку с точ- точностью до —. 2) — часть отрезка ОЕ укладывается в отрезке NM целое число а\ + 1 раз без остатка. В этом случае рациональное число а®^а\ также представляет собой результат измерения по недо- недостатку с точностью до —, ибо — часть ОЕ укладывается в отрезке NM а\ раз с остатком РМ, равным — части ОЕ. Продолжая неограниченно указанные рассуждения, мы при™ дем к бесконечной совокупности рациональных чисел: a®; a®, ai;...; a®, a\a2 ... ап;..., B.1) каждое из которых представляет собой результат измерения от™ резка ОМ по недостатку с соответствующей степенью точно- точности. Вместе с тем каждое из чисел B.1) может быть получено посредством обрывания на соответствующем знаке бесконечной десятичной дроби a®, aia2...an... B.2) Указанные выше рассуждения применимы и для случая, ко™ гда точка М лежит левее точки О, только в этом случае все числа B.1) и бесконечная десятичная дробь B.2) будут иметь отрицательный знак. х) Конечно, на практике во втором случае процесс измерения считают законченным и полагают длину отрезка ОМ равной «о + 1- Однако нам удобнее (в целях единообразия) вести измерения строго по недостатку, что- чтобы и в этом случае получить остаток NM и иметь возможность продолжать процесс измерения.
42 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 Таким образом, мы установили, что посредством описанного нами процесса измерения отрезка ОМ любой точке М число- числовой оси можно поставить в соответствие вполне определен- определенную бесконечную десятичную дробь. Итак, мы видим, что описанный выше процесс измерения произвольного отрезка ОМ числовой оси при помощи масштаб- масштабного отрезка естественным образом приводит нас к рассмотре- шло чисел^ представимых в виде бесконечных десятичных дро- бей. Вместе с тем каждая бесконечная десятичная дробь B.2) полностью характеризуется бесконечной совокупностью B.1) рациональных чисел, приближающих эту дробь. Конечно, опи- описанный выше процесс измерения отрезка ОМ можно видоизме- видоизменить так, что он будет приводить к рассмотрению бесконечных двоичных дробей или к рассмотрению бесконечных дробей в лю- любой другой системе счисления. Заметим, что для задания чисел в современных электронных вычислительных машинах наиболее часто используется двоич- двоичная система счисления, а иногда — троичная система счисления. Это объясняется тем, что входящие в конструкцию электронных машин радиолампы и полупроводниковые элементы имеют ча- чаще всего два, а иногда три устойчивых состояния (например, лампа закрыта, ток не идет — одно устойчивое состояние; лам- лампа открыта, ток идет — другое устойчивое состояние; третье устойчивое состояние возникает, если различать направление, в котором идет ток). В связи с отмеченным обстоятельством возникает необходи- мость в разработке алгоритмов перевода чисел из десятичной системы счисления в двоичную систему и обратного перевода чисел из двоичной системы в десятичную. Примеры таких ал™ горитмов читатель найдет в Дополнении 1 к настоящей главе. 3. Вещественные числа и правило их сравнения. Рас- Рассмотрим множество всевозможных бесконечных десятичных дробей. Числа^ представимые этими дробями^ будем называть вещественными г). Данное вещественное число будем называть положитель- положительным (отрицательным), если оно представимо в виде положи- положительной (отрицательной) бесконечной десятичной дроби. В состав множества вещественных чисел входят, конечно, и все рациональные числа, ибо все они представимы в виде бес- бесконечных десятичных дробей. Представление данного рацио- рационального числа в виде бесконечной десятичной дроби можно получить, например, из следующих соображений. Любому раци- ) Как уже отмечалось в сноске ) на с. 20, понятие числа относится к начальным понятиям.
§ 1 ВЕЩЕСТВЕННЫЕ ЧИСЛА 43 опальному числу соответствует определенная точка М числовой оси, а этой точке ставится в соответствие при помощи способа, указанного в пункте 2, определенная бесконечная десятичная дробь. Так, рациональному числу - ставится в соответствие бес™ 4 конечная десятичная дробь 0,4999... , рациональному числу - о бесконечная десятичная дробь 1, 333 ... Вещественные числа, не являющиеся рациональными, при- принято называть иррациональными. Нашей задачей является последовательное перенесение на случай произвольных вещественных чисел трех правил и всех основных свойств рациональных чисел, перечисленных в п. 1. Тем самым для вещественных чисел будут обоснованы все пра- правила элементарной алгебры, относящиеся к арифметическим действиям и к сочетанию равенств и неравенств. В этом пункте мы установим правило сравнения веществен- вещественных чисел. Прежде чем перейти к формулировке этого правила, договоримся об определенной форме записи тех рациональных чисел, которые представимы в виде конечной десятичной дро- дроби. Заметим, что указанные рациональные числа допускают дво- двоякую запись в виде бесконечных десятичных дробей. Например, число - = 0, 5 можно записать: 1) в виде - = 0,4999 ... ; 2) в виде | = 0, 5000 ... И вообще рациональное число ао? ttift2 • • • ат гДе ап ^0, мож- мож) ( ) ) щ рц о? i2 т Д п ^, но записать: 1) в виде ао, a\CL2 ... Q>n-i(an — 1) 999 ...; 2) в виде ао,а1«2 • • • ап 000 ... Первая из указанных двух записей может быть получена по способу, описанному в п. 2, а вторая — формальным превраще- превращением данной конечной десятичной дроби в бесконечную посред- посредством дописывания нулей. Мы договоримся при сравнении вещественных чисел пользо- пользоваться для указанных рациональных чисел лишь первой из этих двух форм записи в виде бесконечной десятичной дроби. Иными словами, при сравнении вещественных чисел мы не будем употреблять бесконечные десятичные дроби, все десятич- десятичные знаки которых, начиная с некоторого места, равны нулю (за исключением, конечно, дроби 0, 000 ...) 1). Перейдем теперь к формулировке правила сравнения веще™ ственных чисел. ) Принятие такой договоренности вполне соответствует процессу измере- измерения отрезка, описанному в п. 2, ибо описанный процесс не может привести к бесконечной десятичной дроби, у которой все десятичные знаки, начиная с некоторого места, равны нулю.
44 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 Рассмотрим два произвольных вещественных числа а и Ь. Пусть эти числа представимы следующими бесконечными де- десятичными дробями: а = ±ttQ? а\п2 ... ап ..., B-3) b = ±bo,blb2...bn... B.4) (где из двух знаков ± берется какой-то один). Два вещественных числа B.3) и B.4) называются равными^ если они имеют одинаковые знаки и если справедливы равенства ао = Ьо, «1 = bi,..., ап = Ьп,... Пусть даны два неравных вещественных числа а и Ъ. Устано- Установим правило, при помощи которого можно прийти к заключе- заключению, каким знаком, > или <, связаны эти два числа. 1. Пусть сначала а и Ъ оба неотрицательны и имеют следую- следующие представления: а = ао, а\п2 ... ап • • • 5 Ь = Ьо, ^1^2 • • • &п Так как числа а и Ъ не равны, то нарушается хотя бы одно из равенств ао = Ьо, а\ = Ь]_, ..., ап = Ьп,... Обозначим через fc наименьший из номеров п, для которых нарушается равенство аи = Ьп 1). Тогда мы будем считать, что а > Ь, если а^ > Ь^, и а < 6, если а^ < Ъ^. 2. Если из двух чисел оиЬ о(?но неотрицательно, а другое отрицательно, то мы, естественно, будем считать, что неотри- неотрицательное число больше отрицательного. 3. Остается рассмотреть случай, когда оба числа а и Ь отри- цательны. Договоримся называть модулем вещественно- вещественного числа а неотрицательное вещественное число^ обозначаемое символом \а\ и равное десятичной дробщ представляющей чис- число а, взятой со знаком +. Если а и Ъ оба отрицательны^ то мы будем считать, что а > > Ь, если Ь\ > \а , и а < Ь, если \а > | Ь | 2). х) Итак мы считаем, что «о = Ьо, сц = bi, • • •, «fc-i = bfc-i5 но а& / &fc. ) Легко видеть, что сформулированное правило сравнения веществен- вещественных чисел в применении к двум рациональным числам приводит к тому же самому результату, что и правило сравнения рациональных чисел, указан- указанное в сноске 1). на с. 38. В самом деле, достаточно рассмотреть лишь случай двух неотрицатель- неотрицательных рациональных чисел а и Ь. Пусть а > Ь согласно правилу сравнения рациональных чисел, и пусть а = ао, а±а2 ... ап ...; Ь = Ьо, &1&2 • • • Ьп ... Предположим, что рациональному числу а соответствует на числовой оси точка Mi, а рациональному числу Ь — точка Мг. Тогда ясно, что точка Mi лежит правее точки Мг. Вместе с тем из п. 2 вытекает, что целое чис- чис... ak(bobi ... bk) показывает, сколько раз —¦^ часть масштабного отрезка ОЕ укладывается в отрезке О Mi (OM2) с выкинутым правым кон™ цом. Поскольку отрезок ОМ\ больше отрезка ОМ2, то найдется такой но- номер к, что <2o«i • • • dk-i = bob\ ... bk-i, a ao«i ... а& > bobi ... bk, но это и означает, что а > b согласно правилу сравнения вещественных чисел.
§ 1 ВЕЩЕСТВЕННЫЕ ЧИСЛА 45 Убедимся, что правило сравнения вещественных чисел об л а™ дает свойством 1°, сформулированным в п. 1 для рациональнвхх чисел. Именно, докажем, что если а, Ъ и с — произвольные ве- вещественные числа и если а > Ь и Ь > с, то а > с (свойство транзитивности знака >I). Для доказательства этого свойства рассмотрим три возможных случая. 1. Пусть сначала с ^ 0. Тогда из правила сравнения ве- вещественных чисел очевидно, что Ъ > 0 и а > 0. Пусть а = = ао, а\а2 ... ап ...; Ь = Ьо, &1&2 • • • К ... ; с = со, с\С2 ... ... сп ... Обозначим через к наименьший из номеров п, для ко- которых нарушается равенство ап = Ьп (т. е. предположим, что а0 = Ьо, «1 = Ьъ ..., a^-i = bfc_i, а^ > bfc), а через р наимень- наименьший из номеров в, для которых нарушается равенство Ьп = сп (т. е. предположим, что Ьо = со, bi = сь ..., bp^i = cp_i, Ьр > ср). Тогда, если обозначить через т наименьший из двух номеров к и р, то будут справедливы соотношения а® = со, п\ = ci, ... , ... ат^\ = cm_i, ато > сто, а это и означает, что а > с. 2. Пусть с < 0, а ^ 0. Тогда равенство а > с будет справед- справедливо при любом Ь. 3. Остается рассмотреть случай, когда все три числа а, бис отрицательны. Так как а > 6 и 6 > с, то|Ь|>|а|и|е > > Ь |. Но тогда, в силу уже рассмотренного выше случая трех положительных чисел, \с\ > |а|, а это и означает, что а > с. Свойство транзитивности знака > полностью доказано. 4. Приближение вещественного числа рациональны- рациональными числами. В этом пункте мы покажем, что всякое веще- вещественное число молено приблизить с любой степенью точности рациональными числами. Рассмотрим произвольное веществен- вещественное число а. Ради определенности будем считать это число неотрицательным и представим его в виде бесконечной десятич- десятичной дроби а = ао, а±а2 ... ап Обрывая указанную дробь на в-м знаке после запятой, полу™ чим рациональное число ао, а\п2 ... ап. Увеличив это число на 1 . 1 о рое раоаое со а аа а + 1 . 1 —^-, получим другое рациональное число ао, аха2 ... ап + —^-. Из правила сравнения вещественных чисел легко установить, что для любого номера п справедливы неравенства а0, aia2 ... ап ^ а ^ а0, aia2 ... ап + —. B.5) Неравенства B.5) означают, что вещественное число а заклю- заключено между двумя рациональными числами^ разность между которыми равна ——. При этом номер п можно взять любой. ) Свойство транзитивности знака =, утверждающее, что из а = Ь и Ь = = с следует, что а = с, сразу вытекает из правила сравнения вещественных
46 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 Покажем, что для любого наперед взятого положительного рационального числа е, начиная с некоторого номера п, спра- справедливо неравенство ——¦ < е. В самом деле, каково бы ни было рациональное число е > О, найдется лишь конечное число нату- натуральных чисел, не превосходящих числа -. Поэтому лишь для n конечного числа номеров п справедливо неравенство Wn ^ или ——¦ ^ е. Для всех же остальных номеров п справедливо lip ^ обратное неравенство —- < е, что и требовалось доказать. Таким образом, мы приходим к следующему утверждению: для любого вещественного числа а и для любого наперед взя- взятого положительного рационального числа е найдутся два рациональных числа а\ и «2 такие^ что а\ ^ а ^ «2, причем «2 — «1 < ?• Неравенства B.5) позволяют утверждать, что рациональное число ао, «1«2аз • • • ап приближает вещественное число а с точ- точностью до —-. На практике всегда имеют дело с приближенным значением вещественного числа, заменяя его рациональным чис- числом с требуемой степенью точности. 5. Множества вещественных чисел, ограниченные сверху или снизу. В этом пункте мы рассмотрим произволь- произвольное множество вещественных чисел, содержащее хотя бы одно число1). Это множество мы будем обозначать символом {%}. Отдельные числа, входящие в состав множества {ж}, будем на- называть элементами этого множества2). Определение 1. Множество вещественных чисел {х} на- называется ограниченным сверху (с н и з у ), если существует такое вещественное число М (число га), что каж- каждый элемент х множества {х} удовлетворяет неравенству х ^ М (х > га). При этом число М (число га) называется верхней (нижней) гра- гранью множества {х}. Конечно, любое ограниченное сверху множество {х} имеет бесконечно много верхних граней. В самом деле, если веществен- вещественное число М — верхняя грань множества {ж}, то любое веще- вещественное число Af*, большее числа М, также является верхней гранью множества {х}. Аналогичное замечание можно сделать в отношении нижних граней ограниченного снизу множества {х}. г) Такое множество обычно называют непустым. 2) Отметим, что понятие множества и его элемента относится к началь- начальным понятиям (см. сноску 2) на с. 20).
§ 1 ВЕЩЕСТВЕННЫЕ ЧИСЛА 47 Так, например, множество всех отрицательных веществен™ ных чисел ограничено сверху. В качестве верхней грани М тако™ го множества можно взять любое неотрицательное вещественное число. Множество всех целых положительных чисел 1,2,3,... ограничено снизу. В качестве нижней грани этого множества можно взять любое вещественное число га, удовлетворяющее неравенству га ^ 1. Естественно, возникает вопрос о существовании наименьшей из верхних граней ограниченного сверху множества и наиболь- шей из нижних граней ограниченного снизу множества. Определение 2. Наименьшая из всех верхних граней огра- ограниченного сверху множества {х} называется точной верхней гранью этого множества и обозначает- обозначается символом ж = sup{#} 1). Наибольшая из всех нижних граней ограниченного снизу множества {х} называется точной нижней гранью этого множества и обозначается символом ж = inf{#} 2). Определение 2 молено сформулировать и по другому, а именно: Число х (число ж) называется точной верхней (точной нижней) гранью ограниченного сверху (снизу) множества {ж}, если выполнены следующие два требования: 1) каждый эле- элемент х множества {х} удовлетворяет неравенству х ^ ж (х ^ ^ ж), 2) каково бы ни было вещественное число ж;, меньшее ж (большее ж), найдется хотя бы один элемент ж множества {ж}, удовлетворяющий неравенству ж > х' (ж < х'). В этом определении требование 1) означает, что число ж (чис- (число ж) является одной из верхних (нижних) граней, а требова™ ние 2) говорит о том, что эта грань является наименьшей (наи- (наибольшей) и уменьшена (увеличена) быть не может. Очевидно, что у множества всех отрицательных веще- вещественных чисел существует точная верхняя грань — число нуль, причем это число не принадлежит указанному мно- множеству. Очевидно также, что у множества всех целых по™ ложительных чисел 1, 2, 3, ... существует точная нижняя грань ж = 1, которая принадлежит указанному множеству (т. е. является наименьшим элементом этого множества). Та- Таким образом, точная верхняя (точная нижняя) грань множе- ства может как принадлежать, так и не принадлежать этому множеству. ) sup — первые три буквы латинского слова supremum («супремум»), которое переводится как «наивысшее». 2) inf — первые три буквы латинского слова iiifimum («инфимум»), кото- которое переводится как «наинизшее».
48 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 Существование у любого ограниченного сверху (снизу) мно- жества точной верхней (точной нижней) грани не является оче- очевидным и требует доказательства. Докажем следующую основную теорему. Теорема 2.1. Если множество вещественных чисел содер- содержит хотя бы один элемент и ограничено сверху (снизу), то существует вещественное число ж (число ж), которое являет- является точной верхней (точной нижней) гранью этого множества. Доказательство. Мы остановимся лишь на доказа- доказательстве существования точной верхней грани у любого ограни- ограниченного сверху множества, ибо существование точной нижней грани у любого ограниченного снизу множества доказывается совершенно аналогично. Итак, пусть множество {х} ограничено сверху, т. е. существу- существует такое вещественное число М, что каждый элемент х множе- ства {х} удовлетворяет неравенству х ^ М. B.6) Могут представиться два случая: 1°. Среди элементов мно- множества {х} есть хотя бы одно неотрицательное вещественное число. 2°. Все элементы множества являются отрицательными вещественными числами. Эти случаи мы рассмотрим отдельно. 1°. Рассмотрим лишь неотрицательные вещественные числа, входящие в состав множества {х}. Каждое из этих чисел пред- представим в виде бесконечной десятичной дроби и рассмотрим це- целые части этих десятичных дробей. В силу B.6) все целые ча- части не превосходят числа М, а поэтому найдется наибольшая из целых частей, которую мы обозначим через W®. Сохраним сре- среди неотрицательных чисел множества {х} те, у которых целая часть равна жо? и отбросим все остальные числа. У сохранен- сохраненных чисел рассмотрим первые десятичные знаки после запятой. Наибольший из этих знаков обозначим через ~х\. Сохраним сре- среди неотрицательных чисел множества {х} те, у которых целая часть равна жо, а первый десятичный знак равен Ж]., и отбросим все остальные числа. У сохраненных чисел рассмотрим вторые десятичные знаки после запятой. Наибольший из этих знаков обозначим через Ж2- Продолжая аналогичные рассуждения да- далее, мы последовательно определим десятичные знаки некото- некоторого вещественного числа ж: X = Жо, Х\Х2 ... Хп ... Докажем, что это вещественное число ж и является точной верхней гранью множества {х}. Для этого достаточно доказать два утверждения: 1) что каждый элемент х множества {х} удо- удовлетворяет неравенству х ^ ж; 2) что, каково бы ни было веще- вещественное число ж;, меньшее ж, найдется хотя бы один элемент х множества {ж}, удовлетворяющий неравенству х > х1.
§ 1 ВЕЩЕСТВЕННЫЕ ЧИСЛА 49 Сначала докажем утверждение 1). Так как ж неотрицатель™ но, то любое отрицательное число х из множества {х} заведомо удовлетворяет неравенству х ^ ж. Пусть х = жо, х\ ... хп ... — любое неотрицательное число, входящее в состав множества {х}. Предположим, что это число х не удовлетворяет неравенству х ^ х. Тогда х > х и по правилу сравнения найдется номер к такой, что х® = жо, ..., %k-i — #fc-i5 x^ > ж&. Но послед™ ние соотношения противоречат тому, что в качестве ж^ берется наибольший из десятичных знаков х^ тех элементов ж, у которых целая часть и первые (А; — 1) знаков после запятой соответственно равны жо,Ж]_, ..., ~Xk-i- Докажем теперь утверждение 2). Пусть х1 = ж;0, x[xf2 ... ... х'п ... — произвольное вещественное число1), меньшее ж. Тогда в силу правила сравнения вещественных чисел найдется номер п такой, что xf0 = ж0, х[ =хъ ..., ж^ = жп_1, ж^ < жп. B.7) С другой стороны, число х мы строили так, что среди элементов множества {х} найдется число х = жо, х±Х2 ••• хп ..., целая часть и первые п десятичных знаков у которого те же, что и у числа ж, т. е. жо=жо, xi = хъ ...,xn-i = xn-i, хп = хп. B.8) Сопоставляя B.7) и B.8), в силу правила сравнения веществен- вещественных чисел получим, что х1 < х. Утверждение 2) доказано. Та- Таким образом, для случая 1° существование точной верхней грани доказано. 2°. Аналогично доказывается существование точной верх- верхней грани и во втором случае, когда все элементы множе- множества {х} являются отрицательными вещественными числа- ми. В этом случае все элементы множества {ж} мы представим в виде отрицательных бесконечных десятичных дробей. Обозна™ чим через х® наименьшую из целых частей этих дробей; че™ рез жх — наименьший из первых десятичных знаков тех из этих дробей, у которых целая часть равна х®; через Х2 — наимень- наименьший из вторых десятичных знаков тех из этих дробей, у которых целая часть равна х®, а первый десятичный знак равен жх; ... Таким путем мы определим отрицательное вещественное число х = -жо В полной аналогии со случаем 1° доказывается, что число ж яв™ ляется точной верхней гранью множества {ж} (т. е. удовлетворяв ) Это число х мы, не ограничивая общности, будем считать неотри- неотрицательным, ибо если бы оно было отрицательным, то неравенству ж > х удовлетворял бы неотрицательный элемент х множества {ж}.
50 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 ет двум утверждениям, сформулированным при рассмотрении случая 1°). Теорема доказана. Замечание. При доказательстве теоремы 2.1 для слу- случая 2° у числа х = ^Ж0,Ж1Ж2 ... хп ... все десятичные знаки, начиная с некоторого места, могут оказаться равными нулю, т. е. это число может оказаться имеющим вид х = -жо,Ж1 ... xk^jxk 000 ..., где хк ф 0. В этом случае остается в силе приведенное выше доказатель- доказательство, но согласно договоренности, принятой в п. 3, при сравне- сравнении с элементами множества число х следует записывать в виде х = -х0, xi ... xk^i(xk - 1) 999 ... § 2. Арифметические операции над вещественными числами. Основные свойства вещественных чисел 1. Определение суммы вещественных чисел. Одним из важнейших вопросов теории вещественных чисел является вопрос об определении операций сложения и умножения этих чисел и о свойствах этих операций. Остановимся прежде всего на операции сложения вещественных чисел. Хорошо известно, как складывают два вещественных чис- числа на практике. Для того чтобы сложить два вещественных числа а и 6, их заменяют с требуемой степенью точности ра- рациональными числами и за приближенное значение суммы двух данных вещественных чисел берут сумму указанных рациональ- рациональных чисел. При этом совершенно не заботятся о том, с какой стороны (по недостатку или по избытку) взятые рациональные числа приближают данные вещественные числа а и Ь. Факти- Фактически указанный практический способ сложения вещественных чисел предполагает, что чем точнее рациональные числа а и /3 приближают (с любой стороны) вещественные числа а и Ь со- соответственно, тем точнее сумма а + /3 приближает то веще- вещественное число, которое должно являться суммой вещественных чисел а и Ъ. Желание оправдать указанный практический способ сложе- сложения вещественных чисел, естественно, приводит нас к следую- следующему определению суммы двух вещественных чисел. Пусть ol\ и «2 — какие угодно рациональные числа, между которыми заключено вещественное число а (т. е. а\ ^ а ^ «2), a /3i и 02 — какие угодно рациональные числа, между которы- которыми заключено вещественное число Ь (т. е. /3\ ^ Ь ^ fa)- Тогда суммой вещественных чисел а и Ъ мы назовем такое веществен-
§ 2 АРИФМЕТИЧЕСКИЕ ОПЕРАЦИИ НАД ЧИСЛАМИ 51 ное число ж, которое заключено между всеми рациональными числами а\+ fix и «2 + /?2 1)- Иными словами, суммой вещественных чисел а и Ъ мы назовем такое вещественное число ж, которое для любых рацио- рациональных чисел «1, «2, /?i и /?25 удовлетворяющих неравенствам аг^а^а21 /?i ^ Ь ^ /32, B.9) удовлетворяет следующим неравенствам: «1+А ^ж^а2+/?2. B-Ю) Существование такого вещественного числа ж, и притом только одного, не вызывает сомнений. (Соответствующее доказатель- доказательство приводится ниже.) Нетрудно убедиться в том, что таким числом х является точная верхняя грань множества {ot\ + j3\} сумм всех рациональных чисел а\ и /3i, удовлетворяющих ле- левым неравенствам B.9) 2). 1°. Прежде всего убедимся в том, что указанная верхняя грань суще- существует. В самом деле, фиксируем произвольные рациональные числа «2 и р2, удовлетворяющие правым неравенствам B.9), и рассмотрим всевоз- всевозможные рациональные числа а\ и /3i, удовлетворяющие левым неравен- неравенствам B.9). Из свойства транзитивности знака >, установленного в п. 3 § 1, приходим к выводу, что ol\ < ct% /3i < /З2, а из этих неравенств следует, что «1 +/3i ^ «2 +ft (см. конец п. 1 § 1). Таким образом, множество всех раци- рациональных чисел {а\ +/3i} ограничено сверху и число «2 + /?2 является одной из верхних граней этого множества. По теореме 2.1 у множества {ai +/3i} существует точная верхняя грань, которую мы обозначим через х. Остается убедиться в том, что число х является суммой вещественных чисел а и 6, т. е. удовлетворяет неравенствам B.10). В самом деле, по определению точ- точной верхней грани, справедливо левое неравенство B.10), а справедливость правого неравенства B.10) вытекает из того, что «2 +/?2 — одна из верхних граней^ а ж — точная верхняя грань множества {а\ + /3\}. 2°. Установим теперь, что существует только одно вещественное чис- число ж, удовлетворяющее неравенствам B.10). Будем опираться на следую- следующую лемму (для удобства доказательство этой леммы отнесено в конец настоящего пункта): Мем,м,а. Если для двух данных вещественных чисел х\ и Ж2 и для лю- любого наперед взятого положительного рационального е найдутся два раци- рациональных числа 7i и 72 таких, что 71 ^ х\ ^ 72? 7i ^ Ж2 ^ 72 и 72 — 7i < E-> то числа х\ и Ж2 равны. Предположим, что существуют два вещественных числа х\ и Ж2, удов- удовлетворяющих неравенствам B.10) (при любых рациональных числах ai, 02, /3i и /З2, удовлетворяющих неравенствам B.9)). Возьмем любое положитель- положительное рациональное число е. Согласно утверждению, доказанному в п. 4 § 1, 1) Заметим, что в элементарном курсе сумма двух вещественных чисел определялась аналогичным образом (см. А. П. Киселев. Алгебра П. Учпед™ гиз, 1959, с. 9). ) Аналогично можно было бы убедиться в том, что таким числом явля- является точная нижняя грань множества {«2 + @ч} сумм всех рациональных чисел «2 и /?2, удовлетворяющих правым неравенствам B.9).
52 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 для вещественного числа а и для рационального числа е/2 найдутся такие рациональные числа ai и a2j что а.\ ^ a ^ «2, причем «2 — ai < е/2. Анало- Аналогично для вещественного числа Ь и для рационального числа е/2 найдутся такие рациональные числа ft и ft, что ft ^ Ь ^ ft, причем ft — ft < е/2. Таким образом, оба вещественных числа xi и ж2 будут заключены меж- между двумя рациональными числами (а\ + ft) и (а2 + ft), разность между которыми (по модулю) равна (a2 + ft) - (ai + ft) = (a2 - ai) + (ft - ft) < e. Так как е — любое наперед взятое положительное рациональное число, то х\ = ж2 в силу сформулированной выше леммы. 3°. Установим, наконец, что в применении к двум рациональным числам сформулированное нами определение суммы вещественных чисел и извест- известное из элементарного курса определение суммы рациональных чисел при- приводят к одному и тому же результату. В самом деле, если а и Ь — два рациональных числа, удовлетворяющих неравенствам ol\ ^ а ^ «2, ft ^ ^ Ь ^ ft, а (а + Ь) — их сумма, полученная по известному из элементарного курса определению, то очевидно, что (ai + ft) ^ a + Ь ^ (a2 + ft), B.11) причем, согласно только что доказанному утверждению, рациональное чис- число (а + 6) является единственным вещественным числом, удовлетворяющим неравенствам B.11). 4°. Прежде чем доказывать сформулированную выше лемму, установим следующее вспомогательное утверждение. Каковы бы ни были два вещественных числа а и Ь такие, что Ь < а, найдется рациональное число а, заключенное между ними, т. е. такое, что b < а < а (а следовательно, найдется и бесконечное множество раз- различных рациональных чисел^ заключенных меэюду а иЬ). Очевидно, достаточно рассмотреть случай, когда оба числа а и Ь неотри- неотрицательны, ибо случай, когда а и Ь оба неположительны, сводится к указан- указанному случаю посредством перехода к модулям, а случай, когда одно число положительно, а другое отрицательно, тривиален (в качестве а можно взять нуль). Итак, пусть b ^ 0; Ь < а; а = ао, а± п2 ... ап ... ; b = bo, bi 62 • • • bn ... Пусть k — наименьший из номеров п, для которых нарушается равенство ап = Ьп, т. е. ао = bo, ai = bi ... a^i = bfc-i, «fe > &fc- В силу договоренности, принятой в п. 3 § 1, можно считать, что все ап при п > к не могут быть равны нулю. Пусть р — наименьший из номеров п, превосходящих к, для которых ап > 0, т. е. а = ao, fli, ••• flfc 00 ... 0 ар ... Тогда из правила сравнения вещественных чисел непосредственно вытекает, что рациональное число а = ао, сц • • • а^ 00 ... 0 (ар — 1) 999 ... удовлет- удовлетворяет неравенствам Ь < а < а. Вспомогательное утверждение доказано. Обращаясь к доказательству леммы, предположим, что х\ ф Х2- Пусть ради определенности х\ < Х2- Тогда в силу вспомогательного утверждения найдутся два рациональных числа а\ и «2 таких, что xi < а± < а2 < х2. B.12) Пусть теперь 71 и 72 — какие угодно рациональные числа, удовлетворяющие неравенствам
§ 2 АРИФМЕТИЧЕСКИЕ ОПЕРАЦИИ НАД ЧИСЛАМИ 53 7i ^ xi ^ 72, 7i ^ жз ^ 72- B.13) Из сопоставления B.12) и B.13) и из свойства транзитивности знака > по- получим 7i < «1 < «2 < 72- Но тогда 72 —71 > а2 —оц, что противоречит тому, что разность 72 — 7i может быть сделана меньше любого наперед взятого положительного рационального числа е. Лемма доказана. 2. Определение произведения вещественных чисел. Поскольку вопросы, возникающие в связи с определением произ- произведения вещественных чисел, в основном совпадают с вопросами, рассмотренными при определении суммы вещественных чисел, мы ограничимся лишь краткой формулировкой результатов. Определим сначала произведение двух положительных чисел а и Ъ. Обозначим через «i, «25 Pi и /?2 любые положи- положительные рациональные числа, удовлетворяющие неравенствам аг ^ а ^ а2, pi ^ Ь ^ /32. Произведением положительных вещественных чисел а ж b назовем вещественное число ж, удовлетворяющее неравенствам OLlfil ^ X ^ 0,2^2- Точно так же, как и для суммы, устанавливается, что такое вещественное число х существует, и притом только одно. Легко убедиться в том, что таким числом х является точная верхняя грань множества {«i/5i} произведений всех рациональных чисел а\ и /?х, удовлетворяющих неравенствам 0 < а\ ^ а, 0 < /3i ^ Ь. Произведение вещественных чисел любого знака определяет™ ся по следующему правилу: 1) считают, что а • 0 = 0 • а = 0; 2) считают, что аЪ = \а\ • — I a Ъ |, если а и Ь одного знака, Ъ |, если а ж Ь разных знаков. В заключение отметим, что точно так же, как и для суммы, можно доказать, что в применении к двум рациональным чис- числам определение произведения вещественных чисел и известное из элементарного курса определение произведения рациональ- рациональных чисел приводят к одному и тому же результату. 3. Свойства вещественных чмсел. В этом пункте мы убедимся в справедливости для произвольных вещественных чи- чисел всех основных свойству перечисленных в п. 1 § 1 для рацио™ нальных чисел. Справедливость для вещественных чисел свой™ ства 1° уже установлена выше. Таким образом, нужно выяснить лишь вопрос о справедливости для вещественных чисел свойств 2°^13°. Легко убедиться в справедливости для вещественных чисел свойств 2°-5° и 11°, связанных с понятием суммы. Оправед™ ливость свойств 2°ЧЗ° непосредственно вытекает из определе- определения суммы вещественных чисел и из справедливости указанных свойств для рациональных чисел.
54 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 Остановимся на доказательстве свойства 11°, т. е. докажем, что если а, Ь и с — любые три вещественных числа и а > 6, то а + с > 6 + с. Так как а > 5, то в силу вспомогательного утверждения, установленного при доказательстве леммы (см. конец п. 1 настоящего параграфа), найдутся рациональные числа а± и fa такие, что а > а\ > fa > Ь. Для вещественного числа с и для положительного рационального числа е = а\ — fa найдутся рациональные числа 71 и 72 такие, что 71 ^ с ^ 72? причем 72 — 7i < е = = «1 — fa (см. утверждение, доказанное в п. 4 § 1). Пусть далее «2 и /3i — любые рациональные числа, удовлетворяющие неравенствам «2 "^ a, b ^ fa. Тогда по определению суммы вещественных чисел «2 + 72 ^ « + с ^ а\ + 7i, ft + 72 ^ & + с ^ /3i + 71 • Для доказательства того, что а + с>Ь + с, в силу транзитивности знака > достаточно доказать, что а г +71 > fa +72? н0 эт0 непосредственно вытекает из неравенства 72 — ji < oti — fa- Заметим, что вопрос о вычитании вещественных чисел как о действии, обратном сложению, полностью исчерпывается на основании свойств 2°^5°. Назовем разностью веществен- вещественных чисел а и Ь вещественное число с такое^ что cJrb = a. Убедимся в том, что такой разностью является число с = а + + Ь;, где bf — число, противоположное Ъ. В самом деле, используя свойства 2°-5°, можем записать с + Ъ = (а + У) + Ь = а + {У + Ь) = а + 0 = а. Убедимся в том, что существует только одно вещественное чис- число, являющееся разностью двух данных вещественных чисел. Предположим, что кроме указанного выше числа с = а + bf су- существует еще одно число d такое, что d + Ь = а. Тогда, с одной стороны, {d+b)+h' = a+b1 = с, с другой стороны, [d+b)+b' = d+ + {b + У) = d + 0 = d, т. е. с = d. Из определения разности и из свойства 5° вытекает, что чис- число а;, противоположное а, равно разности числа 0 и числа а. Это число обычно записывают в виде —а. Не вызывает затруднения перенесение на случай веществен- вещественных чисел свойств 6°, 7°, 8°, 9°, 10° и 12°, связанных с поня- понятием произведения. Отметим лишь в отношении свойства 9°, что если а — положительное вещественное число, a «i и «2 — какие угодно рациональные числа, удовлетворяющие неравен™ ствам 0 < «1 ^ а ^ «2, то число а! 1 обратное числу а, опреде- определяется как единственное вещественное число, удовлетворяющее неравенствам — ^ а1 ^ — 1). «2 «1 Свойства 6°-9° позволяют сделать вывод, что для любых двух вещественных чисел а и Ь (Ь Ф 0) существует, и притом 1) В качестве числа а может быть взята точная верхняя грань множества г 1 всех рациональных чисел < — t C^2
§ 2 АРИФМЕТИЧЕСКИЕ ОПЕРАЦИИ НАД ЧИСЛАМИ 55 только одно, вещественное число с, удовлетворяющее условию cb = а. Это число с называется частным чисел а и Ь. Из определения частного и из свойства 9° вытекает, что чис- число а;, обратное числу а, равно частному чисел 1 и а, которое мы обозначим как 1/а. Заметим, наконец, что на случай вещественных чисел перено™ сится и последнее 13-е свойство рациональных чисел, а именно: каково бы ни было вещественное число а, можно число 1 повто- рить слагаемым столько раз, что полученная сумма превзой- превзойдет а1). Докажем это свойство. В случае а < 0 доказательство не требуется, ибо 1 > а. Пусть а ^ 0; а = ао, ai • • • ап • • • В силу того, что определение суммы вещественных чисел в при- применении к сумме рациональных чисел совпадает с определением суммы рациональных чисел, повторив число 1 слагаемым п раз, получим целое число п. Таким образом, достаточно доказать, что для числа а найдется целое число п такое, что п > а. Но это очевидно: достаточно взять п = ао + 2. Таким образом, на случай вещественных чисел переносят- переносятся все основные свойства, сформулированные для рациональных чисел в п. 1 настоящего параграфа. Следовательно^ для веще- ственных чисел сохраняют свою силу все правила алгебры^ относящиеся к арифметическим действиям и к сочетанию равенств и неравенств. На этом мы заканчиваем изложение элементов теории ве- вещественных чисел, необходимых для построения курса матема- математического анализа. Дальнейшее развитие теории вещественных чисел читатель может найти в приложении в конце книги. В заключение заметим, что мы построили теорию веществен- вещественных чисел, апеллируя к их представлению в виде бесконечных десятичных дробей. Совершенно ясно, что мы могли бы апеллировать и к беско- бесконечным дробям с любым другим (не обязательно десятичным) основанием. В этом отношении системы счисления с различными основаниями эквивалентны между собой. Однако в некоторых вопросах приближенных вычислений и, в частности, при округ- округлении чисел до заданного количества разрядов системы счисле- счисления с четными и нечетными основаниями ведут себя существен- существенно по-разному (см. по этому поводу дополнение 2 к этой главе). 4. Некоторые часто употребляемые соотношения. Докажем справедливость для любых вещественных чисел а и b следующих двух соотношений: \аЬ а + Ь ^ а I + B.14) B.15) 1) Заметим, что это свойство называют аксиомой Архимеда.
56 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 Словесная формулировка этих соотношений такова: 1) мо- модуль произведения двух чисел равен произведению модулей этих чисел1 2) модуль суммы двух чисел не превосходит суммы мо- модулей этих чисел. Соотношение B.14) непосредственно вытекает из определе- ния произведения двух вещественных чисел. Докажем соот- соотношение B.15). На основании определения модуля и правила сравнения для любых вещественных чисел а и Ь справедливв! неравенства — | а | ^ а ^ | а |, — | Ь | ^ Ь ^ | Ь |. В силу основных свойств, можно почленно складывать неравен™ ства одного знака (это доказано в конце п. 1 § 1). Поэтому -(\а\ + \Ь\) < а + Ь ^ \а\ + \Ь . Используя в случае а + Ь > 0 правое, а в случае а + Ь ^ 0 левое из последних неравенств, мы получим неравенство B.15). Замечание. Отметим еще два часто употребляемых неравенства: а-Ъ\>\а\-\Ъ\, B.16) а-Ъ\>\а\-\Ъ\. B.17) Для получения неравенства BЛ6) достаточно учесть, что а = (а — Ь) +6, и, опираясь на B Л 5), записать неравенство: \а\ ^ | а —6 | + | 6 |. Неравенство B Л7) является следствием неравенства B Л6) и неравенства | b — а | ^ | Ь — — а , которое получается из B Л6), если поменять местами числа а и Ь. § 3. Некоторые конкретные множества вещественных чисел В дальнейшем нам часто придется иметь дело с различны- различными множествами вещественных чисел. Будем обозначать произ- произвольное множество вещественных чисел символом {ж}, а числа, входящие в состав этого множества, будем называть элемента- элементами или точками этого множества. Мы будем говорить, что точ~ ка х\ множества {х} отлична от точки Х2 этого множества^ если вещественные числа х\ и Х2 не равны друз другу. Если при этом справедливо неравенство х\ > Х2 [х\ < Ж2), то будем гово- говорить, что точка х\ лежит правее (левее) точки x<i- Рассмотрим некоторые наиболее употребительные множе- множества вещественных чисел. 1°. Множество вещественных чисел ж, удовлетворяющих неравенствам а ^ х ^ Ь, где а < Ь, будем называть сегмен- том и обозначать символом [а,Ь]. При этом числа а и Ъ будем называть граничными точками или концами сегмента [а,Ь], а любое число ж, удовлетворяющее неравенствам а < х < Ь, будем называть внутренней точкой сегмента [а,Ь].
ДОПОЛНЕНИЕ 1 57 2°. Множество всех вещественных чисел ж, удовлетворяющих неравенствам а ^ х < Ь {или а < х ^ Ъ\, будем называть полу- полусегментом и обозначать символом [а, о) {или (а, Ь]}. 3°. Множество всех вещественных чисел ж, удовлетворяющих неравенствам а < х < Ь, будем называть интервалом и обозна- обозначать символом (а, Ъ). 4°. Любой интервал, содержащий точку с, будем называть окрестностью точки с. 5°. Интервал (с —е, с+б), где 6 > 0, будем называть е-окрест- е-окрестностью точки с. 6°. Множество всех вещественных чисел будем называть чи- числовой (бесконечной) прямой и обозначать символом (—оо, +оо). 7°. Множество всех вещественных чисел ж, удовлетворяющих неравенству х ^ а {или ж ^ Ь}, будем называть полупрямой и обозначать символом [а, оо) {или (—оо,Ь]}. 8°. Множество всех вещественных чисел ж, удовлетворяющих неравенству ж > а {или ж < Ь}, будем называть открытой по- полупрямой и обозначать символом (а, оо) {или (—оо,Ь)}. Замечание. Отметим, что сегмент иногда называют замкнутым отрезком или просто отрезком, а интервал — открытым отрезком. Произвольное множество {ж} будем называть плотным в себе, если в любой окрестности каждой точки х этого множества содержится хотя бы одна точка множества, отличная от х. Примером плотного в себе множе- множества может служить любое из определенных выше множеств 1°-8°. Другим примером плотного в себе множества может служить множество всех ра™ циональных чисел, входящих в состав любого из множеств 1о—8°. ДОПОЛНЕНИЕ 1 О ПЕРЕВОДЕ ЧИСЕЛ ИЗ ДЕСЯТИЧНОЙ СИСТЕМЫ СЧИСЛЕНИЯ В ДВОИЧНУЮ И ИЗ ДВОИЧНОЙ СИСТЕМЫ В ДЕСЯТИЧНУЮ В этом дополнении мы остановимся на алгоритмах перевода чисел из де- десятичной системы счисления в двоичную и обратного перевода из двоичной системы в десятичную ). Перевод чисел из десмтичной системы счисления в двоичную. Для задания десятичного числа хю в разрядной сетке электронной машины используют так называемую нормализованную форму записи этого числа х10 =glo-10Pl°. B.18) В этой форме записи величина q10 = A - 2Sq)(ai - 1СГ1 + а2 • 10~2 + • • • + а9 • 10~9) B.19) ) Излагаемые ниже алгоритмы реализуются, в частности, на электрон- электронной машине БЭСМ-4.
58 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 называется десятичной мантиссой данного числа, причем ol\ 3^1, Sq берется равным нулю при дю ) Ои равным единице при дю < О х), а показатель степени рю = A-25р)(А + 10^2) B.20) называется десятичным порядком данного числа, причем Sp берется равным нулю при рю ^0и равным единице при рю < 0 2). ж 45 sq 44 V 43 •<— 42 41 Рю с Pi 40 39 38 —>> 37 <— 36 0 35 -1 34 —> 33 < 32 «2 31 30 —> 29 ... <— 4 «9 3 2 > 1 Рис. 2.3 На рис. 2.3 указано, как десятичное число B.18)—B.20) задается в раз- разрядной сетке электронной машины. На изображение каждого из десятич- десятичных чисел fa, ai, аг, • • • , «9 отводится по четыре двоичных разряда, так что каждое из указанных чисел может принимать любое целочисленное зна- значение от 0 до 15, а на изображение числа fa отводится всего два разряда, так что fa может принимать значения 0, 1, 2, 3 3). Стандартная программа вырабатывает по десятичному числу B.18)— B.20) соответствующее ему двоичное число Х2- Эта программа реализуется следующим образом. Сначала вычисляется величина j: 26 7 = A - 2Sq)(ai • 109 + а2 - 108 + • • • + a9) Затем указанная величина 7 умножается на величину к = 2 -10"" (послед™ няя величина задается в машине также в нормализованной форме, причем обычно с избытком в две единицы младшего разряда мантиссы). Произведение kj отвечает, очевидно, десятичной мантиссе B.19). Дальнейшая процедура заключается в умножении kj на 10 или 1/10 в за- зависимости от знака рю (т. е. от Sp), производимом столько раз, какова величина \рю\. В завершение программы в полученном результате обычно очищают три младших разряда мантиссы. Указанная программа 1) обеспечивает по крайней мере 30 верных двоич- двоичных знаков результата, 2) обеспечивает перевод в двоичное число любого це- целого десятичного числа в диапазоне от 0 до 50 000, 3) обеспечивает перевод десятично нормализованного числа в двоично нормализованное число ). 1) Таким образом, множитель A — 2Sq) в равенстве B.19) характеризует знак мантиссы дю. 2) Так что множитель A—2SP) в равенстве B.20) характеризует знак порядка рю. ) На самом деле, в силу конструкции клавишного устройства, на этом устройстве нельзя пробить каждое из чисел fa, ai, «2, • • • , «9 большим де- девяти, а число fa нельзя пробить большим единицы. Таким образом, каждое из чисел/?i,ai,a2,... ,«9 меняется в диапазоне от 0 до 9, а число fa принимает значения 0 и 1. ) Если исходное десятичное число не являлось нормализованным (т. е. в B.19) нарушалось условие а± ^ 1), то и результат его перевода в двоичную систему может оказаться ненормализованным.
ДОПОЛНЕНИЕ 2 59 В заключение заметим, что если при реализации указанной программы в процессе умножения на 10 двоичный порядок переводимого числа пре- превышает 59, то дальнейшие умножения на 10 прекращаются, даже если они требуются в соответствии с величиной \рю . Перевод чисел из двоичной системы счисления в десмтичную. Укажем стандартную программу, которая вырабатывает по заданному в нормализованной форме двоичному числу х = д2 • 2Р2 соответствующее ему десятичное число хю, записанное в нормализованной форме B.18)—B.20). В разрядной сетке машины вырабатываемое число располагается так, как указано на рис. 2.3. Программа реализуется следующим образом. Сначала исходное чис- число ж 2 множится на 1/10 для того, чтобы при последующем умножении на 10 не получить машинного переполнения. Затем полученное число множится на 10 или 1/10 в зависимости от того, больше оно единицы или нет, до тех пор, пока результат умножений не попадет в интервал от 1/10 до 1. Количество произведенных умножений, очевидно, определяет \рю\. Что же касается знака рю, то он положителен, если исходное число превосходит единицу, и отрицателен в противном случае. Далее очевидно, что полученное в результате умножений число и будет десятичной мантиссой дю- Цифры ai, «2, • • • , «9 десятичной мантиссы дю определяются последовательно путем умножения на 10 и выделения целой части. ДОПОЛНЕНИЕ 2 ОБ ОШИБКАХ В ОКРУГЛЕНИИ ЧИСЕЛ В СИСТЕМАХ СЧИСЛЕНИЯ С ЧЕТНЫМ И НЕЧЕТНЫМ ОСНОВАНИЯМИ Предположим, что вычислительная машина работает с ^-разрядными числами в системе счисления с основанием р ^ 2. Тогда, не уменьшая общ- общности, можно считать, что все числа х^\ хранящиеся в памяти машины, имеют вид х^ = aip™1 + п2Р~2 + • • • + atp~b, где коэффициенты (ц {г = 1, 2,..., t) могут принимать значения 0,1,... ..., (р — 1). Совершенно ясно, что такие операции, как сложение, умно- умножение или деление, будучи произведены над t-разрядными числами, мо- могут дать в результате числа, содержащие более чем t разрядов, и поэтому естественно возникает необходимость в округлении указанных чисел до t разрядов. Рассмотрим простейшую операцию — округление чисел, содержащих t + г (где г > 0) разрядов, до чисел, содержащих t разрядов. Каким бы способом ни производилось округление содержащего (t + г) разрядов чис- числа x^t+r\ результатом округления должно быть i-разрядное число. Отсюда вытекает, что ошибка округления числа х^ ' (обозначим эту ошибку сим™ волом е(аг +т^)) имеет следующий вид: Здесь г может принимать значения 0, 1, ... , рг - 1 в зависимости от значения последних г разрядов числа зг ^ а от т{г) — некоторая функция от г, принимающая целочисленные значения и зависящая от выбранного способа округления.
60 ТЕОРИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ ГЛ. 2 Наиболее важной характеристикой ошибки округления является ее среднее значение А, которое определяется как дробь г) в числителе которой стоит сумма ошибок, соответствующих всем допу™ стимым значениям чисел x^t+r\ а в знаменателе — количество таких чи- сел xit+T\ Предположим, что все рассматриваемые числа х^ ' удовлетворяют неравенствам 0 ^ яг ^ < 1. Тогда, очевидно, количество rv ' всех чисел х( +г) будет равно р , и мы получим после несложных вычислений, что Сумма *Y^Tn(i)j стоящая под знаком фигурной скобки, зависит от выбран™ ного нами способа округления, но в любом случае эта сумма будет цело- целочисленной. Второй член под знаком фигурной скобки ^—^— при любом четном р не будет целым. Таким образом, при любом четном осно- основании р средняя ошибка А не равна нулю. Это означает, что при любом фиксированном способе округления, определяемом лишь отбрасываемыми разрядами, ошибка от округления до меньшего числа разрядов будет иметь систематическое смещение при любой системе счисления с четным основа™ нием. С другой стороны, легко проверить, что обычное «школьное» правило округления в любой системе с нечетным основанием приводит к «несме- «несмещенным» ошибкам. 1) Символ Y1 есть символ суммирования тех слагаемых, которые записа- записаны вслед за этим символом. Если указанные слагаемые зависят от номера г, те то запись ]Г) обозначает, что нужно произвести суммирование по всем зна- г=т чениям г от т до п.
ГЛАВА 3 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ Одной из основных операций математического анализа явля- ется операция предельного перехода. Эта операция встречается в анализе в различных формах. В настоящей главе рассматри- рассматривается простейшая форма операции предельного перехода, осно- ванная на понятии предела так называемой числовой последо- последовательности. Понятие предела числовой последовательности по- позволит нам в дальнейшем определить и другие формы операции предельного перехода. § 1. Числовые последовательности 1. Числовые последовательности и операции над ни- ними. Из элементарного курса читатель имеет представление о числовых последовательностях. Примерами числовых последо- последовательностей могут служить: 1) последовательность всех элемен- элементов арифметической и геометрической прогрессии, 2) последо- последовательность периметров правильных n-угольников, вписанных в данную окружность, 3) последовательность х\ = 1, Х2 = 1,4, жз = 1,41 ... приближенных значений числа л/2. Этот пункт мы начнем с уточнения понятия числовой последовательности. Если каждому числу п натурального ряда чисел 1,2,... ... , п, ... ставится в соответствие по определенному закону неко- некоторое вещественное число хП1 то множество занумерованных вещественных чисел xi,x2,...,xn,... C.1) мы и будем называть числовой последовательностью или про- просто последовательностью. Числа хп будем называть элементами или членами последо- последовательности C.1). Сокращенно последовательность C.1) будем обозначать символом {жте}. Так, например, символом {1/н} бу- будем обозначать последовательность 1, 1/2, ... , 1/п, ... , а сим- символом {1 + (—1)п} — последовательность 0, 2, 0, 2, ...
62 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Введем понятие арифметических операций над числовыми последовательностями. Пусть даны произвольные последова- последовательности Х\, Ж2, • • • , ХП1 ... И |/1, |/2, . . . , уП1 . . . CyMMOU ЭТИХ последовательностей назовем последовательность х\+у\, ж 2 + + 1/2, • • • , ^и + Угы • • • (или {жте + Уп})-) разностью — последо- последовательность XI - yi, Х2 - У2, • • • 5 Хп- уП1 ... (ИЛИ {Ж^ ^ уи}), произведением — последовательность #i-yi,#2#y2? • • • •> хп'Уги • • • или |жп-уп}), частным — последовательность —, —? • • • ? —?••• |/1 |/2 2/тг или < -^ И . Замечание. При определении частного I — > нужно тре™ {. Уп ) бовать, чтобы все элементы уп последовательности {уп} были отличны от нуля. Однако если у последовательности {уп} обра- обращается в нуль лишь конечное число элементов^ то частное < — > КУп ) можно определить с того номера, начиная с которого все элемен- элементы уп отличны от нуля. 2. Ограниченные и неограниченные последователь- последовательности. Определение 1. Последовательность {хп} называется ограниченной сверху (с н и з у), если суще- существует такое вещественное число М (число га), что каждый элемент хп последовательности {хп} удовлетворяет неравен- неравенству хп ^ М (хп ^ гаI). При этом число М (число га) называется верхней гранью (нижней гранью) последовательности {жп}, а неравенство хп ^ М (хп ^ т) называется условием ограниченности по- последовательности сверху (снизу). Отметим, что любая ограниченная сверху последователь™ ность {хп} имеет бесчисленное множество верхних граней. В самом деле, если М — верхняя грань, то любое число Ж*, боль- большее Ж, также является верхней гранью. Подчеркнем, что в уело™ вии хп ^ М ограниченности последовательности {хп} сверху в качестве М может рассматриваться любая из верхних граней. Аналогичные замечания можно сделать в отношении нижних граней ограниченной снизу последовательности {жте}. Определение 2. Последовательность {хп} называется ограниченной с обеих сторон или просто ограниченно й, если она ограничена и сверху^ и снизу^ т. е. если существуют числа т и М такие^ что любой элемент хп этой последова- последовательности удовлетворяет неравенствам: т ^ хп ^ М. ) Это определение полностью аналогично определению ограниченного сверху (снизу) множества вещественных чисел (см. п. 5 § 1 гл. 2).
§ 1 ЧИСЛОВЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 63 Если последовательность {хп} ограничена и М и т — ее верх™ няя и нижняя грани, то все элементы хп этой последовательно- последовательности удовлетворяют неравенству \хп\ ^ А, C.2) где А — максимальное из двух чисел \М\ и \т\. Обратно, если все элементы последовательности {хп} удовлетворяют неравен- неравенству C.2), то выполняются также неравенства ^А ^ хп ^ А, и, следовательно, последовательность {хп} ограничена. Таким образом, неравенство C.2) представляет собой другую форму условия ограниченности последовательности. Уточним понятие неограниченной последовательности. Последовательность {хп} называется неограниченной^ если для любого положительно- го числа А найдется элемент хп этой последовательности^ удовлетворяющий неравенству \хп\ > А. Рассмотрим несколь- несколько примеров: 1) Последовательность —1, —4, —9, ... , ^п2, ... ограничена сверху и не ограничена снизу. Верхней гранью этой последова™ тельности является любое число, не меньшее — 1. 2) Последовательность 1, 1/2, 1/3, ... , 1/п, ... ограничена. Действительно, верхней гранью этой последовательности явля- является любое число М ^ 1, а нижней гранью — любое число т ^ 0. 3) Последовательность 1, 2, 1, 3, ... , 1, п, 1, (п + 1), ... не ограничена. В самом деле, каково бы ни было положительное число А, среди элементов этой последовательности (с четными номерами) найдутся элементы, превосходящие А. 3. Бесконечно большие и бесконечно малые последо- последовательности. Определение 1. Последовательность {хп} называется бесконечно б о л ь ш о й, если для любого положительного числа А1) можно указать номер N такой2), что при п ^ N все элементы хп этой последовательности удовлетворяют нера- неравенству \хп\ > А. Замечание. Очевидно, что любая бесконечно большая по- последовательность является неограниченной, поскольку для лю- любого А > 0 можно указать номер N такой, что при п > N все элементы хп удовлетворяют неравенству \хп\ > А, а следова- следовательно, для любого А > 0 найдется по крайней мере один та- такой элемент хП1 что \хп\ > А. Однако неограниченная последо- последовательность может и не быть бесконечно большой. Например, неограниченная последовательность 1, 2, 1, 3, ... , 1, в, ... не является бесконечно большой, поскольку при А > 1 неравенство \хп\ > А не имеет места для всех хп с нечетными номерами. х) Сколь бы большим мы его ни взяли. 2) Так как номер N зависит от числа А, то иногда пишут N = N(A).
64 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Определение 2. Последовательность {ап} 1) называется бесконечно малой, если для любого положительного числа е 2) можно указать номер N такой^)^ что при п ^ N все элементы ап этой последовательности удовлетворяют нера- неравенству \ап\ < е. Рассмотрим следующие примеры: 1. Докажем, что последовательность g, g2, д3, ... , qn1 ... при | g | > 1 является бесконечно большой, а при \q\ < 1 — бесконечно малой. Сначала рассмотрим случай \q\ > 1. Тогда | q | = 1 + E, где 5 > 0. Используя формулу бинома Ньютона, получим |д|^ = = A + 5) = 1 + 5N+ положительные члены). Отсюда \q\N > 5N. C.3) Фиксируем произвольное число А > 0 и выберем номер N столь большим, чтобы имело место неравенство 5N > А4). Из по™ следнего неравенства и неравенства C.3) вытекает неравенство \N Q > 1 Q N В СИ™ I g |"ж > А. Так как при п ^ N и при лу свойств произведения вещественных чисел), то \q\n > А при п ^ N. Тем самым доказано, что при | q | > 1 рассматриваемая последовательность является бесконечно большой. Случай | g | < 1 рассматривается совершенно аналогично. В этом случае — = 1 + 5, где S > 0 (мы опустили случай g = 0). Снова используя формулу бинома Ньютона, мы получим вместо C.3) следующее неравенство: 1 \я\> > 5N, или C.3*) Фиксируем произвольное е > 0 и выберем номер Ж из условия ^7 < SN Так как |g1^ при п N ж при | g | < 1, то из полученных неравенств вытекает, что \q\n < е при п ^ ^ N. Тем самым доказано, что при | g | < 1 рассматриваемая последовательность является бесконечно малой. 2. Докажем, что последовательность 1, 1/2, ... , 1/п, ... бес- бесконечно малая. В самом деле, если п ^ Ж, то 1/п ^ 1/N. По- Поэтому по данному е достаточно выбрать номер N из условия 1/N < е. Например, можно положить N = [1/е] + 1. 1) Элементы бесконечно малых последовательностей мы, как правило, будем обозначать греческими буквами. ) Сколь бы малым мы его ни взяли. ) Так как номер N зависит от числа е, то иногда пишут N = N{e). ) Достаточно положить N = [А/$] + 1, где символ [ж] обозначает целую часть числа ж. Например, [5,138] = 5, [-172, 9] = -173. 5) Достаточно положить N = + 1.
§ 1 ЧИСЛОВЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 65 4. Основные свойства бесконечно малых последова- последовательностей. Теорема 3.1. Сумма двух бесконечно малых последова- тельностей есть бесконечно малая последовательность. Доказательство. Пусть {ап} и {/Зп} — бесконечно малые последовательности. Докажем, что последовательность {ofn+/?n}— бесконечно малая. Пусть е — произвольное поло- положительное число, N\ — номер, начиная с которого \ап\ < б/2, а N2 — номер, начиная с которого \/Зп\ < е/2. (Такие номера N\ и N2 найдутся по определению бесконечно малой последователь- последовательности.) Так как модуль суммы двух чисел не превосходит суммы их модулей, т. е. \ап + /Зп\ ^ \ап\ + \Eп\ (см. п. 4 § 2 гл. 2), то, обозначив через N наибольший из двух номеров N\ и iV2, мы получим, что, начиная с номера Ж, выполняется неравенство \ап + /3<п\ < е- Это означает, что последовательность {ап + /Зте} бесконечно малая. Теорема доказана. Теорема 3.2. Разность двух бесконечно малых последова- последовательностей есть бесконечно малая последовательность. Эта теорема доказывается аналогично предыдущей, только вместо неравенства \ап + /Зп\ ^ |ап| + \/Зп\ следует взять нера- неравенство \ап — рп\ ^ \ап\ + \рп\. Следствие. Алгебраическая сумма любого конечного чис- числа бесконечно малых последовательностей — бесконечно малая последовательность. Теорема 3.3. Бесконечно малая последовательность огра- ограничена. Доказательство. Пусть {ап} — бесконечно малая по- последовательность ие- некоторое положительное число. Пусть, далее, N — номер, начиная с которого \ап\ < е. Обозначим че- через А наибольшее из следующих N чисел: ?, |ai|, |а2|,..., \dN-i • Это молено записать так: А = тах{б, |«i|, |«2|? • • • 5 |tti?-i|} /• Очевидно, \ап\ ^ А для любого номера п, что означает огра- ограниченность последовательности. Теорема доказана. Теорема 3.4- Произведение ограниченной последовательно- последовательности на бесконечно малую последовательность представляет собой бесконечно малую последовательность. Доказательство. Пусть {хп} — ограниченная , а {^п} — бесконечно малая последовательности. Так как после™ довательность {хп} ограничена, то существует число А > 0 та- такое, что любой элемент хп удовлетворяет неравенству \хп\ ^ А. Возьмем произвольное положительное число е. Поскольку по- последовательность {ап} бесконечно малая, то для положитель- х) Здесь и в дальнейшем символ а = max{ai, «2, • • •, (%п} означает, что число а равно максимальному из чисел ai, «2, • • •, оип. 3 В.А. Ильин, Э.Г. Позняк, часть I
66 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 ного числа е/А можно указать номер N такой, что при п ^ N выполняется неравенство \otn\ < е/А. Тогда при п ^ N \ хп-ап\ = = \хп\ - \ап\ < А— = е. Поэтому последовательность {хп • ап} бесконечно малая. Теорема доказана. Следствие. Произведение любого конечного числа бесконеч- бесконечно малых последовательностей представляет собой бесконечно малую последовательность. Замечание. Частное двух бесконечно малых последо- последовательностей может быть последовательностью любого типа и даже может не иметь смысла. Если, например, ап = 1/п, /Зп = = 1/п, то все элементы последовательности < -р > равны еди- I Pn J ^ ^ нице. Если ап = 1/п, /Зп = 1/гг2, то последовательность I -р > бесконечно большая, и наоборот, если ап = 1/п2, а /Зп = 1/п, то последовательность < -^ > бесконечно малая. Если бесконеч- v Рп J но много элементов последовательности {f3n} равны нулю, то частное < -^ > не имеет смысла. I Рп J Теорема 5.5. Если все элементы бесконечно малой последо- вательности {ап} равны одному и тому же числу с, то с = 0. Доказательство. Допустим, что с ф 0. Положим е = = | с |/2, б > 0. Начиная с номера Ж, соответствующего этому б, выполняется неравенство \ап\ < е. Так как ап = с, а е = | е |/2, то последнее неравенство можно переписать следующим обра- образом: \с\ < |е|/2, откуда 1 < 1/2. Полученное противоречие показывает, что предположение с ф 0 не может иметь места. Итак, с = 0. Теорема доказана. В заключение отметим предложение, устанавливающее связь между бесконечно большими и бесконечно малыми последова- последовательностями. Теорема 3.6. Если {хп} — бесконечно большая последова- тельность^ то, начиная с некоторого номера п, определена по- последовательность {1/жп}, которая является бесконечно ма- малой. Если все элементы бесконечно малой последовательности {ап} не равны нулю^ то последовательность {1/ап} бесконечно большая. Доказательство. Отметим, во-первых, что у бесконеч- бесконечно большой последовательности лишь конечное число элементов может быть равно нулю. В самом деле, из определения беско- бесконечно большой последовательности вытекает, что для данного положительного числа А можно указать такой номер Ж*, начи- начиная с которого выполняется неравенство \хп\ > А. Это означает, что при п ^ N* все элементы хп не равны нулю, а поэтому по™
§ 2 СХОДЯЩИЕСЯ ПОСЛЕДОВАТЕЛЬНОСТИ 67 следовательность {1/хп} имеет смысл, если ее элементы рассма™ тривать начиная с номера N*. Докажем теперв, что {1/хп} — бесконечно малая последовательность. Пусть е — любое поло- положительное число. Для числа 1/е можно указать номер N ^ N* такой, что при п ^ N элементы хп последовательности {хп} удовлетворяют неравенству \хп\ > 1/е. Поэтому, начиная с ука- указанного номера Ж, будет выполняться неравенство |1/жп| < е. Таким образом, доказано, что последовательность {1/хп} беско- бесконечно малая. Доказательство второй части теоремы проводится аналогично. § 2. Сходящиеся последовательности и их основные свойства 1. Понмтие сходмщейсм последовательности. Определение. Последовательность {хп} называется схо- сходящейся^ если существует такое число а, что последовате- последовательность {хп—а} является бесконечно малой. При этом число а называется пределом последовательности К}1)- Определение сходящейся последовательности молено, очевид- очевидно, сформулировать также и следующим образом. Последовательность {хп} называется сходящейся^ если су- существует такое число а, что для любого положительного чис- числа е можно указать номер N такой2), что при п ^ N все элементы хп этой последовательности удовлетворяют нера- веНСтву \хп -а\<е. C.4) При этом число а называется пределом последовательно- последовательности {хп}. Если последовательность {хп} сходится и имеет своим пре- пределом число а, то символически это записывают так 3): lim хп = а, или хп —>• а при п —> оо. гг>оо 1) В соответствии с этим определением всякая бесконечно малая после- последовательность является сходящейся и имеет своим пределом число нуль. ) Так как N зависит от е, то иногда пишут N = N(e). 3) Отметим, что бесконечно большие последовательности иногда назы™ вают последовательностями, сходящимися к бесконечности. Поэтому если последовательность {хп} бесконечно большая, то символически это запи™ сывают так: lim Xn = ^ п—>оо Если элементы бесконечно большой последовательности, начиная с некото- некоторого номера, имеют определенный знак, то говорят, что последовательность {жте} сходится к бесконечности определенного знака. Символически это за- записывается следующим образом: lim хп = +оо, lim хп = —оо.
68 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Замечание 1. Неравенство C.4) эквивалентно неравен™ ствам —е < хп — а < +?, или а — е < хп < а + е. Последние нера- неравенства означают, что элемент хп находится в е-окрестности числа а (напомним, что ^окрестностью числа а называется интервал (a —s, a + s)). Поэтому определение сходящейся по- последовательности можно сформулировать также и следующим образом. Последовательность {хп} называется сходящейся^ если су- существует число а такое^ что в любой е~окрестности числа а находятся все элементы последовательности {ж^}, начиная с некоторого номераг). Определение сходящейся последовательности утверждает, что разность хп — а = ап является бесконечно малой после™ довательностью. Следовательно, любой элемент хп сходящейся последовательности, имеющей пределом число а, можно пред- представить в виде хп = а + аП1 C.5) где ап — элемент бесконечно малой последовательности. Замечание 2. Из определения предела последователь- последовательности очевидно, что конечное число элементов не влияет на схо- сходимость этой последовательности и на величину ее предела. Рассмотрим примеры сходящихся последовательностей. 1) Последовательность < ^-^ > сходится; предел этой после™ Ы + 1J довательности равен единице. Б самом деле, так как ^^^ — I = = — -, то для доказательства достаточно убедиться, что по- следовательность I — > бесконечно малая. Если п ^ Ж, то ^ и поэтому по данному е > 0 достаточно вы- брать номер N из условия или N > - — 1. Например, можно положить 2) Дока леем, что последовательность х\ = 0,3; Х2 = 0,33 ... ; хп = 0, 33 ... 3; ... сходится и имеет своим пределом число п раз 1/3. Поскольку число 1/3 представимо бесконечной десятичной дробью 0, 333... , то из правила сравнения вещественных чисел г) Зависящего, конечно, от е.
§ 2 СХОДЯЩИЕСЯ ПОСЛЕДОВАТЕЛЬНОСТИ 69 (см. п. 3 § 1 гл. 2) вытекают неравенства1) п раз п раз < ——. Так как при Из этих неравенств получим, что п ^ ^ Тт ^ JW' т0' ВЬ1^Рав п0 любому е > 0 номер JV из уело- 1 10та вия —^- < 6, получим _ 1 Хп з < 6 при n ^ Ж. Возможность выбора номера JV, удовлетворяющего условию < е при любом | q | < 1, была установлена в примере 1 п. 3 § 1. 2. Основные свойства сходящихся последовательно- последовательностей. Теорема 3.7. Сходящаяся последовательность имеет только один предел. Доказательство. Пусть а и Ъ — пределы сходящейся последовательности {жте}. Тогда, используя специальное пред- представление C.5) для элементов хп сходящейся последовательно- последовательности {хп}, получим хп = а + ап, хп = Ь + @п, где ап и рп — элементы бесконечно малых последовательностей {ап} и {/5^}- Вычитая написанные соотношения, найдем (%п ^ /Зп = Ь — — а. Так как все элементы бесконечно малой последовательности {ап — /Зп} имеют одно и то же постоянное значение b — а, то по теореме 3.5 Ъ — а = 0, т. е. Ъ = а. Теорема доказана. Теорема 3.8. Сходящаяся последовательность ограничена. Доказательство. Пусть {хп} — сходящаяся последо- последовательность и а — ее предел. Используя формулу C.5), имеем хп = а ~т otjii где ап — элемент бесконечно малой последовательности. Так как бесконечно малая последовательность {ап} ограничена (см. те™ орему 3.3), то найдется такое число А, что для всех номеров п справедливо неравенство \ап\ ^ А. Поэтому \хп\ ^ \а\ + А для всех номеров п, что и означает ограниченность последователь- последовательности {хп}. Теорема доказана. Замечание 1. Ограниченная последовательность может и не быть сходящейся. Например, последовательность 1, — 1, 1, — 1, ... ограничена, но не является сходящейся. В самом деле, если бы эта последовательность сходилась к некоторому чис- числу а, то каждая из последовательностей {хп — а} и {хп+\ — а} являлась бы бесконечно малой. Но тогда, в силу теоремы 3.2, последовательность {(хп^а) — (xn^i^a)} = хп — хп+\ была бы бесконечно малой, что невозможно, так как | хп — хп^\ | = 2 для любого номера п. См. также неравенства B.5) из п. 4 § 1 гл. 2.
70 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Докажем следующие основные теоремы. Теорема 3.9. Сумма сходящихся последовательностей {хп} и {уп} есть сходящаяся последовательность^ предел ко- которой равен сумме пределов последовательностей {хп} и {уп}- Доказательство. Пусть а ш Ъ — соответственно пределы последовательностей {хп} и {уп}. Тогда хп = а + ап Уп = Ь + ^п, где {ап} и {/Зте} — бесконечно малые последовательности. Сле- Следовательно, (хп + уп) - (а + Ь) = ап + рп. Таким образом, последовательность {(хп+уп) — (а+Ь)} беско- нечно малая, и поэтому последовательность {хп + уп} сходится и имеет своим пределом число а + Ь. Теорема ЗЛО. Разность сходящихся последовательностей {хп} и {уп} есть сходящаяся последовательность, предел кото- которой равен разности пределов последовательностей {хп} и {уп}. Доказательство этой теоремы аналогично доказа- доказательству теоремы 3.9. Теорема 3.11. Произведение сходящихся последовательно- последовательностей {хп} и {уп} есть сходящаяся последовательность^ пре- предел которой равен произведению пределов последовательностей {хп} и {уп}. Доказательство. Если а и Ъ — пределы последователь™ ностей {хп} и {уп} соответственно, то хп = а + ап, уп = b + /Зп и хп ' Уп = а>' Ъ + а • j3n + Ъ • ап + anj3n. Следовательно, хп • уп - а • Ъ = а • /Зп + Ъ • ап + ап • f3n. В силу теоремы 3.4 и следствия из нее, а так лее теоремы 3.1 последовательность {а • /Зп + Ь • ап + ап • /Зи} бесконечно малая, т. е. и последовательность {хп - уп — а - Ь} бесконечно малая, и поэтому последовательность {хп • уп} сходится и имеет своим пределом число а • Ь. Для доказательства соответствующей теоремы для частного двух последовательностей нам понадобится следующая лемма. Лемма 1. Если последовательность {уп} сходится и име- имеет отличный от нуля предел Ь, то, начиная с некоторого номера, определена последовательность \ — > , которая явля- 1Уп ) ется ограниченной. Доказательство. Пусть е = | Ь |/2. Так как Ъ ф Ф 0, то е > 0. Пусть N — номер, соответствующий этому е, начиная с которого выполняется неравенство | уп — Ъ\ < е или I Уп ^ Ь\ < \Ь\/2. Из этого неравенства следует, что при п ^ ^ N выполняется неравенство г) \уп\ > \Ь\/2. Поэтому при г) В самом деле, так как b = (b — уп) + уп и | b — уп\ < \Ь |/2, то \b\ \\ \\ ||/ ||
СХОДЯЩИЕСЯ ПОСЛЕДОВАТЕЛЬНОСТИ 71 п ^ N имеем 2 < —т. Следовательно, начиная с этого номера N, мы можем рассматривать последовательность < — >, и эта I Уп) последовательность ограничена. Лемма 1 доказана. Теорема 8.12. Частное двух сходящихся последовательно- последовательностей {хп} и {уп} пРи условии^ что предел {уп} отличен от нуля^ есть сходящаяся последовательность^ предел которой ра- равен частному пределов последовательностей {хп} и {уп}- Доказательство. Из доказанной леммы 1 следует, что, начиная с некоторого номера iV, элементы последовательно- последовательности {уп} отличны от нуля и последовательность \ — \ ограниче- I Уп J на. Начиная с этого номера, мы и будем рассматривать последо- последовательность < — >. Пусть а и Ъ — пределы последовательностей Г х а 1 {хп} и {уп}- Докажем, что последовательность I — — — > бес™ I Уп О ) конечно малая. В самом деле, так как хп = а + anj уп = Ъ + CП1 то Хп СЬ Хп " О Уп ' & J- / Q> q — - Т = 7 = — \OLn - - @п Уп О Уп'О уп \ Ь гр / 1 1 ±ак как последовательность < — > ограничена, а последо- Г а ] {Уп} вательность \о.п — -fin> бесконечно малая, то последователь- последовательность \ — \OLn — T fin) f = 1 — ^ т\ бесконечно малая. Теорема 1Уп \ О / ) 1уп О ) доказана. 3. Предельный переход в неравенствах. Мы только что выяснили, что арифметические операции над сходящими- сходящимися последовательностями приводят к таким же арифметиче- арифметическим операциям над их пределами. В этом пункте мы покажем, что неравенства, которым удовлетворяют элементы сходящих- сходящихся последовательностей, в пределе переходят в соответствующие неравенства для пределов этих последовательностей. Теорема 3.13. Если элементы сходящейся последователь- последовательности {хп}^ начиная с некоторого номера^ удовлетворяют неравенству хп ^ Ъ (хп ^ Ь), то и предел а этой последова- последовательности удовлетворяет неравенству а ^ Ъ (а ^ Ъ). Доказательство. Пусть все элементы жп, по крайней мере начиная с некоторого номера, удовлетворяют неравенству хп ^ Ь. Требуется доказать неравенство а ^ Ь. Предположим, что а < Ь. Поскольку а — предел последовательности {xn}j то для положительного е = Ь — а можно указать номер N та- такой, что при п ^ N выполняется неравенство \хп — а\ < Ь — а. Это неравенство эквивалентно следующим двум неравенствам: — (Ь — а) < хп — а < Ь — а. Используя правое из этих неравенств,
72 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 мы получим хп < Ь, а это противоречит условию теоремы. Олу™ чай хп ^ b рассматривается аналогично. Теорема доказана. Замечание. Элементы сходящейся последовательности {хп} могут удовлетворять строгому неравенству хп > Ъ1 однако при этом предел а может оказаться равным Ь. Например, если хп = -, то хп > 0, однако lim xn = 0. п п—>оо Следствие 1. Если элементы хп и уп сходящихся последо- вателъностей {хп} и {уп}^ начиная с некоторого номера^ удо- удовлетворяют неравенству хп ^ уп, то их пределы удовлетворя- удовлетворяют такому же неравенству: lim xn ^ lim yn. п-—>оо п-—>оо В самом деле, элементы последовательности {уп^хп} неотри- неотрицательны, а поэтому неотрицателен и ее предел lim (уп — хп) = п^оо = lim yn — lim xn. Отсюда следует, что п^оо п^оо lim xn ^ lim yn. гг>оо гг>оо Следствие 2. Если все элементы сходящейся последова- последовательности {хп} находятся на сегменте [а,Ь], то и ее предел с также находится на этом сегменте. В самом деле, так как а ^ хп ^ Ь, то а ^ с ^ Ь. Следующая теорема играет важную роль в различных приложениях. Теорема 3,14- Пусть {хп} и {zn} — сходящиеся последо- вательностщ имеющие общий предел а. Пусть^ кроме того^ начиная с некоторого номера^ элементы последовательности {уп} удовлетворяют неравенствам хп ^ уп ^ zn. Тогда после- довательность {уп} сходится и имеет предел а. Доказательство. Нам достаточно доказать, что после- последовательность {уп — а} является бесконечно малой. Обозначим через Ж* номер, начиная с которого выполняются неравенства, указанные в условии теоремы. Тогда, начиная с этого же номера, будут выполняться также неравенства хп — а ^ уп — а ^ zn — a. Отсюда следует, что при п ^ Ж* элементы последовательности {Уп — «} удовлетворяют неравенству Уп - а I ^ max{| xn-a zn-a | Так как lim хп = а и lim zn = а, то для любого е > 0 молено указать номера N\ и N2 такие, что при п ^ N\ \xn^a\ < < е, а при п ^ N2 \zn — а\ < е. Пусть N = max{iV*, N1, N2}. Начиная с этого номера, имеет место неравенство \уп ^ а\ < е. Итак, последовательность {уп^а\ — бесконечно малая. Теорема доказана.
§ 3 МОНОТОННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 73 § 3. Монотонные последовательности 1. Определение монотонных последовательностей. Определение. Последовательность {хп} называется неу- неубывающей (невозрастающей)^ если каждый по- последующий член этой последовательности не меньше (не боль- больше) предыдущего^ т. е. если для всех номеров п справедливо неравенство Неубывающие и невозрастающие последовательности объедини™ ются общим наименованием монотонные последовательности. Если элементы монотонной последовательности {хп} для всех номеров п удовлетворяют неравенству хп < хп+\ (хп > xn+i), то последовательность {хп} называется возрастающей (убыва- (убывающей). Возрастающие и убывающие последовательности назы- называются также строго монотонными. Монотонные последовательности ограничены либо сверху, либо снизу. Именно: невозрастающие последовательности огра- ограничены сверху^ а неубывающие последовательности ограниче- ограничены снизу своими первыми элементами. Поэтому невозрастаю™ щая последовательность будет ограниченной с двух сторон, если она ограничена снизу, а неубывающая последовательность будет ограниченной с двух сторон, если она ограничена сверху. Рассмотрим примеры монотонных последовательностей. 1. Последовательность 1, 1, 1/2, 1/2, ... , 1/п, 1/п, ... невоз- растающая. Она ограничена сверху своим первым элементом, равным единице, а снизу числом нуль. 2. Последовательность 1,1,2,2,...,п,п,... неубывающая. Она ограничена снизу своим первым элементом, равным едини™ це, а сверху не ограничена. 3. Последовательность 1/2, 2/3, 3/4, ... , п/(п + 1), ... возра- возрастающая. Она ограничена с обеих сторон: снизу своим первым элементом 1/2, а сверху, например, числом единица. 2. Признак сходимости монотонной последователь- последовательности. Имеет место следующая основная теорема. Теорема 3.15. Если неубывающая (невозрастающая) по- последовательность {хп} ограничена сверху (снизу), то она схо- сходится. Согласно предыдущему пункту последовательность {ж^}, удовлетворяющая условию теоремы 3.15, является ограничен- ограниченной. Поэтому теорему 3.15 можно кратко сформулировать так: если монотонная последовательность {хп} ограничена с обеих сторон^ то она сходится. Доказательство. Так как последовательность {хп} ограничена, то множество ее элементов имеет точные верхнюю и нижнюю грани жиж (см. теорему 2.1). Докажем, что если
74 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 {хп} — неубывающая последовательность, то ее пределом будет указанная точная верхняя грань ж; если же {хп} — невозраста™ ющая последовательность, то ее пределом будет указанная точ- точная нижняя грань ж. Мы ограничимся случаем неубывающей последовательности, поскольку для невозрастающей последова- тельности рассуждения аналогичны. Поскольку ж — точная верхняя грань множества элементов последовательности {жте}, то для любого е > 0 молено указать элемент хм такой, что ждг > ж — е и ждг ^ ж (любой элемент хп не больше точной верхней грани ж, хп ^ ж). Сопоставляя указан- указанные неравенства, получим неравенства 0 ^ ж — ждг < е. Так как {хп} — неубывающая последовательность, то при п ^ N спра- справедливы неравенства хм ^ хп ^ ж. Отсюда следует, что при п ^ N выполняются неравенства 0 ^ж^жте ^ж^ х^. Выше мы отмечали, что ж — ждг < е, поэтому при п ^ N справедливы неравенства 0 ^ ж — хп < 6, из которых вытекает неравенство I %п — х | < е. Таким образом, установлено, что ж — предел по- последовательности {жте}. Теорема доказана. Замечание 1. Условие ограниченности монотонной последовательности представляет собой необходимое и доста- достаточное условие ее сходимости. В самом деле, если монотонная последовательность ограни- ограничена, то в силу теоремы 3.15 она сходится; если же монотонная последовательность сходится, то в силу теоремы 3.8 она ограни- ограничена. Замечание 2. Сходящаяся последовательность может и не быть монотонной. Например, последовательность {ж^}, для которой хп = (—1)п/п сходится и имеет пределом число нуль. Так как знаки элементов этой последовательности чередуются, то она не является монотонной. Замечание 3. Если последовательность {хп} неубы- неубывающая и ограниченная и ж — ее предел, то для всех номеров п справедливо неравенство хп ^ ж. Элементы невозрастающей ограниченной последовательности {ж^}, сходящейся к ж, удовле™ творяют неравенству ж ^ хп. Справедливость этого утвержде- утверждения была установлена в процессе доказательства теоремы 3.15. Следствие из теоремы 3.15. Пусть дана бесконечная си- система сегментов [ai,bi], [«2^2^ [аз^з]5 •••? [ttn^nL •••? ^Q^> дый последующий из которых содержится в предыдущем1) и пусть разность Ъп — ап (будем называть ее длиной сегмента [ап,Ьп]) стремится к нулю при п —>> оо (систему сегментов^ обладающую этими свойствами^ будем называть стягиваю- стягивающейся). Тогда существует^ и притом единственная^ точка с, принадлежащая всем сегментам этой системы. г) Это означает, что ап-\ ^ о>п ^ bn
§ 3 МОНОТОННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 75 Доказательство. Прежде всего заметим, что точ™ ка с, принадлежащая всем сегментам, может быть только одна. В самом деле, если бы нашлась еще одна точка d, принадлежа- принадлежащая всем сегментам, то весь сегмент1) [с, d] принадлежал бы всем сегментам [ап, Ьп]. Но тогда для любого номера п выполня- выполнялись бы неравенства Ъп — ап ^ d — с > О, а это невозможно, ибо Ьп — ^п —> 0 при п —> оо. Докажем теперь, что существует точ- точка с, принадлежащая всем сегментам [ап^Ьп]. Так как система сегментов является стягивающейся, то последовательность ле- левых концов {ап} является неубывающей, а последовательность правых концов {Ьп} невозрастающей. Поскольку обе эти после- последовательности ограничены (все элементы последовательностей {ап} и {Ьп} находятся на сегменте [ai, bi]), то по теореме 3.15 обе они сходятся. Из того, что разность Ьп — ап является бесконеч- бесконечно малой, вытекает, что указанные последовательности имеют общий предел. Обозначим этот предел через с. Из замечания 3 вытекает, что для любого номера п справедливы неравенства О"п ^ с ^ ЬП1 т. е. точка с принадлежит всем сегментам [an, bn]. 3. Некоторые примеры сходящихся монотонных по- последовательностей. Рассмотрим примеры последовательно- последовательностей, для нахождения предела которых будет использована тео- теорема 3.15 о пределе монотонной последовательности. Кроме того, в этом пункте мы познакомимся с одним общим приемом нахождения пределов последовательностей, задаваемых рекур- рекуррентными формулами2). Пример 1. Рассмотрим последовательность {жте}, элемент хп которой равен хп = уа+уа+уа + ... + у/а, а > 0. Эту же последовательность можно, очевидно, задать следующей рекуррентной формулой: х\ = у/а, хп = V'а + хп-\. Для того чтобы установить существование предела последова- последовательности {ж^}, докажем, что эта последовательность возраста- возрастающая и ограниченная. Первое усматривается непосредственно. Докажем, что последовательность {хп} ограничена сверху чис- числом А, где А — наибольшее из двух чисел а и 2. Если хп ^ а, то требуемое доказано. Если же хп > а, то, заменив в правой ча- ) Ради определенности мы считаем, что d > с. 2) Рекуррентная формула (от латинского слова «reeurrens» — возвраща- возвращающийся) — формула, позволяющая выразить (п + 1)-й элемент последова- последовательности через значения ее первых п элементов.
76 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 сти неравенства ж2 = а + хп^\ ^ а + хп число а превосходящим его числом жп, мы получим ж2 < 2жп, откуда хп < 2. Итак, мы доказали, что последовательность {хп} ограничена сверху. По теореме 3.15 она имеет предел. Обозначим этот предел через с. Очевидно, с > 0. Из рекуррентной формулы имеем соотношение 2 , ж :=:: a i ж 1 которое означает, что последовательности {ж2} и {а + хп-\} то- тождественны. Поэтому их пределы равны. Так как первая из этих последовательностей имеет предел с2, а вторая а + с, то с2 = = . г\ ^ а 1 + VI + 4а = а + с. Отсюда, поскольку с > и, находим, что с = Пример 2. Рассмотрим теперь последовательность {ж^}, с помощью которой обычно вычисляют квадратный корень из положительного числа а на современных быстродействующих электронных машинах. Эта последовательность определяется следующей рекуррентной формулой: xn+i = - [хп + — ) , га = 1, 2,... , Z \ Хп / где в качестве х\ может быть взято любое положительное число. Докажем, что эта последовательность сходится и имеет сво- своим пределом число у/а. Прежде всего докажем существование предела последовательности {ж^}. Для этого достаточно уста™ новить, что последовательность {хп} ограничена снизу к, на- начиная со второго номера^ является не возрастающей. Снача- Сначала докажем, что последовательность {ж^} ограничена снизу. По условию х\ > 0. Но тогда из рекуррентной формулы, взятой при п = 1, вытекает, что Ж2 > 0, а отсюда и из той же форму- формулы, взятой при п = 2, вытекает, что жз > 0. Продолжая эти рассуждения, мы докажем, что все хп > 0. Докажем теперь, что при п ^ 2 все хп удовлетворяют нера- неравенству хп ^ у/а. Переписав рекуррентную формулу в виде хп+\ = ¦*— I —= + ^- j, воспользуемся почти очевидным неравен™ 2 V у а, хп у ством t+- ^ 2 1), справедливым для любого t > 0 ( мы берем t = t V = -^L ]. Получим, что ж^+i ^ у/а при любом п ^ 1, т. е. хп ^ л/а, л/а/ начиная с номера п = 2. Докажем, наконец, что последовательность {хп} при п ^ ^2 не возрастает. Из рекуррентной формулы получим ^^ = ) Для доказательства этого неравенства достаточно заметить, что при t > 0 оно эквивалентно неравенству t2 — 2t + 1 ^ 0.
§ 3 МОНОТОННЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 77 = - ( 1 + — 1, а отсюда, учитывая, что хп ^ у/а, найдем n+1 ^ 1, или хп ^ хп^\ (при n ^ 2). Так как последовательность {хп} при n ^ 2 невозрастающая и ограничена снизу числом у/а, то она имеет предел, не меньший у/а (см. теорему 3.15 и теорему 3.13). Обозначая этот предел через с и учитывая, что lim xn+\ = с и п—ь-оо lim i 77 ( жп + — f = oc+™ получим с = 77 ( с + - 1 М. Сле- гс-юо L 2 \ Жп/J 2 \ с/ 2 \ с/ довательно, с = у/а. Замечание 1. В рассмотренных примерах использовал- использовался следующий часто употребляемый прием разыскания предела последовательностей. Сначала устанавливается существование предела, а затем находится его числовое значение из уравнения, которое получается из рекуррентной формулы путем замены в ней хп и хп+\ искомым значением с предела последователь™ ности {хп}. Замечание 2. Рекуррентные формулы часто исполь™ зуются в современной вычислительной математике, поскольку их применение приводит к многократному повторению одно™ типных вычислительных операций, что особенно удобно при проведении вычислений на быстродействующих электронно- вычислительных машинах. Рассмотренная нами рекуррентная формула определяет, как мы убедились, алгоритм вычисления у/а (мы доказали, что lim xn = у/а). п^оо В дополнении 2 к настоящей главе изучается вопрос о скоро™ сти сходимости последовательности {хп} к у/а. Мы доказываем, что для любого а > 1 при определенном выборе первого при- приближения х\ уже четвертое приближение х^ дает нам число у/а с ошибкой, не превышающей 10^10. Пример 3. Докажем, что последовательность {сп}, для хп+1 которой сп = , имеет при любом фиксированном х предел, [п + 1). ' X равный нулю. Так как при достаточно большом п дробь ' < < 1, то, начиная с некоторого номера Ж, имеем | cn+i < \oi поскольку | сп+\ П\ 71+ 1 71+ 1 Следовательно, начиная с номера Ж, последовательность {| сп |} будет монотонно убывающей и ограниченной снизу (на- (например, нулем). По теореме 3.15 последовательность {| сп\} схо- сходится. Пусть с — предел этой последовательности. Из соотно- 1) Это равенство вытекает из рекуррентной формулы хп+\ = — (хп-\ 2 V хп
78 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 шения X cn_|_i| = \cn\ • — следует, что с = 0, так как предел последовательности {| cw+i|} равен с, а предел последовательно- / \х\ X сти < — > равен нулю. 4. Число е. Применим теорему 3.15 о существовании пре- предела монотонной последовательности для доказательства суще™ ствования предела последовательности {ж^}, элемент хп кото- которой определяется формулой хп = Докажем, что эта последовательность возрастает и ограни- ограничена сверху. Применив формулу бинома Ньютона, найдем хп = 2! п2 3! Представим это выражение в следующей форме: Х« = г+2\\1-п +Ъ\К1-- )( Совершенно аналогичным образом запишем элемент хп+\\ . C.6) + " (n + l)! Непосредственным сравнением убеждаемся, что1) т. е. последовательность {ж^} возрастающая. Для доказательства ограниченности этой последовательно™ сти сверху заметим, что каждое выражение в круглых скобках в соотношении C.6) меньше единицы. Учитывая также, что -^ < < fc_1 при fc ^ 2, получим 1 ^ ^ 1 Итак, последовательность {ж^} возрастает и ограничена сверху. По теореме 3.15 последовательность {хп} имеет предел. Этот г) Ибо A — — ) < A — л ) для любого 0 < к < п и, кроме того, xn+i V п/ V п + 1/ содержит по сравнению с жп лишний положительный член.
§ 4 СВОЙСТВА ПРОИЗВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 79 предел называют числом е. Следовательно, по определению, е = lim A + - п Замечание. В дальнейшем выяснится, что число е играет валяную роль в математике. В настоящем пункте мы даем только определение числа е, но не указываем способа вычисления этого числа с любой степенью точности. Это будет сделано в пп. 1 и 2 § 16 гл. 8. Здесь мы лишь отметим, что поскольку хп < 3 и из C.6) непосредственно очевидно, что 2 < хП1 то число е заключено в пределах 2 ^ е ^ 3 C.7) (в силу следствия 2 из теоремы 3.13). § 4. Некоторые свойства произвольных последовательностей и числовых множеств 1. Подпоследовательности числовых последователь- последовательностей. Пусть х\, Х2, • • • , хп, ... — некоторая числовая после- последовательность. Рассмотрим произвольную возрастающую после- последовательность целых положительных чисел к\, ^2 ? • • • > кп, ... Выберем из последовательности {хп} элементы с номерами fci, &2, • • • 5 ^ni • • • и расположим их в таком же порядке, как и числа кп: Полученную числовую последовательность будем называть под- подпоследовательностью последовательности {хп}. В частности, сама последовательность {хп} может рассматриваться как под- подпоследовательность (в этом случае кп = п). Отметим следу- следующее свойство подпоследовательностей сходящейся последова™ тельности: если последовательность {хп} сходится и имеет своим пределом число а1 то и любая подпоследовательность этой последовательности сходится и имеет своим пределом число а. В самом деле, так как {хп} — сходящаяся последо- последовательность и а — ее предел, то для любого е > 0 молено ука- указать номер N такой, что при п ^ N выполняется неравен- неравенство \хп — а\ < е. Пусть {х^п} — некоторая подпоследователь- подпоследовательность последовательности {хп}. Так как км ^ N, то, начи- начиная с номера к^^ элементы подпоследовательности {х^п} удо- удовлетворяют неравенству \хп ^ а\ < е. Поэтому подпоследо- подпоследовательность {xkn} сходится и имеет пределом число а. Спра- Справедливо и обратное предложение: если все подпоследователь- подпоследовательности данной последовательности {хп} сходятся^ то преде- пределы всех этих подпоследовательностей равны одному и тому
80 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 же числу щ в частности^ к этому же числу сходится и по- последовательность {хп}. Действительно, так как последователь- последовательность {хп} также является подпоследовательностью, то она схо- сходится и имеет пределом некоторое число а. Но тогда и любая другая подпоследовательность также сходится и имеет тот же предел а. Подпоследовательности бесконечно больших последователь- последовательностей обладают аналогичным свойством. Именно, каждая подпоследовательность бесконечно большой последовательно- последовательности также будет бесконечно большой. Доказательство это- этого утверждения аналогично доказательству соответствующего предложения о подпоследовательностях сходящихся последова- последовательностей. Замечание. Из каждой сходящейся последователь™ ности можно выделить монотонную сходящуюся подпоследова- подпоследовательность. В самом деле, если {хп} — сходящаяся последова- последовательность и а — ее предел, то имеет место по крайней мере один из следующих трех случаев: 1) имеется бесконечно много рав- равных а элементов последовательности, 2) в любой е-окрестности точки а имеется бесконечно много элементов, удовлетворяющих неравенству хп < а, 3) в любой ^-окрестности точки а имеет- имеется бесконечно много элементов, удовлетворяющих неравенству хп < а г). В первом случае сходящейся монотонной подпосле- подпоследовательностью является подпоследовательность равных а эле- элементов. Второй и третий случаи рассматриваются одинаково, поэтому ограничимся рассмотрением второго случая, т. е. бу- будем считать, что в любой 6-окрестности точки а имеется беско- бесконечно много элементов хП1 удовлетворяющих неравенству хп < < а. Иными словами, рассмотрим случай, когда в любом ин- интервале (а — е, а) содержится бесконечно много элементов по- последовательности. Пусть Хкг — один из этих элементов, х^г < < а. Из бесконечного множества элементов последовательности {xn}j находящихся на интервале (ж^15а), выберем какой-нибудь элемент х^2, номер &2 которого больше к\. Затем из бесконечно- бесконечного множества элементов последовательности {жте}, находящихся на интервале (х^2, а) выберем элемент ж^3, для которого к% > > &2- Продолжая этот процесс неограниченно, мы получим мо- монотонно возрастающую подпоследовательность {х^п} последо- последовательности {жте}, которая, в силу указанного в этом пункте свойства подпоследовательностей сходящейся последовательно- последовательности, сходится к а. ) Если бы ни один из этих случаев не имел места, то в некото- некоторой e-окрестыости точки а находилось бы лишь конечное число элемен- элементов последовательности, т. е. точка а не была бы пределом последова- последовательности.
§ 4 СВОЙСТВА ПРОИЗВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 81 Отметим, что из каждой бесконечно большой последователь™ ности можно выделить монотонную бесконечно большую подпо- следовательность. 2. Предельные точки последовательности. Определение 1. Точка х бесконечной прямой называется предельной точкой последовательности {хп}^ если в любой е-окрестности этой точки имеется бесконечно много элементов последовательности {хп}. Справедлива следующая лемма. Лемма 2. Если х — предельная точка последовательности {хп}^ то из этой последовательности можно выделить подпо- подпоследовательность {xkn}^ сходящуюся к числу х. Доказательство. Пусть х — предельная точка последо- вательности {хп}. Рассмотрим систему ^окрестностей точки ж, для которых е последовательно равно 1, 1/2, 1/3, ... , 1/п, ... В первой из этих окрестностей выберем элемент х^г последо- последовательности {хп}, во второй окрестности выберем элемент х^2 такой, что &2 > k\. В третьей окрестности выберем элемент х^3 такой, что к% > &2- Этот процесс можно продол жать неограни- неограниченно, так как в любой е-окрестности точки х имеется бесконеч- бесконечно много элементов последовательности {хп}. В результате мы получим подпоследовательность х^х, х^2, ... , х^п, ... последо- последовательности {жте}, которая сходится к ж, так как \х^п — х\ < —. Лемма доказана. Замечание. Справедливо и обратное утверждение: ес- если из последовательности {хп} можно выделить подпоследова- подпоследовательность, сходящуюся к числу ж, то число х является пред ель™ ной точкой последовательности {хп}. В самом деле, в любой 6-окрестности точки х имеется бесконечно много элементов вы- выделенной подпоследовательности, а стало быть, и самой после- последовательности {хп}. Таким образом, можно дать другое определение предельной точки последовательности, эквивалентное определению 1. Определение 2. Точка х называется предельной точкой последовательности {хп}^ если из этой последовательности можно выделить подпоследовательность^ сходящуюся к х. Отметим следующее утверждение. Лемма 8, Каждая сходящаяся последовательность имеет только одну предельную точку^ совпадающую с пределом этой последовательности. Доказательство. Отметим, во-первых, что предел а сходящейся последовательности {хп} является предельной точ- точкой этой последовательности, поскольку в любой е-окрестности точки а содержатся все элементы последовательности, начиная с некоторого номера. Убедимся, что у сходящейся последова-
82 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 тельности нет других предельных точек. Действительно, пусть b — предельная точка сходящейся последовательности. В силу леммы 2 из {хп} можно выделить подпоследовательность {ж^п}, сходящуюся к Ь, но любая подпоследовательность сходящейся последовательности имеет предел а (см. п. 1 этого параграфа), и поэтому b = a. Приведем пример последовательности, имеющей две пре- предельные точки. Докажем, что последовательность 1 9 I 9 I 9 1 9 имеет только две предельные точки 0 и 2. Очевидно, что эти точки являются предельными точками рассматриваемой после- последовательности, поскольку подпоследовательность 1, 1/2, 1/3, ... ... , 1/п, ... этой последовательности имеет предел нуль, а под- подпоследовательность 2, 2, ... , 2, ... имеет предел 2 1). Других предельных точек у этой последовательности нет. В самом деле, пусть х — любая точка числовой оси, отличная от точек 0 и 2. Рассмотрим неперекрыва- О х 2 ющиеся б-окрестности то™ ее ее ее чек 0, 2 и ж (рис. 3.1). В е-окрестностях точек О рис 3 1 и 2 содержатся, начиная с некоторого номера, все элементы последовательности, и поэтому в указанной 6-окрест- ности точки х находится лишь конечное число ее элементов, т. е. ж не является предельной точкой. 3. Существование предельной точки у ограничен- ограниченной последовательности. Справедливо следующее замеча- замечательное утверждение. Теорема 3.16. У всякой ограниченной последовательности существует хотя бы одна предельная точка. Доказательство. Так как последовательность {хп} ограничена, то существуют вещественные числа т и М такие, что все элементы хп последовательности {хп} удовлетво™ ряют неравенствам т ^ хп ^ М. Рассмотрим множество {х} вещественных чисел х таких^ что правее2) каждого из этих чисел либо вовсе нет элементов последовательности {xn}j ли- либо таких элементов лишь конечное число. Множество {х} име™ ет хотя бы один элемент (например, число М) и ограничено сни- снизу (любым числом, меньшим га). В силу теоремы 2.1 у множе™ 1) См. определение 2 предельной точки. ) Мы говорим, что число а лежит правее числа 6, если а > b (см. § 3 гл. 2).
§ 4 СВОЙСТВА ПРОИЗВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 83 ства {ж} существует точная нижняя грань, которую мы обозна™ чим через х1). Докажем, что это число ж и является предельной точкой по™ следовательности {хп}. Пусть е — любое положительное число. Число х — е заведомо не принадлежит множе™ х—г х х х+е ству {ж}, а поэтому пра- \^ g ^/V g ^^ ^ вее числа ж — е леэюит бесконечно много элемен- Рис 3 2 шов последовательности {хп}. По определению точной нижней грани найдется число х1 из множества {ж}, удовлетворяющее неравенствам ж ^ х1 ^ ж + + 6 (рис. 3.2). По определению множества {ж} правее х1 леэюит не более чем конечное число элементов последовательности {хп}. Стало быть, на полусегменте (ж — е,ж;], а тем более и в е^окрестности точки ж содержится бесконечно много элементов последовательности, т. е. ж является предельной точкой после- последовательности {ж^}. Теорема доказана. Замечание 1. Обратимся еще раз к множеству {ж}, введенному при доказательстве теоремы 3.16. Мы доказали, что точная нижняя грань ж этого множества представляет собой предельную точку после- последовательности {ж^}. До™ хх х кажем, что ни одно чис~ ° ° '^ „^^ ? ^ > ло ж, превосходящее ж, не является предельной рис 3 3 точкой последовательно- последовательности {жте}, т. е. ж является наибольшей предельной точкой этой последовательности. Пусть ж — любое число, превосходящее ж. Выберем е > 0 столь малым, чтобы число ж — е также пре™ восходило число ж (рис. 3.3). По определению точной нижней грани найдется число х1 из множества {ж}, лежащее левее ж — — е. По определению множества {ж}, правее ж;, а стало быть, и в б™окрестности точки ж лежит не более чем конечное число эле™ ментов последовательности {хп}. Это и доказывает, что число ж не является предельной точкой. Определение, Наибольшая предельная точка ж последо- последовательности {хп} называется верхним пределом этой последовательности и обозначается символом ж = = lim xn. Замечание 1 позволяет утверждать, что у всякой ограничен- ограниченной последовательности существует верхний предел. 1) Целесообразность обозначения этой нижней грани символом х будет выяснена ниже.
84 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Совершенно аналогично вводится понятие нижнего преде- предела ж последовательности {ж^}, который определяется как наи- наименьшая предельная точка этой последовательности. Для ниж- нижнего предела используется обозначение ж = lim хп. п—>оо Существование нижнего предела у любой ограниченной по- последовательности {хп} доказывается в полной аналогии с рас- рассуждениями теоремы 3.16 и замечания 1 к этой теореме. Только на этот раз следует рассмотреть множество {х} вещественных чисел х таких, что левее каждого из этих чисел лежит не более чем конечное число элементов этой последовательности. Итак, мы приходим к следующему утверждению. У всякой ограниченной последовательности существуют верхний и нижний пределы. Извлечем еще ряд следствий из рассуждений теоремы 3.16 и замечания 1. Следствие 1. Если (а, Ъ) — интервал, вне которого лежит лишь конечное число элементов ограниченной последователь- последовательности {жте}, а ж их — нижний и верхний пределы этой после- последовательности, то интервал (ж, ж) содержится в интервале (а, Ъ) и поэтому х — ж ^ Ъ ~~ а. Доказательство. Так как правее точки Ъ находится не более чем конечное число элементов последовательности , то Ь принадлежит указанному в доказательстве теоремы 3.16 множе- множеству {х} и поэтому ж ^ Ь. Рассуждая аналогично, убедимся, что а ^ ж. Это и означает, что интервал (а, Ъ) содержит интер™ вал (ж,ж). Следствие 2. Для любого положительного числа е интер- интервал (ж^б,ж + б) содержит все элементы последовательности {ж^}, начиная с некоторого номера (зависящего^ конечно^ от е). Доказательство. Так как ж является точной нижней гранью множества {жп}, указанного при доказательстве теоре- теоремы 3.16, то для любого е > 0 найдется число ж;, меньшее ж + + е и принадлежащее {ж}. Но это означает, что направо от ж;, а стало быть, и направо от интервала (ж — е,ж + е) может лежать лишь конечное число элементов последовательнос- последовательности {хп}. Аналогично доказывается, что и налево от интервала (ж — ?, ж + е) может лежать лишь конечное число элементов по- последовательности {ж^}. Замечание 2. Выясним вопрос о том, сколько пред ель™ ных точек может иметь ограниченная последовательность {хп}. Обозначим через жиж соответственно нижний и верхний пределы этой последовательности. Очевидно, что все предель- предельные точки последовательности {хп} (сколько бы их ни было) лежат на сегменте [ ж, ж ].
§ 4 СВОЙСТВА ПРОИЗВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 85 Если х_ = х 1), то последовательность имеет только од™ ну предельную точку. Если же х_ < ж, то последовательность имеет по крайней мере две предельные точки жиж. От- Отметим, что последовательность может иметь любое и даже бесконечное число предельных точек. Последовательность 1, 2, 1/2, 2, ... , 1/п, 2, ... , рассмотренная в предыдущем пунк- пункте, имеет только две предельные точки: нижний предел х_ = О и верхний предел ~х = 2. Приведем пример последовательно™ сти, имеющей бесконечно много предельных точек. Рассмотрим, например, последовательность, элементы которой без повто- повторений пробегают все рациональные числа сегмента [О, I]2). Очевидно, любая точка этого сегмента будет предельной точкой указанной последовательности. 4. О выделении сходмщейсм подпоследовательности. Результаты предыдущего пункта приводят к следующей основ- ной теореме. Теорема 3.17 (теорема Бояъщано-Вейерштрасса3)). Из любой ограниченной последовательности можно выделить сходящуюся подпоследовательность. Доказательство. Так как последовательность огра™ ничена, то она имеет хотя бы одну предельную точку х. В таком случае из этой последовательности можно выделить подпосле- подпоследовательность, сходящуюся к точке х (см. определение 2 пре™ дельной точки). Замечание 1. Из любой ограниченной последовательно- последовательности можно выделить монотонную подпоследовательность. В самом деле, в силу теоремы Больцано^Вейерштрасса из любой ограниченной последовательности можно выделить сходящуюся подпоследовательность, а из этой подпоследовательности, в силу замечания п. 1 этого параграфа, можно выделить монотонную подпоследовательность. ) Ниже мы докажем, что равенство х_ = х и условие ограниченности являются необходимыми и достаточными условиями сходимости последо- последовательности. 2) Рациональные числа сегмента [0,1] можно расположить в последова™ тельность без повторений, например, так. Рассмотрим группы рациональ- рациональных чисел этого сегмента, причем в первую группу отнесем числа 0 и 1, во вторую — число 1/2, в третью — все несократимые числа p/q со знамена- знаменателем 3 и вообще в n-ю группу — все несократимые рациональные дроби из сегмента [0,1] со знаменателем п. Очевидно, каждое рациональное число попадает в одну группу и в каждой группе будет лишь конечное количество рациональных чисел. Выпишем теперь подряд элементы первой группы, за ними элементы второй группы, затем третьей и т. д. В результате мы и получим нужную нам последовательность. 3) Бернгард Больцано — чешский философ и математик A781-1848), Карл Вейерштрасс — немецкий математик A815-1897).
86 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Замечание 2. Пусть {хп} — ограниченная последова- телъностъ^ элементы которой находятся на сегменте [а, Ь]. Тогда предел с любой сходящейся подпоследовательности \х^п } также находится на сегменте [а, Ь]. Действительно, так как а ^ Xkn ^ Ь, то в силу следствия 2 из теоремы 3.13 выполняют- выполняются неравенства а ^ с ^ Ъ. Это и означает, что с находится на сегменте [а, Ь]. Отметим, что в отдельных случаях и из неограниченной последовательности также можно выделить сходящуюся под™ последовательность. Например, последовательность 1, 1/2, 2, 1/3, ... , п, 1/(п + 1), ... неограниченная, однако подпосле- подпоследовательность 1/2,1/3,... , 1/п,... ее элементов с четными но- номерами сходится. Но не из каждой неограниченной последова- последовательности можно выделить сходящуюся подпоследовательность. Например, любая подпоследовательность неограниченной по- последовательности 1, 2, ... , п, ... расходится. Поэтому теоре- теорему Больцано^Вейерштрасса, вообще говоря, нельзя распростра- распространить на неограниченные последовательности. Аналогом этой теоремы для неограниченных последователь- последовательностей является следующее предложение. Летта 4- Из каждой неограниченной последовательности мотсно выделить бесконечно большую подпоследовательность. Доказательство. Пусть {жте} — неограниченная последова- последовательность. Тогда найдется элемент Хкг этой последовательности, удовле- удовлетворяющий условию \хкг\ > 1, элемент Хк2 этой последовательности, удо- удовлетворяющий условиям Хк21 > 2, ^2 > k\j ... , элемент Xkn этой после- последовательности, удовлетворяющий условиям \хкп\ > п, кп > кп~г и т. д. Очевидно, подпоследовательность Хкг, ж^2, ... , Хкп, ... является бесконеч- бесконечно большой. Из леммы 4 и из теоремы Больцано—Вейерштрасса вытекает следующее утверждение. Лежта 5. Из совершенно произвольной последовательности мотсно выделить либо сходящуюся, либо бесконечно большую подпоследователь- подпоследовательность. Замечание 3. Результаты настоящего пункта позволяют несколь- несколько расширить понятие предельной точки и верхнего и нижнего пределов последовательности. Будем говорить, что +оо(--оо) является предельной точкой последо- последовательности {жп}, если из этой последовательности можно выделить бес- бесконечно большую подпоследовательность, состоящую из положительных (отрицательных) элементов. При таком расширении понятия предельной точки у последовательно- последовательности, кроме конечных предельных точек, могут существовать еще две пре- предельные точки +оо и — оо. В таком случае лемма 5 позволяет утверждать, что у совершенно произвольной последовательности существует хотя бы одна предельная точка1). 1) Либо конечная, либо бесконечная.
§ 4 СВОЙСТВА ПРОИЗВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 87 Естественно считая, что + со и -—со связаны с любым конечным веще- вещественным числом х соотношением — оо < х < +оо, убедимся в том, что у совершенно произвольной последовательности существуют верхний и нижний пределы (т. е. существуют наибольшая и наименьшая предельная точки). Ради определенности, установим существование верхнего предела. В силу замечания 1 к теореме 3.16 достаточно рассмотреть только слу- случай, когда последовательность {жп} не является ограничен- ограниченной. Если при этом {жп} не является ограниченной сверху, то из нее можно выделить бесконечно большую последовательность, все элементы которой положительны, и поэтому +оо является предельной точкой, а, стало быть, и верхним пределом {жп}. Рассмотрим случай, когда неограниченная последовательность {хп} яв- является ограниченной сверху, т. е. когда существует вещественное число М такое, что все элементы хп удовлетворяют условию хп ^ М. Поскольку последовательность {хп} не является ограниченной снизу, из нее можно выделить бесконечно большую последовательность, все элементы которой отрицательны, а это означает, что — оо является предельной точкой рассма- рассматриваемой последовательности. Если при этом последовательность не имеет ни одной конечной предель- предельной точки, то ^оо является единственной предельной точкой, а поэтому является и верхним пределом рассматриваемой последовательности. Дока- Докажем, что если последовательность, кроме — оо, имеет еще хотя бы одну ко™ нечную предельную точку жо, то и в этом случае у нее существует верхний предел. Так как все элементы хп удовлетворяют условию хп ^ М, то в силу теоремы 3.13 и жо удовлетворяет условию жо ^ М. Фиксируем произволь- произвольное е > 0. Так как в е-окрестности жо лежит бесконечно много элементов последовательности {хп}, то и на сегменте [жо — е, М] лежит бесконечно много этих элементов. Выделим из последовательности {жп} подпоследовательность тех ее эле- элементов, которые лежат на сегменте [жо — ?, М]. Выделенная подпоследо- подпоследовательность является ограниченной. Поэтому в силу замечания 1 к тео™ реме 3.16 у нее существует верхний предел, т. е. наибольшая предельная точка ж. Очевидно, что ж ^ жо и является предельной точкой и всей по- последовательности {хп}- Очевидно также, что последовательность {хп} не имеет предельных точек, превосходящих ж, ибо если бы некоторое число ж, превосходящее ж, являлось предельной точкой последовательности {жп}, то поскольку все элементы последовательности {жп}, превосходящие число ж о — ?, являются элементами и выделенной нами подпоследовательности, это число ж являлось бы предельной точкой и выделенной нами подпосле- подпоследовательности, а эта подпоследовательность не имеет предельных точек, превосходящих ж. Итак, число ж является наибольшей предельной точкой рассматривае- рассматриваемой последовательности. Существование у совершенно произвольной последовательности верхне- верхнего предела доказано. Аналогично доказывается существование нижнего предела. 5. Необходимое и достаточное условие сходимости последовательности. При выяснении вопроса о сходимости последовательности {хп} при помощи определения сходимости нам приходится оценивать разность элементов хп этой последо™
88 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 вательности и ее предполагаемого предела а. Иными словами, приходится предугадывать, чему равен предел а этой последо- последовательности. Естественно указать «внутренний» критерий сходимости по- последовательности, позволяющий выяснить вопрос о ее сходимо- сходимости лишь по величине ее элементов. Такой внутренний критерий и будет установлен в настоящем пункте. Для формулировки это- этого критерия введем понятие фундаментальной последовательно- последовательности. Определение. Последовательность {хп} называется ф у н- даментальной^ если для любого положительного е найдется номер N такой, что для всех номеров п, удовлетво- удовлетворяющих условию п ^ N, и для всех натуральных чисел р (р = = 1,2,...) справедливо неравенство Основной задачей настоящего пункта является доказатель™ ство следующего критерия сходимости последовательности (так называемого критерия Коши1)): для того чтобы последова- последовательность была сходящейся, необходимо и достаточно^ чтобы она была фундаментальной. Прежде чем перейти к доказательству критерия Коши, мы докажем несколько вспомогательных предложений, имеющих и самостоятельный интерес. Теорема 3,18. Для того чтобы последовательность {хп} была сходящейся^ необходимо и достаточно^ чтобы она была ограниченной и чтобы ее верхний и нижний пределы ж и ж сов- совпадали. Доказательство. 1) Необходимость. Пусть последовательность {хп} сходится. Тогда она ограничена (в силу теоремы 3.8) и имеет единственную предельную точку (в силу леммы 3 п. 2). Таким образом, ж = ж. 2) Достаточность. Следствие 2 из теоремы 3.16 утверждает, что для любого е > 0 интервал (ж — е, х + е) со- содержит все элементы последовательности {хп}^ начиная с неко- некоторого номера. Так как х_ = ж = ж, то указанный интервал совпа- совпадает с б™окрестностью точки ж, т. е. число ж является пределом последовательности {ж^} (см. замечание 1 п. 1 § 2). Установим теперь важное свойство фундаментальной по- последовательности, непосредственно вытекающее из ее опреде- определения. Для любого положительного числа е можно указать та- такой элемент ждг фундаментальной последовательности^ в е-окрестности которого находятся все элементы последова- г) Огюстеы Луи Коши — французский математик A789-1857).
§ 4 СВОЙСТВА ПРОИЗВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 89 тельности^ начиная с номера N. Иными словами^ вне интер- интервала (хм — ?, %n + s) находится не более чем конечное число элементов последовательности1). В самом деле, из определения фундаментальной последо- последовательности следует: для любого е > 0 можно указать такой номер JV, что для всех натуральных р (р = 1,2,3,...) выпол- выполняется неравенство |ждг+р — хм\ < ?, которое и означает, что в 6-окрестности элемента х^ находятся все элементы последова- последовательности, начиная с номера N. Отмеченное свойство позволяет установить ограниченность фундаментальной последовательности. В самом деле, пусть е — некоторое фиксированное положительное число и х^ — элемент, в б-окрестности которого находятся все элементы последова™ тельности, начиная с номера N. Тогда вне этой е-окрестности могут находиться только элементы х\,х<2,-> • • •, #jv-i- Положим А = тах{| #i|, | #215 • • • ? I ждг-il, | xn ~~ e|, | xn + s\} 2)- Тогда на сегменте [—А, +А] находятся числа #i, Ж2, • •• , xn-\, xn — в, ^jv + ^5 a следовательно, и все точки е-окрестности элемента ждг. Отсюда вытекает, что все элементы фундаментальной последо- последовательности находятся на сегменте [—А,+А], что и означает ее ограниченность. Переходим к доказательству основного утверждения этого пункта. Теорема 8.19 (критерий Коши сходимости после- последовательности). Для того чтобы последовательность {хп} была сходящейся^ необходимо и достаточно^ чтобы она была фундаментальной. Доказательство. 1) Необходимость. Пусть последовательность {хп} сходится и х — ее предел. Требуется доказать, что эта последовательность является фундаменталь- фундаментальной. Возьмем любое положительное число е. Из определения схо™ дящейся последовательности вытекает, что для положительного числа е/2 найдется номер N такой, что при п ^ N выполняется неравенство \хп — х\ < е/2. Если р — любое натуральное число, то при п ^ N выполня- выполняется также и неравенство \хп^р — х\ < е/2. Так как модуль суммы двух величин не больше суммы их модулей, то из последних двух неравенств получим, что при п ^ )Яи для всех натуральных чисел р = I уХп^р X) + уХ Хп)\ ^ \Хп^р Х\ ~г Х Хп Х\ <С Е. ) Отметим, что указанное свойство эквивалентно определению фунда™ ментальной последовательности. ) Геометрически это означает, что А равно максимальному из расстояний от начала отсчета 0 до точек xi, Ж2, • • •, xn-i, %n ~~ s, xn + s.
90 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Тем самым фундаментальность последовательности {хп} уста™ новлена. 2) Достаточность . Пусть {хп} — фундаментальная последовательность. Требуется доказать, что эта последователь™ ность сходится. Согласно теореме 3.18 для этого достаточно доказать ограниченность последовательности {хп} и равенство ее верхнего и нижнего пределов жиж. Ограниченность фунда™ ментальной последовательности уже установлена нами выше. Для доказательства равенства верхнего и нижнего пределов жиж воспользуемся доказанным выше свойством фундамен- фундаментальной последовательности: для любого положительного чис- числа е можно указать элемент ждг такой, что вне интервала (ждг — — ?, хм + ^) находится не более чем конечное число элементов последовательности. На основании следствия 1 из теоремы 3.16 интервал (xjy — б,ждг + б) содержит интервал (ж,ж), и поэтому ж — ж ^ 2б, откуда, в силу произвольности s, ж = ж. Тем са- самым сходимость последовательности установлена. Теорема пол- полностью доказана. Пример. Применим критерий Коши для установления сходимости следующей последовательности {ж^}: %п = «1 + «2 + • • • + ttfij где dk (к = 1,2,3,...) — произвольные вещественные числа, удовлетворяющие условию \а^\ ^ q , ag — некоторое число из интервала 0 < q < 1. Пусть п — любой номер, р — любое натуральное число. Тогда, очевидно, \хп+р - хп\ = nn+i . пп+2 , , п+р _ д -д < д q ™hg -\- . . . -\- q — 1 — а 1 — а' Учитывая, что последовательность {qn} является бесконечно малой (см. пример 1 из п. 3 § 1), мы можем утверждать, что для любого е > 0 найдется номер N такой, что qn+l <e(l-q) (прип^Ж). Стало быть, при п ^ N и для любого натурального р п + 1 К+р-ж^! < ^— < 6, т. е. последовательность {жте} является фундаментальной и схо- сходится согласно теореме 3.19. 6. Некоторые свойства произвольных числовых множеств. В этом пункте мы рассмотрим некоторые свойства произвольных числовых множеств. Часть из этих свойств аналогична свойствам числовых после- последовательностей.
§ 4 СВОЙСТВА ПРОИЗВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 91 В п. 5 § 1 гл. 2 мы ввели понятие множества, ограниченного свер- сверху (снизу). Договоримся теперь называть множество {ж} ограниченным с обеих сторон или просто ограниченным^ если это множество ограничено и сверху и снизу, т. е. если найдутся такие два вещественных числа т и Ж, что каждый элемент х множества {х} удовлетворяет неравенствам п ^ х ^ М. Множество {ж} будем называть конечным или бесконечным в зависимости от того, является ли число элементов, входящих в состав этого множества, конечным или бесконечным. Точку х бесконечной прямой назовем предельной точкой множест- множества {ж}, если в любой s-окрестности точки х содержится бесконечно много элементов этого множества. Точку ж (точку ж) назовем верхней (нижней) предельной точкой мно- множества {ж}, если эта точка является предельной точкой множества {ж}, но ни одна точка, большая ж (меньшая ж), не является предельной точкой этого множества. Дословно повторяя доказательство теоремы 3.16 с заменой термина «по- «последовательность {жп}>> на «множество {ж}», мы придем к следующему утверждению: у всякого ограниченного бесконечного множества существу- существует хотя бы одна предельная точка. Дословно повторяя рассуждения замечания 1 к теореме 3.16, мы по- получим, что всякое ограниченное бесконечное множество имеет верхнюю и нижнюю предельные точки. Следствием указанных утверждений явля- является следующий факт: из элементов всякого ограниченного бесконечного множества можно выделить сходящуюся последовательность. Наряду с понятием множества часто пользуются понятием подмноже- подмножества. Множество {ж;} называется подмножеством множества {ж}, если все элементы множества {ж;} входят в состав множества {ж}. Например, множество всех четных целых чисел является подмножеством множества всех целых чисел. Два множества {ж} и {у} называют эквивалентными, если между эле- элементами этих множеств можно установить взаимно однозначное соответ- соответствие ). Заметим, что два конечных множества эквивалентны тогда и толь- только тогда, когда число элементов у этих множеств одинаковое. Приведем пример двух эквивалентных бесконечных множеств. Легко видеть, что мно- множество {ж}, элементами которого служат четные положительные числа 2, 4, 6, ... , 2тг, ... , эквивалентно множеству {|/}, элементами которого слу™ жат натуральные числа 1, 2, 3, ... , п, ... В самом деле, мы установим взаимно однозначное соответствие между элементами этих множеств, по- поставив в соответствие элементу 2п множества {ж} элемент п множества {у}. Обратим внимание на то, что рассмотренное нами множество {ж} является подмножеством множества {у}. Таким образом, бесконечное множество {у} оказывается эквивалентным своему подмножеству {ж} 2). 1) Взаимно однозначным соответствием между элементами двух мно- множеств называется такое соответствие, при котором каждому элементу пер- первого множества отвечает только один элемент второго множества так, что при этом каждый элемент второго множества отвечает только одному эле- элементу первого множества. ) Легко показать, что любое бесконечное множество эквивалентно неко- некоторому своему подмножеству, не совпадающему со всем множеством. Этот факт может быть принят за определение бесконечного множества.
92 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Из всевозможных множеств выделим следующие два важных типа: 1°. Всякое множество, эквивалентное множеству всех натуральных чисел 1, 2, 3, ... , п, ... будем называть счетным. Из определения счетного множества вытекает, что все элементы этого множества можно зануме- занумеровать. 2°. Всякое множество^ эквивалентное мнотсеству всех вещественных чисел интервала (О,1), будем называть множеством мощности конти- континуума. Приведем примеры счетных множеств и множеств мощности континуу- континуума. Первым примером счетного множества может служить рассмотренное выше множество четных положительных чисел 2, 4, 6, . .. , 2тг, .. . Дру- Другим примером счетного множества может служить множество всех раци- рациональных чисел сегмента [0,1], ибо, как доказано в сноске 2) на с. 85, это множество можно расположить в последовательность без повторений, т. е. занумеровать. Примером множества мощности континуума может служить множество всех вещественных чисел (бесконечная прямая). В самом де- деле, функция у = dgirx 1) устанавливает взаимно однозначное соответствие между точками интервала 0 < х < 1 и точками бесконечной прямой. В заключение докажем, что множество мощности континуума не эквивалентно счетному множеству. Для этого достаточно доказать, что множество всех вещественных чисел интервала @,1) нельзя занумеровать. Допустим противное, т. е. предположим, что все вещественные числа ин- интервала @,1) можно занумеровать. Тогда, записывая эти числа в виде бес- бесконечных десятичных дробей, мы получим последовательность х\ = 0, Х2 = О, хп = 0, ап\ Рассмотрим теперь вещественное число х = 0, fei, 62 ••• Ьп ..., где Ь\ — любая цифра, отличная от an, 0 и 9, 62 — любая цифра, отличная от <222, 0 и 9, и вообще Ьп — любая цифра, отличная от апп, 0 и 9. Так как число ж не содержит после запятой нулей и девяток, то это число не принадлежит к классу рациональных чисел, представимых двумя способами в виде бесконечных десятичных дробей ). Но в таком случае число х заведомо отлично от всех чисел xi, Ж2,..., хп, • • •, ибо совпадение числа х с каким-либо хп означало бы совпадение Ьп и апп. Математиков долгое время занимал вопрос о существовании бесконеч- бесконечного множества {ж}, не эквивалентного ни счетному множеству, ни множе- множеству мощности континуума, но эквивалентного части множества мощности континуума. В 1963 г. американский математик П. Коэн доказал, что ги- гипотеза о существовании такого множества не зависит от остальных аксиом теории множеств. Это означает, что возможно построить внутренне не про- ) Читатель имеет представление о функции у = ctg тгж из элементарного курса. Вопрос о строгом построении тригонометрических функций выясня- выясняется в гл. 4. 2) См. п. 3 § 1 гл. 2.
ДОПОЛНЕНИЕ 1 93 тиворечивую теорию множеств, постулирующую как факт существования такого множества, так и факт его отсутствия (см. книгу: П. Дж. Коэн. Те™ ория множеств и континуум-гипотеза. — М.: Мир, 1969). ДОПОЛНЕНИЕ 1 ТЕОРЕМА ШТОЛЬЦА т^ Г Хп 1 Во многих случаях для исследования сходимости частного < — > после- довательностей {хп} и {уп} оказывается полезным следующее предложе- предложение. Теорета Штольца. Пусть {уп} — возрастающая бесконечно боль- шая последовательность, и пусть последовательность \ п > схо- (xn\Vn ^Уп~1 J дится и имеет предел а. Тогда последовательность s—— ? сходится и име- em предел а. Таким образом, -,. Хп ,. Х X hm —— = liiii ж—->oo yn x^oo yn — Уп-1 Доказательство. Поскольку последовательность < — — \ 1Уп -Уп-1 J сходится и имеет пределом число а, то последовательность {а™}, где ап = _ _п п— _ ^ бесконечно малая. Пусть N — любой фиксированный Уп -Уп^1_ номер и п > N. Используя выражение для ап, рассмотрим серию равенств: xn-i — xn^2 = a(yn-i — yn-2) + an-i(yn-i ~~ Уте-2), xn - xn^i = a(yn - yn-i) + ®n(yn - Уп^г)- Складывая эти равенства, найдем хп - xw = ауп - ау^ + aF+1 (yF+1 - yw) + aF+2 (yF+2 - yF+1) + . .. ... + an-i(yn-i — Уп-2) + otn(yn — Уп-i)- Так как {уп} — возрастающая бесконечно большая последовательность, то, начиная с некоторого номера, ее элементы положительны. Будем считать, что при п ^ N уп > 0. Тогда из последнего равенства получим Уп + • • • + ап(Уп - Уп-l) Уп
94 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 Поскольку последовательность {уп} возрастающая, то разности yk+i ~~~ 2/fe? к = iV,JV + l,...,n—1, положительны. Поэтому из последнего соотношения имеем хп Уп Уп ¦ ...+\ап\(уп- Уп-i) Уп C.8) Докажем теперь, что последовательность \ — > сходится и имеет предел а. I yn J Для этого достаточно доказать, что для любого положительного е можно указать номер N такой, что при п ^ N выполняется неравенство — — Уп < е. Во-первых, по данному е > 0 выберем номер N так, чтобы при . -rz , S . п ^ N выполнялось неравенство \ап < — (это возможно, поскольку по- последовательность {ап} бесконечно малая). Далее, выберем номер N ^ N так, чтобы при п ^ N выполнялось неравенство Уп < -. Такой выбор номера N возможен, поскольку число х^ — ау^ фиксировано, а по- последовательность {уп} бесконечно большая, и поэтому последовательность ' X д7 — «2/д7 1 > Уп > J бесконечно малая. Пусть теперь п ^ N. Из неравенства C.8) Хп Уп Уп Уп е е 2^2 уп Так как при п^ N уп — у^т ^ уп и уп > 0, то — ^ 1. Поэтому при п^ N Уп из последнего неравенства имеем Хтг_ _ Уп Теорема доказана. Замечание. Если {уп} — возрастающая бесконечно большая по- последовательность, а последовательность \ п \ тактсе бесконечно ^Уп -Уп-i J большая и стремится к бесконечности определенного знака, то последо- последовательность \ — > бесконечно большая. В самом деле, пусть Хп Хп—1 Уп - Уп~1 = Ап.
ДОПОЛНЕНИЕ 1 95 Последовательность {Ап} бесконечно большая. Имеем при п ^ N xn+i xn — Ам хп - xn~i = Ап(уп ~~ уп-\ Складывая эти равенства, найдем Отсюда хп Уп ¦... + Ап(уп - уп-i) Уп Уп Из этого соотношения имеем Уп Уп C.9) Будем для определенности считать, что при п ^ N элементы последова- последовательностей {уп} и {Ап} положительны. Выберем, далее, по заданному по- положительному А номер N так, чтобы при п ^ N выполнялось неравенство Ап > 4А, затем такое N ^ iV, что при п ^ N Уп <А Уп Возмож:ность выбора такого N обеспечивается тем, что последовательности {Ап} и {уп} бесконечно большие и их члены, начиная с некоторого номера, положительны. Очевидно, при п ^ N из неравенства C.9) имеем (l/lv+i - Vn) + • • • + (Уп ^ Уп-i) Уп Хп Уп Таким образом, последовательность < —— \ бесконечно большая. I уп J Рассмотрим несколько примеров. 1°. Докажем, что если последовательность {ап} сходится и имеет пре™ Г п\ + «2 + • • • + «те 1 т дел а, то последовательность < — > средних арифметиче™ I п J ских значений элементов последовательности {ап} сходится к тому же са™ мому пределу а1). В самом деле, если положить а\ + п2 + ... + ап = жте, а Xfl %П—1 пп Т ^П %П—1 т. уп = jij то ¦™™™™™™™™™™™™™™™^ = ап. 1ак как lim ™™™™™™™™™™™™™™™™-" = lim an существует, Уп ^ Уп~1 то по теореме Штольца lim п—>оо «1 + «2 + • • • - Уп -Уп-1 — = lim an = а. 1) Это предложение было доказано Коши.
96 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 2°. Рассмотрим теперь последовательность ап, где пк+1 ш к — целое положительное число. к к к Обозначим 1к + 2к + ... + пк через хп, а пк+1 через уп. Тогда последо- последовательность {ап\ приобретает вид < — >. Исследуем сходимость последова- тельности < >. Имеем ^Уп -Уп-i J хп — хп~\ пк пк Уп _ Уп_х Поделив числитель и знаменатель последнего выражения на пк, получим т,— 1 -L Уп-Уп-i А: ч-1 Ч- —[.. -]' п где в знаменателе в квадратных скобках опущено выражение, предел кото™ Г ( )] Г (к + 1)к] 1Л „ рого при п —)> оо равен . Из последней формулы находим Жтг Хп— 1 J- 1II1 n^oo yn -yn-! k- Следовательно, по теореме Штольца имеем lim те —>oo 1к 3°. Рассмотрим, наконец, последовательность < — >, а > 1. Полагая ап = хп и тг = |/те и исследуя последовательность < —^ — \, находим ^УП -Уп-1 -1 lim = lim (a — а ) = lim all = +оо. те->оо г/те — уп—\ те->оо п->сю \ а/ Поэтому, в силу замечания к теореме Штольца, имеем ,. ап lim — = +оо. п—»оо 11 ДОПОЛНЕНИЕ 2 О СКОРОСТИ СХОДИМОСТИ ПОСЛЕДОВАТЕЛЬНОСТИ, ПРИБЛИЖАЮЩЕМ у/а В п. 3 § 3 этой главы мы доказали, что предел последовательности {хп}, определяемой рекуррентной формулой \ + — \ п = 1,2,..., C.10) Хп /
ДОПОЛНЕНИЕ 2 97 где а > 0, а х\ — любое положительное число, равен у/а. В качестве прибли- приближенного значения у/а мы можем взять любой элемент жп+1 этой последова- последовательности. При этом, естественно, нужно выяснить вопрос о выборе числа п итераций ), обеспечивающих приближение у/а с заданной погрешностью. Обратимся к последовательности {жп}, определяемой реккурентной формулой C.10). Будем называть элемент хп этой последовательности п-м приближением числа 7 = у/а. Величину ?п = () назовем относительной погрешностью п-го приближения. Справедливо следующее утверждение об оценке относительной погреш- погрешности en+i через относительную погрешность е\ первого приближения. Пусть х\ выбрано так, что \е\\ < 1/2. Тогда при любом п ^ 1 имеют место неравенства 0^еп+1 ^еГ. C.12) Доказательство. Из формулы C.11) имеем хп =7A + ета). C.13) Обращаясь к формулам C.10), C.13) и к равенству — = 7? получим 7 1 / а \ 1 г /Л ч а i Xn+i = ~{ + ) 1 + 0 + 2 7A +en)-1 L 2A + en) Так как жте+1 = 7A + en+i), то, очевидно, а \ 1 г /Л ч а ] г — ) = -71 + ^0 + ———d =7i xn/ 2L 7A +en)-1 L ( n) C-14) По условию \ег\ < 1/2. Отсюда следуют неравенства 0 < < 1. Но 2A + ei) тогда из C.14) при п = 1 вытекает неравенство 82 ^ 0. Используя далее соотношение C.14) при п = 2, 3, ... , убедимся в неотрицательности en+i для любого п^1. 1 Из равенства C.14), из соотношений 0 < —; г- < 1 и из неотрица™ 2A + е\) тельности еп для любого п > 1 вытекает неравенство en+i ^ ?те Для любого п ^ 1. Отсюда сразу же получаем правое из неравенств C.12). Утверждение доказано. Обращаясь к неравенствам C.12), мы видим, что относительная погреш™ ность еп-\-1 вычисления у/а после п итераций оценивается через относитель- относительную погрешность е\ первого приближения х\ и число п итераций. Ниже мы убедимся, что при а > 1 2) первое приближение х\ можно выбрать так, что ?\ по абсолютной величине не будет превышать 0, 05. Очевидно, что при таком выборе х\ относительная погрешность е\ будет удовлетворять усло- условиям доказанного нами утверждения. Ясно также, что тем самым будет 1) Итерация (от латинского слова «iteratio» — повторение) — ре- результат повторного применения какой-либо математической операции. В рассматриваемом случае одной итерацией является вычисление жп+1 по хп с помощью рекуррентной формулы C.10). 2) Если а < 1, то а = 1/6, где b > 1, и у/а равен 1/у/Ь. 4 В.А. Ильин, Э.Г. Позняк, часть I
98 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ ГЛ. 3 решен вопрос о выборе числа п итераций, обеспечивающих приближение к у/а с заданной относительной погрешностью е: это число п мотсет быть найдено из формулы ) (О, 05J" <е. C.15) Итак, пусть а > 1. Представим число а в следующей форме: а = 2 2k+i м, C.16) где к — целое неотрицательное число, число г равно либо нулю, либо еди- единице, а число М удовлетворяет условиям 1 ^ М < 2. C.17) Отметим, что представление числа а в форме C.16) единственно. Выберем xi следующим образом: g) C.18) Убедимся, что для любого М, удовлетворяющего условиям C.17), пер™ вое приближение xi, вычисляемое по формуле C.18), дает относительную ошибку 8i при вычислении 7 :=: \/^? превышающую по абсолютной величине числа 0, 05. Для доказательства обратимся к точному выражению относительной ошибки ?\ = . Так как, согласно C.16), 7 = 2 у2гМ, то из выражения 7 для ?i и формулы C.18) получим ?1 = /2iM C.19) Поскольку число г равно либо нулю, либо единице, а М ^ 1, то у2гМ ^ 1. Отсюда и из C.19) вытекает неравенство 17 C.20) Обозначим y/2iM через X. Поскольку 1 ^ М < 2 и i равно либо нулю, либо единице, то все допустимые значения X наверняка находятся на сег- сегменте [1, 2]: 1^Х^2. C.21) Используя введенное обозначение X для у2гМ1 перепишем неравен- неравенство C.20) в следующей форме: C.22) В силу C.22) максимальное значение |ei| не превышает максимально- 1 „9 „ 17 го значения Л 24 для значений X, удовлетворяющих условиям ) Справедливость этой формулы непосредственно вытекает из соотно- соотношений C.12).
ДОПОЛНЕНИЕ 2 99 C.21). Для выяснения вопроса об этом максималвном значении обратимся 1 17 к графику функции f(X) = —X2 -1Н—-. Из курса элементарной мате- математики известно, что графиком этой функции является парабола, вершине о 1 которой отвечает точка X = - (рис. 3.4) г). Так как /A) = /B) = —, 2 24. а /( тг)= ^ 777? т0 ясно, что для значений X, удовлетворяющих условиям C.21), зна- значения f(X) заключены между и —. 24 24 Иными словами 1 2 17 1 I/W|- зА + 24 ^24' Из последнего неравенства и неравенства C.22) вытекает интересующее нас неравен- неравенство для Ei 111 ^ 24 ^ ' Рис. 3.4 Замечание. Отметим, что если заданная относительная погрешность е равна 10™10, то для вычисления с такой точностью квадратного корня из любого числа а > 1 после выбора xi по формуле C.18) потребуется всего лишь три итерации (п = 3), поскольку @, 05J < 10™10. 1) На рис. 3.4 масштаб по оси О у в 20 раз больше масштаба по оси Ох.
ГЛАВА 4 ПОНЯТИЕ ФУНКЦИИ. ПРЕДЕЛЬНОЕ ЗНАЧЕНИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ Эту главу мы начнем с уточнения важнейшего понятия мате™ матического анализа — понятия функции. Опираясь на понятие предела числовой последовательности, мы введем новую форму операции предельного перехода, основанную на понятии предель- предельного значения (или предела) функции. В этой главе вводится также важное математическое понятие непрерывности функции. Значительное место в главе отводится выяснению свойства непрерывности и других свойств простейших элементарных функций. Вопрос о приближенном вычислении значений элементарных функций рассматривается в Дополнении к гл. 8. § 1. Понмтме функции 1. Переменная величина и функция. В гл. 1 мы уже отметили, что со всяким реальным физическим процессом свя- связаны по меньшей мере две переменные величины, изменение ко™ торых взаимообусловлено. Рассматривая реальные физические переменные величины, мы приходим к выводу, что эти величины не всегда могут при- принимать произвольные значения. Так, температура тела не мо- может быть меньше ^273° С, скорость материальной точки не мо- может быть больше 3 • 1010 см/с (т. е. скорости света в пустоте), смещение у материальной точки, совершающей гармонические колебания по закону у = Asm(u)t + <5), может изменяться лишь в пределах сегмента [—А, +А]. В математике отвлекаются от конкретных физических свойств наблюдаемых в природе переменных величин и рас- рассматривают абстрактную переменную величину 1), характеризу™ г) Уместно отметить, что понятие величины относится к числу начальных математических понятий (см. сноску 2) на с. 20).
ПОНЯТИЕ ФУНКЦИИ 101 емую только численными значениями, которые она может при™ нимать. Множество {ж} всех значений, которые может принимать данная переменная величина, называется областью изменения этой переменной величины. Переменная величина считается за- заданной, если задана область ее изменения. В дальнейшем мы,как Рис. 4.1 Рис. 4.2 У 4! правило, будем обозначать переменные величины строчными латинскими буквами ж, у, и, ... , а области изменения этих пе- переменных символами {ж}, {у}, {^}, ... Пусть задана переменная величина ж, имею- имеющая областью изменения некоторое множество {ж}. Если каждому значению переменной ж из множества {ж} ставится в соответствие по известному закону некоторое число у, то гово- рят, что на множестве {ж} задана функция у = = у(х) или у = /(ж). При этом переменная ж называется аргу- аргументом, а множество {ж} — областью задания функции у = /(ж). Число у, которое соответствует данному зна- значению аргумента ж, называется частным значением функции в точке ж. Совокуп- Совокупность всех частных значений функции образует вполне определенное множество {у}, называемое множеством всех значений функции. В обозначении у = /(ж) буква / называет- называется характеристикой функции. Для обозначения аргумента, функции и ее характеристики могут употребляться различные буквы. Приведем примеры функций: 1°. у = ж2. Эта функция задана на бесконечной прямой ^оо < ж < +оо. Множество всех значений этой функции — по™ лупрямая 0 ^ у < +оо (рис. 4.1). Рис. 4.3
102 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 о г 2°. у = л/l — х2. Функция задана на сегменте — 1 ^ х ^ +1. Множество всех значений функции — сегмент 0 ^ у ^ 1 (рис. 4.2). 3°. у = п\. Эта функция задана на множестве натуральных чисел п = 1,2,... Множество всех значений этой функции — множество натуральных чисел вида п! (рис. 4.3). 4°. Функция Дирихле1) {О, если х — иррациональное число, л 1, если ж — рациональное число. Эта функция задана на бесконечной прямой ^оо < х < +оо, а множество всех ее значений состоит из двух точек 0 и 1. 5° Ут * f +1, если ж > О, I/ = sgnx = < 0, если х = О, [ —1, если ж < 0. (Термин sgn происходит от латин- латинского слова signum — знак.) Эта функция задана на всей бесконеч- бесконечной прямой ^оо < х < +оо, а мно- множество всех ее значений состоит из трех точек: —1, 0 и +1 (рис. 4.4). 6°. у = [ж], где [ж] обозначает целую часть вещественного числа ж. Читается: «у равно антье ж» (от французского слова entier — целый). Эта функция задана для всех вещественных значений ж, а множество всех ее значений состоит из целых чи- чисел (рис. 4.5). 2. О способах задания функции. В этом пункте мы оста- остановимся на некоторых способах задания функции. Часто закон, устанавли- устанавливающий связь между аргу- аргументом и функцией, задает- задается с помощью формул. Та- Такой способ задания функ- функции называется аналитиче- аналитическим. Следует подчеркнуть, что функция может опреде- определяться разными формулами на разных участках области своего задания. Например, функция Рис. 4.4 ^4 1 1 1 1 1 1 1 L -3 -2 I I I I I i I L 1 | —С1 У> 4 3 2 1 -1 Рис -г-[ 1 2 -1 -2 -3 -4 ;. 4.5 1—<i ^гк! ! ^i: : III I 1 1 I I 1 6 1 1 > 3x4 5х sin ж х при при ж ^ 0, ж > 0 ) Петер Густав Дежен™Дирихле — немецкий математик A805—1859).
§ 2 ПОНЯТИЕ ПРЕДЕЛЬНОГО ЗНАЧЕНИЯ ФУНКЦИИ 103 задана аналитическим способом на всей бесконечной прямой (рис. 4.6). Довольно распространенным способом задания функции яв- является табличный способ, заключающийся в задании таблицы отдельных значений аргумента и соответствующих им значений функции. При этом моле- молено приближенно вычислить не содержащиеся в табли- таблице значения функции, со™ y=sin x ответствующие промежуточ- промежуточным значениям аргумента. Для используется способ ин- интерполяции, заключающий- заключающийся в замене функции между ее табличными значениями ис* какой-либо простой функцией (например, линейной или ква- квадратичной). Примером табличного задания функции может служить расписание движения поезда. Расписание определяет местоположение поезда в отдельные моменты времени. Интер- Интерполяция позволяет приближенно определить местоположение поезда в любой промежуточный момент времени. В практике физических измерений используется и еще один способ задания функции — графический, при котором соответ- соответствие между аргументом и функцией задается посредством гра- графика (снимаемого, например, на осциллографе). § 2. Понятие предельного значения функции 1. Определение предельного значения функции. Рас- Рассмотрим функцию у = /(ж), определенную на некотором мно- множестве {ж}, и точку а, быть может, и не принадлежащую мно- множеству {ж}, но обладающую тем свойством, что в любой е- окрестности точки а имеются точки множества {ж}, отличные от а. Например, точка а может быть граничной точкой интер- интервала, на котором определена функция. Определение 1. Число Ъ называется предельным значением функции у = /(ж) в точке х = а (или пределом функции при ж —>> а), если для любой сходя- сходящейся к а последовательности жх, Ж2,... , жп,... значений аргу- аргумента ж, элементы хп которой отличны от а г) (хп ф а), соот- соответствующая последовательность /(жх), /(#2), • • • ? f(xn)j • • • значений функции сходится к Ь. ) Это требование объясняется, в частности, тем, что функция /(ж) может быть не определена в точке а.
104 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 Для обозначения предельного значения функции использу- ется следующая символика: lim f(x) = b. Отметим, что функция у = f(x) моэюет иметь в точке а только одно предельное значение. Это вытекает из того, что по- последовательность {f(xn)} может иметь только один предел. Рассмотрим несколько примеров. 1°. Функция f(x) = с имеет предельное значение в каждой точке бесконечной прямой. В самом деле, если жх5 #25 • • • ,хП1... есть любая сходящаяся к а последовательность значений аргу- мента, то соответствующая последовательность значений функ- функции имеет вид с^с^... , с,... и поэтому сходится к с. Таким об- образом, предельное значение этой функции в любой точке х = а равно с. 2°. Предельное значение функции f(x) = х в любой точке а бесконечной прямой равно а. Действительно, в этом случае по- последовательности значений аргумента и функции тождествен- тождественны, и поэтому, если последовательность {хп} сходится к а, то и последовательность {f(xn)} также сходится к а. 3°. Функция Дирихле, значения которой в рациональных точках равны единице, а в иррациональных — нулю, не имеет предельного значения ни в одной точке а бесконечной прямой. Действительно, для сходящейся к а последовательности рацио- рациональных значений аргумента предел соответствующей последо- последовательности значений функции равен единице, а для сходящей- сходящейся к а последовательности иррациональных значений аргумента предел соответствующей последовательности значений функции равен нулю. В дальнейшем мы будем использовать понятия односторон- односторонних предельных значений функции. Будем считать, что множество {ж}, на котором задана функ- функция /(ж), для любого е > 0 имеет хотя бы один элемент , лежа- лежащий на интервале (а, а + е) (соответственно на интервале (а — -е,а)). Определение 2. Число Ъ называется правым (левым) предельным значением функции f(x) в точке х = а, если для любой сходящейся к а последовательности х\, Х2, ... ... ; xnj ... значений аргумента ж, элементы хп которой боль- больше (меньше) а, соответствующая последовательность /(жх), /(#2), • • • 1 f(xn)i • • • значений функции сходится к Ь. Для правого предельного значения функции используется обозначение lim f(x) = b или f(a + 0) = b. ^+0 Для левого предельного значения употребляется обозначение lim f(x) = b или /(а — 0) = Ь. ^а0
§ 2 ПОНЯТИЕ ПРЕДЕЛЬНОГО ЗНАЧЕНИЯ ФУНКЦИИ 105 В качестве примера рассмотрим функцию f(x) = sgnx1). Эта функция имеет в нуле правое и левое предельные значе™ ния, причем sgn@ + 0) = 1, a sgn@ — 0) = — 1. В самом деле, если {хп} — любая сходящаяся к нулю последовательность зна- значений аргумента этой функции, элементы хп которой больше нуля (хп > 0), то sgnx^ = 1 и поэтому lim sgnx^ = 1. Таким образом, справедливость равенства sgn@ + 0) = 1 установлена. Аналогично доказывается, что sgn@ — 0) = — 1. Замечание. Если в точке а правое и левое предельные значения функции f(x) равны^ то в точке а существует пре- предельное значение этой функции^ равное указанным односторон- односторонним предельным значениям. Этот наглядный факт мы снабдим доказательством. Пусть {хп} — любая сходящаяся к а последовательность зна- значений аргумента функции /(ж), элементы которой не равны а. Пусть {xkm} — подпоследовательность этой последовательно- последовательности, состоящая из всех больших а элементов последовательно- последовательности {xn}j a {xim} — подпоследовательность, состоящая из всех меньших а элементов последовательности {хп} 2). Так как в си™ лу п. 1 § 4 гл. 3 подпоследовательности {х^т} и {xim} сходятся к а, то из существования правого и левого предельных значе- значений функции f(x) в точке а вытекает, что последовательности {f(xkm)} и {f(xlm)} имеют пределы, которые по условию рав- равны. Пусть Ъ — предел этих последовательностей. Для любого е > 0 можно указать номер N такой, что все элементы после™ довательностей {f(xkm)} и {/(ж|т)}, для которых кт ^ N и 1т ^ Ж, удовлетворяют неравенствам \f(xkm) — b\ < е и \f(xim) — — Ь\ < е. Следовательно, при п ^ N выполняется неравенство \f(xn) — b\ < е, т. е. последовательность {f(xn)} сходится к Ь. Тем самым доказано, что предельное значение функции f(x) в точке а существует и равно Ь. Сформулируем определения предельного значения функции при стремлении аргумента х к бесконечности и к бесконечности определенного знака. Будем считать, что множество {ж}, на котором задана функ- функция /(ж), для любого А > 0 имеет хотя бы один элемент, лежа™ щий вне сегмента [—А, +А\. Определение 5. Число Ь называется предельным значением функции f(x) при х —> оо (или 1) Определение функции у = щпх дано в п. 1 § 1. 2) Мы исключаем из рассмотрения случаи, когда у последовательности {жп} лишь конечное число элементов лежит правее (левее) точки а. В этом случае сходимость {f(xn)} очевидна.
106 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 пределом функции при х —>• сю), если для любой бесконечно большой последовательности значений аргумента соответствующая последовательность значений функции схо- сходится к Ь. Для обозначения предельного значения функции при х —> оо используется следующая символика: lim fix) = b. Наконец, будем считать, что множество {ж}, на котором за- задана функция /(ж), для любого А > 0 имеет хотя бы один эле- элемент ж, удовлетворяющий условию х > А (х < —А). Определение 4- Число Ъ называется предельным значением функции f(x) при стремлении аргумента х к положительной (отрицательной) бесконечности^ если для любой бесконечно большой последовательности значений аргумента^ элементы которой^ начиная с некоторого номера, положительны (отри- (отрицательны) , соответствующая последовательность значений функции сходится к Ъ. Символические обозначения: lim f(x) = b ( lim f(x) = В качестве примера рассмотрим функцию f(x) = 1/х. Эта функ- функция имеет равное нулю предельное значение при х —> оо. Дей- Действительно, если х\1Х21... ,жП5... — бесконечно большая по- последовательность значений аргумента, то последовательность l/#i, l/#2, • • • 1 ^/хпч • • • бесконечно малая и поэтому имеет пре- предел, равный нулю. 2. Арифметические операции над функциями, имею- имеющими предельное значение. Убедимся, что арифметические операции над функциями, имеющими предельное значение в точке а, приводят к функциям, также имеющим предельное значение в этой точке. Справедлива следующая основная теорема. Теорема ^Л. Пусть заданные на одном и том эюе множе- множестве функции f(x) и g(x) имеют в точке а предельные значе- значения Ь и с. Тогда функции f(x) + g(x), f(x) — g{x), f(x) • g(x) и ^у^т имеют в точке а предельные значения (частное при уело- вии с ф 0), равные соответственно Ь + с, Ь^с, Ь • с и -. Доказательство. Пусть жх, #2, • • • 5 хт • • • (%п Ф а) ~ произвольная сходящаяся к а последовательность значений ар- аргумента функций f(x) и g(x). Соответствующие последователь- последовательности /(жх),/(ж2),... ,/(жп),... и g(xi),g(x2),... ,g(xn),... значений этих функций имеют пределы бис. Но тогда, в силу теорем 3.9-3.12, последовательности {f(xn) + g(xn)}1 {f(xn) —
ПОНЯТИЕ ПРЕДЕЛЬНОГО ЗНАЧЕНИЯ ФУНКЦИИ 107 Г fix ) 1 - g(xn)}, {f(xn) • g(xn)} и < ^УЦ \ имеют пределы, соответ™ [ ё\хп) j ственно равные 6 + с, 6~с, Ь-си -. В силу произвольности по™ с следовательности {хп\ это означает, что \im\f (х) + g (х)] = 6 + с, Нт[/(Ж) - g(a:)] = Ь - с, lim[f(x) ¦ g(x)} = b ¦ с, Нт Щ = Ч. х^а х^а х^а g{x) с Теорема доказана. Применим доказанную теорему для отыскания предельных значений многочленов и несократимых алгебраических дро- дробей1). Имеет место следующее утверждение. В каждой точке а бесконечной прямой предельные значения многочленов и несократимых алгебраических дробей существу- существуют и равны частным значениям этих функций в указанной точке (в случае алгебраической дроби а не должно быть кор- корнем знаменателя). Действительно, в силу теоремы 4.1 Нт х2 = Нт х • х = Нт х • Нт х = а2. Аналогично можно убедиться, что limxn = ап. п Следовательно, для многочлена Ь®хп + Ь\хп + ... + Ьп-\х + b получим (используя теорему 4.1 для произведения и суммы) \im(boxn + Ь\хп^1 + • • • + Ьп-\х + Ьп) = = 0012 + Ь\п -\- * * * + On — i€L H™ Ь^г- В случае несократимой алгебраической дроби, когда а не явля- является корнем знаменателя, получим (применяя теорему 4.1 для частного) т box71 + Ь\хп~~ + ... + bn—ix + Ьп Ьоап + bian~~ + ...+ &n-ia + &ri l+ ... + ст^га + ст 3. Сравнение бесконечно малых и бесконечно боль- больших функцмй. Функция у = f(x) называется бесконечно ма- малой в точке х = а (при х —> а), если lim f(x) = 0. Легко убе- х^а диться, например, что функция f(x) = (х — a)w, где т — целое положительное число, является бесконечно малой в точке х = = а. В самом деле, в предыдущем пункте мы установили, что ) Несократимая алгебраическая дробь — частное двух многочленов, не имеющих отличных от постоянной общих множителей.
108 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 предельное значение многочлена f(x) = (ж — а)т в любой точ™ ке бесконечной прямой существует и равно частному значению многочлена в этой точке. Поэтому Mm (ж — а)т = 0. х^а Отметим, что если функция у = f(x) имеет равное Ь предель- нов значение в точке а, то функция а(х) = f(x) — b является бесконечно малой в точке а. Действительно, предельные значе™ ния каждой из функций f(x) и Ъ в точке а равны Ь, и поэтому в силу теоремы 4.1 lim а(х) = lim (/(ж) — Ъ) = lim f(x) — Mm 6 = 0. х?а ж>а жа хьа Используя полученный результат, мы получаем специальное представление для функции, имеющей равное Ъ предельное зна- значение в точке х = а: f(x) =Ь + а(х), где lim а(х) = 0. D.1) х^а Представление D.1) оказывается весьма удобным при дока- доказательстве различных предложений и будет неоднократно ис- использовано нами ниже. Наряду с понятием бесконечно малой функции часто ис- используется понятие функции, бесконечно большой в точке а справа или бесконечно большой в точке а слева. Именно, функ- функция f(x) называется бесконечно большой в точке а справа (сле- (слева) , если для любой сходящейся к а последовательности жх, Ж2, ••• , хп ... значений аргумента ж, элементы хп которой больше а (меньше а), соответствующая последовательность /(жх), f(x2)-> • • • , 1(хп)ч • • • значений функции является беско- бесконечно большой последовательностью определенного знака. Для бесконечно больших функций используются следующие обозначения: lim f(x) = +00 или f(a + 0) = +00, ж^а+0 lim f(x) = +00 или f(a — 0) = +00, Mm f(x) = ^00 или f(a + 0) = ^00, lim f(x) = ^00 или f(a — 0) = ^00. ^а0 Познакомимся с методикой сравнения бесконечно малых функций и употребляемой терминологией. Пусть а(х) и j3(x) — две заданные на одном и том же множе™ стве функции, являющиеся бесконечно малыми в точке х = а. 1. Функция а(х) называется бесконечно малой более высокого порядка^ чем C(х) (имеет более высокий порядок малости), если предельное значение функции а(х)//3(х) в точке а равно нулю.
§ 2 ПОНЯТИЕ ПРЕДЕЛЬНОГО ЗНАЧЕНИЯ ФУНКЦИИ 109 2. Функции а(х) и C(х) называются бесконечно малыми одно- одного порядка (имеют одинаковый порядок малости), если пред ель™ ное значение функции а(х)//3(х) в точке а существует и отлично от нуля. 3. Функции а(х) и /3(х) называются эквивалентными беско- бесконечно малыми, если предельное значение функции а(х)//3(х) в точке а равно единице. Часто бесконечно малые функции сравнивают с какими-либо стандартными бесконечно малыми функциями. Обычно в каче- стве функции сравнения берут функцию (ж^а)ш, где т — целое положительное число. В этом случае употребляется следующая терминология: бесконечно малая в точке а функция а(х) имеет порядок малости га, если предельное значение функции (х — а)т в точке а отлично от нуля. При сравнении бесконечно малых функций часто употребля- ют символ о (о малое). Именно, если функция а = а(х) пред- представляет собой бесконечно малую в точке а функцию более вы™ сокого порядка, чем бесконечно малая в этой же точке функция /3 = /3(ж), то это условно записывают так: а = оф) (читается: а равно о малое от /3). Таким образом, символ оф) означает любую бесконечно малую функцию, имеющую в точ- точке а более высокий порядок малости, чем бесконечно малая в этой точке функция /3 = /3(х). Отметим следующие очевидные свойства символа о: если j = = оф), то оф) ± оG) = о(/3), оф) ± оф) = оф). Заметим также, что если а и /5 — бесконечно малые в точке а функции, то функция а/3 имеет более высокий порядок малости, чем каждый из сомножителей, и поэтому Для бесконечно больших в точке а справа (или слева) функ- функций используется аналогичная методика сравнения. Пусть А(х) и В(х) — бесконечно большие в точке а справа функции, и пусть, например, обе эти бесконечно большие функ- функции положительного знака, т. е. lim A(x) = +оо и lim B(x) = +оо. ^а+0 ж^а+0 Мы будем говорить, что функция А(х) имеет в точке а справа более высокий порядок роста, чем функция В(х), если функция А(х) ) { является бесконечно большой в точке а справа. Если же В^ А(х) правое предельное значение функции в точке а конечно и
110 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 отлично от нуля, то в этом случае мы будем говорить, что А(х) и В(х) имеют в точке а справа одинаковый порядок роста. Рассмотрим несколько примеров. 1°. Функции а(х) = Зж2 + ж3 и /3(ж) = 2ж2 являются беско- бесконечно малыми функциями одного порядка в точке х = 0. Дей™ / А а(х) 3 . 1 гр 1-1 а ствительно, при х Ф и ^; { = - + -х. ±ак как lim -ж = и, то в Р(х) 2 2 х^о 2 а(х) 3 силу теоремы 4.1 lim —^ = -. А это означает, что а(х) и /3(ж) — бесконечно малые одного порядка. 2°. Функции а{х) = ж2 — 6ж3 и /3(ж) = ж2 — эквивалентные бесконечно малые в точке ж = 0. В самом деле, „, ( = 1 — 6ж. Р(х) Так как lim 6ж = 0, то в силу теоремы 4.1 lim ^~т = 1- Это и ж^О ж^О Р(х) означает эквивалентность бесконечно малых а(х) и /3(ж). 1 + X 1 3°. Функции А(ж) = и В(х) = — имеют одинаковый порядок роста в точке ж = 0 справа и слева. Это следует из А(х) того, что lim —-Нг — lim(l + ж) = 1. х^О В(х) х^0Х J § 3. Понятие непрерывности функции 1. Определение непрерывности функции. Пусть точ- точка а принадлежит области задания функции /(ж) и любая ^окрестность точки а содержит отличные от а точки области задания этой функции. Определение 1. Функция /(ж) называется непрерыв- непрерывной в точке а, если предельное значение этой функции в точке а существует и равно частному значению f(a). Таким образом, условие непрерывности функции /(ж) в точке а символически можно выразить следующим образом: lim f(x) = f (а). х—^а Так как а = lim ж, то предыдущему равенству можно при™ дать следующую форму: lim /(ж) = / ( lim ж Следовательно, для непрерывной функции символ «lim» пре- предельного перехода и символ «/» характеристики функции мож- можно менять местами. Используя определение 1 предельного значения функции /(ж) в точке а (см. п. 1 § 2 настоящей главы), мы можем следую- следующим образом перефразировать определение 1 непрерывности функции в точке а.
§ 3 ПОНЯТИЕ НЕПРЕРЫВНОСТИ ФУНКЦИИ 111 Определение 1*. Функция f(x) называется н е п р е р ы в~ н о й в точке а, если для любой сходящейся к а последователь- ности #1, #2, • • • 1 хП1 ... значений аргумента х соответствую- соответствующая последовательность f(xi),f(x2),... ,/(жп),... значений этой функции сходится к числу /(а). Заметим, что, по сравнению с определением 1 из п. 1 § 2 предельного значения f(x) в точке а, мы в определении 1* опу- стили требование, обязывающее все элементы последовательно- последовательности Ж]_, #2, • • • ^ жп? • • • быть отличными от а. Это можно сделать в силу того, что добавление к элементам последовательности {f(xn)}i сходящейся к /(а), любого числа новых элементов, рав- равных /(а), не нарушит сходимости получающейся при этом по- последовательности к f(a). Предположим, что множество {ж}, на котором задана функ- ция /(ж), содержит точку а и для любого е > 0 имеется хотя бы один элемент этого множества, лежащий на интервале (а, а + е) (на интервале (а — в, а)). Определение 2. Функция f(x) называется н е п р е р ы в- н о й справа (слева) в точке а, если правое (левое) предельное значение этой функции в точке а существует и равно частному значению /(а). Символические обозначения непрерывности справа (слева): lim f(x) = f(a) или f(a + O) = f(a) ( lim f(x) = f(a) или f(a - 0) = f(a)). Замечание. Если функция f(x) непрерывна в точке а и слева и справа, то она непрерывна в этой точке. В самом деле, в силу замечания п. 1 § 2 этой главы в этом случае суще- существует предельное значение функции в точке а, равное частному значению этой функции в точке а. Рассмотрим примеры. 1°. Степенная функция f(x) = xn с целочисленным положи- положительным показателем п непрерывна в каждой точке бесконечной прямой. Действительно, в п. 2 § 2 мы доказали, что предельное значение этой функции в любой точке бесконечной прямой рав- равно частному значению ап. 2°. Так как многочлены и несократимые алгебраические дро- дроби имеют в каждой точке области задания предельное значение, равное частному значению (см. п. 2 § 2), то они являются непре™ рывными функциями. Точки, в которых функция не обладает свойством непре- непрерывности, называются точками разрыва функции1). Например, 1) В § 8 мы дадим классификацию точек разрыва.
112 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 функция f(x) = sgnrz; имеет разрыв в точке х = 0 (в п. 1 § 2 мы доказали, что правое и левое предельные значения этой функ™ ции в точке х = 0 существуют, но не равны друг другу, и поэто- поэтому не существует предельное значение функции в этой точке). Функция Дирихле разрывна в каждой точке бесконечной пря- прямой, поскольку она не имеет предельного значения ни в одной точке этой прямой (см. п. 1 § 2). Мы будем говорить, что функция f(x) непрерывна на мно- множестве {ж}, если она непрерывна в каждой точке этого множе- множества. Если функция непрерывна в каждой точке интервала, то говорят, что она непрерывна на интервале. Если функция непре- непрерывна в каждой внутренней точке сегмента [а,Ь] и, кроме того, непрерывна справа в точке а и слева в точке Ь, то говорят, что она непрерывна на сегменте [а, Ь]. 2. Арифметические операции над непрерывными функциями. Убедимся, что арифметические операции над не- непрерывными функциями приводят к непрерывным функциям. Докажем следующую основную теорему. Теорема J^.2. Пусть заданные на одном и том же множе- множестве функции f(x) и g(x) непрерывны в точке а. Тогда функции f{x)+g(x), f(x)—g(x), f(x)-g(x) и ij-~ непрерывны в точке а (частное при условии g(a) ф 0). Доказательство. Так как непрерывные в точке а функции f(x) и g(x) имеют в этой точке предельные значения /(а) и g(ft), то в силу теоремы 4.1 предельные значения функций fix) f(x) +g{x), f(x) -g{x), f(x) • g(x) и ^± существуют и равны соответственно /(a)+g(a), f(a) — g(a), /(a)-g(a), А^т- Но эти величины как раз и равны частным значениям перечисленных функций в точке а. Теорема доказана. 3. Сложная функцим и ее непрерывность. Функции, образованные в результате суперпозиции (т.е. последовательно- последовательного применения) двух или нескольких функций, будем называть сложными. Достаточно определить сложную функцию, образованную в результате суперпозиции двух функций. Пусть функция х = (p(i) задана на некотором множестве {?}, и пусть {х} — множество значений этой функции. Предположим далее, что на указанном множестве {х} опре- определена другая функция у = f(x). Тогда говорят, что на множе™ стве {?} задана сложная функция у = /(ж), где x = или у = f[<p(t)] = F(t).
§ 4 НЕКОТОРЫЕ СВОЙСТВА МОНОТОННЫХ ФУНКЦИИ 113 Справедлива следующая основная теорема. Теорема J^.3. Если функция х = (p(t) непрерывна в точке а, а функция у = f(x) непрерывна в соответствующей точке Ь = = (р(а), то сложная функция у = f[(f(t)] = F(t) непрерывна в точке а. Доказательство. Пусть {in} — произвольная последо- последовательность значений аргумента сложной функции, сходящаяся к а. Так как функция х = ip(t) непрерывна в точке а, то (в силу определения 1* из п. 1) соответствующая последователь- последовательность значений этой функции хп = (f(tn) сходится к частному значению этой функции в точке а, т. е. к числу Ъ = ф{о). Далее, поскольку функция у = f(x) непрерывна в точке Ъ = (р(а) и для нее указанная последовательность {жте}, сходящаяся к Ъ = (f(a)j является последовательностью значений аргумента, то (в силу того же определения 1* из п. 1) соответствующая последова- последовательность значений функции f(xn) = f[(p{tn)] = F(tn) сходится к числу /(&) = f[<p(a)] = F(a). Итак, мы получаем, что для любой последовательности {tn} значений аргумента сложной функции, сходящейся к а, соответ- соответствующая последовательность значений самой сложной функ- функции {f[(p(tn)]} = {F(tn)} сходится к числу f[(p(a)] = F(a), являющемуся частным значением сложной функции в точ- точке а. В силу того же определения 1* из п. 1 это означает, что сложная функция f[<p(t)] = F(t) непрерывна в точке а. Теорема доказана. § 4. Некоторые свойства монотонных функции 1. Определение и примеры монотонных функций. Определение. Функция у = f(x) называется неубыва- неубывающей (невозрастающей) на множестве {ж}, если для любых х\ и х^ из это- этого множества^ удовлетворяющих усло- условию х\ < Х2, справедливо неравенство Неубывающие и невозрастающие функции объединяются общим наимено™ ванием монотонные функции. — Если для любых х\ и Х2 из множества {ж}, удовлетворяющих условию х\ < Х2, справедливо неравенство f(x\) < /(#2) (f(x\) > /(#2)), т0 функция у = f(x) на- называется возрастающей (убывающей) на множестве {х}. Возрастающие и убыва- убывающие функции называются также стро- р .„ го монотонными.
114 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 Приведем примеры монотонных функций. 1. Функция f(x) = х + sgnx возрастает на всей числовой прямой (рис. 4.7). 2. Функция f(x) = sgna; является неубывающей на всей чи- числовой прямой (см. рис. 4.4). 2. Понятие обратной функции. Монотонные функ- функции, имеющие обратную. В этом пункте формулируется по- понятие обратной функции и устанавливаются условия существо- существования обратной функции для монотонной функции. Пусть функция у = f(x) задана на сегменте [а, Ь], и пусть множеством значений этой функции является сегмент [а,/3]. Пусть^ далее^ каждому у из сегмента [а, /3] соответствует только одно значение х из сегмента [а, Ь], для которого f(x) = = у. Тогда на сегменте [а,/?] можно определить функцию х = = f~1(y)J ставя в соответствие каждому у из [а,/3] шо зна™ чение х из [а, Ь], для которого f(x) = у. Функция х = f^l[y) называется обратной для функции у = f(x). В указанном определении вместо сегментов [а,Ь] и [а,/3] можно было бы рассматривать интервалы (а, Ь) ti (а, /3). Можно также допускать, что один или оба интервала (а, Ь) и (а, /3) пре- превращаются в бесконечную прямую или в открытую полупрямую. Отметим, что если х = /~г(у) — обратная функция для у = = /(ж), то, очевидно, функция у = f(x) является обратной для функции х = /^г(у). Поэтому функции у = f(x) и х = f^l{y) называют также взаимно обратными. Взаимно обратные функции обладают следующими очевид- очевидными свойствами: Рассмотрим примеры взаимно обратных функций. 1°. Пусть на сегменте [0,1] задана функция f(x) = Зх. Мно- Множеством значений этой функции будет сегмент [0,3]. Функция f^1(y) — ^Уч определенная на сегменте [0,3], является обратной о для заданной функции f(x) = Зх. 2°. Рассмотрим на сегменте [0,1] функцию, определенную следующим образом: _ г/ \ _ jxi если х — рациональное число, ^ ' [1 — ж, если х — иррациональное число. Функция х = f^1(yI заданная на сегменте [0,1] и определен™ ная равенствами _/.-]/ \ _ /у? если у — рациональное число, 1 1 — у, если у — иррациональное число,
§ 4 НЕКОТОРЫЕ СВОЙСТВА МОНОТОННЫХ ФУНКЦИИ 115 будет обратной к данной. В этом нетрудно убедиться непосред™ ственной проверкой. Замечание 1. Пусть на сегменте [а,Ь] задана строго монотонная функция у = /(ж), и пусть множеством значений этой функции является сегмент [а,/3]. Тогда, в силу строгой мо- монотонности функции у = /(ж), каждому у из [а, /3] соответствует только одно значение ж из [а, Ь], для которого /(ж) = у, и поэто- поэтому на сегменте [«,/3] существует функция ж = f^1(y)J обратная для функции у = /(ж). Более того, если функция у = /(ж) яв- является возрастающей на сегменте [а, Ь], то функция ж = f^1(y) также является возрастающей на сегменте [о, /3], если же у = = /(ж) — функция, убывающая на [а, Ь], то ж = f^1(y) являет- является убывающей на сегменте [/3, а]. Убедимся, например, что если у = /(ж) - возрастающая функция, то и ж = /^1(у) — также воз- возрастающая функция. Действительно, если у\ < |/2? то и жх < Ж2 (#1 — f~1(yi) и Ж2 = f^1(lf2))j ибо из неравенства х\ ^ Ж2 и из возрастания функции у = /(ж) следовало бы, что у\ ^ ?/2? а эт° противоречит неравенству у\ < г/2. Лемма 1. Для того чтобы строго монотонная на сегменте [а^Ь] функция у = /(ж) являлась непрерывной на этом сегмен- те, необходимо и достаточно^ чтобы любое число 7, заключен- заключенное между числами а = f(a) и /3 = /(Ь), было значением этой функции. Иными словами, для того чтобы строго монотонная функция у = /(ж) была непрерывна на сегменте [а, Ь], необхо™ димо и достаточно, чтобы множеством значений этой функции был сегмент [а, /3] (или [/3, а] при /3 < а), где а = /(а) и /3 = /(Ь). Доказательство. 1) Необходимость. Ради определенности рассмотрим возрастающую непрерывную на сегменте [а, 6] функцию у = f(x) (для убывающей функции доказательство аналогично). Покажем, что если а < 7 < А т0 существует внутренняя точка с сегмента [а, Ь], в которой /(с) = = 7 (в силу возрастания функции /(ж) на сегменте [а, Ь] такая точка с будет единственной). Обозначим через {ж} множество точек сегмента [а, Ь], для которых /(ж) ^ j (этому множеству принадлежит, например, точка а, ибо f(a) = а < j). Множе- Множество {ж} ограничено сверху и поэтому имеет точную верхнюю грань с. Докажем, что /(с) = 7- Отметим, что любое число из сегмента [а, Ь], меньшее с, принадлежит множеству {ж}1), а любое число, превосходящее с, не принадлежит этому множе™ ству2). Покажем, что с — внутренняя точка сегмента [а, Ь]. В ) Ибо по определению точной верхней грани для любого ж, меньшего с, найдется х1 такое, что х < х1 и f(x') ^ j. Но тогда из возрастания /(ж) следует что и /(ж) ^ 7? т- е- х принадлежит {ж}. 2) В силу определения точной верхней грани.
116 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 самом деле, пусть, например, с = Ь. Рассмотрим сходящуюся к Ь возрастающую последовательность {хп} значений аргумен- аргумента функции у = f(x). Так как f(x) непрерывна в точке Ъ слева, то lim f(xn) = /3. С другой стороны, f(xn) ^ 7 "Л и поэтому п—>-оо в силу теоремы 3.13 lim (хп) ^ j. Таким образом, /3^7? чт0 п—>-оо противоречит условию j < /3. Полученное противоречие дока™ зывает, что с < Ъ. Аналогично молено убедиться, что а < с. Так как с - внутренняя точка сегмента [а, Ь], то найдутся {xfn} и {ж^} — сходящиеся к с возрастающая и убывающая последовательно™ сти значений аргумента х. Поскольку f(x) непрерывна в точке с, то lim (х'п) = lim /«) = /(с). Но /«) < 7, а /«) > > 72)- Поэтому lim f(xfn) ^ 7? lim (хп) ^ 7? откуда следует, что /(с) = 7- 2) Достаточность. Проведем доказательство для возрастающей на сегменте [а, Ь] функции у = f(x) (для убываю- убывающей функции рассуждения аналогичны). Пусть с — любая точка сегмента [а, Ь] и j = /(с) — значение функции у = = f(x) в этой точке. Убедим™ ся, что число 7 является пра- правым и левым предельным значением функции f(x) в точке с (если с — граничная точка сегмента [а,Ь], то 7 является соответствующим односторонним предельным п\ a d хп с Ь х значением в этой граничной точке). Пусть а < с ^ Ь: п , о ; J \ 5 Рис> 4.8 докажем, что 7 является ле- левым предельным значением функции в точке с. Пусть е — столь малое положительное число, что а < j — е (рис. 4.8). Посколь- Поскольку по условию леммы число j — е является значением функции /(ж), то на сегменте [а,Ь] можно указать точку d такую, что f(d) = j — e. Так как функция f(x) возрастает, то d < с. Рассмо- Рассмотрим теперь любую сходящуюся к с последовательность {хп} значений аргумента ж, элементы которой меньше с. Начиная с некоторого номера Ж, все элементы хп этой последовательности удовлетворяют неравенствам d < хп < с (один такой элемент изображен на рис. 4.8), так что в силу возрастания f(x) при п ^ N справедливы неравенства f(d) < f(xn) < /(с). Так как 1) Так как все хп меньше с и, стало быть, принадлежат {ж}. 2) В силу того, что х'п < с < х'п для любого п.
§ 5 ПРОСТЕЙШИЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 117 f(d) = 7 ~~ е и /(с) = 7? т0 из последних неравенств вытекает, что при п ^ N , 0<7-/Ы<е, т. е. последовательность {f(xn)} сходится к 7? a поскольку {хп} — произвольная сходящаяся к с слева последовательность значений аргумента, то тем самым доказано, что левое предель- предельное значение в точке с существует и равно j = /(с) 1). Если а ^ с < Ь, то, рассуждая аналогично, молено доказать, что 7 = /(с) является правым предельным значением функции в точке с. Мы доказали, что правое и левое предельные значения функции у = f(x) в любой внутренней точке с равны частному ее значению /(с), а это, в силу замечания в п. 1 § 2, означа- означает непрерывность f(x) во внутренних точках сегмента. Непре™ рывность этой функции в граничных точках сегмента следует из того, что соответствующие односторонние предельные значе- значения f(x) в граничных точках сегмента равны частным значени- значениям функции. Лемма полностью доказана. Следствие. Пусть на сегменте [а,Ь] задана строго моно- монотонная непрерывная функция у = /(ж), и пусть а = /(а), /3 = = f(b). Тогда эта функция имеет на сегменте [а,/3] (или [/3, а], если $ < а) строго монотонную и непрерывную обратную функ- функцию х = /~г(у). Доказательство. В силу только что доказанной лем- леммы множеством значений функции у = f(x) является сегмент [а,/5], а тогда, согласно замечанию 1 этого пункта, на сегмен- сегменте [а, /3] существует обратная строго монотонная функция х = = f^l(y)j множеством значений которой является сегмент [а,Ь] и которая поэтому, в силу той же самой леммы, непрерывна на сегменте [а, /3]. Замечание 2. Отметим, что монотонные функции имеют правое и левое предельные значения в каждой внутрен- внутренней точке области задания. Доказательство этого предложения предоставляем читателю. § 5. Простейшие элементарные функции Простейшими элементарными функциями обычно называют следующие функции: у = ж°, у = аж, у = logftx, у = sin-ж, у = = cos ж, у = tgx, у = ctgx, у = arcsin^, у = arccosx, у = arctgx, у = arcctgx. Из элементарного курса читатель имеет представление об этих функциях и об их графиках. Некоторые из этих функций, ) Мы рассмотрели случай столь малого е > 0, что а < j — e. Если а, ^ j — — е, то достаточно положить d = а и повторить проведенные рассуждения, используя очевидное неравенство 7 — ? ^ f(A).
118 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 например у = аж, без труда определяются для рациональных значений аргумента х. Мы выясним вопрос об определении про- простейших элементарных функций для всевозможных веществен- вещественных значений их аргументов. Этот вопрос не является простым: неясно, например, как возвести произвольное вещественное чис- число ж в произвольную вещественную степень а. Мы изучим также вопрос о непрерывности простейших эле- элементарных функций во всех точках области их задания. Нами будет обосновано то поведение простейших элементарных функ- функций, которое наглядно вырисовывается из рассмотрения их графиков. В дополнении к гл. 8 приводятся алгоритмы вычисления зна- значений простейших элементарных функций. 1. Рациональные степени положительных чисел. Воз™ ведение любого вещественного числа х в целую положительную степень п определяется как п™кратное умножение числа х са- самого на себя. Следовательно, при целом п мы можем считать определенной степенную функцию у = хп для всех веществен- вещественных значений х. Некоторые свойства этой функции будут нами использованы для определения рациональных степеней положи- положительных чисел. Докажем следующую лемму. Лемма 2. Степенная функция у = хп при х ^ 0 и целом положительном п возрастает и непрерывна. Доказательство. Докажем возрастание этой функции. Пусть 0 ^ xi < Х2- Так как х% — х^ = (х2 — х\)х х(х^г + Непрерывность этой функции была нами установлена ранее (см. пример 1 п. 1 § 3). Следствие. Рассмотрим степенную функцию у = хп на сег- сегменте [0,7V], где N — любое положительное число. Так как эта функция непрерывна и возрастает на указанном сегменте, то она имеет в силу следствия из леммы 1 этой главы на сегмен- сегменте [0, Nn] возрастающую и непрерывную обратную функцию, которую мы обозначим через yl'n. Поскольку N молено выбрать как угодно большим, то и Nn также будет сколь угодно большим. Следовательно, функция х = у1'11 определена для всех неотрицательных значений у. Ме- Меняя для этой функции обозначение аргумента у на ж, а обозначе™ ние функции х на у, мы получим степенную функцию у = xl'n', определенную для всех неотрицательных значений х. Определим а1^п как число 6, равное значению функции у = = xl'n в точке а. Мы можем теперь определить любую рацио-
§ 5 ПРОСТЕЙШИЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 119 нальную степень г положительного числа а. Именно, если г = = т/п^ где тшп- целые положительные числа, то мы положим ar = am/n = (al/n)me Договоримся, кроме того, что а0 = 1, а~г = A/а)г. Нетрудно убедиться в справедливости следующих свойств ра™ циональной степени положительных чисел: (ar)s = аг'\ аг • br = (а • bf', аг • as = ar+s. (*) Докажем сначала справедливость первого свойства (*). Заметим, что при целом положительном р равенство {ат'п)р = ат'р'п, в котором под т и п понимаются любые целые положительные числа, заведомо справедливо, ибо как левая, так и правая части этого равенства равны произведению числа а1/71 самого на себя т • р раз. mi т,2 , r,s r.s Полагая г = , s = , докажем равенство (а ) = а в ситуации ('mi \ —*- CL П1 ) П2 j C2 = = a n\-ni . Если бы с\ было отлично от сг, то из возрастания степенной функции у = хП2 следовало бы, что и с^2 ф с^2, а последнее соотношение, в силу уже доказанной справедливости равенства {ат'п)р = ат"р'п при це- целом р, означало бы, что ^ат1'П1)т'2 ф ami"m2/rii> Полученное соотношение противоречит уж:е доказанному нами для целых положительных mi, n\ и Ш2 равенству [amilni)rn'1 = ami'm2/riie Тем самым, с\ = С2 и первое равен- равенство (*) доказано для любых положительных рациональных г и s. Распространение этого равенства на неположительные г и s не предста- представляет труда в силу нашей договоренности о том, что /1 \ г а0 = 1, a"r = ( - ) при г > 0. \°/ Второе равенство (*) также достаточно доказать для положитель- положительного рационального г. Полагая это г равным m/n, где т ш п — целые по- положительные числа, заметим, что нам достаточно доказать равенство a1'n • • Ьг'п = (а • ЬI , ибо перемножением m таких равенств будет доказано общее соотношение аг • br = (а • b)r. Для доказательства равенства а 'п -Ь 'п = (а -Ь) 'п заметим, что в силу свойств взаимно обратных функций у = х'пшх = уп можно утверждать, что (Ь1/п)п = Ъ, (а1/п)п = a, ((a • ЬI/п)п = а • Ь. Поэтому, положив а = = а1/71 • b1/71, C2 = (а • ЬI^п и предполагая, что с\ ф сг, мы получили бы, что с? / С2 5 чт0 противоречит равенству а • b = ab. Докажем теперь последнее свойство (*), учитывая, что первые два уже доказаны. Пусть г = mi/ni, s = П12/П2, тогда г = т\П2/'{П1П2), s = m2 • • fii/(ji2 " Tii), и мы приходим к следующему равенству: = I aniTO2 Последнее равенство справедливо, так как mi • П2 и ni2 • п\ — целые числа.
120 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 Таким образом, (mi П2+'нг2'П'1) mi m<2, аг • а8 = a nin% = а^7 + ^Г = ar+s, что и требовалось. Докажем, что при а > 1 и рациональном г > 0 справедлив во неравенство аг > 1. В самом деле, пусть г = т/п и аг = = ат/?г ^ 1. Перемножая почленно п указанных неравенств, получим ат ^ 1. Последнее неравенство противоречит неравен™ ству ат > 1, полученному почленным перемножением т нера- неравенств вида а > 1. Отметим, наконец, что если рациональная дробь г = т/п имеет нечетный знаменатель п, то определение рациональной степени можно распространить и на отрицатель- отрицательные числа, полагая (^а)г = аг, если т — четное, {^а)г = ^аг, если т — нечетное. 2. Показательная функцим. Из рассуждений предыдуще- предыдущего пункта вытекает, что если а — положительное число, то функ- функция у = ах определена для всех рациональных х. Легко убедиться в том, что функция у = аж, а > 1, опреде- определенная на множестве {ж} всех рациональных чисел, монотонно возрастает на этом множестве. В самом деле, пусть х\ и Х2 — любые два рациональных чис- числа, удовлетворяющие условию Х2 > х\. Тогда Так как Х2 — х\ > 0 и а > 1, то aX2^Xl > 1, т. е. правая часть последнего равенства положительна, и поэтому aX2>aXl. Возрас- Возрастание функции ах на множестве рациональных чисел доказано. Переходим к определению функции ах на множестве всех вещественных чисел. Фиксируем произвольное вещественное число х и рассмо™ трим всевозможные рациональные числа а и /5, удовлетворяю- удовлетворяющие неравенствам а < х < J3. D.2) Определим ах при а > 1 как вещественное число у, удовле- удовлетворяющее неравенствам аа^у^ а^ D.3) Ниже мы докажем, что такое число у существует, и притом только одно. Мы докажем также, что определенная нами функ- функция у = ах обладает следующими важными свойствами: 1) воз- возрастает на всей бесконечной прямой, 2) непрерывна в любой точке х этой прямой.
§ 5 ПРОСТЕЙШИЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 121 1°. Прежде всего докажем, что для любого фиксированного х и любых рациональных чисел а и /3, удовлетворяющих неравенствам D.2), суще- существует вещественное число у, удовлетворяющее неравенствам D.3). Фиксируем произвольное рациональное число /3, удовлетворяющее пра- правому неравенству D.2), и рассмотрим всевозможные рациональные числа а, удовлетворяющие левому неравенству D.2). Так как а < /3 и показательная функция, определенная на множестве ра- циональных чисел, возрастает, то аа < а^3. Таким образом, множество {аа} ограничено сверху и число а^ является одной из верхних граней этого мно- множества. Стало быть, это множество имеет точную верхнюю грань, которую мы обозначим через у. Остается доказать, что у удовлетворяет неравен- неравенствам D.3). Из определения точной верхней грани вытекает справедливость левого неравенства D.3), а справедливость правого неравенства D.3) выте- в кает из того, что аИ — одна из верхних граней, at/ — точная верхняя грань множества {аа}. 2°. Установим теперь, что существует только одно вещественное число у, удовлетворяющее неравенствам D.3). Достаточно доказать, что для любого е > 0 найдутся такие рациональ- рациональные числа а и /3, удовлетворяющие неравенствам D.2), для которых от — — аа < е. В самом деле, тогда любые два числа у\ иг/2, удовлетворяющие неравенствам D.3), обязаны совпадать, ибо разность между ними по моду- модулю меньше любого наперед взятого положительного числа е. Фиксируем произвольное е > 0 и некоторое рациональное /Зо, удовле- удовлетворяющее правому неравенству D.2). Тогда, так как аа < от0, получим а^аа = аа(а0-а - 1) < apQ{a^a - 1). Неравенство а^' —аа < е будет доказано, если мы установим возможность выбора таких а и /3, что а^"а - 1 < ^^> Из гл. 2 вытекает, что для любого натурального п можно выбрать рациональные числа а и /3, удовлетворяющие неравенствам D.2), так что разность /3 — а будет меньше 1/п. Таким образом, достаточно доказать су- существование такого натурального п, для которого Убедимся в возможности выбора такого натурального п. Пусть а1/п = 1+бп. Так как а 'п > 1, то 5п положительно. Используя формулу бинома Нью- A / \п а 'п ) = A + ёп)п = 1 + пёп-{- (положительные члены) > 1 + пёп. Отсюда а — 1 > пёп и 0 < ёп < . Стало быть, п д1/" _ 1 = §п < . Неравенство D.4) будет справедливо, если мы вы- п а-1 е (а- 1)а/3° берем п удовлетворяющим требованию ------------ < —т™ или п > . п а?® е Доказательство однозначной определенности числа у, удовлетворяющего неравенствам D.3), завершено. Заметим, что если х — рациональное число и ах — значение в точке х показательной функции, первоначально определенной лишь на множестве
122 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 рациональных чисел, то ах и является тем единственным вещественным числом у, которое удовлетворяет неравенствам D.3). 3°. Докажем теперь, что построенная нами функция ах (при а > 1) возрастает на всей бесконечной прямой. Пусть х\ иж2 — любые вещественные числа, удовлетворяющие неравен- неравенству х\ < Х'2. Очевидно, найдутся рациональные числа а и /3, удовлетворяю- удовлетворяющие неравенствам х\ < а < C < ж2 (см. утверждение, доказанное в конце п. 1 § 2 гл. 2). Из определения показательной функции и из возрастания ее на множестве рациональных чисел вытекают неравенства aXl ^ аа < <т ^ ^ аЖ2, т. е. aXl < аХ2. Возрастание функции ах доказано. 4°. Остается доказать непрерывность построенной нами функции ах в любой точке х бесконечной прямой. Пусть {жп} — любая сходящаяся к х последовательность вещественных чисел. Достаточно доказать, что для любого е > 0 найдется номер N такой, что при п^ N справедливо неравенство \аХп — ах\ < е. Фиксируем произвольное О 0 и выберем рациональные числа а и /5, удовлетворяющие неравенствам D.2), так, чтобы было справедливо нера- неравенство w — аа < е (возможность выбора таких а и /3 доказана в 2°). Так как последовательность {жп} сходится кжиа<ж</3, то найдется но- номер N такой, что при п ^ N справедливы неравенства а < хп < /3. Из неравенств а<х</3ша<хп<Cшшз свойства монотонности показа- показательной функции вытекает, что аа < аХп < а^3 и аа < ах < аР (при п ^ N). Так как разность между числами от и аа меньше е и оба числа ах и аХп заключены между аа и а^, то \аХп — ах\ < е (при п ^ N). Доказательство непрерывности завершено. Замечание 1. Если 0 < а < 1, то а = 1/Ь, где Ъ > 1. Поэтому функцию у = а при 0 < а < 1 можно определить как функцию у = Ь^ж, Ъ > 1. Установим некоторые свойства показательной функции у = = аж, а > 1. 1. Все значения показательной функции положительны. Дей- Действительно, пусть х — произвольная точка числовой прямой, а х1 — рациональная точка, такая, что х1 < х. Так как, по опре- определению, ах > 0 и ах < аж, то ах > 0. 2. lira ax = 0, lim ax = +оо. Х^~ (X) Ж^ + ОО В самом деле, так как a > 1, то a = 1 + а, где а > 0 и ап = = A + а)п > 1 + па. Следовательно, lim an = +оо. В силу монотонности функции lim ax = +оо. Так как а~п = 1/ап, то ж—>+оо lim a~n = 0, и поэтому lim ax = 0. п—>оо ж^^оо 3. Из свойств 1 и 2, а также из монотонности и непрерывности функции у=ах вытекает, в силу леммы 1, что значения у этой функции заполняют всю положительную полупрямую у > 0. 4. Для любых вещественных чисел х\ и Х2 справедливы со- соотношения (а*1)*2 = аХ1Х2, aXlbXl = (а ¦ Ь)х\ аХ1ах* = аХ1+х\
простейшие элементарные функции 123 Действительно, мы уже отмечали справедливость этих соотно™ шений для рациональных показателей. Чтобы убедиться в сира™ ведливости этих соотношений для любых показателей, достаточ- достаточно рассмотреть последовательности {xfn} и {ж^} рациональных чисел, сходящиеся соответственно к х\ и Х2- Тогда, например, а «о п = а п^ п. Переходя к пределу при п —> оо и используя свойство непрерывности показательной функции, мы получим аж1аж2 _ аж1+ж2> Аналогично можно убедиться в справедливо- справедливости и других из перечисленных выше соотношений. 0 1 у=ах@<а<1) X Рис. 4.9 Рис. 4.10 Замечание 2. Мы установили свойства 1—4 показа- показательной функции у = аж, а также непрерывность и монотонное возрастание этой функции на бесконечной прямой для случая а > 1. Отметим, что при 0 < а < 1 функция у = аж, в силу замечания 1, непрерывна и монотонно убывает на бесконечной прямой. Кроме того, для этой функции сохраняются свойства 1, 3 и 4, а свойство 2 модифицируется следующим образом: lim ax = +оо, lim ax = 0. ж—>• —оо ж-->+оо На рисунках 4.9 и 4.10 изображены графики показательной функции у = ах для случаев а>1и0<о<1. Замечание 3. Свойство aXl+X2 = aXlaX2 может быть по- положено в основу функционального определения показательной функции у = ах. Можно доказать, что существует, и притом единственная, функция /(ж), определенная на всей бесконечной прямой и удовлетворяющая следующим трем требованиям: 1) для любых вещественных х\ и Х2 соотношению /(Ж1+Ж2) = = f(x1)f(x2); 2) соотношениям /@) = 1, /A) = а, где а > 0; 3) непрерывная при х = 0. Такой функцией и является построенная выше функция ах. 3. Логарифмическая функцим. Рассмотрим произволь- произвольный сегмент [с, d] бесконечной прямой. На этом сегменте функ™ ция у = ах строго монотонна и непрерывна. Поэтому, в силу
124 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 следствия из леммы 1, функция у = f(x) = ах имеет на сегмен™ те [а,/3], где а = ас, /3 = ad, обратную функцию х = f^1(y)J которую мы будем называть логарифмической. Логарифмиче- Логарифмическая функция обозначается следующим образом: х = 1оёа У- Меняя для этой функции обозначение аргумента у на ж, а обозначение функции х на у, мы получим функцию У = 1оёа х- Отметим следующие свойства логарифмической функции, непосредственно вытекающие из ее определения: 1°. Логарифмическая функция определена для всех поло™ жительных значений х. Это следует из того, что ее аргумент представляет собой значения показательной функции, которые, в силу свойств 1 и 3 этой функции (см. предыдущий пункт), только положительны и заполняют всю положительную полу- полупрямую х > 0. 2°. Логарифмическая функция непрерывна и возрастает на всей открытой полупрямой х > 0 при а > 1 (убывает при а < 1), причем при а > 1 lira 1оел х = ^оо, lim log,, x = +оо. Справедливость этого свойства вытекает из свойств показатель™ ной функции и из замечания 1 п. 2 § 4. 3°. ДЛЯ ЛЮбыХ ПОЛОЖИТеЛЬНЫХ Х\ И Х2 loga(xi • х2) = loga xi + loga ж2. Это свойство также вытекает из свойств показательной функции. Рис. 4.11 Рис. 4.12 Замечание. Следует особо отметить логарифмическую функцию у = logp ж, где е = lim ( 1 + - 1 . Мы будем для этой функции использовать обозначение у = In ж. Подчеркнем, что
§ 5 ПРОСТЕЙШИЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 125 логарифмическая функция у = In x играет важную роль в мате™ матике и ее приложениях. Логарифмы по основанию е принято называть натуральными. На рисунках 4.11 и 4.12 изображены графики логарифмиче™ ской функции у = loga х для случаев а>1иО<о<1. 4. Гиперболические функции. Гиперболическими функ™ циями называются следующие функции х): 1°. Гиперболический синус ~" *" су 2°. Гиперболический косинус 2 3°. Гиперболический тангенс . I S11X в I thx = -— = сп ж еж + I 4°. Гиперболический котангенс sha? еж — е^ж Из определения гиперболических функций следует, что ги- гиперболический синус, гиперболический косинус и гиперболиче- гиперболический тангенс заданы на всей числовой прямой. Гиперболический котангенс определен всюду на числовой прямой, за исключением точки х = 0. Гиперболические функции непрерывны в каждой точке обла- области задания (это ввстекает из непрерывности показательной функции и теоремы 4.2). Гиперболические функции обладают рядом свойств, ана- аналогичных свойствам тригонометрических функций. Например, для гиперболических функций имеют место теоремы сложе- сложения, аналогичные теоремам сложения для тригонометрических функций. Именно: sh(x + у) = sh х ch у + ch x sh у, ch(x + у) = ch x ch у + sh x sh у. На рисунках 4.13—4.16 изображены графики гиперболических функций. 1) Наименование «гиперболические функции» объясняется тем, что гео- геометрически функции y = shxwy = chx могут быть определены из рассмо- рассмотрения равнобочной гиперболы по тем же правилам, по которым функции у = sin х и у = cos х могут быть определены из рассмотрения единичной окружности.
126 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 i/=sh х y=ch x Рис. 4.13 Рис. 4.14 +1 0 X y=th х У* +1 0 X y=cth x Рис. 4.15 Рис. 4.16 5. Степеннам функцим с любым вещественным пока- показателем а. Пусть а — произвольное вещественное число. Опре- Определим общую степенную функцию у = ха1 х > 0, следующим образом: у = ха = (al0&°xY = aal0^x (а > 1). Из определения степенной функции следует, что при а > О она представляет собой возрастающую, а при а < 0 убывающую функцию. Рассмотрим предельное значение степенной функции при х —> 0 + 0. Докажем, что lim х = 0 при а > 0, (^ +оо при а < 0. Действительно, пусть {жте} — любая сходящаяся к нулю справа последовательность значений аргумента х. Так как lim logo хп = ^оо, то из свойств показательной функции вы-
5 простейшие элементарные функции 127 текает, что lim аа gaXn = 0 при а > 0 и lim а(ЛЮ^аХп = +оо п—)-оо п—)-оо при а < 0. Естественно положить теперь 0° = 0 при а > 0 и считать это выражение неопределенным при а ^ 0. Докажем непрерывность степенной функции в любой точке х положительной бесконечной полупрямой (х > 0). Для этого до- достаточно установить, что эта функция непрерывна в каждой точке х указанной полупрямой слева и справа (см. замечание в п. 1 § 3). Докажем, например, непрерывность этой функции в точке х слева (непрерывность справа доказывается аналогично). При этом ради определенности будем считать а > 0. Обратимся к формуле у = ха = аа ^аХ^ а > 1. Пусть {хп} — любая сходя- сходящаяся слева к х последовательность значений аргумента степен- степенной функции, так что хп < х. Так как логарифмическая функ- функция непрерывна, то последовательность {t^}? гДе ип = a^°Eaxni .=1/ У Рис. 4.17 у=х , а= Рис. 4.19 Рис. 4.20
128 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 сходится к и = alogax, причем все элементы ип отличны от и (в самом деле, поскольку при а > 1 логарифмическая функ™ ция возрастает, то справедливо неравенство ип < и). В силу непрерывности показательной функции последовательность {а^} сходится к аи. Иными словами, последовательность |аа1о8аж«|7 представляющая собой последовательность {ж"} значений сте- степенной функции, соответствующую последовательности {жп}5 сходится к a og«x, т. е. к жа. Непрерывность степенной функции в точке ж > 0 слева доказана. Аналогично доказывается непре- непрерывность этой функции в точке х > 0 справа. Но непрерывность функции в точке х слева и справа означает, что функция непре- непрерывна в этой точке. Отметим, что если а > 0, то степенная функция у = ха непрерывна также и в точке х = 0. Замечание. Отметим, что если показатель а степенной функции представляет собой рациональное число т/п, где п — нечетное целое число, то степенную функцию у = ха молено определить на всей числовой оси, полагая для х < 0 у = |ж|°, если а = т/п и т — четное, у = ^|ж|а, если а = т/п и т — нечетное. На рисунках 4.17-4.20 изображены графики степенной функ- функции у = ха для различных значений а. 6. Тригонометрические функции. В курсе элементарной математики с помощью наглядных геометрических соображе- соображений были введены тригонометрические функции у = sin ж и у = = cos ж х). Перечислим некоторые важные для дальнейшего свойства тригонометрических функций: 1°. При любых вещественных ж;, х" и х справедливы следую™ щие соотношения: sin(V + х") = sin ж'cos ж" + cos ж'sin ж", cgs^' + х") = собх1 cosx" — sin ж'sin ж", D.5) sin2 ж + cos2 ж = 1. г) Остальные тригонометрические функции у = tgx, у = ctgsc, у = sec ж и у = cosec х определяются через указанные: sin ж cos ж 1 1 ctgx = — , sec ж = , cosec ж = sin ж cos ж , g , , cos ж sin ж cos ж sin ж Подчеркнем, что определение функций sin ж и cos ж с помощью нагляд- наглядных геометрических соображений не является логически безупречным, ибо при этом возможность определить эти функции для всех вещественных значений аргумента ж сводится к возможности установления взаимно од- однозначного соответствия между всеми точками единичной окружности и всеми вещественными числами из сегмента [0, 2тг].
простейшие элементарные функции 129 2°. sin 0 = 0, cos 0 = 1, sin- = 1, cos - = и. Z Z 3°. Если 0 < ж < |, то О < sin ж < ж. D.6) D.7) Рис. 4.21 Указанные свойства устанавливаются посредством геомет- геометрических рассуждений. Мы не будем давать здесь известные из курса элементарной математики гео- геометрические выводы свойств 1° и 2°. Оста- _ i _ в новимся лишь на геометрическом выводе неравенств D.7). Кроме неравенства D.7), мы установим неравенство ж < tg ж (при Рассмотрим окружность радиуса 1 с центром в точке О и точку А на этой окружности (рис. 4.21). От точки А про- против часовой стрелки будем отсчитывать дуги окру лености. Пусть М — точка окружности, находящаяся в первой чет- четверти, и ж — длина дуги AM, 0 < ж < - (ж — радианная ме- мера угла АОМ), N — основание перпендикуляра, опущенного из М на О А, В — точка пересечения перпендикуляра к 0^4, вос- восстановленного из точки А, с продолжением отрезка ОМ. Тогда MN = sin ж, ON = cos ж, АВ = igx. Так как треугольник ОМА содержится в секторе ОМА, который в свою очередь содержит- содержится в треугольнике ОБА, и площади перечисленных фигур соот- 1 . х 1 , ветственно равны - sin ж, - и - tg ж, то имеют место неравенства sin ж <ж< tg ж, 0 < ж < -. При указанных значениях ж sin ж > 0. Таким образом, справедливость неравенств 0< &тх<х< tg# (при 0 < ж < -) установлена. Свойства 1°, 2°, 3° могут быть положены в основу опреде- определения функций sin ж и cos ж. Можно доказать, что существу- существует, и притом единственная, пара функций, определенных для всех вещественных значений аргумента, первую из которых мы обозначим через sin ж, а вторую через cos ж, удовлетворяю- удовлетворяющих требованиям 1°, 2°, 3°. Доказательство этого утверждения приведено в дополнении к этой главе. 5 В.А. Ильин, Э.Г. Позняк, часть I
130 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 Подчеркнем, что из свойств 1°, 2° и 3° функций sin ж и cos ж можно вывести все известные из элементарного курса свойства тригонометрических функций1). Докажем непрерывность тригонометрических функций в каждой точке области их задания. Установим сначала непре- непрерывность функции у = sin ж в точке ж = 0. Пусть {хп} — про- произвольная сходящаяся к точке х = 0 справа последовательность значений аргумента х. Из неравенств D.7) имеем 0 < тпхп < < хп. Отсюда, в силу теоремы 3.14, вытекает, что последова- последовательность {sinrEn} имеет предел, равный нулю. Таким образом, Una sin ж = sin 0 = 0. Так как при (—тг/2) < ж < 0 справедливы неравенства ж < sin ж < О2), то рассуждая аналогично, получим llm sin ж = sinO. Мы установили, что в точке ж = 0 функция ^ОО у = sin ж непрерывна справа и слева, т. е. является непрерывной в указанной точке. Для доказательства непрерывности функции у = sin ж в любой точке ж бесконечной прямой воспользуемся 1 „ • // / о ж" + X . х" - X формулой sin ж — sin ж = 2 cos ^—^— sin ^—^—, которая может ? ?, быть получена из формул D.5). Пусть {хп} — произвольная схо- сходящаяся к ж последовательность значений аргумента. Полагая в последней формуле х" = хп и х1 = ж, получим lim (smxn — sin ж) = 2 lim cos sin = и. 2 2 Справедливость этого заключения вытекает из того, что после- Г хп + х 1 q\ довательность < cos > ограниченная J, а последователь- последовательность I sin >, в силу доказанного выше, бесконечно малая. Непрерывность функции у = cos ж устанавливается с по- помощью аналогичных рассуждений из формулы // / о . х" + х' . х" — х' cos ж ^совж =—2 sin—-—sin—-—. Непрерывность остальных тригонометрических функций (tga;, ctgrc, sec ж, совесж) в калсдой точке области их задания следует из теоремы 4.2. 1) Например, равенства sin(—ж) = ™sinx, cos(^x) = cos ж. 2) Эти неравенства получаются из неравенств D.7) путем замены жна-ж и учета формулы sin (—ж) = ™sin;r. 3) Из третьей формулы D.5) следует, что | cosx| ^ 1 и | sinx| ^ 1. Отсюда очевидна ограниченность последовательности Г Хп+Х} сти < cos >.
простейшие элементарные функции 131 y=ctg х Рис. 4.25
132 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 Область задания каждой тригонометрической функции раз™ деляется на участки монотонности этой функции1). Функция у = sin ж возрастает на каждом сегменте \2ктт — — ^2ктт + — 2) L ^ ^ J и убывает на каждом сегменте Bк + 1)тг — —, Bк + 1)тг + — . Функция у = cos ж возрастает на каждом сегменте [Bfc—1)тг, 2ктг] и убывает на каждом сегменте [2А:тг, Bк + 1)тг]. Функция у = = tg ж возрастает на каждом интервале ( кж ~~ —, кж + — J. Функ- Функция у = ctgx убывает на каждом интервале ((к — 1)тт/ктт). Для функций у = sec ж и у = msec ж читатель без труда установит области возрастания и убывания. На рисунках 4.22^4.27 изображены графики тригонометри- тригонометрических функций. 7. Обратные тригонометрические функции. Функция у = arcsin^ определяется следующим образом. Рассмотрим на сегменте [^тг/2,тг/2] функцию у = sin ж. В предыдущем пункте мы отметили, что на этом сегменте функция у = sin ж возраста- возрастает, непрерывна и имеет в качестве множества значений сегмент [—1,1]. В силу следствия из леммы 1 для функции у = sin ж на сегменте [—1,1] существует непрерывная возрастающая обрат- -1 1 X К  t/=arcsin х Рис. 4.28 1 х i/=arccos х Рис. 4.29 ) Монотонность функций sin х и cos х на соответствующих сегментах легко установить из формул sin х — sin ж = 2 cos sin , яж ^cosx = —2 sin sin 2 2 2) Здесь под к мы понимаем любое целое число.
ПРЕДЕЛЬНЫЕ ЗНАЧЕНИЯ НЕКОТОРЫХ ФУНКЦИЙ 133 ная функция. Эту функцию мы будем обозначать х = arcsiny. Меняя для этой функции обозначение аргумента у на ж и обозна™ чение х для функции на у, мы получим функцию у = arcsinx. На рис. 4.28 изображен график этой функции. Совершенно аналогично определяется функция у = arccosx. Областью ее задания служит сегмент [—1,1], а множеством зна- значений сегмент [0, тг]. Указанная функция убывает и непрерывна на сегменте [—1,1]. На рис. 4.29 изображен график функции у = = arccosx. Функции у = arctg x и у = arcctg x определяются как обрат- обратные для тангенса и котангенса. Эти функции определены, моно- монотонны и непрерывны на бесконечной прямой. На рис. 4.30 и 4.31 изображены графики этих функций. -± t/=arctg х y=arctg х Рис. 4.30 Рис. 4.31 § 6. Предельные значения некоторых функций 1. Предварительные замечания. В гл. 1 было указано, что для вычисления производных функций у = sin х и у = loga х нужно доказать существование предельных значений (или пре™ \ д. sin(Aa/2) д п , Л , Ах\х/Ах делов) функции ' при /лх 4ии функции I I + — 1 при Ах 4 0 и фиксированном х > 0. Этому вопросу и посвя- посвящен настоящий параграф. Нам понадобится предложение о пре™ дельном значении функции, заключенной между двумя функ- функциями, имеющими общее предельное значение в данной точке. Это предложение представляет собой функциональный аналог теоремы 3.14. Лемма 5. Пусть в некоторой S-окрестности точки а (за исключением^ быть может^ самой точки а) заданы функции /(ж), g(x) и h(x), причем функции f(x) и g(x) имеют в точ- точке а одинаковое предельное значение, равное Ъ. Если в указанной окрестности точки а (за исключением^ быть может, самой точки а) выполняются неравенства f(x) ^ h(x) ^g(x), то пре- предельное значение функции h(x) в точке а существует и равно Ъ. Доказательство. Пусть {хп} — произвольная сходящаяся к а последовательность значений аргумента ж, эле™ менты хп которой лежат в указанной J-окрестности точки а и не
134 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 равны а, и {/(ж^)}, {g(xn)}J {h(xn)} — соответствующие после™ довательности значений функций /(ж), g(x) и h(x). По условию lim f(xn) = lim g(xn) = b и /(жте) ^ /г(жте) < g(xn). w>oq w>oq Но тогда, в силу теоремы 3.14, lim h(xn) = b. Поскольку п—>оо {жтг} — произвольная сходящаяся к а последовательность значе™ ний аргумента, то последнее равенство означает, что lim h(x) = х—ьа = Ъ. Лемма доказана. 2. Предельное значение функции ^^ 1) в точке ж = О X (первый замечательный предел). Докажем следующую тео- теорему. Теорема 4*4- Предельное значение функции в точке X х = 0 существует и равно единице: 1 • S1I1 X -I / л о\ lim = 1. D.8) х^О х к ; Доказательство. Мы уже отмечали, что при 0 < < х < тг/2 справедливы неравенства 0 < sin ж < х < tg ж (см. п. 6 предыдущего параграфа). Деля почленно эти неравенства на sin ж, получим -, . х . 1 . sin ж . -, 1 < -— < или cos ж < < 1. Последние неравенства справедливы также и для значений ж, >ы убедиться sin ж sin(—ж) удовлетворяющих условиям ^— < ж < 0. Чтобы убедиться в этом, достаточно заметить, что cos ж = сов^ж) и х 7 ж — ж Так как cos ж — непрерывная функция, то lim cos ж = 1. Таким Г JL » 1 Sin Ж „ С ооразом, для функции cos ж, 1 и в некоторой о™окрестности точки ж = 0 выполняются все условия леммы 3 (для того чтобы убедиться в этом, обозначим /(ж) = cos ж, g(x) = 1 и h(x) = и положим 5 = тг/2). Следовательно, lim = lim cos ж = 1. Теорема доказана. 1) Выше мы говорили о функции j. , Если обозначить Аж/2 через sin ж ж, то мы и получим функцию . Условие Аж —> 0 при этом обозначении ж сводится к условию ж —>¦ 0.
ПРЕДЕЛЬНЫЕ ЗНАЧЕНИЯ НЕКОТОРЫХ ФУНКЦИЙ 135 3. Предельное значение функции A + - 1 при ж —> оо X (второй замечательный пределI). Докажем следующую теорему. ( 1 \х Теорема 4-5. Предельное значение функции f(x)=ll + -j при х —> оо существует и равно е: lim (l + \Y = е. D.9) Доказательство. Нужно доказать, что, какова бы ни была бесконечно большая последовательность {х^} значений ( 1 \х аргумента функции f(x)=ll + -j , соответствующая последо™ \ Ж / вательность {/(ж^)} значений этой функции имеет своим преде™ лом число е. Рассмотрим следующие четыре группы бесконечно больших последовательностей значений аргумента х: 1°. Бесконечно большие последовательности {п^}, элемента- элементами которых являются целые положительные числа. К указанной группе относится, например, последовательность 2, 2,1,1, 3, 3, 2, 2,4,4,... , п + 1, п + 1, п, п,... 2°. Бесконечно большие последовательности, элементы кото™ рых, начиная с некоторого номера, состоят из положительных вещественных чисел. 3°. Бесконечно большие последовательности, элементы кото™ рых, начиная с некоторого номера, состоят из отрицательных вещественных чисел. 4°. Бесконечно большие последовательности, содержащие бесконечно много как положительных, так и отрицательных ве- вещественных чисел2). Заметим, что совершенно произвольная бесконечно большая последовательность значений аргумента относится к одной из групп 1°, 2°, 3°, 4°. Поэтому теорема будет доказана, если мы проведем доказательство для каждой группы 1°, 2°, 3° и 4°. ) Упомянутая ранее задача о предельном значении функции A + Дж/ж) х при Аж, стремящемся к нулю, и фиксированном ж > > 0 сводится к указанному вопросу. Действительно, если положить Аж/ж = 1/и, то при Аж -> 0 и ->- оо и A + Аж/ж)ж/Лж = A + 1/и)и, а эта функция отличается от функции A + 1/ж)ж только обозначением аргумента. ) Так как функция I Ц— 1 не определена на сегменте [—1,0] (поскольку для значений ж из этого сегмента выражение A4— 1 либо отрицательно, V ж/ либо не имеет смысла), то естественно считать, что элементы последова- последовательностей 2°, 3° и 4° не принадлежат сегменту [—1,0].
136 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 (При этом последовательности группы 1° имеют вспомогатель™ ный характер.) Пусть {п^} — какая-либо последовательность тт т Л . 1 \Пк тт первой группы. Докажем, что lim I + — = е. Пусть е — ( 1 \те любое положительное число. Так как lim A + — ) = е (см. п. 4 § 3 гл. 3), то можно указать такой номер JV*, что при п ^ ^ N* выполняется неравенство 1 п 1 + -) -е П < 6. Поскольку последовательность {п^} бесконечно большая и ее элементы — целые положительные числа, то для положитель- положительного числа N* можно указать такой номер Ж, что при к ^ N выполняется условие п^ ^ N*. Но для таких целых п&, как указывалось, выполняется неравенство 1 + < е. Следовательно, lim A + — ) " = е. Перейдем теперь к последовательностям второй группы. Пусть {xfc} - любая последовательность второй группы ж N — номер, начиная с которого все элементы этой последовательно- последовательности больше единицы. Считая к ^ N', обозначим через п& целую часть Xk, n^ = [х^]. Тогда пк ^хк<пк + 1. D.10) Отметим, что последовательности {пк} и {п^ + 1} представляют собой последовательности первой группы. Из неравенств D.10) имеем пк + 1 хк пк или 1 + i <1 + ^1 + + + ^ + пк + 1 хк пк Отсюда, используя еще раз неравенства D.10), получим пк + 1 ^) ( ) ( пк + 1 / V xfe / V пк 4.11 «I \пкЛ ( ( 1 \^fe + li 1+ > и < ( 1+^ > Пк+1/ ) IV Пк) J равны е. Действительно, первая из этих последовательностей
§ 6 ПРЕДЕЛЬНЫЕ ЗНАЧЕНИЯ НЕКОТОРЫХ ФУНКЦИЙ 137 может быть представлена как произведение последовательно™ 1+ > и < 1+ >, пределы которых рав- Wfe+l/ J IV nfc+l/ J ны соответственно 1) е и 1. Вторая последовательность предста™ вляет собой произведение последовательностей < I I + — 1 > и 1 + — 1 >, пределы которых также равны соответственно е и 1. В силу неравенств D.11) по теореме 3.14 имеем / 1 \хк lim A + — ) = е. %к / Рассмотрим последовательности третьей группы. Если } — бесконечно большая последовательность, элементы ко™ торой, начиная с некоторого номера, отрицательны, то после- последовательность {2^}, где Zk = — 1 — ж&, бесконечно большая и ее элементы, начиная с некоторого номера, состоят из положи- положительных вещественных чисел. Поэтому {#&} представляет собой последовательность второй группы. Так как lim A + - ) = Mm A + -L ) A + -L ) = e, / 1 \ xk lim A + — ) = e. TO Для завершения доказательства нам нужно рассмотреть по™ следовательности четвертой группы. Пусть {х^} — такая после- последовательность. Обозначим через {xfk} подпоследовательность этой последовательности, состоящую из всех неотрицательных элементов 2) последовательности {ж^}, а через {ж'Д — подпо™ следовательность, состоящую из всех отрицательных элементов последовательности {х^} 3). Так как по доказанному / 1 \Хк /1 \ Mm A + — ) = е и lim 1 + ^7 ) При этом учитывается, что {nk} принадлежит к первой группе. ) Эти элементы, начиная с некоторого номера, строго положительны. ) Здесь мы, в отличие от гл. 3, выбранные подпоследовательности отме- отмечаем знаками и , сохраняя при этом у элемента подпоследовательности тот номер, который он имел в последовательности {}
138 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 то для любого е > 0 можно указать номер N такой, что при к^ N С е и т. е. при к ^ N |A + -1 ~е Следовательно, lim (\ + — У^ = е. <е. Теорема доказана. Замечание. Из доказанной теоремы следует, что В самом деле, пусть {хп} — любая сходящаяся к нулю после™ довательность значений аргумента функции A +жI/ж, элемен- элементы хп которой отличны от нуля. Тогда последовательность {^и}, где zn = t/xni бесконечно большая (см. теорему 3.6). Так как A + хпI^Хп = A + — ) П и lim A + — ) П = е, ТО Jim (I +xn)l/Xn = е, и поэтому § 7. Непрерывность и предельные значения некоторых сложных функций 1. Непрерывность и предельные значения некото- некоторых сложных функций. Докажем непрерывность некоторых сложных функций. 1°. Пусть х = cp(t) и у = f(x) — простейшие элементарные функции (см. § 5), причем множество значений {х} функции х = ip(t) является областью задания функции у = f(x). Из ре™ зультатов § 5 следует, что простейшие элементарные функции непрерывны в каждой точке области задания. Поэтому, в силу теоремы 4.3, сложная функция у = /[<?>(?)], т. е. суперпозиция двух элементарных функций, непрерывна. Например, функция у = sin - непрерывна в любой точке х ф 0. Чтобы убедиться X в этом, достаточно рассмотреть функции ж = Г1 и у = sin ж. Сложная функция у = slnt^1 только обозначением аргумента
§ 7 НЕПРЕРЫВНОСТЬ И ПРЕДЕЛЬНЫЕ ЗНАЧЕНИЯ 139 отличается от функции у = sin — и, в силу сказанного выше, непрерывна в любой точке t Ф 0. Рассуждая аналогично, легко убедиться, что функция у = In sin ж непрерывна в любой точке каждого интервала BА:тг, Bк + 1)тг) г). 2°. Степенно-показательные выражения u(x)<xh Очевидно, имеет смысл лишь случай, когда и(х) > 0. Легко убедиться, что если и(х) и v(x) непрерывны в точке а и и(х) > 0 в окрестности точки а, то функция u(x)v(x' также непрерывна в точке а. В самом деле, u(x)v^ = ev(x)lnu(x). Поскольку \пи(х) пред™ ставляет собой непрерывную в точке а функцию, то и функ- функция v(x) lnu(x) также непрерывна в точке а. Но тогда функция ev(x)\nu(x) непрерывна в точке а. Отметим, что установленное свойство непрерывности позволяет утверждать, что при сделан™ пых предположениях Mm u(x)v^ = u^ х^а 3°. Предельные значения степенно-показательных выражений. Выясним вопрос о предельных значениях степенно-показательных вы- выражений u(x)v^ при х —>¦ а. При этом мы будем предполагать, что и(х) > 0 в некоторой окрестности точки а. Из соотношения u{x)v^ = ег)(жIпад(ж) видно, что предельное значение выражения u(x)v^x^ при х —>• а зависит от предельного значения выражения v(x) \nu(x). I. Пусть lim v(x) \nu{x) = Ь. х—>а Убедимся, что в этом случае lim u(x)v^ = eb. х—->а В самом деле, функция . . I v(x)lnu(x) при х ф а, w(x) = < [ о при х = а непрерывна в точке х = а. Поэтому и сложная функция ew^x^ непрерывна в этой точке. Следовательно, lim ew(-x^ = ew^ = eb. Так как lim ew^ = x—>a x—>a = lim ev(x)lnu(x)j T0 nm u(x)v^ существует и равен eb. х-Ла х—>а Используя полученные в этой главе сведения о предельных значениях ew при w —> —оо к w —> +оо, легко убедиться в следующем. П. Если lim v(x)\nu(x) = ^оо, то lim u(x)v^ = 0. х—>а х—>а III. Если lim v(x)lnu(x) = +оо, то lim u(x)v^ = +оо. х^-а х^-а Установленная связь меж:ду предельными значениями выраж:ений u(x)v^x^ и v{x) lnu(x) позволяет в ряде случаев легко найти предельное зна- 1) Там, где sin ж > 0.
140 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 чение функции u(x)v^x , если известны предельные значения функций и{х) и v(x). Рассмотрим для примера следующие случаи: 1) существует lim и(х) > 0 и lim v(x)\ ж—>а ж—>а 2) lim и{х) = Ь, Ь > 1, lim i;(sc) = +оо; 3) lim u(x) = Ь, Ь > 1, Нпи;(ж) = —оо. Убедимся, что в случае 1) lim u(x)v(-x) = lim ге(ж) Iх^а . Действи- ж—>а 1_ж—->а J тельно, так как lim и(ж) > 0, то, в силу непрерывности логарифмической функции, lim In и(х) существует и равен In lim u{x) . Поэтому существует х^?а 1.x ^r a J lim v(x) In u(x) = lim v(x) In lim u(x) . Согласно I отсюда вытекает, что т / \v(x) lim v(x)lnu(x) lim v(ж) ln[ lim u(x)] Г.. , ч"I Ji^a v(ж^ lim гг(ж) = еж^а = ex^a x^a = lim u(x)\ x—ta В случае 2) lim v(x) lnu(x) = +оо, и поэтому, согласно III, lim u(x)v^ = = +оо. х^а х^а В случае 3) lim v(x) lnu(x) = ^оо, и поэтому, согласно II, lim u(x)v^ = rx x—>a ж->а В заключение укажем три случая, для которых нахождение предельного значения u(x)v^x^ требует дополнительных исследований. 1. Неопределенность типа 1°°: lim и(х) = 1, lim v(x) = оо. ж—¦>а ж—>а 2. Неопределенность типа 0°: lim ia(x) = 0, lim v(x) = 0. ж—>а ж—>а 3. Неопределенность типа оо°: lim 1а(ж) = +оо, lim v(x) = 0. ж—>а ж—>а Для первого из этих случаев мы приведем формулу, удобную для прак- практических приложений. Преобразуем выражение u(x)v^ следующим образом: I [ад(ж)™11г;(ж) Положим, далее, U(x) = [1 + (и(х) - 1)] «(')-i и V(x) = [и(х) - l]v(x), так что u(x)v{x) = U(x)v(x\ Поскольку lim U(x) = е (см. замечание к теореме 4.5) и е > 1, то значе» ж—>а ние lim u(x)v^ = lim U(x)v^ зависит от предельного значения функции х-Ч-а х-Ч-а V(x) в точке а, т. е. от lim [и(х) — t]v(x). Именно: если lim [it(ж) — 1]1;(ж) = ж—>a ж—>a = lim V(x) = с, то lim u(x)v{*x) = lim 17(ж)у(ж) = ес (см. случай 1)); ее- х^-а х^-а x^-a ли lim [u(x) — l]v(x) = +oo, то lim u(x)v^ = +oo (см. случай 2)); если
§ 7 НЕПРЕРЫВНОСТЬ И ПРЕДЕЛЬНЫЕ ЗНАЧЕНИЯ 141 lim [и(х) — l]v(x) = ^оо, то lim u(x)v^ = 0 (см. случай 3)). Таким образом, х^-а х^-а мы получаем следующую формулу: lim и(хУ^ = е^[и(х)-1Мх). х—>а Неопределенности типа 2 и 3 приводятся к неопределенности типа 1 следующим образом. Положим U(x) = ev(x\ V(x)=\nu(x). Очевидно, lim U(x) = 1 и lim V(x) = ±oo. Кроме того, х^-а х^-а и(хУ(х) = [ev^]lnUM = eW)v™ = U(x)v(x). Пример. Найти lim [cos x] sin2 x . Так как lim cos ж = 1, a lim —~— = х^о1 х^о ^osiirx = сю, то налицо неопределенность типа 1°°. т / \v(x) lim[u(x)-l]v(x) Используем формулу lim u[x) l ; = ех^° , полученную нами ж—>-0 выше. Имеем lim[u(x) — l]v(x) = lim [cos ж — 1]—5— = х^о х^о sin х 1 1 l v Г о • 2 Ж] 1 1 = lim —2 sin — ^ ^г = lim 77г =. Поэтому lim [cos x] sin2 ж = e 2 = ^^. 4°. Предельные значения некоторых сложных функций. Докажем справедливость следующих равенств: т yi + i-1 1 т 1пA+ж) 1 lim = —, lim = 1, ^О х п ^О х v ех-1 л г lim ^^^ = 1, lim 1, lim o . х х^О х1 2 1) Рассмотрим первый из этих пределов. Имеем ж 1 )п - 1 х)п
142 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 Так как знаменатель последнего выражения при ж —>• 0 имеет предел, равный п (функция A + ж) >п непрерывна в точке ж = О и поэтому lim(l + х)к/п = 1), то lim жЯГ J П х^О ем ( + ) ), ж-ЯГ J П х^О х п 2) Перейдем к доказательству второго равенства D.12). Име- Имеп^ х—\п.A+хI1х. Доопределим функцию f(x) = (l+xI^, полагая /@) = limf(x) = lim(l + x)l/x = e. В результате мы х^О ж^О получим непрерывную в точке х = 0 функцию f(x). Тогда и функция lnf(x) также будет непрерывна в нулевой точке, и по- поэтому НтЬП+жI^ = ln/@) = lne = 1. Итак, lim 1пA + ж) = 1. 3) Докажем справедливость третьего равенства D.12). По- Положим х = 1пA + и) и заметим, что при х —>- 0 переменная и стремится к нулю. Имеем = -—. -. Отсюда следует, что х 1пA +и) т. еж — 1 т и л lim = lim — т = 1. х и^О 1пA + и) 4) Докажем справедливость последнего равенства D.12). тж l-cos^ 2 sin2 (ж/2) 1 sin2 (ж/2) rp r sin2 (ж/2) Имеем — = ^^ = - ; ( ;. Так как lim ;o;9; = 2 2 2 (/2J о (/2J ^ ; ( . Так как lim ;o;9 ж2 ж2 2 (ж/2J х^о (ж/2J 1/ Z/ioW т 1"™" COS Ж 1 = 1 (см. D.8)), то Ш—-;- = -. Используя соотношения D.8), D.12), равенство D.1) и символ о(х) (см. п. 3 § 2), легко убедиться в справедливости следующих формул: sin ж = х () D.13) Докажем, например, справедливость первой формулы. Так как lim = 1, то в силу D.1) = 1 + шж), где а(х) — х^о х х бесконечно малая в точке х = 0 функция. Из последней форму™ лы вытекает, что sin ж = х + ха(х). Поскольку ха(х) = о(ж), то sin ж = ж + о(х). 2. Понмтме элементарной функции. Класс элементар- элементарных функций. В приложениях важную роль играет класс функций, получаемых посредством конечного числа арифмети™ ческих операций над простейшими элементарными функциями,
§ 8 КЛАССИФИКАЦИЯ ТОЧЕК РАЗРЫВА ФУНКЦИИ 143 а также получаемых путем суперпозиции этих функций. На™ пример, функции ж3 + 3 cos 2ж, In | sin Зх\ — earctg ^x принадлежат этому классу. Мы будем называть этот класс функций классом элементарных функций^ а каждую функцию этого класса — эле- ментарной. Отметим следующее свойство элементарных функций — они непрерывны в каждой точке области задания1). Это свойство непосредственно вытекает из теорем 4.2 и 4.3 и непрерывности простейших элементарных функций в каждой точке области задания. § 8. Классификация точек разрыва функции 1. Точки разрыва функции и их классификация. В п. 1 § 3 мы определили точки разрыва функции как точки, в которых функция не обладает свойством непрерывности. Мы будем называть также точками разрыва функции точки, в кото™ рых функция не определена, но в любой ^окрестности которых имеются точки области задания функции. Рассмотрим возможные типы точек разрыва функции. 1°. Устранимый разрыв. Точка а называется точкой устранимого разрыва функции у = /(ж), если предель- предельное значение функции в этой точке существует^ но в точке а функция f(x) или не определена^ или ее частное значение f(a) в точке а не равно предельному значению. Например, функция {sin ж / А при ж^О, х 2 при х = 0 имеет в нулевой точке устранимый разрыв, поскольку пред ель™ ное значение этой функции в точке х = 0 равно 1, а частное равно 2. Если функция f(x) имеет в точке а разрыв указанного типа, то этот разрыв можно устранить^ не изменяя при этом значений функции в точках, отличных от а. Для этого достаточ- достаточно определить значение функции в точке а равным ее предель™ ному значению в этой точке. Так, если в рассмотренном примере положить /@) = 1, то Mm/(ж) = /@) и функция будет непре™ рывнои в точке х = и. Замечание. На практике точки устранимого разрыва встречаются при сосредоточенных распределениях физических величин. ) Если при этом область задания функции окажется состоящей из от™ дельных изолированных точек, то естественно считать, что функция по определению непрерывна в каждой из этих точек.
144 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 2°. Разрыв 1-го рода. Точка а называется точ- точкой разрыва 1-го рода^ если в этой точке функция f(x) имеет конечные^ но не равные друг другу правое и левое предельные значения: lim f(x) ж-->а+0 lim f(x) х—ь-а—О 1. Для функции f(x) = sgnrz; точка х = 0 является точкой разрыва 1-го рода (см. рис. 4.4). Действительно, так как 1 при х > О, sgnx = ^ 0 при х = О, — 1 при то lim sctix = 1, 00 ж<0, lim sgnx = —1. 2. Функция /(ж) = , определенная всюду, кроме точки х = 0, имеет в точке ж = 0 разрыв 1-го рода (рис. 4.32). В самом деле, если {хп} — сходящаяся к нулю последовательность, элементы которой положитель- положительны, то I — > — бесконечно 1жп J большая последовательность с положительными членами, и поэтому < 1 + 21/Хп > — также х бесконечно большая последова- последовательность. Но тогда последова- последовательность < г,— > бесконеч- L 1 + 2l/Xn j но малая, и поэтому lim f(x)=0. Если же {хп} — сходящаяся к нулю последовательность, элементы которой отрицательны, то \ — > — бесконечно большая последовательность с отрица™ I хп ) тельными членами, и поэтому lim 2l'Xn = 0. Следовательно, п-—>оо lim J(x) = l. Рис. 4.32 3°. Разрыв 2-го рода. Точка а называется точкой разрыва 2-го рода^ если в этой точке функция f(x) не имеет по крайней мере одного из односторонних предельных значений или если хотя бы одно из односторонних предельных значений бесконечно.
КЛАССИФИКАЦИЯ ТОЧЕК РАЗРЫВА ФУНКЦИИ 145 Рассмотрим, например, функцию f(x) = sin™ (рис. 4.33) 1). Эта функция в точке х = 0 не имеет ни правого, ни левого предельного значения. Действительно, рассмот- рассмотрим следующие сходящие™ ся к нулю справа после- последовательности значений аргумента: тг 5тг Этг (An — 3)тг тг 2тг Зтг П7Т Рис. 4.33 Соответствующие последовательности значений функции у = . 1 = sin - имеют следующий вид: 1, 1, о, о, о, ... , о, ... Первая из этих последовательностей имеет предел, равный единице, а вторая имеет предел, равный нулю. Следовательно, функция f(x) = sin - в точке х = 0 не имеет правого предельно™ го значения. Так как sin — = — sin —, то эта функция не имеет —х х и левого предельного значения в этой точке. Другим примером функции, имеющей точки разрыва 2-го ро- рода, может служить функция у = ctgx (см. рис. 4.25). Эта функ™ ция имеет разрыв 2-го рода в каждой из точек тт, п = 0, ±1, ± ±2,... 2. Кусочно непрерывные функции. Функция у = f(x) называется кусочно непрерывной на сегменте [a, ft], если она непрерывна во всех внутренних точках [a, ft], за исключением, быть может, конечного числа точек, в которых имеет разрыв 1-го рода и, кроме того, имеет односторонние предельные значе- значения в точках а и ft. Функция называется кусочно непрерывной на интервале или бесконечной прямой, если она кусочно непрерыв- непрерывна на любом принадлежащем им сегменте. Например, функция f(x) = [x] 2) кусочно непрерывна как на любом сегменте, так и на бесконечной прямой. х) Рисунок 4.33 носит чисто иллюстративный характер. 2) Напомним, что символ [ж] обозначает целую частв числа х.
146 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 ДОПОЛНЕНИЕ ДОКАЗАТЕЛЬСТВО УТВЕРЖДЕНИЯ ИЗ П. 6 § 5 В настоящем дополнении дается доказательство утверждения из п. 6 § 5. Для удобства сформулируем здесь это утверждение в следующей форме. Существует, и притом единственная, пара функций S(x) и С(х), определенных на всей бесконечной прямой и удовлетворяющих следующим трем требованиям: 1°. Для любых вещественных чисел ж;, х!1 и х выполняются соотно- соотношения S{x + х") = S{x)C{xlf) + C(x')S(x"), C(xf + x!l) = C(xf)C(xff) - S(xf)S(xff), S2{x) + C2{x) = 1. D.5;) г) 2°. S@) = 0, G@) = 1, *(§)-•¦ 3°. При 0 < x < — справедливы неравенства 0 < S{x) < х. D.7') Доказательство этого утверждения мы разделим на две части. Именно: сначала мы докажем единственность, а затем существование функций S(x) и С(х), удовлетворяющих требованиям 1°, 2° и 3°. 1. Доказательство единственности. Для доказательства единствен™ ности достаточно убедиться в справедливости следующих двух утвержде- утверждений: 1) Функции S(x) и С(х), обладающие перечисленными свойствами^ непрерывны на всей числовой прямой. 2) Значения функций S{x) и С{х) определяются единственным образом на некотором всюду плотном множестве точек бесконечной прямой2). Действительно, в силу непрерывности функций S(x) и С{х) их част- частные значения в каждой точке х бесконечной прямой равны их предельным значениям в этой точке. Если теперь мы рассмотрим сходящуюся к х после- последовательность значений аргумента, элементы которой принадлежат указан- указанному выше всюду плотному множеству точек, то соответствующие после- последовательности значений функций S(x) и С(ж), в силу сформулированного выше утверждения 2), определяются единственным образом, а поэтому и пределы этих последовательностей определяются также единственным об- образом. Но эти пределы как раз и являются частными значениями функций S{x) и С (ж) в точке х. Следовательно, функции 5 (ж) и С(х) определяются единственным образом на всей бесконечной прямой. г) Формулы D.5;)^D.7;) получены из формул D.5)-D.7) п. 6 § 5 путем замены обозначений функций sin ж и cos ж на S(x) и С(х) соответственно. ' ) Множество {ж} точек бесконечной прямой называется всюду плотным на бесконечной прямой, если в любой е-окрестности каждой точки этой прямой имеется бесконечно много точек множества {ж}.
ДОПОЛНЕНИЕ 147 1) Прежде чем перейти к доказательству непрерывности функций 5 (ж) и С(ж), установим некоторые формулы. Полагая в первых двух из соотношений D.5;) х' = ж, х" = -—х и учиты- учитывая, что 5@) = 0, G@) = 1, получим 0 = S(x) • С(-х) + С(х) - S(-x), 1 = С(х) • С(-ж) - 5(ж) • 5(-ж). l " j Умножим соотношения D.14) соответственно на S(x) и С(х) и сложим по- полученные при этом соотношения. Учитывая, что 52(ж) + О2(ж) = 1, получим С(-х) = С(х). Совершенно аналогично, умножая соотношения D.14) соответственно на С(х) и —S(x) и складывая их, получим S(—x) = —S(x). Таким образом, С(х) — четная функция, a S(x) — нечетная функция 1). Но тогда, используя первую из формул D.5;), получим S(x") = S fx'+x" и аналогично Вычитая почленно последние две формулы, получим S(x") - S(x') = 1С (^-) S (^-Тр-) ¦ D-15) Докаж:ем теперь непрерывность функций С (ж) и S(x) в любой точке ж бесконечной прямой. Заметим, что непрерывность функции S(x) в точке ж = 0 справа непосредственно вытекает из соотношения D.7;) и из равенства S@) = 0. В самом деле, если {хп} — произвольная последовательность значений аргумента, сходящаяся к нулю справа, то из соотношения 0 < < S(xn) < xn следует, что и соответствующая последовательность значений функции {S(xn)} сходится к нулю, т. е. к частному значению 5@). Из нечетности функции S(x) вытекает непрерывность этой функции в точке ж = 0 слева. Таким образом, функция S(x) непрерывна в точке ж = 0. Непрерывность S(x) в любой точке ж вытекает из соотношения D.15). В самом деле, пусть ж — любая точка бесконечной прямой, {хп} — произволь- произвольная сходящаяся к ж последовательность значений аргумента. Положив в D.15) х' = ж, х" = жте, будем иметь (^p)(^^) D.16) ) Функция /(ж), определенная на бесконечной прямой, называется нечетной^ если f(—x) = —/(ж), и четной, если f(—x) = /(ж).
148 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 В силу того, что S(x) непрерывна в нуле и S@) = 0, получим, что lim Ь ) = 0. Поскольку последовательность < С > ограни- п-ч-оо V 2 / IV2/J ченная ), правая (а стало быть, и левая) часть D.16) имеет своим пределом нуль. Но это означает, что Km S(xn) = S(x), т. е. функция S(x) непрерыв- п-->оо на в точке ж. Аналогично доказывается непрерывность функции С(х). Для этого вме- вместо D.15) нужно получить формулу 2 ) \ 2 2) Докажем, что значения функций S(x) в С (ж) определяются един™ ртг ственным ооразом в точках ——, где р — целое положительное или отри- Z цательное число, а п — целое положительное число. Отметим, что такие точки образуют всюду плотное множество точек числовой прямой. Предва- Предварительно установим некоторые свойства функций S(x) и С(х). Установим, во-первых, что эти функции периодические и имеют период 2тг 2). В самом деле, полагая в D.15) х" = ж + 2тг и х' = ж, получим S(x + 2тг) - S(x) = 2С(х + тгM(тг). Так как 5*(тг) = S* f ^ + ^ J = 2S ( — ) С ( — ) =0, то из последнего соотно- соотношения вытекает, что т. е. функция S(x) периодическая и имеет период 2тг. Отсюда, в частности, следует, что SBn) = 0. Полагая во второй формуле D.5 ) ж =жиж = 2тг и учитывая, что 5Bтг) = 0, найдем С(ж + 2тг) = С(ж)СBтг). Так как СBтг) = 1 (в этом легко убедиться, применяя формулы D.5;) сна- сначала для ж = тг/2 и ж = тг/2, а затем для ж = тг и ж = тг), то L/ уХ -f~ Z7TJ — L/ \<L J. Таким образом, периодичность С (ж) также установлена. Свойство периодичности функций S(x) и С (ж) позволяет в наших рассу- рассуждениях ограничиться сегментом [0, 2тг]. Мы установим сейчас, какие знаки имеют значения функций 5*(ж) и С (ж) в различных точках этого сегмента. Из D.6;), D.7;) и непрерывности S(ж) следует, что на сегменте [0, тг/2] значе- значения функции 5(ж) неотрицательны, причем на этом сегменте функция 5(ж) обращается в нуль только в точке ж = 0. Так как ^тг — ж) = 5(тг)G(—ж) — - G(тгM(жK) и 5(тг) = 0, С(тг) = -1, то 5(тг - ж) = S(x). Поэтому на сегменте [тг/2,тг] значения функции S(x) неотрицательны, причем на этом г) Из соотношения 52(ж) + С2{х) = 1 вытекает, что |С(ж)| ^ 1 для всех ж, Г (X + Хп\ 1 а отсюда вытекает ограниченность последовательности < G I 1 >. ) Функция /(ж) называется периодической с периодом а > 0, если для любого ж справедливо соотношение /(ж + а) = /(ж). ) Эта формула вытекает из первой формулы D.5;) и нечетности функции S(x).
ДОПОЛНЕНИЕ 149 сегменте функция S(x) обращается в нуль только в точке ж = тг. Из форму- формулы БBтг — х) = —S(x), которая может быть получена аналогично формуле ^(тг — ж) = S(x)j вытекает, что на сегменте [тт, 2тт] значения функции S(x) неположительны, причем функция S(x) обращается в нуль лишь на концах этого сегмента. Рассуждая совершенно аналогично, можно убедиться, что функция С(х) неотрицательна на сегментах [0,тг/2] и [Зтг/2, 2тг] и неполо- жительна на сегменте [тг/2, Зтг/2] и обращается в нуль только в точках тг/2 и Зтг/2. Для завершения доказательства единственности функций S(x) и С (ж) нам понадобятся некоторые формулы, к выводу которых мы и переходим. Во-первых, отметим, что из D.5;) вытекают следующие формулы 1): Полагая в этих формулах ж = ж + ж и еще раз применяя формулы D.5 ), мы и получим интересующие нас соотношения х+х \ _ 1 - С (ж )С(х ) + S(x )S(x ) 2 ) 2 2 fx'+x"\ _ l + C(x')C(x")-S(x')S(x") v 2 ; 2 Эти формулы показывают, что если известны значения функций S(x) х' + ж/; и G(ж) в точках х ж х , то значения этих функций в точке ------------- опреде- ляются единственным образом, поскольку из приведенных выше рассужде- рассуждений следует, что нам известны знаки функций S(x) и С(х) в каждой точке сегмента [0, 2тг], а следовательно, в силу их периодичности с периодом 2тг, и в любой точке х числовой прямой. Исходя из известных и единствен- единственным образом определенных значений S(x) и С(х) в точках 0, тг/2, тг, 2тг сегмента [0, 2тг], мы можем, применяя последовательно только что получен- полученные формулы, вычислить единственным образом значения этих функций во всех точках вида ртт/2п сегмента [0, 2тг] (р и п — целые неотрицательные числа, причем р ^ 2n+1). Так как множество точек вида ртг/2п плотно на сегменте [0, 2тг], то, в силу сказанного в начале доказательства единствен- единственности, функции S(x) и С(х) единственным образом определены на всей числовой прямой. 2. Доказательство существованим. Мы докажем более общее утвер- утверждение. Существуют функции S(x) и С(х), определенные и непрерывные на всей числовой прямой, удовлетворяющие требованиям: 1°. Для любых вещественных чисел ж;, х" и х выполняются соотно- соотношения S(xf + х") = S{x')C{x") + C{x')S{x"), С{х + х") = С(х')С(х") - S(x')S(x"), D.51) ) Достаточно во второй формуле D.5;) взять х = х" = ж/2, а в третьей формуле D.5;) взять ж/2 вместо ж.
150 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 2°. S(d) = 1, C(d) = 0, ^4'6 ^ где d — некоторое заданное положительное число. 3°. Существует положительное число L такое, что при 0 < х < d справедливы неравенства 0<S(x)<Lx, D.71) причем, если d = тг/2, то L = 1. Доказательство. Определим, во-первых, значения функций S(x) и С(х) на множестве {s} точек сегмента [0, с?], каждая из которых может быть представлена в виде s = —, где ржп — целые неотрицательные числа, причем р < 2П. Предварительно мы определим значения этих функций в точках sn = —¦, п = 0,1,... Так как sn+i = -^, то, используя формулы D.17), мож:но полож;ить S{sn+i) = S{ — ) =+\/ , , „, , D.18) Из соотношения C(d) = С I —^ 1 = C(so) = 0 с помощью рекуррентных формул D.18) определяются значения S(x) и С(ж) во всех точках sn = = d/2n. Дополнительно к указанным значениям S(x) и С(х) в точках sn мы определим значения этих функций в точках 0 и d так, как это указано в D.61). Перейдем теперь к определению значений S{x) и С(х) во всех точках T)d множества {s}, s = —, р и п — целые неотрицательные числа, р < 2п. Известно, что любое целое положительное число может быть единственным образом представлено в виде суммы целых степеней числа 2 ): где (ц равно либо нулю, либо единице. Поэтому pa v^ aid ^r^ 8= = 2 = 2ai Таким образом, каждое значение s представимо в виде конечной суммы чи- чисел Si, для каждого из которых значения S(si) и C(si) определены выше. Мы можем теперь, используя формулы D.5 ), определить значения S(x) )В двоичной системе счисления целое число р единственным образом представляется в виде символа, состоящего из нулей и единиц. Этот сим- символ и представляет собой краткую запись числа р в виде суммы степеней числа 2. 2)См. сноску на с. 60.
ДОПОЛНЕНИЕ 151 и С (ж) в точках множества {s}. При этом мы должны убедитвся, что по- последовательное применение этих формул приводит к одному и тому же результату независимо от способа объединения слагаемых si в группы в формуле D.19). п Например, мы можем положить s = ж + ж , где х = aisi иж = У^ ajSi, г = 2 и затем вычислить S(s) по первой формуле D.5 ). Но также можно поло- п жить х = a\S\ + «2^2 и х" = J2 aisi- Чтобы убедиться, что последова™ г=3 тельное применение формул D.51) будет давать один и тот же результат независимо от способа объединения слагаемых si в группы в сумме D.19), достаточно, чтобы имели место соотношения S[(x + х ) + х j = 5[ж + (x + ж )\ и G[(ж +ж ) + ж j = C[x + (ж +ж )J. Справедливость этих соотношений устанавливается непосредственно путем двукратного применения формул D.5 ). Убедимся теперь, что функции S(s) и C(s), определенные нами на мно- множестве {s}, обладают свойством 1° на этом множестве. Пусть s;, sl! и s'' + sl! принадлежат указанному множеству. Представим s , s и s + s в виде сумм D.19). Объединяя входящие в s и s числа sn с одинаковыми п до тех пор, пока оставшиеся sn не будут иметь различные индексы, мы придем к груп- группировке слагаемых sn, дающей представление D.19) для числа s' + s". Но выше мы показали, что результат вычисления S(s) или C(s) для суммы нескольких аргументов не зависит от способа группировки слагаемых этой суммы. Следовательно, если s;, sl! и s1 + sl! принадлежат множеству {s}, то значения S(s) и C(s), вычисленные в этих точках, удовлетворяют первым двум соотношениям D.5 ). В справедливости третьего соотношения D.5 ) для указанных значений аргумента убедиться нетрудно. В самом деле, из определения S(x) и С(х) в точках 0 и d следует, что S2@) +С2@) = 1 и S (d) + С (d) = 1. Из рекуррентных формул D.18) вытекает справедли- справедливость соотношения S2{sn) + C2(sn) = 1 для всех sn, а из непосредственно проверяемой формулы S2{x + х") + С2{х + х") = (S2(x) + C2{x')){S2{x") + С2{х")) следует справедливость соотношения S (s) + G (s) = l для всех точек мно™ ж:ества {s}. Покажем теперь, что для всех точек множества {s}, отличных от 0 и d, справедливы неравенства О < S{s) < 1, 0 < С(з) < 1 х). D.20) Доказательство справедливости неравенств D.20) проведем по индук- индукции. Для этого каждому п поставим в соответствие группу элементов мно- множества {s}, относя в эту группу все элементы {s}, которые можно предста- X)d вить в виде —¦, где 0<_р<2пир — нечетное число. Элементы этой группы )Напомним, что в точках 0 и d значения S(s) и C(s) определены форму- формулами D.61).
152 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 будут называться элементами порядка п. Каждый элемент порядка п + 1 лежит между двумя последовательными элементами, порядок которых не больше п и которые отличаются друг от друга на —, т. е. на sn. Первый элемент порядка п+1 равен sn+i. Все остальные элементы порядка п+1 мо- могут быть получены прибавлением к sn+i различных s порядка п. Вычислим значения S(si) и C(si) (si — единственное значение s порядка единицы). Имеем из D.18) S(s\) = д/1/2 и C{s\) = д/1/2. Таким образом, для эле™ ментов первой группы неравенства D.20) имеют место. Допустим теперь, что неравенства D.20) имеют место для всех элементов, порядок которых не выше п. Тогда, в силу первой формулы D.51), значения S(s) во всех точках по- порядка п + 1 положительны, а в силу третьей формулы D.5 ) эти значения не больше единицы. Полагая в первой формуле D.51) х" = d, % = —s и учитывая четность функции C(s), найдем, что C(s) = S(d — s), и поэтому для C(s) справедливы неравенства D.20) для значений s порядка п+ 1, так как, если s имеет порядок п + 1, то и d™ s также имеет порядок п + 1. По индукции отсюда следует, что для всех точек множества {s}, отличных от 0 и dj справедливы неравенства D.20). Докажем, что функции S(s) и C(s), определенные нами на множе- стве {s}, монотонны на этом множестве. Именно, покажем, что S(s) — возрастающая функция, a C(s) — убывающая функция. Пусть 0 ^ sf < i . // // / < s" < d. Тогда —-— и —-— заключены строго между нулем и d. Из формулы D.15) и из неравенств D.20) следует, что S(sff) > S(sf). Следо- Следовательно, S(s) — возрастающая функция. Из соотношения C(s) = S(d — s) следует, что C(s) — убывающая на множестве {s} функция. Докажем теперь, что функции S(s) и C(s), определенные на всюду плотном множестве {s} точек сегмента [0,с?], имеют предельное значе- значение в каждой точке сегмента [0,d]. Рассмотрим, во-первых, последовательность {sn} и покажем, что Km S(sn) = 0 и Km C(sn) = 1 (существование этих пределов следует те->оо те—>оо из монотонности и ограниченности S(s) и C(s) на множестве {s}). Для до- (t(sn)} ( . S(sn) < >, где t(sn) = —-—-. I sn J C(sn) Из D.18) имеем казательства рассмотрим последовательность 2S(sn+1)C(sn+1) = л/1-С2{зп) = S(sn) C(sn) = C2{sn+1) - S2(sn+1) < C2(sn+1). Поэтому t(sn) _ S(sn) _ 2S(sn+i)C(sn+i) _ t(sn+1) C2(sn+1) > t(sn +i) sn snC(sn) 2sn+iC(sn) sn+\ C(sn) sn+\ тж *(S«) ^ t(sn+i) t(sn) ^ A ,, Итак, ——- > — и ——- > 0 при любом гг, т. е. последовательность Sn «Sn + l ^n \ —— \ убывающая и ограниченная. По теореме 3.15 она имеет предел, I sn J который мы обозначим через L: цт *W = L. D.21) n->oo Sn
ДОПОЛНЕНИЕ 153 Так как sn —> 0 при п —> оо, то lira. t(sn) = 0, и поэтому, в силу ограничен- те—^оо ности функции C(s) (см. D.20)) lim S(sn) = lim (i(sn)C(sn)) = 0. D.22) n—>oo n—>oo Поскольку C(s) > 0, из D.22) и соотношения 52(sn) + C2(sn) = 1 вытекает, что lim C(sn) = 1. D.23) те—>оо Отметим, что из D.21) и D.23) следует, что lim v 7 = L. D.24) те^оо Sn _ ?(вта) 25(sn+i)C(sn+i) 5(sn+i) 1ак как ^—^— = ^^^^^—^^^^^— < , то последовательность ( , «те 25те+1 Sn+1 i —^г2 I ВОЗрастает> Поэтому из D.21) и D.24) имеем I sn J «те «те ИЛИ S(sn) <L-sn <t(sn). D.25) Пусть {s* } — любая сходящаяся к нулю последовательность значений s из множества {s}. Для любого п можно, очевидно, указать такой номер к, что 0 < sn < Sfc. Отсюда, в силу монотонности S(s) на множестве {«}, имеем О < S(sn) < S(sk). Поэтому из D.22) следует, что lim 5(s*) = 0. те—>оо Докажем теперь, что функция 5(s), определенная на множестве {s} ), имеет предельное значение в любой точке х сегмента [0,d]. Пусть {s'n} — монотонно возрастающая, сходящаяся к х последовательность элементов множества {s}. Так как {S(s;n)} — возрастающая ограниченная после- последовательность, то существует предел lim S(sn), который мы обозначим п—>оо через S(x). Пусть {s^} — любая сходящаяся к х последовательность эле- ментов множества {s} (s^ ф ж). Тогда последовательность < \— — > име- имеет предел нуль. Согласно доказанному lim S[ п п ) = 0. Из D.15) и те->сю \ 2 / ограниченности функции C(s) имеем lim \S(s'n) - S(sn)\ = lim С те—>оо = 0. 2 Иными словами, lim S(s'n) = S(x). В силу произвольности последова- п—->схэ тельности {s'n} это означает существование предельного значения функ- функции S(s)j определенной на {s}, в каждой точке х сегмента [0,d]: lim S(s) = S(x). s—Ух Из соотношения S (s) + G (s) = 1 и неотрицательности функции C(s) на множестве {s} следует существование предельного значения функ- функции C(s) в каж:дой точке сегмента [0, с?]. Мы будем обозначать предельное значение этой функции в точке х символом С(х). г) Напомним, что {s} — всюду плотное множество точек сегмента [0,d].
154 ПОНЯТИЕ ФУНКЦИИ. НЕПРЕРЫВНОСТЬ ГЛ. 4 Определим теперь значения функций S(x) и С(х) в любой точке х сегмента [0, с?] как предельные значения в точке х функций S{s) и C(s), определенных на множестве {s~}. Докажем, что так определенные функции S(x) и С (ж) обладают свойствами 1° и 2° утверждения, сформулированного в начале доказательства существования функций S(x) и С(х). Предвари- Предварительно установим, что определенные указанным выше способом на сегменте [О, с?] функции S(x) и С(х) монотонны и непрерывны на этом сегменте. Во™ первых, докажем, что если х — любое число из сегмента [0, с/], a s и s — любые числа из множества {s}, удовлетворяющие неравенству s < х < sff, то S(sf) < S(x) < S(s"), C(sf) > C(x) > C(sff). Установим, например, что S(sf) < S(x) (неравенства S(x) < S(sff) и C(sf) > C(x) > C{s") доказыва- доказываются аналогично). Пусть {sfn} — сходящаяся к ж, возрастающая последо- последовательность чисел множества {s}, все элементы s'n которой удовлетворяют неравенствам s < sn < х. Так как на множестве {s} функция S(s) возраста- возрастает, то последовательность {S(sn) — S(s )} возрастает и имеет положительные элементы. Поэтому предел S(x) — S(sf) х) этой последовательности положи- положителен. Таким образом, S(sf) < S(x). Докажем теперь, что функция S(x) возрастает на сегменте [0,d] (доказательство убывания функции С(х) на этом сегменте проводится аналогично). Пусть жиж — любые два числа сегмента [0, d], удовлетворяющие неравенству х1 < х". Если sf — некоторое число множества {s}, заключенное между х и ж/;, х < s < x\ то по до- доказанному S(xf) < S(s') и S(sf) < 5(ж"), т. е. S(xf) < S(x/f). Монотонность функции S(x) на [0, с?] доказана. Претсде чем перейти к доказательству непрерывности функций S(x) и С(х), установим, что предельные значе- значения функций S(s) и C(s) в точках множества {s} совпадают со значени- значениями этих функций в соответствующих точках множества {s}. Рассмотрим произвольное число s множества {¦§} и две сходящиеся к s последовательности {sfn} и {s^} элементов множества {s} таких, что sn < < s < s'n. В силу монотонности функции S{s) на множестве {s} справедли- справедливы неравенства S(sfn) < S(s) < S(s'n) 2). Так как lim S(sfn) = lim S(s'n) и n—>oo n—>oo указанные пределы равны предельному значению в точке s функции S(s), то только что сформулированное утверждение доказано. Убедимся теперь, что функции S(x) и С(х) непрерывны в каждой точке сегмента [0, d]. Для этого достаточно установить, что эти функции непрерывны в каждой точ- точке ж указанного сегмента слева и справа, непрерывны справа в точке 0 и непрерывны слева в точке d (см. замечание в п. 1 § 3). Докажем ради опре- определенности непрерывность функции S(x) в точке ж сегмента [0, с?] слева (непрерывность справа и непрерывность С(х) доказывается аналогично). Пусть {s^} — некоторая сходящаяся к ж слева последовательность чисел множества {s}. Так как lim S(sfk) = 5(ж), то для любого е > 0 можно ука™ fc--»OG зать элемент s'k этой последовательности, для которого 0 < S{x) — S{s'k) < < s. Рассмотрим теперь произвольную сходящуюся к ж слева последова- последовательность {жп}. Пусть N — номер, начиная с которого выполняются неравенства sk < < хп < х. В силу возрастания функции при п ^ N выполняются неравен- г) Поскольку lim S(sfn) = S(ж), a S(sf) - фиксированное число, то lim [S(sfn) - S(sf)]*=S(x) - S(sf). n—>oo 2) Ради определенности мы доказываем это утверждение для функ- функции S(x).
ДОПОЛНЕНИЕ 155 ства S(s'k) < S(xn) < S(x). Сопоставляя их с неравенствами 0 < S(x) — ~~ S(sfk) < е, получим, что при п ^ N справедливы неравенства 0 < S(x) — — S{xn) < е. Иными словами, предельное значение функции S(x) в точке х слева равно частному ее значению в этой точке. Таким образом, непрерыв- непрерывность S(ж) в точке х слева доказана. Определим теперь функции S(x) и С(х) на сегменте [с?, 2с?] с помощью соотношений S(x + с?) = С(х) и С(х + d) = —S(x). Применяя эти формулы еще раз, распространим эти функции на сегмент [ 2с?, 4с?]. Повторяя эти рас- рассуждения, мы определим эти функции для всех положительных значений х. Для отрицательных значений х мы определим эти функции с помощью соотношений S(x) = —S(—x) и С{х) = С(—х). Легко убедиться, что в ре- результате мы получим функции, непрерывные на всей бесконечной прямой. Докажем, что функции S(x) и С(х) удовлетворяют требованиям 1°, 2° и 3° утверждения, сформулированного в начале доказательства существо- существования. Заметим, что если s , s , s + s и s принадлежат множеству {s} сегмента[О,с?], то для этих значений аргумента формулы D.51) имеют ме- место. Из указанного выше способа продолжения функций S(x) и С(х) следует справедливость этих формул для значений аргумента с? + s', s", где s' и s" принадлежат сегменту [0, с?]. Повторяя эти рассуждения, мы докажем, что соотношения D.51) справедливы для всех значений аргумента бесконечной прямой вида pd/2n, где ршп — любые целые числа. Так как эти значения ар™ гумента образуют всюду плотное множество точек бесконечной прямой ), то, в силу непрерывности функций S(x) и С(х), соотношения D.51) будут справедливы для всех значений х. Поскольку требование 2° выполнено в результате построения функций S(x) и С(ж), остается убедиться в справедливости требования 3°. Отметим, что если s;, s" и s1 + s" — элементы множества {s} сегмента [0, с?] и спра- справедливы неравенства 0 < S(V) < Ls' и 0 < S{s") < Ls", то, в силу первой формулы D.5 ) и неравенств D.20), выполняются также неравенства 0 < < S(sf + sff) < Ls' + Ls1' = L(s' + s"). Используя это замечание, формулу D.19) и неравенства D.20) и D.25), легко убедиться, что неравенства 0 < < S(s) < Ls справедливы для всех s из множества {s} сегмента [Q,cf]. Так как это множество всюду плотно на [0, с?], a S(x) — непрерывная функция, то для всех х из [0,с?] имеют вместо неравенства 0 < S(x) < Lx. Справед- Справедливость требования 3° установлена. Заметим теперь, что число L зависит от выбора d. Именно, если вместо d выбрать число d* = d/k, то тогда s^ = sn/k. По построению S(sn) :=: S(sn), и поэтому Ит ^^ = lim k^^- = kL (см. D.24)). Выбирая k = 1/L, п-^оо Sn n-^oo Sn мы определим на сегменте [0, с?*] такие функции S(x) и С(х), что будут выполняться неравенства 0 < S(x) < х. Геометрические соображения показывают, что если d = тг/2, то 2S(sn) — длина стороны правильного 2п-угольника, вписанного в окружность ради- радиуса 1, 2sn — длина дуги окружности, стягиваемой хордой длины 2S(sn), и 2t(sn) — длина стороны правильного 2п-угольника, описанного вокруг этой окружности. Неравенства D.25) в этом случае имеют вид S(sn) < < sn < t(sn). Поэтому в указанном случае L = 1. Утверждение полностью доказано. 1) См. сноску 2) на с. 146.
ГЛАВА 5 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ В этой главе вводятся понятия производной и дифференциа- дифференциала, устанавливаются правила дифференцирования, вычисляют™ ся производные всех простейших элементарных функций, уже выписанные нами в гл. 1. Далее рассматриваются производные и дифференциалы высших порядков. § 1. Производная. Ее физическам и геометрическая интерпретация 1. Приращение аргумента и функции. Разностная форма условия непрерывности. Пусть функция у = /(ж) определена на некотором интервале1) (а,Ь). Фиксируем любое значение ж из указанного интервала и зададим аргументу в точ- точке ж произвольное приращение Ах такое, что значение х + Ах также принадлежит интервалу (а, Ъ). Приращением функции у = f(x) в точке ж, соответствующим приращению аргумента Дж, назовем число Ay = f(x + Ax)-f(x). E.1) Так, для функции у = sin ж приращение в точке ж5 соответ- соответствующее приращению аргумента Аж, равно (Д, гр \ Д, гр х + — 1 sin —. E.2) Z у Z Имеет место следующее утверждение: для того чтобы ция у = /(ж) являлась непрерывной в точке ж, необходимо и достаточно^ чтобы приращение Ау этой функции в точке ж, ) Вместо интервала (а,Ь) можно рассматривать сегмент [а, Ь], полупря- полупрямую, всю бесконечную прямую и вообще любое плотное в себе множество {ж}. Определение плотного в себе множества {ж} дано в § 3 гл. 2.
ПРОИЗВОДНАЯ 157 соответствующее приращению аргумента Дж, являлось беско- бесконечно малым при Ах —>> 0. В самом деле, по определению, функция у = /(ж) непрерывна в точке ж, если существует предельное значение f(x). E.3) В силу п. 3 § 2 гл. 4 существование предельного значения E.3) эквивалентно тому, что функция [f(x+Ax) — f(x)] аргумента Ах является бесконечно малой при Ах —>> 0. Доказанное утверждение позволяет выразить условие непре™ рывности функции у = f(x) в точке х в новой форме, а именно: функция у = }'{х) непрерывна в точке ж, если приращение Ау этой функции в точке ж, соответствующее приращению аргу- аргумента Аж, является бесконечно малым при Ах —>• 0, т. е. если lim Ay = lim [/(ж + Аж) - /(ж)] = 0. E.4) Дж^О Дж^О Условие E.4) мы и будем называть разностной формой условия непрерывности функции у = /(ж) в точке ж. Это условие мы будем неоднократно использовать в дальнейшем. С помощью условия E.4) еще раз убедимся в том, что функ™ ция у = sin ж непрерывна в любой точке ж бесконечной прямой. В самом деле, из формулы E.2), из условия и из равенства lim sin-— = 0 непосредственно вытекает, что lim Ay = 0. Ах cos (ж + — V ^ 2. Определение производной. Сохраним для функции у = /(ж) предположения и обозначения, сформулированные в начале предыдущего пункта. Считая, что Аж ф 0 рассмотрим в данной фиксированной точке ж отношение приращения Ау функции в этой точке к со™ ответствующему приращению аргумента Аж Ay _ fjx + Ах) - /Qc) f, ,, А^ " А^ • E*5) Отношение E.5) будем называть разностным отношением (в данной точке ж). Поскольку значение ж мы считаем фиксиро- ванным^ разностное отношение E.5) представляет собой функ- функцию аргумента Аж. Эта функция определена для всех значе™ ний аргумента Аж, принадлежащих некоторой достаточно ма- малой окрестности точки Аж = 0, за исключением самой точки Аж = 0. Таким образом, мы имеем право рассматривать вопрос о существовании предела указанной функции при Аж —>• 0. Определение. Производной функции у = /(ж) в данной фиксированной точке ж называется предел при Ах —>> 0
158 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 разностного отношения E.5) (при условии, что этот предел существует). Производную функции у = f(x) в точке х будем обозначать символом у1 (х) или f'(x). Итак, по определению, ?i ( \ т А г/ 1. /(ж + Аж) —/(ж) (г г\ f (х) = lim -т-^ = lim — ^——^. E.6) Отметим, что если функция у = f(x) определена и имеет произ- производную для всех х из интервала (а, Ь), то эта производная будет представлять собой некоторую функцию переменной ж, также определенную на интервале (а, Ь). 3. Производная с физической точки зрения. Понятие производной мы ввели, исходя из физических соображений, еще в гл. 1. Здесь мы еще раз остановимся на физических приложе- приложениях понятия производной. Прежде всего, предположим, что функция у = f(x) описы- описывает закон движения материальной точки по прямой линии (т. е. зависимость пути у, пройденного точкой от начала отсче- отсчета, от времени х). Тогда, как известно, разностное отношение E.5) определяет среднюю скорость точки за промежуток вре™ мени от х до х + Ах. В таком случае производная /;(ж), т. е. предел разностного отношения E.5) при Ах —>• 0, определяет мгновенную скорость точки в момент времени х. Итак, про- производная функции, описывающей закон движения, определяет мгновенную скорость точки. Чтобы не создалось представление о том, что понятие про- производной широко используется только в механике, приведем примеры приложения понятия производной из других разделов физики. Пусть функция у = f(x) определяет количество электриче- электричества у, протекшего через поперечное сечение проводника за вре- время х. (При этом момент времени х = 0 берется за начало отсче- отсчета.) В таком случае производная ff(x) будет определять силу тока^ проходящего через поперечное сечение проводника в мо- момент времени х. Рассмотрим, далее, процесс нагревания некоторого тела. Предположим, что функция у = f(x) определяет количество тепла1) у, которое нужно сообщить телу для нагревания это™ го тела от 0 до х°. Тогда, как известно из курса элементарной физики, разностное отношение E.5) определяет среднюю теп- лоемкость тела при нагревании его от х° до (х + Ах)°. В таком случае производная /;(ж), т. е. предельное значение разностного отношения E.5) при Аж —)> 0, определяет теплоемкость тела Выраженное, например, в калориях.
ПРОИЗВОДНАЯ 159 при данной температуре ж. Подчеркнем, что эта теплоемкость, вообще говоря, меняется с изменением температуры ж. Мы рассмотрели примеры приложения понятия производной в трех разных областях физики. При изучении курса общей фи™ зики читатель встретится с другими многочисленными приме- примерами приложения понятия производной. 4. Производная с геометрической точки зреним. В § 2 гл. 1 мы рассматривали задачу о нахождении касательной к кривой, являющейся графиком функции у = f(x) (на некото™ ром интервале (а,Ь)). Там мы дали определение касательной к указанной кривой в точке M(x,f(x)) этой кривой. (Здесь х — некоторое значение аргумента из интервала (а, Ь); см. рис. 5.1.) Если через Ах обозначить произвольное приращение аргумен™ та, а символом Р обозначить точку на кривой с координатами (х + Дж, f(x + Дж)), то ка™ сательную, проходящую че- через точку М данной кривой, мы определяем как предель- предельное положение секущей МР при Дж^О. Из рис. 5.1 ясно, что угловой коэффициент се™ кущей МР (т. е. тангенс угла наклона этой секущей к оси Ох) равен разностному отно- отношению E.5). Из этого факта У >f(x+Ax)-f(x) О а ф(Ах) х x+Axb x Рис. 5.1 и из того, что в пределе при Дж^О угол наклона секущей должен переходить в угол на- наклона касательной, мы в § 2 гл. 1 сделали основанный на на- наглядных соображениях вывод о том, что производная /;(ж) рав- равна угловому коэффициенту касательной в точке М к графику функции у = /(ж). В настоящем пункте мы уточним указанные наглядные со- соображения. Предположив, что функция у = /(ж) имеет произ™ водную в данной точке ж, мы докажем: 1) что график функции у = f(x) имеет касательную в данной точке Ж(ж,/(ж)), 2) что угловой коэффициент указанной касательной равен /;(ж). Будем доказывать утверждения 1) и 2) одновременно. Обо- Обозначим угол наклона секущей МР к оси Ох символом (р(Ах). Поскольку угловой коэффициент секущей МР (т. е. tgip(Ax)) равен отношению Ay то <р(Ах) = arctg E.7) при любом достаточно малом Дж, отличном от нуля. Из суще™ ствования производной /;(ж), т. е. из существования предель™
160 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 ного значения lim -т-^ = ff(x) и из непрерывности функции А^О Ах и= arctg х для всех значений аргумента вытекает существование предельного значения функции E.7) в точке Ах = 0 и равенство lim ш(Ах) = lim arctg-^ = arctg/'(ж). E.8) Аж^О Аж^О Ах Равенство E.8) доказывает существование предельного значе- значения (при Ах —>> 0) угла наклона секущей МР, т. е. доказывает существование касательной к точке М. Кроме того, из равенства E.8) вытекает, что если обозначить угол наклона касательной через ср0, то щ = arctg/'(ж), т. е. tg^0 = f(x). 5. Правам и левая производные. В полной аналогии с по- понятиями правого и левого предельных значений функции вво- вводятся понятия правой и левой производных функции у = f(x) (в данной точке х). Определение. Правой (левой) произ- производной функции у = f(x) в данной фиксированной точ~ ке х называется правое (левое) предельное значение разностного отношения E.5) в точке Ах = 0 (при условии, что это пре- предельное значение существует). Правую производную функции у = f(x) в точке х обычно обозначают символом /;(ж+0), а левую производную в точке х — символом ff(x — 0). Если функция у = f(x) имеет в точке х производную , то она имеет в этой точке и правую^ и левую производные^ совпа- совпадающие между собой. Если функция у = f(x) имеет в точке х и правую^ и левую производные и если указанные производные совпадают между собой^ то функция у = f(x) имеет в точке х производную1). Вместе с тем существуют функции, имеющие в данной точке х и правую, и левую производные, но не имеющие производной в этой точке. Примером такой функции может слу- служить функция „, ч I +ж, если х ^ 0, f(x) = \x\ = ( I —ж, если х < и. Эта функция имеет в точке х = 0 правую производную, равную т Ах 1 ,. -Ах 1 lim -— = 1, и левую производную, равную lim —А—= — 1, Ах J F J ' F J Аж^О^О Ах но не имеет в точке х = 0 производной. 6. Понятие производной векторной функции. В математическом анализе и его приложениях часто встречаются понятия векторной функции и ее производной. ) Это утверждение следует из соответствующего утверждения для право- правого и левого предельных значений функции (см. замечание из п. 1 § 2 гл. 4).
ПРОИЗВОДНАЯ 161 Если каждому значению переменной t из некоторого множества {t} ставится в соответствие по известному закону определенный вектор а, то говорят^ что на множестве {t} задана векторная функция а = a(t). Так как каждый вектор а в заданной декартовой прямоугольной систе- системе однозначно определяется тремя координатами ж, у и z, то задание век- векторной функции а = a(t) эквивалентно заданию трех скалярных функций х = x(t), у = y(t) и z = z(t). Понятие векторной функции становится особенно наглядным, если обратиться к так называемому годографу этой функции. Годографом называется геометрическое место концов всех векторов a(t), приложенных к началу координат О. Кривая L на рис. 5.2 предста- представляет собой годограф векторной функции а = a(t). Понятие годографа векторной функции представляет собой обобщение понятия графика скалярной функции. Введем понятие производной вектор™ ной функции a(t) в данной фиксирован- фиксированной точке t. Для этой цели придадим аргументу t произвольное приращение At / 0 и рассмотрим вектор Аа = a(t + + At) — a(t) (на рис. 5.2 указанный век- вектор совпадает с вектором МР). Умножив указанный вектор на число I/At, мы по- получим новый вектор М E.5* У Рис. 5.2 коллинеарный прежнему. Вектор E.5 ) является аналогом разностного отноше- отношения E.5). Отметим, что вектор E.5 ) представляет собой среднюю скорость изменения векторной функции на сегменте [t,t + At]. Производной векторной функции а = a(t) в данной фиксированной точ- точке t называется предел при At —»¦ 0 разностного отношения E.5*). Производная векторной функции a(t) обозначается символом a;(t) или da/dt. Из геометрических соображений очевидно, что производная векторной функции а = a(t) представляет собой вектор, касательный к годографу этой функции. Так как координаты разностного отношения E.5 ) соответственно равны x(t + At) - x(t) y(t + At) - y(t) z(t + At) - z(t) At At At то ясно, что координаты производной a;(t) равны производным функций х''(?), |/(t), z'(t). Таким образом, вычисление производной векторной функ- функции сводится к вычислению производных ее координат. Замечание 1. Так как векторная функция а = a(t) определяет закон движения материальной точки по кривой L, представляющей собой годограф этой функции, то производная a;(t) равна скорости движения по указанной кривой. Замечание 2. Из курса аналитической геометрии известны раз- различные типы произведений векторов (скалярное произведение, векторное 6 В.А. Ильин, Э.Г. Позняк, часть I
162 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 произведение и смешанное произведение). Выражение всех этих произведе- произведений в координатах дает возможность указать правила, по которым вычис- вычисляются производные соответствующих произведений векторных функций. В качестве примера приведем правило вычисления производной скалярного произведения двух векторных функций a(t) = {ai(t),a2(t),as(t)} и b(t) = {b()b()&()} Mt)h(t)}f = a!(t)h(t) + a(*)b'(t) = K(i)b!(t) + af2(t)b2(t) + + a'3(t)b3(t)} + {cuity'^t) + a2{t%{t) Аналогичное правило справедливо и для векторного произведения двух векторных функций: [a(t)h(t)]f = [af § 2. Понмтме дифференцируемости функции 1. Понмтие дифференцируемости функции в данной точке. Пусть, как и в пп. 1, 2 предыдущего параграфа, функ- функция у = f(x) определена на некотором интервале (а, Ь), симво- символом ж обозначено некоторое фиксированное значение аргумента из указанного интервала, а символом Ах обозначено любое при- приращение аргумента, такое, что значение аргумента ж + Ах также принадлежит (а, Ь). Определение. Функция у = f(x) называется диффе- дифференцируемой в данной точке ж, если приращение Ау этой функции в точке ж, соответствующее приращению аргумента Дж, моэюет быть представлено в виде Ау = ААх + оДж, E.9) где А — некоторое число^ не зависящее от Аж, а а — функция аргумента Аж, являющаяся бесконечно малой при Ах —> 0. Заметим, что функция а(Ах) может принимать в точке Аж = = 0 какое угодно значение (при этом в этой точке остается спра- справедливым представление E.9)). Ради определенности молено по- положить а@) = О1). Так как произведение двух бесконечно малых аАх является бесконечно малой более высокого порядка, чем Аж (см. п. 3 § 2 гл. 4), т. е. аАж = о(Аж), то формулу E.9) можно переписать в виде Ау = у4Дж + о(Дж). Теорема 5.1. Для того чтобы функция у = /(ж) являлась дифференцируемой в данной точке ж, необходимо и достаточно, чтобы она имела в этой точке конечную производную. ) При этом частное значение функции а(Аж) в точке Аж = 0 будет совпадать с ее предельным значением в этой точке.
§ 2 ПОНЯТИЕ ДИФФЕРЕНЦИРУЕМОСТИ ФУНКЦИИ 163 Доказательство. 1) Необходимость. Пусть функция у = f(x) дифференцируема в данной точке ж, т. е. ее приращение Ау в этой точке представимо в виде E.9). Предположив, что Ах / 0 и поделив равенство E.9) на Дж, получим ^| = А + а. E.10) Из равенства E.10) вытекает существование производной, т. е. предельного значения lim -r^- = А. 2) Достаточность. Пусть функция у = f(x) имеет в данной точке х конечную производную, т. е. существует пре- предельное значение lim *У = /'(дЛ E.11) В силу определения предельного значения функция а = -г-^ — ^ff(x) аргумента Ах является бесконечно малой при Ах —>• 0, т. е. Ay = ff(x)Ax + «Дж, E.12) где lim а = 0. Представление E.12) совпадает с представле» Аж^О нием E.9), если обозначить через А не зависящее от Ах число ff(x). Тем самым доказано, что функция у = f(x) дифференци- дифференцируема в точке х. Доказанная теорема позволяет нам в дальнейшем отожде- отождествлять понятие дифференцируемости функции в данной точке с понятием существования у функции в данной точке производной. Операцию нахождения производной в дальнейшем догово™ римся называть дифференцированием. 2. Свмзь между понятиями дифференцируемости и непрерывности функции. Имеет место следующее элемен™ тарное утверждение. Теорема 5.2. Если функция у = f(x) дифференцируема в данной точке ж, то она и непрерывна в этой точке. Доказательство. Так как функция у = f(x) диффе™ ренцируема в точке ж, то ее приращение Ау в этой точке может быть представлено в виде E.9). Но из формулы E.9) вытекает, что lim Ay = 0, т. е. функция у = fix) непрерывна в точке х в силу разностной формы условия непрерывности (см. п. 1 § 1). Теорема доказана. Естественно, возникает вопрос о том, справедливо ли утвер- утверждение, обратное теореме 5.2, т. е. вытекает ли из непрерыв™ ности функции в данной точке ее дифференцируемость в этой
164 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 точке. На этот вопрос следует дать отрицательный ответ, ибо существуют функции непрерывные в некоторой точке, но не яв™ ляющиеся в этой точке дифференцируемыми. Примером такой функции может служить функция у = |ж|. Очевидно, что эта функция непрерывна в точке ж = 0, но она (как показано в конце п. 5 § 1) не является дифференцируемой в этой точке. Отметим, что существуют непрерывные на некотором сегменте функции, не имеющие производной ни в одной точке этого сегмента1). 3. Понмтие дифференциала функции. Пусть функция у = /(ж) дифференцируема в точке ж, т. е. приращение Ау этой функции в точке ж может быть записано в виде E.9). Ана- Анализируя формулу E.9), мы приходим к выводу, что прираще- приращение Ау дифференцируемой функции представляет собой сумму двух слагаемых: первое из этих слагаемых ААх при А ф 0 пред- представляет собой функцию приращения аргумента Дж, линейную и однородную2) относительно Ах; это слагаемое представляет собой при Ах —> 0 бесконечно малую такого эюе порядка, что и Ах; второе слагаемое аДж представляет собой при Аж —>> О бесконечно малую более высокого порядка^ чем Аж, так как от- отношение —-— = а стремится к нулю при Аж —>> 0. Таким обра™ зом, при А ф 0 первое слагаемое ААх является главной частью приращения дифференцируемой функции. Эту главную часть приращения называют дифференциалом функции в точке ж, со- соответствующим приращению аргумента Аж. Итак, в случае А ф 0 дифференциалом функции у = /(ж) в данной точке ж, соответствующим приращению аргумента Аж, называют главную линейную относительно Ах часть при- приращения этой функции в точке ж. Принято обозначать диффе- дифференциал функции у = /(ж) символом dy. Если для приращения функции Ау справедливо представление E.9), то дифференциал этой функции, по определению, равен dy = ААх. E.13) В случае А = 0 слагаемое ААх перестает быть главной частью приращения Ау дифференцируемой функции (ибо это слагае- слагаемое равно нулю в то время, как слагаемое аДж, вообще говоря, отлично от нуля). Однако договариваются и в случае А = 0 ) Первый опубликованный пример такой функции принадлежит Вейер™ штрассу. Ранее независимо от него аналогичный пример был построен чеш- чешским математиком Больцано, но этот пример не был опубликован. В До- Дополнении к гл. 11 будет указан пример такой функции. ' ) Напомним, что линейной функцией аргумента х называется функция вида у = Ах + В, где А и В — некоторые постоянные. В случае В = 0 линейная функция называется однородной.
ПОНЯТИЕ ДИФФЕРЕНЦИРУЕМОСТИ ФУНКЦИИ 165 У1 0 F /А -А X Ах N х^Ах х определять дифференциал функции формулой E.13), т. е. счи™ тают, что он равен нулю в этом случае. Если учесть теорему 5.1, т. е. учесть, что А = /;(ж), то фор™ мулу E.13) можно переписать в виде dy = f'(x)Ax. E.14) Формула E.14) дает выражение дифференциала функции в точ- ке ж, соответствующего приращению аргумента Ах. Следует подчеркнуть, что дифференциал функции dy в данной точке ж, вообще говоря, не равен прираще- приращению функции Ау в этой точке. Это особенно легко уяснить из рассмо- рассмотрения графика функции у = f(x) (рис. 5.3). Пусть точка М на кри- кривой у = f(x) соответствует зна™ чению аргумента ж, точка Р на той же кривой соответствует зна™ чению аргумента х + Дж, MS — касательная к кривой у = /(ж) в точке М. Пусть далее MN || Ож, PJV || Of/, Q — точка пересечения касательной MS с прямой PN. То- Тогда приращение функции Ау рав- равно величине отрезка NP. В то же время из прямоугольного тре- треугольника MQN и из формулы E.14) ясно, что дифференциал функции dy равен величине отрезка NQ, ибо величина отрезка MN равна Аж, а тангенс угла AQMN равен /;(ж). Очевидно, что величины отрезков NP и NQ, вообще говоря, различны. В заключение этого пункта мы установим выражение для дифференциала функции у = /(ж), аргумент ж которой явля- является независимой переменной1). Введем понятие дифференциала dx независимой перемен- переменной х. Под дифференциалом dx независимой переменной ж мож- можно понимать любое (не зависящее от ж) число. Договоримся в дальнейшем брать это число равным приращению Аж независи- независимой переменной2). Эта договоренность позволяет нам перепи- переписать формулу E.14) в виде dy = f'(x)dx. E.15) Подчеркнем, что формула E.15) пока что установлена нами лишь для случая, когда аргумент ж является независимой пе- Рис. 5.3 ) Подчеркнем, что аргумент х функции у = /(ж), вообще говоря, сам может являться функцией некоторой переменной. ) Эта договоренность оправдывается рассмотрением независимой пере- переменной х как функции вида у = ж, для которой dy = dx = Аж.
166 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 ременной. Однако ниже, в § 9, мы докажем, что формула E.15) остается справедливой и для случая, когда аргумент х не явля- является независимой переменной, а сам представляет собой диффе- дифференцируемую функцию некоторой новой переменной. Пока что мы можем сделать следующий вывод из формулы E.15): для случая, когда аргумент х функции у = f(x) является независимой переменной, производная ff(x) этой функции рав- равна отношению дифференциала функции dy к дифференциалу аргумента dx, т. е. f'(x) = dy/dx. В § 9 будет доказано, что это соотношение справедливо и в слу- случае, когда аргумент х сам является дифференцируемой функ- функцией некоторой новой переменной. § 3. Правила дифференцирования суммы, разности, произведения и частного Теорема 5.8. Если каждая из функций и(х) и v(x) ференцируема в данной точке х1 то сумма^ разность, произ- ведение и частное этих функций (частное при условии^ что v(x) Ф 0) также дифференцируемы в этой точке^ причем име- имеют место формулы [и(х) ± v(x)]' = и{х) ± v'{x), [u(x)v(x)]f = uf(x)v(x) + u(x)v'(x), E.16) [и(х)У и (x)v(x) — u(x)vf(x) v(x) J v'2(x) Доказательство. Рассмотрим отдельно случаи суммы (разности), произведения и частного. 1°. Пусть у(х) = и(х) ± v(x). Обозначим символами Аи, Av и Ау приращения функций и (ж), v(x) и у (х) в данной точке ж, соответствующие приращению аргумента Ах. Тогда, очевидно, Ау = у(х + Ах) — у(х) = = [и(х + Ах) ± v(x + Ах)] - [и(х) ± v(x)} = = [и(х + Ах) — и(х)] =Ь [v(x + Ах) — v(x)] = Аи ± Av. Таким образом, при Ах ф 0 Ау _ Аи , Av /r 1?ч Пусть теперь Ах —>• 0. Тогда в силу существования производных функций и(х) и v(x) в точке х существует предельное значение правой части E.17), равное u/(x)±v/(x). Стало быть, существует предельное значение (при Ах —>> 0) и левой части E.17). По
§ 3 ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 167 определению производной указанное предельное значение равно у'(ж), и мы приходим к требуемому равенству yf(x) = и(х) ± v(x). 2°. Пусть далее у(х) = u(x)v(x). Сохраняя за Дк, Av и Ау тот же смысл, что и выше, будем иметь Ау = у(х + Ах) — у{х) = и(х + Ax)v(x + Ах) — u(x)v(x) = = [и(х + Ax)v(x + Дж) — и(х + Дж)'у(ж)] + + [и(х + Дж)-у(ж) — u(x)v(x)] (мы прибавили и вычли слагаемое и{х + Ax)v(x)). Далее можем записать: Ау = и(х + Ax)[v(x + Дж) - г;(ж)] + v(x)[u(x + Дж) - и(х)} = = к(ж + Аж)А/у + v(x)Au. Таким образом, при Аж ф О g ? + v{x)g;. E.18) Пусть теперь Аж —>• 0. Тогда в силу дифференцируемости функ- функций и(х) и г; (ж) в точке ж существуют предельные значения от- u Аи, Аг; i / \ § / \ -рг ношении ~— и ——, соответственно равные и (ж) и г? (ж). Далее из дифференцируемости и(х) в точке ж, в силу теоремы 5.2, еле™ дует непрерывность и(х) в этой точке. Стало быть, существует предельное значение lim и(х + Аж), равное и(х). Таким обра- зом, существует предельное значение правой части E.18) при Аж —>• 0, равное u(x)vf(x) + v(x)uf(x). Стало быть, существу- существует предельное значение (при Аж —> 0) и левой части E.18). По определению производной указанное предельное значение равно у'{хI и мы приходим к требуемой формуле yf(x) = u(x)v(x) + u(x)vf (х). 3°. Пусть, наконец, у(х) = -^Ц-. Тогда1) л / , д \ / \ и Ау = у(х + Ах) - у{х) = и(х) = и(х + Ax)v(x) — v(x + Ах)и(х) v(x)v(x + Аж) ) Так как в дальнейшем в знаменателе фигурирует значение v(x + Аж), то следует доказать, что это значение отлично от нуля для всех достаточно малых Аж. В самом деле, если бы это было не так, то нашлась бы беско- бесконечно малая последовательность значений Ажте такая, что v(x + Ажте) = 0. Но поскольку функция v(x) непрерывна для значения аргумента ж, то мы получили бы из условия v(x + Ажте) = 0, что v(x) = 0, а это противоречит условию теоремы.
168 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 Добавляя и вычитая в числителе слагаемое u(x)v{x), будем иметь: д [и(х + Ax)v(x) — u(x)v(x)} — [v(x + Ах)и(х) — u(x)v(x)] v(x)v(x + Ax) v(x)[u(x + Ax) — u(x)] — u(x)[v(x + Ax) — v(x)] v(x)Au — u(x)Av v(x)v(x + Ax) v(x)v(x + Ax) Таким образом, при Ax ф О / , Аи ( ,Av ^У _ Ах А^ /5 j_g\ Ах v(x)v(x + Ах) ' V • / Пусть теперь Аж —> 0. В силу дифференцируемости (и выте- вытекающей из нее непрерывности) функций и(х) и v(x) в точке х существуют предельные значения т Аи // \ т Av // \ т / . д \ / \ иш -^ = и (ж), Iim -— = v (ж), lim г;(ж + Ах) = г?(ж). Таким образом, поскольку v(x) Ф 0, существует предельное зна™ чение при Ах —>> 0 правой части E.19), равное Стало быть, существует предельное значение (при Ах —>- 0) и левой части E.19). По определению производной указанное пре- предельное значение равно |/(ж), и мы получим требуемую формулу #/ ч _ u(x)v(x)-vf(x)u(x) У {Х) - vHx) Теорема 5.3 полностью доказана. § 4. Вычисление производных степенной функции, тригонометрических функций и логарифмической функции В этом параграфе мы приступим к вычислению производных простейших элементарных функций. 1. Производная степенной функции с целочисленным показателем. Начнем с вычисления производной степенной функции у = хп1 показатель п которой является целым положи- положительным числом1). Случай степенной функции, показатель ко- которой является любым вещественным (не обязательно целым) числом^ отложим до § 8. ) Эта производная уже рассматривалась в гл. 1 с помощью интуитивного представления о пределе.
§ 4 ВЫЧИСЛЕНИЕ ПРОИЗВОДНЫХ 169 Используя формулу бинома Ньютона, можем записать: Ау = (х + Ах)п - хп = = [жта + пхп~хАх + п{п~1]хп-2{АхJ + ... + (Аж)п] - хп = = nxn-lAx + ^LzHxn-2(Axf + ... + (Дж)п. Таким образом, при Ах ф О Д| 1 !^112 ... + (Аж)". E.20) Поскольку все слагаемые в правой части E.20), начиная со вто- рого, содержат в качестве множителя Ах в положительных сте- степенях, существует предельное значение указанных слагаемых при Ах —>• 0, равное нулю. Первое слагаемое в правой части E.20) от Ах не зависит. Стало быть, существует предельное значение (при Ах —> 0) правой части E.20), равное пхп~1. По определению производной указанное предельное значение равно производной функции у = хп ^ т. е. {хпУ = пхп-\ Проведенные рассуждения справедливы для любой точки х бесконечной прямой. 2. Производная функции у = sin ж. Пользуясь формулой приведения разности синусов к виду, удобному для логарифми- логарифмирования, можем записать: Ay = sin (х + Ах) — sin х = 2 cos f x + -^- j sin Таким образом, при Ах ф 0 Ах 2 Так как функция у cos ж является непрерывной в любой точке х бесконечной прямой1), то существует предельное значение lim cos I x + — I = cos x. E.22) Далее, в силу основного результата п. 2 § 6 гл. 4, существует предельное значение . Ах sin — lim ^2 = L E^23) ) Это доказано в п. 6 § 5 гл. 4. Впрочем, непрерывность функции г/ = cos x легко доказать, используя разностную форму условия непрерывности.
170 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 Таким образом, существует предельное значение (при Ах —> 0) правой части E.21), равное произведению предельных значений E.22) и E.23), т. е. равное cos ж. По определению производной указанное предельное значение равно производной функции у = = sin ж, т. е. (sin ж)' = cos ж. Проведенные рассуждения справедливы для любой точки ж бес- бесконечной прямой. 3. Производная функции у = cos ж. Пользуясь формулой приведения разности косинусов к виду, удобному для логариф- логарифмирования, можем записать: Ay = cos(x + Ах) — cos ж = —2 sin (х + -?- J sin-^. Таким образом, при Ах ф 0 E-24> 2 Так как функция у = sin ж является непрерывной в любой точке ж бесконечной прямой, то существует предельное значе™ ние ж + — = sin ж. E.25) . _ 2 / Из существования предельных значений E.23) и E.25) вытека- вытекает существование предельного значения (при Ах —)> 0) правой части E.24), равного (—sinж). По определению производной по™ следнее предельное значение равно производной функции у = = cos ж, т. е. (cos ж)' = — sin ж. Проведенные рассуждения справедливы для любой точки ж бес- бесконечной прямой. 4. Производные функций у = tgx и у = ctgx. Так как нами уже вычислены производные функций у = sin ж и у = cos ж и так как cos ж ° sin ж то для вычисления производных функций у = tg ж и у = ctg ж молено воспользоваться теоремой 5.3 (точнее, формулой, выра- выражающей производную частного, т. е. третьей из формул E.16)). Мы получим, что всюду, кроме тех точек, в которых cos ж = = о, /, у (виажУ cos ж — (совж)' sin ж 1 I Tig Ж J — — —.
§ 5 ТЕОРЕМА О ПРОИЗВОДНОЙ ОБРАТНОЙ ФУНКЦИИ 171 Итак, COSZ Ж (для всех значений ж, кроме ж = — + тгп, где п = 0, ±1,...). Аналогично всюду, кроме тех точек, в которых sin ж = О, / . у (cos ж)' sin ж — (sin ж)' cos ж 1 sin ж sin ж Итак, (ctgx); = ^^ = -A + ctg2 ж) (для всех значений ж, кроме ж = тгп, где п = 0, ±1,...). 5. Производная функции у = loga ж @ < а ф 1). Взяв в качестве ж любую точку полупрямой ж > 0 и считая, что |Аж| < < ж, можем записать: ДУ = loga(a; + Аж) - loga ж = loga ^^ = loga (l + ^ Таким образом, при Аж ф О Ау 1 , Л , Аж\ , Л , Аж\1/Аж Аж Аж оа V ж / оа V ж / В силу основного результата п. 3 § 6 гл. 4 выражение в квадрат™ пых скобках имеет при Аж ^ 0 (и при любом фиксированном значении ж) предельное значение, равное е. Тогда на основании непрерывности функции у = loga ж в точке ж = е существует предельное значение (при Аж —>• 0) правой части E.26), рав- равное — loga e. По определению производной указанное предельное значение равно производной функции у = loga#, т. е. Aоёаж); = -logae (для всех значений ж, принадлежащих полупрямой ж > 0). В частном случае а = е получим § 5. Теорема о производной обратной функции Теорема 5.4- Пусть функция у = /(ж) в некоторой окрест- окрестности точки жо возрастает (или убывает) и является непре- непрерывной. Пусть^ кроме того^ функция у = /(ж) дифференциру- дифференцируема в точке жо и производная /;(жо) отлична от нуля. Тогда существует обратная функция ж = /т1(|/), которая определена
172 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 в некоторой окрестности соответствующей точки у® = /(жо), дифференцируема в этой точке и имеет в этой точке произ- водную, равную l/ff(x®). Доказательство. Прежде всего заметим, что для функции у = f(x) выполнены в окрестности точки х® все условия следствия из леммы 1 § 4 гл. 4. Согласно этому след™ ствию существует обратная функция х = f^1(y)J определенная в некоторой окрестности точки у® = f(x®) и непрерывная в этой окрестности. Придадим аргументу у этой обратной функции в точке уо произвольное отличное от нуля приращение Ау. Это- Этому приращению отвечает приращение Ах обратной функции, причем в силу возрастания (или убывания) функции Ах ф 0. Таким образом, мы имеем право написать следующее тожде- тождество: — = 1 E 27) Ay Ay/Ax' l * } Пусть теперь в тождестве E.27) Ау -Л 0. Тогда, в силу непре™ рывности обратной функции х = f^1(y) в точке уо и согласно разностной форме условия непрерывности, и Ах —>> 0. Но при Ах —>- 0 знаменатель дроби, стоящей в правой части E.27), по определению производной, имеет предельное значение, равное f'{x) ф 0. Стало быть, правая часть E.27) имеет при Ау —>> 0 предельное значение, равное Но тогда и левая У часть E.27) имеет при Ау —>> 0 предельное значение. По опре- определению производной указанное предельное значение равно1) {/~^(уо)У- Таким образом, мы доказали дифференцируемость обратной функции в точке у® и получили для ее производной со- М / отношение " {Г1ЫУ = ущ° E-28) О р/ хо х Теорема 5.4 доказана. Доказанная теорема имеет простой гео- геометрический смысл. Рассмотрим в окрест- окрестности точки х® график функции у = Рис- 5-4 = f(x) (или обратной функции). Предпо- Предположим, что точке х® на этом графике соответствует точка М (рис. 5.4). Тогда, очевидно, производная ff(x®) равна танген- тангенсу угла наклона а касательной, проходящей через точку М, к оси Ох. Производная обратной функции {/~1(уо)У равна тан™ ) Символом {/ (уо)У мы обозначаем производную обратной функции в точке 2/о.
§ 6 ВЫЧИСЛЕНИЕ ПРОИЗВОДНЫХ 173 генсу угла наклона /3 той же касательной к оси Оу. Поскольку углы а и /3 в сумме составляют тг/2, то формула E.28) выражает очевидный факт: § 6. Вычисление производных показательной функции и обратных тригонометрических функций В этом параграфе, опираясь на доказанную выше теоре- теорему 5.4, мы продолжим вычисление производных простейших элементарных функций. 1. Производная показательной функции у = ах @ < < а ф 1). Показательная функция у = аж, будучи определена на бесконечной прямой, служит обратной для логарифмической функции х = loga у, определенной на полупрямой у > 0. По- Поскольку для логарифмической функции в окрестности любой точки у полупрямой у > 0 выполнены все условия теоремы 5.4, то, согласно этой теореме, функция у = ах дифференцируема в любой точке х = loga у и для ее производной справедлива фор™ мула ("*)' = 7Г"Ч = т^— = Г*— (l0Sal/) ilog e l0Sae У Из этой формулы, воспользовавшись известным из элементар- элементарного курса соотношением loga Ь = и учитывая, что у = аж, окончательно получим (аху = ах In a. Полученная формула справедлива для всех точек х бесконечной прямой. В частном случае а = е эта формула принимает вид 2. Производные обратных тригонометрических функ- функций. Начнем с вычисления производной функции у = arcsinx. Эта функция, будучи определена на интервале — 1 < х < +1, служит обратной для функции х = sin у, определенной на ин- интервале — ^ < у < +^. Поскольку для функции х = sin у в окрестности любой точки у интервала — - < у < — выполне- выполнены все условия теоремы 5.4, то, согласно этой теореме, функция у = arcslnx дифференцируема в любой точке х = sin у и для ее производной справедлива формула (arcsmxV = —5— = — = , г E.29) v ; (sin у)' cosy n ^^ v ;
174 ОСНОВЫ ДИФФЕГЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 Мы взяли перед корнем знак +, ибо cosy положителен всюду на интервале —^ < у < ^. Учитывая, что sin у = ж, из форму™ лы E.29) окончательно получим (arcslnx)' = Полученная формула, как уже отмечалось в процессе ее вывода, справедлива для всех х из интервала — 1 < х < +1. По анало- аналогичной схеме вычисляется производная функции у = arccosx. Эта функция, будучи определена на интервале — 1 < х < +1, служит обратной для функции х = cosy, определенной на ин- интервале 0 < у < тг. Поскольку для функции х = cos у в окрестно™ сти любой точки у интервала 0 < у < тг выполнены все условия теоремы 5.4, то, согласно этой теореме, функция у = arccosx дифференцируема в любой точке х = cosy и для ее производи ной справедлива формула (\ / XX X / с о/~\\ arccosx) = , , = ^^— = — . ^—. (o.oU) (cosy)' sin г/ Гл * Мы учли, что sin у = +Y 1 — cos2 у ибо sin у > 0 всюду на ин- интервале 0 < у < тт. Принимая во внимание, что cosy = ж, из формулы E.30) окончательно найдем 1 arccos х) = — - Полученная формула, как уже отмечалось в процессе ее вывода, справедлива для всех значений х из интервала — 1 < х < 1. Перейдем к вычислению производной функции у = arctgx. Эта функция, будучи определена на бесконечной прямой ^оо < < х < +оо, служит обратной для функции х = tgy, определен™ ной на интервале — — < у < —. Поскольку для функции х = tg у в окрестности любой точки у интервала —^ < у < ^ выполне™ ны все условия теоремы 5.4, то, согласно этой теореме, функция у = arctg х дифференцируема в любой точке х = tg у и для ее производной справедлива формула (arete; x)f = , = о . 1 & } (tgy)' 1 + tg2!/ Учитывая, что tgy = ж, окончательно получим Полученная формула справедлива для всех точек х бесконечной прямой.
§ 7 ПРАВИЛО ДИФФЕРЕНЦИРОВАНИЯ СЛОЖНОЙ ФУНКЦИИ 175 Остается вычислить производную функции у = arcctga^. Эта функция, будучи определена на бесконечной прямой ^оо < х < < +оо, служит обратной для функции х = ctgy, определенной на интервале 0 < у < тг. Поскольку для функции х = ctgy в окрестности любой точки у интервала 0 < у < тг выполнены все условия теоремы 5.4, то, согласно этой теореме, функция у = = arcctgx дифференцируема в любой точке х = ctgy и для ее производной справедлива формула (arcctgxV = Учитывая, что ctgy = ж, окончательно получим (arcctgx); = ^YT^° Эта формула справедлива для всех точек х бесконечной прямой. Таким образом, мы вычислили производные всех простейших элементарных функций, за исключением степенной функции с любым вещественным показателем. Откладывая вычисление производной этой последней функ™ ции до § 8, займемся обоснованием правила дифференцирования сложной функции. § 7. Правило дифференцирования сложной функции Целью настоящего параграфа является установление прави™ ла, позволяющего найти производную сложной функции у = = f[<p(t)]i если известны производные составляющих ее функций У = Нх) и х = ?>(*)¦ Теорема 5.4' Пусть функция х = </?(?) дифференцируема в некоторой точке to, а функция у = f(x) дифференцируема в соответствующей точке х® = ip(to). Тогда сложная функция f[(f(t)] дифференцируема в указанной точке to, причем для про- производной этой функции справедлива следующая формула1): {/М*о)]}' = f'(xo)v'(to). E.31) Доказательство. Придадим аргументу t в точ™ ке to произвольное, отличное от нуля приращение At. Этому приращению соответствует приращение Ах функции х = <p(t). Приращению Ах в свою очередь соответствует приращение Ау функции у = f(x) в точке xq. Поскольку функция у = f(x) предполагается дифференцируемой в точке жо5 приращение этой функции в точке xq может быть записано в виде (см. § 2) ' E.32) ) Символом {f[^p(to)]}f мы обозначаем производную сложной функции У = fVp{P)] в точке t = to-
176 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 где lim a = 0. E.33) Поделив равенство E.32) на At, будем иметь Ay pi, ч Аж Аж Пусть теперь в равенстве E.33) At —>> 0. Так как из дифференци- руемости функций х = (p(t) в точке to вытекает непрерывность этой функции в точке to, то, в силу разностной формы условия непрерывности, Аж —>> 0 (при At —> 0). Поэтому можно утвер- утверждать, что существует предельное значение lim a = 0. E.34) At^O Кроме того, в силу требования дифференцируемости функции х = (p(t) в точке to существует предельное значение Существование предельных значений E.34) и E.35) обеспечи- обеспечивает существование предельного значения (при At —>- 0) всей правой части E.33), равного ff(x®)(pf(to). Стало быть, существу- существует предельное значение (при At —>> 0) и левой части E.33). По определению производной указанное предельное значение рав- равно производной сложной функции f[(f(i)] в точке to- Тем самым нами доказана дифференцируемость сложной функции в точке to и установлена формула E.31). Теорема 5.5 доказана. Замечание. Мы рассматривали сложную функцию у = /(ж), где х = (p(t), т. е. брали х в качестве промежуточного аргумента, at в качестве окончательного аргумента. Эти обо- обозначения, конечно, могут быть изменены. Часто удобнее бывает рассматривать сложную функцию вида у = f(u), где и = <р(х), т. е. брать х в качестве окончательного аргумента, а некоторую переменную и в качестве промежуточного. Для этой функции формула дифференцирования E.31) принимает вид У' = {ПФ)]У = f'(u)<p'(x) E-36) (мы опустили у соответствующих значений аргументов х и и нули, имевшие вспомогательный характер). Приведем примеры использования только что доказанного правила дифференцирования сложной функции. 1°. Вычислить производную функции у = earctga\ Эту функ- функцию будем рассматривать как сложную функцию вида у = ем, где и = arctgx. Используя формулу E.36), получим 1+ж .2 *
§ 8 ЛОГАРИФМИЧЕСКАЯ ПРОИЗВОДНАЯ 177 2 2°. Вычислить производную функции у = 2х . Эту функцию будем рассматривать как сложную функцию вида у = 2W, где и = х . Используя формулу E.36), получим у1 = BиУ(х2у = Bй 1п2Jж = 2ш2+1ж1п2. 3°. При рассмотрении указанных двух примеров мы отдель™ но выписывали функции, составляющие данную сложную функ- функцию. В этом, конечно, нет никакой необходимости, и на практике дифференцирование сложной функции производится сразу без расчленения на отдельные составляющие функции. Например, у = arcsln75a:, у1 = = G5жУ = — л/1 - G5жJ1 ; у/1 - G5жJ (здесь |ж| < 1/75). 4°. Теорема 5.5 и содержащееся в ней правило последователь- последовательно переносятся и на случай сложной функции, являющейся су- суперпозицией трех и большего числа функций. Рассмотрим пример такой функции. Пусть требуется вычис- вычислить производную функции у = 5arcctg^ ). Последовательно применяя правило дифференцирования сложной функции, по- получим § 8. Логарифмическая производная. Производная степенной функции с любым вещественным показателем. Таблица производных простейших элементарных функций 1. Понмтие логарифмической производной функции. Пусть функция у = f(x) положительна и дифференцируема в данной точке х. Тогда в этой точке существует lay = lnf(x). Рассматривая lnf(x) как сложную функцию аргумента ж, мы можем вычислить производную этой функции в данной точке ж, принимая у = f(x) за промежуточный аргумент. Получим [lnf(x)}' = y'/y. E.37) Величина, определяемая формулой E.37), называется логариф- логарифмической производной функции у = f(x) в данной точке х. В качестве примера вычислим логарифмическую производную так называемой степенно-показательной функции у = u(x)v^xK Мы уже знаем из п. 2 § 7 гл. 4, что эта функция определена и непрерывна для всех значений ж, для которых и(х) и v(x) непрерывны и и{х) > 0. Теперь мы дополнительно потребуем, чтобы и(х) и v(x) были дифференцируемы для рассматриваемых
178 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 значений ж. Тогда, поскольку In у = v(x)lnu(x)J мы получим, что логарифмическая производная рассматриваемой функции равна ^ = [v(x) lnu(x)]f = v'{x) Ыи(х) + у(х)^Щ» E.38) Из равенства E.38), учитывая, что у = u(x)v^x\ получим сле- следующую формулу для производной степенно-показательной функции: у1 = u{x)v№ \v'{x) lnu(x) + у(х)^ |_ Uyj 2. Производная степенной функции с любым веще- вещественным показателем. Приступим теперь к вычислению производной степенной функции у = ха с произвольным ве- вещественным показателем а. Мы будем вычислять производную этой функции для тех значений ж, для которых эта функция определена при любом о, а именно для значений ж, принадле- принадлежащих полупрямой "*¦) х > 0. Имея в виду, что всюду на полу- полупрямой х > 0 функция у = ха положительна, вычислим лога™ рифмическую производную этой функции. Так как In у = a In ж, то логарифмическая производная равна Отсюда, учитывая, что у = жа, получим формулу для производи ной степенной функции Таким образом, нами вычислены производные всех простейших элементарных функций. Собирая воедино все вычисленные про- производные, мы получим следующую таблицу, уже выписанную нами в гл. 1. 3. Таблица производных простейших элементарных функций. 1°. (хаУ = аха^1. В частности, (-)' = --L (y^Y = f-^=V \xj x2 vv \2л/х/ 2°. (loga x);=i loga e (x > 0, 0 < a ф 1). В частности, Aпж); = -. 3°. (ахУ = axlna @<аф1).В частности, (ex)f = еж. 4°. (mnx)f = cos ж. 1) В случае, когда а = 1/га, где т — целое нечетное число, функция у = ха определена на всей бесконечной прямой. Однако и в этом случае достаточно вычислить производную указанной функции лишь для значений х > 0, ибо указанная функция является нечетной и ее производную для значений х < 0 легко получить из этого соображения.
ИНВАРИАНТНОСТЬ ФОРМЫ ПЕРВОГО ДИФФЕРЕНЦИАЛА 179 5°. (cosж)' = —sinж. 6°. (tgar)' = ^^ = l + tg2a; (ж/ | + тгп, где п = 0, ±1,...). 7°. (ctga;)'=-—i-=-(l+ctg2?)(?^7rn, гдеп = 0,±1, ...)¦ Sill Ж (arcsmrr)' = (—1 < x < 1). 9°. (arccosa;)' = - X (-1 < x < 1). 10°. 11°. В § 4 гл. 4 мы ввели гиперболические функции у = у = chx, у = thx ш у = cthx, которые являются простыми комбинациями показательных функций. Из определения этих функций элементарно вытекают следующие выражения для их производных: 12°. (shx); = 13°. (dixy = 15°. (ctha;)^-^- (x ф 0). Указанная таблица вместе с правилами дифференцирования суммы, разности, произведения и частного (т. е. формулами E.16)) и правилом дифференцирования сложной функции со™ ставляет основу дифференциального исчисления. Установленные правила и формулы дифференцирования по- позволяют сделать один важный вывод. В § 7 гл. 4 мы ввели понятие элементарной функции как та- такой функции, которая выражается через простейшие элементар- элементарные функции посредством четырех арифметических действий и суперпозиций, последовательно примененных конечное число раз. Теперь мы можем утверждать, что производная любой эле- элементарной функции представляет собой также элементар- элементарную функцию. Таким образом, операция дифференцирования не выводит нас из класса элементарных функций. § 9. Инвариантность формы первого дифференциала. Некоторые применения дифференциала 1. Инвариантность формы первого дифференциала. В конце § 2 мы установили, что для случая, когда аргумент х является независимой переменной^ дифференциал функции у =
180 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 = f(x) определяется формулой dy = f{x)dx. E.39) В этом пункте мы докажем, что формула E.39) является уни- версальной и справедлива не только в случае, когда аргумент х является независимой переменной, но и в случае, когда аргу- аргумент х сам является дифференцируемой функцией некоторой новой переменной t. Указанное свойство дифференциала функ- функции обычно называют инвариантностью его формы. Итак, пусть дана дифференцируемая в некоторой точке х функция у = /(ж), аргумент х которой представляет собой диф- дифференцируемую функцию х = (p(t) аргумента t. В таком случае мы можем рассматривать у как сложную функцию у = f[<p(t)] аргумента i, a x как промежуточный аргумент. В силу теоре- теоремы 5.5 производная у по t определяется формулой y' = f'(x)<p'(t). E.40) Поскольку переменную t мы можем рассматривать как незави- симую^ производные функций х = (f(t) и у = f[<p(t)] по аргу- аргументу i, согласно установленному в конце § 2, равны отношению дифференциалов этих функций к dt1 т. е. Вставляя эти значения производных в формулу E.40), прида- придадим этой формуле вид Умножая обе части равенства E.41) на dt, получим для dy выра- выражение E.39). Тем самым доказана инвариантность формы пер- первого дифференциала функции, т. е. доказано, что как в слу~ чае, когда аргумент х является независимой переменной^ так и в случае^ когда аргумент х сам является дифференцируемой функцией другой переменной^ дифференциал dy функции у = = f(x) равен производной этой функции^ умноженной на диф- дифференциал аргумента dx. По-другому свойство инвариантности дифференциала мож- можно сформулировать так: производная функции у = f(x) всегда1) равна отношению дифференциала этой функции dy к дифферен- дифференциалу аргумента dx^ т. е. fix) = %. E.42) ) То есть как в случае, когда аргумент х является независимой перемен- переменной, так и в случае, когда ж сам является дифференцируемой функцией некоторой другой переменной.
§ 9 ИНВАРИАНТНОСТЬ ФОРМЫ ПЕРВОГО ДИФФЕРЕНЦИАЛА 181 Доказанное равенство E.42) позволяет нам в дальнейшем ио пользовать отношение -^ для обозначения производной функ- ах ции у = f(x) по аргументу х. Заметим в заключение, что после того, как доказано ра- равенство E.42), правило дифференцирования сложной функции принимает вид простого тождества: dy _ dy dx /г л^ч Столь же простой вид приобретает правило дифференцирова- дифференцирования обратной функции: — = г E 44) dx dx/dy Подчеркнем, однако, что равенства E.43) и E.44) нельзя рассма- рассматривать как новые методы доказательства теорем 5.5 и 5.4, ибо формулы E.43) и E.44) существенно используют факт инвари- инвариантности первого дифференциала, установленный нами именно при помощи теоремы 5.5. 2. Формулы и правила вычисления дифференциалов. Мы доказали, что дифференциал dy функции у = f{x) всегда равен производной этой функции /;(ж), умноженной на диффе- дифференциал аргумента dx. Таким образом, таблица производных, выписанная нами в п. 3 § 8, приводит к соответствующей табли- таблице дифференциалов: 1°. d{xa)=axa~1dx. В частности, d (-) =- %, d(y/x) = х 7 \х/ х2 Х? 7 ) % х/ х2 2°. d(\ogax) = l^^dx (x > 0, 0 < а ф 1). В частности, X т/1 \ (IX а(тх) = —. 3°. d(ax) = ax\nadx @ < а ф 1). В частности, d{ex) = exdx. 4°. d(sini) = cosxdx. 5°. d(cosx) = ^sinxdx. 6°. d(tgx) = —^— = A + tg2 x)dx {x ф — +7ГП, где n = О, =Ы, \ COS X Zi 7°. d(ctgx) = — , 2 = — A + ctg2 x)dx (x ф тгп, где п = 0, ±1,... ). 8°. d(arcslnx) = / dx (-1 < x < 1). V1 — x2 9°. d(arccosx) = - dx (-1 < x < 1). 11°. d(arcctgx) = — x 2, 2
182 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 Из формул E.16) и из соотношения E.39) непосредственно выте™ кают следующие правила для вычисления дифференциала сум™ мы, разности, произведения и частного: 7/ i \ 7i? 7/ \ i 1 1 (u\ vdu — udv щи ±v) = аи ± av, a(uv) = vdu + uav, a[-)= . 3. Использование дифференциала для установления приближенных формул. Хотя, как мы видели в § 2, диффе- дифференциал dy функции у = f(x) не равен приращению Ау этой функции, но с точностью до бесконечно малой более высокого порядка, чем Дж, справедливо приближенное равенство Ay » dy. E.45) Относительная 1) погрешность этого равенства становится сколь угодно малой при достаточно малом Ах. Формула E.45) позво- позволяет приближенно заменить приращение Ау функции у = /(ж) ее дифференциалом dy. Преимущество такой замены состоит в том, что дифференциал dy зависит от Ах линейно, в то время как приращение Ау, вообще говоря, представляет собой более сложную функцию от Ах. Имея в виду, что приращение функции Ау определяется фор- формулой E.1), а дифференциал dy определяется формулой E.14), мы придадим приближенному равенству E.45) следующий вид: f(x + Ax)-f(x)*f'{x)Ax ИЛИ f{x + Ax)^f(x) + f'(x)Ax. E.46) По формуле E.46) функция / для значений аргумента, близких к х (т. е. для малых Аж), приближенно заменяется линейной функцией. В частности, из формулы E.46) может быть получен ряд уже известных нам из гл. 4 приближенных формул. Так, полагая f(x) = A + жI//тг, х = 0, получим, что 1 + ^ E.47) Полагая f(x)= sin ж, х = 0, получим smAx^Ax. E.48) Полагая, /(ж) = еп 1 х = 0, получим еАх « 1 + Ах. E.49) ) Относительная погрешность равенства E.45) определяется отношени- отношением —— . Отметим, что, по определению дифференциала, Ау — dy = = о(Ах).
§ 10 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 183 Полагая f(x) = ln(l + ж), х = 0, получим 1пA + Ах) « Ах. E.50) Каждое из равенств E.47)—E.50) справедливо с точностью до бесконечно малой более высокого порядка, чем Ах. Равенства E.47)—E.50) в форме точных оценок уже были установлены нами в конце § 7 гл. 4. § 10. Производные и дифференциалы высших порядков 1. Понмтие производной п-го порядка. Как уже отмеча- отмечалось в п. 2 § 1, производная f'{x) функции у = /(ж), определен- определенной и дифференцируемой на интервале (a, ft), представляет со- собой функцию^ также определенную на интервале (a, ft). Может случиться, что эта функция f'{x) сама является дифференци- дифференцируемой в некоторой точке х интервала (a, ft), т. е. имеет в этой точке производную. Тогда указанную производную называют второй производной (или производной 2-го порядка) функции у = f(x) в точке х и обозначают символом f^2\x) или у^2\х) 1). После того как введено понятие второй производной, мож- можно последовательно ввести понятие третьей производной, затем четвертой производной и т. д. Если предположить, что нами уже введено понятие (п — 1)-й производной и что (п — 1)-я произ- водная дифференцируема в некоторой точке х интервала (а, 6), т. е. имеет в этой точке производную, то указанную производ- производную называют п-й производной (или производной п-го порядка) функции у = f(x) в точке х и обозначают символом f^n\x) или уМ(х). Таким образом, мы вводим понятие n-й производной индук- индуктивно, переходя от первой производной к последующим. Соот- Соотношение, определяющее n-ю производную, имеет вид у(п) = [у(п-1I E.51) Функцию, имеющую на данном множестве {х} конечную про- производную порядка п, обычно называют п раз дифференцируемой на данном множестве. Понятие производных высших порядков находит многочисленные применения в физике. Здесь мы огра- ограничимся тем, что укажем механический смысл второй производ- производной. Если функция у = f(x) описывает закон движения мате- материальной точки по прямой линии, то, как мы уже знаем, первая производная f'{x) дает мгновенную скорость движущейся точки ) Вторую производную функции у = /(ж) обозначают также символом f\x) или у"(ж)-
184 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 в момент времени х. В таком случае вторая производная равна скорости изменения скорости^ т. е. равна ускорению дви™ жущейся точки в момент времени х. Заметим, что методика вычисления производных высшего порядка предполагает умение вычислять только производные первого порядка. В качестве примеров вычислим производные в~го порядка некоторых простейших элементарных функций. 2. п-е производные некоторых функций. 1°. Вычислим в~ю производную степенной функции у = ха (х > 0, а — любое вещественное число). Последовательно дифференцируя, будем иметь yf = аха~\ уB) = а(а - 1)ха~2, у® = а(а - 1)(а ~~ 2)ха~\ ... Отсюда легко уяснить общий закон (ха)№ = а(а - 1)(а - 2)... (а - п + 1)ха~п. Строгое доказательство этого закона легко проводится методом индукции. В частном случае а = т, где т — натуральное число, полу™ чим (хт)^ = т!, (жш)(п) =0прип>т. Таким образом, п™я производная многочлена тгг-го порядка при п> т равна нулю 1). 2°. Далее вычислим п~ю производную показательной функ™ ции у = ах @ < а ф 1). Последовательно дифференцируя, будем иметь у; = аж In а, у{2) = аж In2 щ у^ = ах In3 а,... Общая формула, легко устанавливаемая по методу индукции, имеет вид (ах)М =ах1ппа. В частности, 3°. Вычислим n-ю производную функции у = sin ж. Первую производную этой функции можно записать в виде у1 = cos ж = = sin (ж + ? ) • Таким образом, дифференцирование функции у = = sin ж прибавляет к аргументу этой функции величину тг/2. Отсюда получаем формулу (smxp71' = si: х) При этом мы используем еще следующую очевидную формулу [Ач(х)-\- + Bv(x)](n) = Аи{п\х) + Bv(n)(x), где А и В — постоянные.
10 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 185 4°. Совершенно аналогично устанавливается формула (cosхр71' = cos I х + п 5°. В заключение вычислим n-ю производную так называе- называемой дробно-линейной функции у = , где а, &, с и rf - неко™ торые постоянные. Последовательно дифференцируя эту функ- функцию, будем иметь у, = уB) = (ad - 6с) (-2) (еж + d)~3c, у(з) = (ad - 6с)(-2)(-3)(сж + < Легко усмотреть и общий закон который может быть обоснован по методу индукции. 3. Формула Лейбница длм п-ш производной произве- произведения двух функций. В то время как установленное выше правило вычисления первой производной от суммы или разно™ сти двух функций (u±v)f = u'~kv' легко переносится (например, по методу индукции) на случай n-й производной (и ± vpn^ = = и^ =Ь у(п\ возникают большие затруднения при вычислении n-й производной от произведения двух функций uv. Соответствующее правило носит название формулы Лейбни- Лейбница и имеет следующий вид: + Clu^-^v^ + С;УП-3М3) + ... + uv^n\ E.52) Легко подметить закон, по которому построена правая часть формулы Лейбница E.52): она совпадает с формулой разлоэюе- ния бинома (и + /у)?г, лишь вместо степеней и и v стоят про- производные соответствующих порядков. Это сходство становится еще более полным, если вместо самих функций и и v писать со- соответственно и^ и v^ (т. е. если рассматривать саму функцию как производную нулевого порядка). Докажем формулу Лейбница по методу индукции. При п = = 1 эта формула принимает вид {uvI = u'v + ш/, что совпада- совпадает с установленным выше (в § 3) правилом дифференцирования произведения двух функций. Поэтому достаточно, предположив справедливость формулы E.52) для некоторого номера п, до™ казать ее справедливость для следующего номера п + 1. Итак,
186 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 пусть для некоторого номера п формула E.52) верна. Продиф™ ференцируем эту формулу и объединим слагаемые, стоящие в правой части, так, как это указано ниже: E.53) (При этом мы воспользовались тем, что 1 = С%). Из элементар- элементарного курса известно, что для любого номера fc, не превосходя- превосходящего п, справедлива формула1) Пользуясь этой формулой, мы можем следующим образом не™ реписать равенство E.53): Тем самым доказана справедливость формулы E.52) для номера (п + 1). Вывод формулы Лейбница завершен. Пример 1. Вычислить n-ю производную функции у = = ж2 cos ж. Воспользуемся формулой Лейбница, положив в ней и = cos ж, v = х2. В таком случае для любого номера к и№ = = cos (х + к-\, v; = 2ж, vW = 2, vC) = v^ = ... = 0. Получим = ж2 COS f Ж + п| 1 + 2ПЖ COS |ж + (П - 1) |1 + + п(п - 1) cos [ж + (п - 2)-1 L ^ J Пример 2. Вычислить п~ю производную функции у = = ж3еж. Воспользуемся формулой Лейбница, положив в ней и = = еж, -у = ж3. Тогда для любого номера к и^ = еж, г?' = Зж2, ^B) = 6ж, ^C) = 6, г/4) = vE) = ... = 0. Получим уМ = (ж3 + Зпж2 + Зп(п - 1)ж + п(п - 1)(п - 2))еш, Рассмотренные примеры показывают, что формула Лейбница особенно эффективна в случае, когда одна из двух перемножа- перемножаемых функций имеет лишь конечное число отличных от нуля производных. 4. Дифференциалы высших пормдков. В рассуждени™ ях настоящего пункта мы будем использовать для обозначения дифференциала наряду с символом d также и символ 5 (т. е. бу- будем писать там, где это удобно, вместо dx и dy символы 5х и ду). г) Впрочем, эта формула элементарно проверяется.
§ 10 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 187 Предположим, что функция у = f(x) дифференцируема в некоторой окрестности точки х®. Тогда первый дифференци- дифференциал dy этой функции имеет вид 1) dy = fl{x)dx и является функ- функцией двух переменных: точки х и величины dx. Предположим дополнительно, что функция ff(x) также яв- ляется дифференцируемой в точке х® и что величина dx имеет одно и то же фиксированное значение для всех точек х рассма- рассматриваемой окрестности точки х®. При этих предположениях существует дифференциал функ- функции dy = f'(x)dx в точке xq, который мы будем обозначать сим- символом S(dy)j причем этот последний дифференциал определяет- определяется формулой S(dy) = 8[f'(x)dx]\x=xo= [f'(x)dx]'\x=xoSx = f"(xo)dx8x. E.54) Определение. Значение S(dy) дифференциала от первого дифференциала dy, взятое при ёх = dx, называют вторым дифференциалом функции у = f(x) (в точке х®) и обозначают символом d2y. Из формулы E.54) и из определения второго дифференциала вытекает, что d2y = f"(xo)(dxJ. E.55) Заметим, что так как мы считаем величину dx фиксирован- фиксированной, то из определения второго дифференциала сразу же вы- вытекает, что второй дифференциал независимой переменной d x равен нулю. Совершенно аналогично последовательно определяются диф- дифференциалы более высоких порядков. Предполагая, что произ- производная порядка (п — 1) функции у = f(x) дифференцируема в точке х® (т. е. предполагая, что функция у = f(x) имеет в точке х® производную порядка п), мы определим диффе- дифференциал n-г о порядка dny функции у = f(x) (в точке xq) как дифференциал S(dn~1y) от дифференциала (п — 1)-го порядка dn^ly1 взятый при 8х = dx. Для дифференциала n-го порядка dny методом индукции эле- элементарно устанавливается формула dny = f^(x0)(dx)n. E.56) В самом деле, при п = 1 и п = 2 формула E.56) справедли- справедлива. Предположим, что эта формула справедлива для некоторого номера (п —1), т. е. предположим, что dn^1y = f^n^1\x)(dx)n^1. Тогда, согласно определению сРу, получим2) г) См. п. 1 § 9, формулу E.39). 2) Мы опускаем индекс 0 у точки х.
188 ОСНОВЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 5 dny = Sx=dx т. е. справедливость формулы E.56) установлена. Из формулы E.56) вытекает следующее выражение для про- производной порядка п: /(*)(ж) = ^_. E.56;) J v ; (dx)n y ; Очень важно отметить, что при п > 1 формулы E.56) и E.56;) справедливы, вообще говоря, лишь тогда, когда х явля- является независимой переменной (т. е. второй и последующие дифференциалы не обладают, вообще говоря, свойством инвариантности формы). Чтобы убедиться в этом, рассмотрим вопрос о вычислении второго дифференциала (дважды дифференцируемой) функции у = /(ж) в предположении, что переменная х является дважды дифференцируемой функцией некоторого аргумента t. Исполь™ зуя равенство E.39) и формулу S(uv) = vSu + u5v, получим d*y = 8(dy)\Sx=dx=8[fi(x)dx]\Sx=dx = = {dxS[f(x)] + f(x)8(dx)} ..= [dx.f"(x)8x] ,,+f'(x)d2x. Итак, d2y = f"{x){dxf + f'(x)d2x. Последняя формула отличается от E.55) наличием в ней дополнительного и, вообще говоря, не равного нулю члена f(x)d2x. §11. Дифференцирование функции, заданной параметрически В этом параграфе мы остановимся на методике вычисления производных функции, заданной параметрически. Пусть х ж у заданы как функции некоторого параметра t: x = = (p(t), у = t/j(t). При этом мы предположим, что функции cp(t) и ip(t) имеют нужное число производных по переменной t в рас- рассматриваемой области изменения этой переменной. Кроме того, мы предположим, что функция х = ip(t) в окрестности рассма™ триваемой точки имеет обратную функцию t = ip^l{x) l). По- Последнее предположение дает нам возможность рассматривать у как функцию аргумента х. ) Это обеспечивается существованием первой производной (ff(t)j отлич- отличной от нуля в некоторой окрестности рассматриваемой точки t (см. п. 4 § 2 гл. 15).
§ 11 ФУНКЦИЯ, ЗАДАННАЯ ПАРАМЕТРИЧЕСКИ 189 Поставим задачу о вычислении производных у по аргумен™ ту х. Эти производные договоримся обозначать символами / B) C) Ух^ УХ2 5 УХ3 5 • • • В силу свойства инвариантности первого дифференциала мо- можем записать 1) у'х = %dy = 4>'(t)dt, dx = <p'(t)dt. E.57) Из этих формул получим следующее выражение для первой про™ изводной: Ух - ^гщ• E.58) Аналогично вычисляются производные высших порядков. Так, для вычисленв вить ее в виде для вычисления второй производной y^J достаточно предста- „B) _ d{y'x) и воспользоваться формулой E.58), третьей из формул E.57) и правилом дифференцирования частного. Пример. Вычислить первую и вторую производные функ- функции, заданной параметрически: х = a(t — sint), у = аA — cost), ^оо < t < оо. Кривая, определяемая этими уравнениями, называется циклоидой 2). Получим Ух = 4a sin4 | ) При этом мы берем dy и dx в одной и той же точке t и для одного и того же dt. ) Циклоида представляет собой траекторию некоторой фиксированной точки окружности, катящейся без скольжения по прямой линии.
ГЛАВА 6 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ В этой главе будет рассмотрена задача о восстановлении функции по известной производной этой функции. Актуаль- Актуальность этой задачи была выяснена в гл. 1. § 1. Понятие первообразной функции и неопределенного интеграла 1. Понятие первообразной функции. К числу важных задач механики относится задача об определении закона дви- движения материальной точки по заданной ее скорости, а также задача об определении закона движения и скорости материаль- материальной точки по заданному ее ускорению г). Эти задачи приводят к математической проблеме отыскания функции по заданной производной этой функции. Переходим к рассмотрению этой проблемы. Определение. Функция F(x) называется первообраз- первообразной функцией (или просто первообразной) для функции f(x) на интервале (а, 6), если в любой точке х интервала (а, Ь) функция F(x) дифференцируема и имеет про- производную Ff(x)^ равную f(x). Замечание. Аналогично определяется первообразная для функции f(x) на бесконечной прямой и на открытой полу- полупрямой2). Примеры. 1) Функция F(x) = у/1 — %2 является перво- первообразной для функции f(x) = — — на интервале (—1,+1), ) Вместо ускорения материальной точки можно задать действующую на эту точку силу (ибо, согласно второму закону Ньютона, сила определяет ускорение этой точки). 2) И вообще на любом плотном в себе множестве {ж}. Определение плот- плотного в себе множества см. в 8 3 гл. 2.
§ 1 ПЕРВООБРАЗНАЯ ФУНКЦИЯ И НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ 191 ибо в любой точке ж этого интервала л/1-х2 2) Функция F(x) = sin ж является первообразной для функ- функции /(ж) = cos ж на бесконечной прямой (—оо, оо), ибо в каждой точке х бесконечной прямой (sin ж)' = cos ж. 3) Функция F(x) =\nx является первообразной для функции /(ж) = - на открытой полупрямой х > О, ибо в каждой точке х этой полупрямой Aпж); = —. Если F(x) является первообразной для функции f(x) на ин- интервале (а, Ь), то, очевидно, и функция F{x) + С, где С — лю- любая постоянная, является первообразной для функции f(x) на интервале (а, Ь). Естественно, возникает вопрос, как связаны между собой раз- различные первообразные для одной и той же функции f(x). Сира™ ведлива следующая основная теорема. Теорема 6.1. Если F\(x) и ^(ж) — любые первообразные для функции /(ж) на интервале (а, Ь), wo всюду на этом интервале F\(x) — F2(x) = С, где С — некоторая постоянная. Другими словами, две любые первообразные для одной и той же функции могут отличаться лишь на постоянную. Доказательство. Положим Ф(ж) = F\(x) —^(ж). Так как каждая из функций F\{x) и i^(^) дифференцируема на ин- интервале (а, Ь), то в силу теоремы 5.3 и функция Ф(ж) дифферен- дифференцируема на интервале (а,Ь), причем всюду на этом интервале Ф'(х) = F[{x) - F^x) = f(x) - f(x) = 0. В § 10 гл. 8 методами, не использующими результатов этой главы1), будет доказана теорема 8.13 следующего содержания: если функция Ф(ж) дифференцируема всюду на интервале (а, Ь) и если всюду на этом интервале Ф'(ж) = 0, то функция Ф(ж) является постоянной на интервале (а, Ь). Из этой теоремы получим, что Ф(ж) = F\(x) — i^(^) = С = = const, что и требовалось доказать. Следствие. Если F(x) — одна из первообразных функций для функции /(ж) на интервале (а, Ь), то любая первооб- первообразная Ф(ж) для функции /(ж) на интервале (а, Ь) имеет вид Ф(ж) = F(x) + G, где С — некоторая постоянная. 2. Неопределенный интеграл. Определение. Совокупность всех первообразных функций для данной функции /(ж) на интервале (а, Ь) называется н е- определенным интегралом от функции /(ж) ) Заметим, что главы 6 и 7 без ущерба для понимания этой книги могут читаться после гл. 8. Мы выдвигаем главы 6 и 7 вперед, чтобы ускорить знакомство читателя с техникой интегрирования.
192 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 6 (на этом интервале) и обозначается символом Jf(x)dx. F.1) В этом обозначении знак J называется знаком интеграла, выра™ жение f(x)dx — подынтегральным выражением, а сама функ™ ция /(ж) — подынтегральной функцией. Если F(x) — одна из первообразных функций для функции /(ж) на интервале (а, Ь), то, в силу следствия из теоремы 6.1, (ж) dx = F(x) + G, F.2) где С — любая постоянная. Подчеркнем, что если первообразная (а стало быть, и не- неопределенный интеграл) для функции /(ж) на интервале (а,Ь) существует, то подынтегральное выражение в формуле F.1) представляет собой дифференциал любой из этих первообраз- первообразных. В самом деле, пусть F(x) — любая из первообразных для функции /(ж) на интервале (а, Ь), т.е. для всех ж из интервала (а,Ь) F'(x) =/(ж). Torm f(x)dx = Ff(x)dx = Примеры. 1) / х dx = у 1 — х2 + С на интерва™ J V1 ~~ х2 ле — 1 < х < 1, ибо функция F(x) = у 1 — ж2 является одной из первообразных для функции fix) = -^^=^ на указанном \/\ х2 интервале. 2) Jcosx dx = sin ж + С на всей бесконечной прямой ^оо < < х < оо, ибо функция F(x) = sin ж является одной из первооб- первообразных для функции f(x) = cos ж на бесконечной прямой. В этой главе мы не будем заниматься вопросом о существова- существовании первообразных (или неопределенных интегралов) для ши- широких классов функций. Здесь мы лишь отметим, что в § 7 гл. 10 будет доказано, что для всякой функции /(ж), непрерывной на интервале (а, Ь), существует на этом интервале первообраз- первообразная функция (и неопределенный интеграл). Операцию нахождения первообразной или неопределенного интеграла (от функции /(ж)) принято называть интегри- интегрированием (функции /(ж)). 8. Основные свойства неопределенного интеграла. Прежде всего отметим два свойства, непосредственно вытекаю- вытекающие из определения неопределенного интеграла: 1°. dff(x)dx = f(x)dx. 2°. JdF(x) =F{x) + C.
§ 1 ПЕРВООБРАЗНАЯ ФУНКЦИЯ И НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ 193 Свойство 1° означает, что знаки d и J взаимно сокращаются в случае, если знак дифференциала стоит перед знаком инте- грала. Свойство 2° означает, что знаки J и d взаимно сокращаются и в случае, если знак интеграла стоит перед знаком дифферен™ циала, но в этом случае к F(x) следует добавить произвольную постоянную С. Для установления свойства 1° достаточно взять дифферен- дифференциал от обеих частей формулы F.2) и учесть, что dF{x) = = Ff(x)dx = f(x)dx. Для установления свойства 2° достаточно в левой части F.2) воспользоваться равенством dF{x) = f(x)dx. Следующие два свойства обычно называют линейными свой- свойствами интеграла: 3°.f[f(x)±g(x)]dx = ff(x)dx±fg(x)dx. 4°. f[Af(x)]dx = Aff(x)dx (A = const). Подчеркнем, что равенство в формулах 3° и 4° имеет услов- ный характер: его следует понимать как равенство правой и ле- левой частей с точностью до произвольного постоянного слагаемо™ го (это понятно, поскольку каждый из интегралов, фигурирую™ щих в формулах 3° и 4°, определен с точностью до произволь- произвольного постоянного слагаемого). Поскольку две первообразные для одной и той же функции могут отличаться лишь на постоянную, то для доказательства свойства 3° достаточно доказать, что если F(x) — первообраз- первообразная для /(ж), a G(x) — первообразная для g(x)J то функция [F(x) ± G(x)\ является первообразной для функции f(x) ± g(x). Это последнее непосредственно вытекает из того, что производ- производная (алгебраической) суммы функций равна сумме производных этих функций, т. е. [F(x)±G(x)]f = Ff(x) ±Gf(x) = f(x)±g(x). Аналогично доказывается свойство 4°. В этом случае использу- используется равенство [AF(x)]f = AF'(x) = Af(x). 4. Таблица основных неопределенных интегралов. В гл. 5 мы получили таблицу производных простейших элемен- элементарных функций (см. § 8 гл. 5), представляющую собой вы- вычислительный аппарат дифференциального исчисления. Каж- Каждая формула этой таблицы, устанавливающая, что та или иная функция F(x) имеет производную, равную /(ж), приводит нас, в силу определения неопределенного интеграла, к соответствую- соответствующей формуле интегрального исчисления [ f(x)dx = Таким путем мы приходим к следующей таблице основных неопределенных интегралов: 7 В.А. Ильин, Э.Г. Позняк, часть I
194 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 6 Г. 2°. 3°. 4°. 5°. 6°. 7°. 8°. JO- dx = C. /1- dx = x + C. f *1 = ax dx = ^- In a ), fexdx = ex J J sin x dx = — cos ж + С. j cos x dx = sin ж + G. ^ = /A + tg2x)dx = igx (x ф | тт, где ,) //» —%— = / A + ctg2x)dx = ^ctga; + С (ж ^ тгп, где sin ж J 10°. 12°. J arcsln ж + С, 1 — arccos ж + С arctg ж + G, — arcctg ж + С. 1). С2±1 = 1п (при — |ж| > 1). 1-х С(\х\ф1). К этим формулам можно присоединить и соответствующие формулы для гиперболических функций: 14°. J sh ж dx = ch ж + G. 15°. /спж cte = sha; + C. dx ,, . ^ 16°. 17°. dx sh2 ж (ж ^ 0). Сделаем замечания в отношении формул 4, 12 и 13. Формула 4 справедлива для любого интервала, не содержащего значения ж = 0. В самом деле, если ж > 0, то из формулы Aпж); = - I dx заключаем, что / — = In ж + С, а если ж < 0, то из формулы / ж
§ 1 ПЕРВООБРАЗНАЯ ФУНКЦИЯ И НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ 195 [1п(—ж)"!' = - заключаем, что / — = 1п(—ж) + С. Тем самым L v /J х J x y ' формула 4 оправдана для любого х ф 0. Формулы 12 и 13 занимают исключительное положение в на- нашей таблице, ибо эти формулы не имеют аналогов среди формул таблицы производных. Однако для проверки формул 12 и 13 достаточно убедиться в том, что производные выражений, стоящих в правых частях этих формул, совпадают с соответствующими подынтегральны™ ми функциями. Наша ближайшая цель — дополнить таблицу неопределенных интегралов основными приемами и методами интегрирования. Но прежде чем приступить к реализации этой цели, сделаем одно важное замечание. В § 7 гл. 4 мы ввели понятие элементарной функции, а в п. 3 § 8 гл. 5 установили, что производная любой элементарной функ- функции представляет собой также элементарную функцию. Иными словами, мы установили, что операция дифференцирования не выводит нас из класса элементарных функций. Отметим сразу же, что с операцией интегрирования дело об- обстоит иначе. Можно доказать, что интегралы от некоторых эле™ ментарных функций уже не являются элементарными функци- функциями. Примерами таких интегралов могут служить следующие: 1°. fe~x2dx. 2°. fcos(x2)dx. 3°. fsin(x2)dx. 4°. [ ^-@<хф1). 5°. / S^? dx (хфО). J X no I sin ж , о . I dx. J x Каждый из указанных интегралов представляет собой функ- не являющуюся элементарной. Указанные функции не только реально существуют х), но и играют большую роль в раз- различных вопросах физики. Так, например, интеграл 1, называ- называемый интегралом Пуассона или интегралом ошибок, широко используется в статистической физике, в теории теплопровод- теплопроводности и диффузии, интегралы 2 и 3, называемые интегралами г) Мы уже отмечали, что в § 7 гл. 10 будет доказано существование неопределенного интеграла от любой непрерывной функции. Существо- Существование интегралов 1—6 обеспечивается непрерывностью подынтегральных функций.
196 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 6 Френеля, широко применяются в оптике. Часто встречаются в приложениях и интегралы 4-6, первый из которых называется интегральным логарифмом, а последние два — интегральными косинусом и синусом. Для всех перечисленных новых функций (интеграла Пуас- Пуассона, интегралов Френеля, интегрального логарифма, синуса и косинуса) составлены таблицы и графики. Ввиду важности для приложений, эти функции изучены с та- такой же полнотой, как и простейшие элементарные функции. Во™ обще следует подчеркнуть условность понятия простейшей эле- элементарной функции. § 2. Основные методы интегрирования 1. Интегрирование заменой переменной (подстанов- (подстановкой). Замена переменной — один из самых эффективных прие- приемов интегрирования. Этот прием базируется на следующем эле- элементарном утверждении. Пусть функция t = (f(x) определена и дифференцируема на некотором множестве {х} 1) и пусть {?} — множество всех значений этой функции. Пусть далее для функции g(t) суще- существует на множестве {t} первообразная функция G(t), га. е. Г g(t)dt = G(t) + C. F.3) Тогда всюду на множестве {х} для функции g ствует первообразная функция^ равная G[(p(x) ){x)\(f {x) суще~ т. е. ё[ф)У(х) dx = О[ф)} + С. F.4) Для доказательства этого утверждения достаточно восполь- воспользоваться правилом дифференцирования сложной функции2) )} = С'[ф)У{х) dx и учесть, что, по определению первообразной, G'{t) = g(t). Предположим теперь, что нам требуется вычислить интеграл f(x)dx. F.5) В ряде случаев удается выбрать в качестве новой переменной такую дифференцируемую функцию t = (р(х), что имеет место 1) Это множество представляет собой либо интервал, либо сегмент, либо полупрямую, либо бесконечную прямую. 2) См. § 7 гл. 5.
§ 2 ОСНОВНЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ 197 равенство /(х)=ёЫх)У(х), F.6) причем функция g(t) легко интегрируется, т. е. интеграл [ g(t)dt = просто вычисляется. Доказанное выше утверждение позволяет нам написать следующую формулу для интеграла F.5): Jf(x)dx = G[<p(x)] + C. F.7) Этот прием вычисления интеграла F.5) и называется интегри- интегрированием путем замены переменной. Конечно, такой прием применим не ко всякому интегралу. Кроме того, следует подчеркнуть, что выбор правильной под™ становки в значительной мере определяется искусством вычис™ лителя. Приведем ряд примеров, иллюстрирующих только что изложенный метод. 1°. Вычислить J cos 2x dx. Для вычисления этого интеграла следует сделать простейшую подстановку t = 2ж, dt = 2dx. В результате этой замены получим /» cos 2x dx = / - cos tdt = - sin t + C=- sin 2x + С I A A A I dx 2°. Вычислить I . Этот интеграл вычисляется посред™ J x + а ством замены t = х + a, dt = dx. При этом получим — = [ — = In \t\ + С = In \x + а\ + С (хф -а). 3°. Вычислить J ecosxs'mx dx. Легко видеть, что этот инте- интеграл вычисляется путем замены t = cos ж. В самом деле, при этом dt = — sin ж dx и ecosx sin^ dx = - f e* dt = -e* + С = -ecosx + С 9—^— ax. Для вычисления этого инте™ X ~т~ X грала удобна замена t = arctgrc. В самом деле, при такой замене \wo,,_t101,n_(MctgxI01
198 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 6 5°. Вычислить JGx^9J999 dx. Конечно, этот интеграл мож™ но свести к сумме трех тысяч табличных интегралов, расписы- расписывая подынтегральную функцию по формуле бинома Ньютона. Несравненно проще сделать замену t = 7х — 9, dt = 7 dx, в ре™ зультате которой мы получим Gх - 9J999 dx-1- Aх у; ax-7 21QQQ С /dx б . Чтобы усмотреть ту замену, посред- посредством которой может быть взят этот интеграл, перепишем его в виде dx / cos ж dx / cos ж dx I dx / cos ж dx / / cos x I cos2 x I 1 — sin2 x После этого понятно, что следует положить t = sin ж, dt = = cos ж dx. В результате получим [ dx _ f dt / COS X / 1 — t2 = 64ж3 с!ж. При этом /х3 dx 1 / Bж)8 + 1^64J = iln 1+t 1 -t . Удобна замена t = Bx) , dt = dt Bж)8 8°. Вычислить + а^ arctgt \ ri arctgB^L ^ ^ 64 ^64 ' . Для вычисления этого интегра- ла оказывается удобной тригонометрическая подстановка t = , х , , j dt = arete: -, х = atgt, dx = а ° a cos2 t В результате этой подстановки интеграл принимает вид С = 1 / , ,, sint . ^-y = ^г / cos t dt = ^^ + G = (a2 — ж2 :. Здесь оказывается удобной под- становка t = arcsin-, ж = a sint, dx = а cos tdt. При этом dx (а2-ж2K/2 dt cos2 t = ^ + c = a2 sini
§ 2 ОСНОВНЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ 199 10°. Вычислить / а dx. Для вычисления этого интегра™ / У а — х л а оказывается удобной замена 2t = arccos —, х = acos2t, dx = а = ^2asln2tdt. Мы получим г ¦ dx = —4а / cos2 idt = = -4а | [ i + i cos 2t ] dt = -2at - 2a / cos 2t dt = i Z Z = -2at - a sin 2t + С = -a arccos - + l /1 — - a V \a ¦a 2. Интегрирование по частям. К числу весьма эффектив- эффективных методов интегрирования относится метод интегрирования по частям. Этот метод основывается на следующем утвержде™ НИИ. Пусть каждая из функций и(х) и v(x) дифференцируема на множестве {х} щ кроме того^ на этом множестве существу- существует первообразная для функции v(x)uf(x). Тогда на множестве {х} существует первообразная и для функции u(x)vf(x)J при- причем справедлива формула г u(x)vf(x) dx = u(x)v(x) — I v(x)u(x) dx. F.8) Замечание. Определение дифференциала и свойство инвариантности его формы позволяет записать формулу F.8) в виде г г udv = u(x)v(x) — I vdu. F.9) Для доказательства сформулированного утверлсдения запишем формулу для производной произведения двух функций и(х) и v(x) [u(x)v(x)]f = u(x)vf(x) + u'(x)v(x). F.10) Умножим равенство F.10) на dx и возьмем интеграл от обеих частей полученного таким путем равенства. Так как по усло- условию для всех х из множества {х} существует J v(x)uf (x) dx и j[u(x)v(x)]f dx = u(x)v(x)^C (см. свойство 2° из п. 3 § 1), то для всех х из множества {х} существует и интеграл Ju(x)vf(x) dx5 причем справедлива формула F.8) (или F.9)). Формула F.9) сводит вопрос о вычислении интеграла J udv к вычислению интеграла j v du. В ряде конкретных случаев этот последний интеграл без труда вычисляется.
200 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 6 Вычисление интеграла J udv посредством применения фор™ мулы F.9) и называют интегрированием по частям. Заметим, что при конкретном применении формулы интегрирования по частям F.9) очень удобно пользоваться таблицей дифференци- дифференциалов, выписанной нами в п. 2 § 9 гл. 5. Переходим к рассмотрению примеров. 1°. Вычислим интеграл / = j xnlnx dx (п ф — 1). Полагая и = In ж, dv = xn dx и используя формулу F.9), получим du = dx xn+1 = —, v = ——, X П + 1 4-1 Г 4-1 I = ^— In ж- —^— xndx = ^— (in ж- —Ц-) +С. п + 1 (п + 1) J w + l\ n + l/ 2°. Вычислим далее интеграл I = /жаг^ж dx. Полагая и = = аг^ж, dv = х dx ж используя формулу F.9), будем иметь i dx х2 du = y^^j v = у, 'i +T2) _ и х2 , 1 I j . 1 I dx ж2 + 1 , ж.^ = у arctgx ^ - у dx + - у тт^ = ^^ arctgx - - + С. 3°. Вычислим интеграл / = J ж2 cos ж с!ж. Сначала применим формулу F.9), полагая и = ж2, dv = cos ж dx. Получим du = = 2ж dж, v = sin ж, / = ж2 sin ж — 2 J ж sin ж dx. Для вычисления последнего интеграла еще раз применим формулу F.9), полагая на этот раз и = ж, dv = sin ж с?ж. Получим d^ = d#, v = — cos ж, I = x2 sin ж + 2ж cos ж — 2 J cos ж dж = (ж2 — 2) sin ж + 2ж cos ж + С Таким образом, интеграл J ж2 cos ж dж вычислен нами посред- посредством двукратного интегрирования по частям. Легко понять, что интеграл J xn cos ж dж (где п — любое целое положительное число) может быть вычислен по аналогичной схеме посредством n-кратного интегрирования по частям. 4°. Вычислим теперь интеграл I = /eaxcosfe dж (а = const, b = const). Сначала применим формулу F.9), полагая и = еаж, dv = cos Ъх dx. Получим du = aeax dx, v = —-—, j _ eax sin bx a ~ b ~ b Для вычисления последнего интеграла еще раз применим фор™ мулу F.9), полагая на этот раз и = еаж, dv = slnkc dx. Получим
§ 2 ОСНОВНЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ 201 i or i cosbx аи = ае ах, v = ——=—, о т еах sinbx , а ах l °2 т (о 1 1 \ I = + ~-еах cos Ъх - —I. F.11) b bz bz Таким образом, посредством двукратного интегрирования по частям мы получили для интеграла уравнение первого поряд™ ка F.11). Из этого уравнения находим j a cos Ъх + Ь sin bx ax 6 Практика показывает, что большая часть интегралов, берущих- берущихся посредством интегрирования по частям, может быть разбита на следующие три группы: 1) К первой группе относятся интегралы, подынтеграль- подынтегральная функция которых содержит в качестве множителя одну из следующих функций: In ж, arcslnx, arccosx, arctga^, (arctgxJ, (arccosxJ, \тр(х), ... (см. рассмотренные выше примеры 1° и 2°). Для вычисления интегралов первой группы следует при- применить формулу F.9), полагая в ней и(х) равной одной из ука- указанных выше функций1). 2) Ко второй группе относятся интегралы вида (ах + Ь)п cos(cx)dx, / (ах + b)n sin(cx)dx, / (ах + Ь)песх dx, где а, Ь, с — некоторые постоянные, п — любое целое положи- положительное число (см. выше, пример 3°). Интегралы второй группы берутся путем n-кратного применения формулы интегрирова- интегрирования по частям F.9), причем в качестве и(х) всякий раз следует брать (аж + Ь) в соответствующей степени. После каждого инте™ грирования по частям эта степень будет понижаться на единицу. 3) К третьей группе относятся интегралы вида J eax cosbx dx, J eax sinbx dx, /sln(lnx) dx, Jcos(lnx)dx, ... (см. рассмотренный выше пример 4°). Обозначая любой из инте- интегралов этой группы через / и производя двукратное интегриро- интегрирование по частям, мы составим для / уравнение первого порядка. Конечно, указанные три группы не исчерпывают всех без ис- исключения интегралов, берущихся посредством интегрирования по частям. Приведем примеры интегралов, не входящих ни в од- одну из перечисленных трех групп, но вычислимых при помощи формулы F.9). ) В случае, если подынтегральная функция содержит в качестве множи- множителя (arctgxJ, (arccosxJ, ... , формулу интегрирования по частям F.9) придется применить дважды.
202 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 6 5°. Вычислим интеграл 1=1 —^—. Этот интеграл не входит J COS2 X ни в одну из упомянутых трех групп. Тем не менее, применяя формулу F.9) и полагая в ней и = х, dv = ——, получим du = COS2 X = dx, v = tgx, / / d(cosx) , iii , /^r I — = xtgx + In cos ж + G. J COS Ж ° ' 6°. Вычислим, наконец, весьма важный для дальнейшего ин- /» теграл К\ = / -г-г ^-?-, где а = const, А = 1, 2,... Этот инте- J (iz + az)A грал также не входит ни в одну из упомянутых выше трех групп. Для вычисления этого интеграла установим для него рекуррент- рекуррентную формулу, сводящую вопрос о вычислении К\ к вычисле™ нию К\-\. Можно записать (при А ф 1) Тг 1 / a dt 1 I [(t -\- а ) — t ]dt ~~ о2 I (t2 +а2)А ~~ а2™ / (t2 + а2)А ~~ dt I f + 2tdt __ 1^ 1 f +d{t2 + a2) F2 . O2\A^1 20^ / t (f2 +а2\А ~" Гг11^-! ^ I ^ /,2 2чА • J \^ Hi J LtlAi I yb \^ U J tli Zfti/ I yli T^ Ui J Для вычисления последнего интеграла применим формулу инте™ грирования по частям F.9), полагая в ней и = t, dv = ^2 ^. Получим dK = dt, v = /х . ~ , о,л_1? Л = ^2 л™х + 2а2(Л - l)(t2 + а2)'^ ~ 2а2(Л - 1) А"Ь Из последнего равенства получим рекуррентную формулу ^ = 2а»(А-1Ж»+а»)*-1 + i^f^- F2) Убедимся в том, что рекуррентная формула F.12) позволяет вычислить интеграл К\ для любого А = 2, 3,... В самом деле, интеграл К\ вычисляется элементарно [ dt if d(t/a) 1 После того как вычислен интеграл К\, полагая в формуле F.12) А = 2, мы без труда вычислим К.2- В свою очередь, зная К2 и полагая в формуле F.12) А = 3, мы без труда вычислим К%. Продолжая действовать таким образом дальше, мы вычислим интеграл К\ для любого натурального А.
ГЛАВА 7 КОМПЛЕКСНЫЕ ЧИСЛА. АЛГЕБРА МНОГОЧЛЕНОВ. ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНЫХ ФУНКЦИЯХ В предыдущей главе было указано, что неопределенный инте™ грал от элементарной функции, вообще говоря, не является эле- элементарной функцией. Тем не менее существуют довольно широ™ кие классы функций, интегралы от которых представляют собой элементарные функции. (Такие классы функций мы будем на- называть интегрируемыми в элементарных функциях.) Изучение указанных классов функций и составляет основную цель настоя- настоящей главы. Поскольку среди указанных классов функций одним из основных является класс рациональных функций, мы долж- должны прежде всего уточнить наши представления о многочленах и рациональных функциях. Для этого в свою очередь требуется уточнить наши сведения о комплексных числах. § 1. Краткие сведения о комплексных числах Два вещественных числа х и у мы будем называть упоря- упорядоченной парой, если указано^ какое из этих чисел является первым^ какое вторым. Упорядоченную пару вещественных чи™ сел х и у будем обозначать символом (ж, у), записывая на первом месте первый элемент пары х. Комплексным числом называется упорядоченная пара (ж, у) вещественных чисел^ первое из которых х называется дей- действительной частью^ а второе у — мнимой частью этого ком- комплексного числа. В случае, когда мнимая часть у равна нулю, соответствую- соответствующую пару (ж, 0) договариваются отождествлять с вещественным числом х. Это позволяет рассматривать множество всех веще- вещественных чисел как часть множества комплексных чисел. Два комплексных числа z\ = (х\,у\) и Z2 = (#2,2/2) называ~
204 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 ются равными^ если х\ = Ж2, 2/1 =1/2- Говорят, что комплексное число z = (ж, у) равно нулю^ если х = 0 и у = 0. Определим операции сложения и умножения комплексных чисел. Поскольку вещественные числа являются частью мно™ жества комплексных чисел, эти операции должны быть опре- определены так, чтобы в применении к двум вещественным числам они приводили к уже известным нам из § 2 гл. 2 определениям суммы и произведения вещественных чисел. Суммой двух комплексных чисел z\ = (#1,2/1) и z2 = (#2,2/2) назовем комплексное число z вида z = (xi + ж2, yi +1/2). G.1) Произведением двух комплексных чисел z\ = (#1,2/1) и Z2 — — {х2чУ2) назовем комплексное число z вида z = (xix2 - 2/12/2, # 12/2 + #22/i). G.2) Легко проверить, что сумма и произведение комплексных чисел обладают теми же самыми свойствами, что и сумма и произ- произведение вещественных чисел. Именно справедливы следующие свойства: 1°. z\ + Z2 = #2 + z\ (переместительное свойство суммы). 2°. [z\ + #2) + 2:3 = 21 + B2 + 23) (сочетательное свойство суммы). 3°. z + @,0) = z (особая роль числа @,0)). 4°. Для каждого числа z = (ж, у) существует противополож- противоположное ему число z1 = (—ж, —2/) такое, что z + z; = @, 0). 5°. z\ • Z2 = ^2 *^i (переместительное свойство произведения). 6°. [z\ - z2) - zs = z\- (z2- zs) (сочетательное свойство произве- произведения) . 7°. z - A,0) = z (особая роль числа A,0)). 8°. Для любого комплексного числа z = (ж,у), не равного нулю, существует обратное ему число - = ! _i_ 2 ' 2 _i_ 2 такое, что z • - = A,0). 9°. [z\ + Z2) • z% = zi • 03 + Z2 • 2:3 (распределительное свойство произведения относительно суммы). Свойства 1°—9° позволяют утверждать, что для комплексных чисел полностью сохраняются все правила элементарной алгеб- алгебры, относящиеся к арифметическим действиям и к сочетанию равенств. Кроме того, эти свойства полностью решают вопрос о вычи- вычитании комплексных чисел как о действии, обратном сложению, и о делении комплексных чисел как о действии, обратном умно- умножению. Разностью двух комплексных чисел z\ = (#1,2/1) и z2 = = (#2,2/2) называется такое комплексное число z, которое в
§ 1 КРАТКИЕ СВЕДЕНИЯ О КОМПЛЕКСНЫХ ЧИСЛАХ 205 сумме с Z2 дает z\. С помощью свойств 1°—4° элементарно уста™ навливается существование и единственность разности двух лю- любых комплексных чисел 1). Легко проверить, что разностью двух комплексных чисел z\ = (#i,yi) и Z2 = (#2?У2) является комплексное число z вида Z = (Xi -Х2, 2/1 -?/2). G.3) Частным двух комплексных чисел z\ = (#1,2/1) и Z2 — = (ж2?1/2)? второе из которых не равно нулю^ называется та- такое комплексное число z, которое при умножении на Z2 дает z\. С помощью свойств 5°^8° легко установить, что единствен- единственным частным двух указанных комплексных чисел является ком™ плексное число z вида о о 1 о о I • Ж2+2/2 ^2+2/2 / В операциях с комплексными числами особую роль играет число, представимое парой @,1) и обозначаемое буквой г. Умно- Умножая эту пару самое на себя (т. е. возводя ее в квадрат), получим в силу определения произведения комплексных чисел: @,1) . @,1) = (-1,0) = -1, т. е. i2 = -1. Заметив это, мы можем любое комплексное число z = (ж, у) представить в виде z = (х,у) = (ж,0) + @,|/) = (ж,0) + (у,0) • (ОД) =x + iy. В дальнейшем мы будем широко использовать для комплекс- комплексного числа z = (х^у) представление z = х + гу. Это представ™ ление и рассмотрение г в качестве множителя, квадрат которо- которого равен — 1, позволяет производить операции с комплексными числами так же, как они производятся с алгебраическими мно- многочленами. Комплексное число ~z = (ж, —у) = х^гу принято называть со- пряженным по отношению к комплексному числу z = (ж, у) = = x + iy. Очевидно, что комплексное число равно нулю тогда и только тогда^ когда равно нулю сопряженное ему число^ ибо равенства х = 0, у = 0 эквивалентны равенствам х = 0, —у = 0. Для геометрического изображения комплексных чисел удоб™ но пользоваться декартовой прямоугольной системой координат. При этом комплексное число z = (x^y) изображается или точ- точкой М с координатами (ж,у), или вектором ОМ, идущим из начала координат в точку М. ) Это делается точно так же, как и для вещественных чисел (см. п. 3 § 2 гл. 2).
206 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 При таком способе изображения сложение и вычитание ком™ плексных чисел сводится к сложению и вычитанию соответст- соответствующих им векторов (это понятно из формул G.1) и G.3)). Если наряду с декартовой системой координат ввести поляр™ ную систему координат так, чтобы полюс находился в начале О декартовой системы, а полярная ось была направлена вдоль по- положительного направления оси Ож, то декартовы координаты (ж, у) и полярные координаты (р, 0) любой точки Ж, как извест- известно, связаны формулами „2 X = pCGS0, у = р sin 0 Р = при ж > 0, G 5) arctg - + тг sgn у при ж < 0, 77 Sgn у При Ж = 0. 2 Формулы G.5) приводят нас к тригонометрической форме представления комплексного числа z = (ж,у): z = (ж, у) = ж + гу = (р cos 0, р sin 0) = p(cos 0 + г sin 0). G.6) В тригонометрической форме представления G.6) число р назы- называют модулем^ а угол 0 аргументом комплексного числа. Аргу™ мент 0 определен неоднозначно: вместо значения 0 можно брать значение 0 + 2тгп (где п = 0, =Ы, ±2,...). В тригонометрической форме удобно производить операции умножения и деления комплексных чисел. Пусть даны два произвольных комплексных числа ^2 = (Ж2,У2) = (Р2 COS 02, P2 sin f92). Тогда, по определению умно^кения (в силу формулы G.2)), произведение этих чисел имеет вид Zi ' Z2 = (Ж1Ж2 - У1У2, Xiy2 + Ж2Ш) = (Р1Р2 COS 0i COS 6>2 - ~~ Pi Р2 sin 0'i sin 02 5 Pi P2 cos 0i sin 02 + pi p2 sin 0i cos 02) = = [(P1P2) cos@! + 02), (plP2) sm@! + 02)]. G.7) Аналогично из формулы G.4) заключаем, что частное — двух комплексных чисел z\ = (х\,у\) — (picos0i, pism0i) и z2 = = (^2?У2) = (P2cos02, p2sm02) имеет вид1) ^ = \{РА cos@! - 02), (El Z2 1\р2/ \р2 - 02)l. G.8) 1 ) При этом предполагается, что комплексное число Z2 не равно нулю, т. е. р2 ф 0.
§ 2 АЛГЕБРАИЧЕСКИЕ МНОГОЧЛЕНЫ 207 Из формул G.7) и G.8) заключаем, что при умножении двух комплексных чисел их модули перемножаются^ а аргументы складываются (при делении двух комплексных чисел их модули делятся^ а аргументы вычитаются). Это свойство последова™ тельно переносится на случай произведения любого конечного числа комплексных чисел. В частности, если перемножаются п равных комплексных чисел (т. е. если комплексное число возво™ дится в степень п), то (pcosO, psm0)n = (рпсо8вп, рптпвп). G3) Из формулы G.9) при р = 1 получим так называемую формулу Муавра1) (cos^, sinflO1 = (cosвп, sin 0га). G.10) Формулу G.10) можно записать и в другом представлении: (cos 19 + isme)n = cos 0га+ i sin 0га. G.11) В заключение заметим, что комплексное число, записанное в тригонометрической форме, равно нулю в том и только в том случае, когда равен нулю его модуль. Отсюда и из того, что при перемножении комплексных чисел их модули перемножаются, вытекает, что произведение нескольких комплексных чисел рае- но нулю лишь в том случае^ когда равен нулю хотя бы один из сомножителей. § 2. Алгебраические многочлены 1. Алгебраическим многочленом n-й степени называется вы™ ражение вида f(z) = cozn + Clzn^ + ... + cn-xz + cm G.12) где z = (ж, у) = х + iy — переменное комплексное число, а co,ci,... , сп — некоторые постоянные комплексные числа, пер- первое из которых отлично от нуля. Как известно, любой алгебра™ ический многочлен степени п можно поделить «столбиком» на другой алгебраический многочлен степени не выше чем п. Та- Таким путем мы приходим к следующему утверждению: каковы бы ни были два многочлена f(z) и ip(z) такие^ что степень cp(z) не выше^ чем f(z), справедливо равенство f{z)=<p(z)-q{z)+r{z), G.13) в котором q(z) и r(z) — некоторые многочлены^ причем сте- степень q(z) равна разности степеней многочленов f(z) и (p(z), a степень r(z) ниже степени (f(z). ) А. де Муавр — английский математик, по национальности француз A667^1754).
208 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 По отношению к фигурирующим в равенстве G.13) многочле™ нам f(z), <p(z), q(z) и r(z) обычно применяют вполне понятные термины «делимое», «делитель», «частное» и «остаток». Говорят, что многочлен f(z) делится на многочлен (f{z), если в полученной посредством деления столбиком формуле G.13) остаток r(z) = 0. Договоримся называть многочленом нулевой степени любую комплексную постоянную. Тогда совершенно ясно, что любой многочлен делится на отличный от нуля многочлен нулевой степени. Изучим вопрос о делимости многочлена f{z) на мно- многочлен первой степени {z — b). Определение. Назовем комплексное число Ъ корнем многочлена /(г), если /(ft) равно нулю. Теорема 7.1. Многочлен нулевой степени f(z) делится на двучлен (z — b) тогда и только тогда^ когда b является корнем многочлена f(z). Доказательство. Запишем для многочленов f(z) и (p(z) = {z — b) формулу G.13). Поскольку степень остатка r{z) в этой формуле обязана быть ниже степени делителя (p{z) = z — — ft, то r{z) — многочлен нулевой степени^ т. е. r{z) = с = const. Таким образом, формула G.13) принимает вид f(z) = (z-b)-q(z)+c. G.14) Полагая в формуле G.14) z = ft, найдем, что с = /(ft). По опреде- определению f{z) делится на^~& тогда и только тогда, когда остаток в формуле G.14) с = f{b) равен нулю, т. е. тогда и только тогда, когда ft является корнем f{z). Теорема доказана. 2. Естественно, возникает вопрос: всякий ли алгебраический многочлен имеет корни? Ответ на этот вопрос дает основная теорема алгебры1): всякий многочлен ненулевой степени име- имеет хотя бы один корень. Опираясь на эту теорему, докажем, что алгебраический мно- многочлен п-й степени имеет точно п корней2). В самом деле, пусть f{z) — многочлен n-й степени. Согласно основной теоре™ ме алгебры f{z) имеет хотя бы один корень fti, т. е. для f{z) справедливо представление в котором через fi{z) обозначен некоторый многочлен степени (п — 1). Если п Ф 1, то, согласно основной теореме алгебры, fi{z) имеет хотя бы один корень &2, т. е. для f\{z) справедливо 1) Доказательство этой теоремы см. в выпуске «Функции комплексной переменной». 2) При этом, конечно, мы считаем, что п > 0.
§ 2 АЛГЕБРАИЧЕСКИЕ МНОГОЧЛЕНЫ 209 представление h(z) = (z-b2)f2(z), G.152) в котором через /2B) обозначен некоторый многочлен степени (п — 2). Повторяя указанные рассуждения далее, мы получим представления /2(z) = (z- h)h(z), G.153) /n_1(^) = (^-6n)/n(^). G.15") В последнем из этих представлений через fn(z) обозначен неко- некоторый многочлен нулевой степени, т. е. fn(z) = с = const. Сопо™ ставляя между собой равенства G.151)—G.15гг) и учитывая, что fn(z) = с, будем иметь f(z) = (z- h)(z -b2)...(z- bn)c. G.16) Отметим, что комплексная постоянная с не равна нулю, ибо в противном случае многочлен f(z) был бы тождественно равен нулю и не являлся бы многочленом n-й степени 1). Из равенства G.16) очевидно, что f(b\) = /(^2) = • • • ... = f(bn) = 0, т. е. каждое из чисел fti, &2? • • • ? Ьп является кор- корнем многочлена f(z). Кроме того, из G.16) очевидно, что, каково бы ни было комплексное число Ь, отличное от Ь]_, &2,... ? Ьп, ком- комплексное число /(Ь) не равно нулю, ибо произведение несколь- нескольких комплексных чисел равно нулю лишь в том случае, когда равен нулю хотя бы один из сомножителей (см. § 1). Таким об- образом, многочлен f(z) имеет ровно п корней: bi, &2,... , Ъп. Равенство G.16) дает разложение многочлена f(z) на мно™ жители. Если известен вид многочлена f(z) G.12), то мы можем определить постоянную с в равенстве G.16). Сравнивая в равен- равенствах G.16) и G.12) коэффициенты при zn, получим с = щ 2). Многочлен G.12), у которого cq = 1, называется приведен- приведенным. Для приведенного многочлена формула разложения G.16) ) Здесь мы используем следующее утверждение: если многочлен f(z) = = a®zn + a\zn^1 + ... + an^\z + an тождественно равен нулю, то все его коэффициенты равны нулю. В самом деле, если f(z) = 0, то при z = 0 получим ап = 0. Но тогда f(z) = z\a^zn^1 + ai/~2 + ... + an_i] = 0. Так как z ^0, то выражение в квадратных скобках тождественно равно нулю, откуда при z = 0 получим ап—\ = 0. Продолжая аналогичные рассуждения далее, докажем, что все коэффициенты равны нулю. 2) Здесь мы используем утверждение: если два многочлена aoz11' +a\zn~1 + + ... + ап и bozn + b\zn^ + ... + Ьп тождественно равны друг другу\ то а0 = 6о, о>1 = foi, ..., ап = bn- Для доказательства достаточно к разности указанных многочленов применить утверждение, отмеченное в сноске ) на этой странице.
210 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 принимает вид f(z) = (z- h)(z -b2)...(z- bn). G.17) Сравнивая формулу G.17) с формулой G.12) (при cq = 1), по- получим следующие соотношения: c = -(bl+b2 + ... + bn), С2 = +(hb2 + Мз + ... + bn-ibn), сп = (-1)пЬ1Ь2...Ъп. В дальнейшем, если не оговорено противное, мы будем рассма- тривать приведенные многочлены. § 3. Кратные корни многочлена. Признак кратности корнм Среди корней многочлена f(z) могут быть совпадающие кор- корни. Пусть а, Ь,... , с — различные корни приведенного многочле- многочлена f(z). Тогда в силу результатов предыдущего параграфа для f(z) справедливо разложение f(z) = (z-a)a(z-bf...(z-c)t. G.18) В этом разложении а, /3,... , 7 ~ некоторые целые числа, каждое из которых не меньше единицы, причем а + /3 + .. . + 7 = ^? гДе п — степень многочлена f(z). Если для многочлена f(z) справедливо разложение G.18), то говорят^ что комплексное число а является корнем f(z) крат- кратности а, комплексное число Ъ является корнем f(z) кратности /3, ... , комплексное число с является корнем f(z) кратности j. Корень, кратность которого равна единице, принято назы- называть однократны м^ а корень, кратность которого больше единицы, принято называть кратным. Можно дать и другое эквивалентное определение корня дан- данной кратности: комплексное число а называется корнем много- многочлена f(z) кратности а, если для f(z) справедливо представ- f(z) = (z-a)a<p(z), где <р{а) ф 0. G.19) Наша цель — указать необходимое и достаточное условие для того, чтобы комплексное число а являлось корнем многочлена f(z) кратности а. Назовем производной многочлена f(z) многочлен /;(^), полу- полученный формальным дифференцированием1) f(z) no z. Прежде всего докажем следующее утверждение. г) Дифференцирование f(z) no z производится так, как если бы z была вещественной переменной.
§ 3 КРАТНЫЕ КОРНИ МНОГОЧЛЕНА 211 Лемма 1. Если комплексное число а является корнем крат- кратности а многочлена f(z), то это же число а является корнем кратности (а — 1) многочлена f'{z). Замечание. В частности, при а = 1 число а, будучи однократным корнем /(#), не является корнем ff(z). Доказательство. По условию для f(z) справедли- во представление G.19). Дифференцируя формулу G.19), будем иметь f'(z) = a(z - а)а-1ф) + {z- a)a<p'(z), ИЛИ f'(z) = (z-a)a-1<p1(z), G.20) где = a(f(z) + {z- a)ip'(z). Поскольку (fi(a) = aip(a) ф 0, то представление G.20) означает, что число а является корнем кратности (а—1) многочлена f'(z). Лемма доказана. Теорема 7.2. Для того чтобы комплексное число а явля- являлось корнем кратности а многочлена /(г), необходимо и до- статочно^ чтобы были выполнены следующие условия: /(а) = /'(а) = ...=/(«-1)(а)=0, /^(а) ф 0. G.21) Доказательство. 1) Необходимость. Пусть а является корнем кратности а многочлена f(z). Тогда, согласно лемме 1, это же число а является корнем кратности (а — 1) многочлена /;(^), корнем кратности (а — 2) многочлена /^(z), ..., корнем кратности единица многочлена /^^(z), т. е. Согласно замечанию к лемме 1 число а не является корнем мно- многочлена /^(z), т. е. f^a\a) ф 0. Выполнение условий G.21) до™ казано. 2) Достаточность. Пусть выполнены условия G.21). Требуется доказать, что число а является корнем крат™ ности а многочлена f(z). Так как /(а^(а) = 0, число а являет- является корнем многочлена f^^iz) кратности не ниже единицы. Стало быть, на основании леммы 1 число а является корнем мно- многочлена f^a^2\z) кратности не ниже двух^ корнем многочле- многочлена f^a^^(z) кратности не ниже трех, ..., корнем многочлена f(z) кратности не ниже а. Остается доказать, что кратность корня а многочлена f(z) не выше а. Если бы эта кратность была выше о, то, согласно лемме 1, кратность корня а многочлена f^a^l\z) была бы выше
212 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 единицы, откуда следовало бы, что а является корнем f^a'(z), т. е. f(a'(a) = 0, что противоречит последнему из условий G.21). Теорема доказана. § 4. Принцип выделения кратных корней. Алгоритм Евклида 1. Принцип выделения кратных корней. Поставим пе- перед собой цель — для данного многочлена /(#), имеющего, во- вообще говоря, кратные корни, найти такой многочлен F(z), кото- который имеет те эюе самые корни, что и f(z), но все кратности единица. Для достижения этой цели введем некоторые новые понятия. Определение 1. Назовем делителем двух много- многочленов f(z) и (p(z) любой многочлен^ на который делятся оба многочлена f(z) и (f(z). Определение 2. Назовем наибольшим общим делителем двух многочленов f(z) и ip(z) такой их дели- тель, который делится на любой другой делитель этих двух многочленов. Договоримся обозначать наибольший общий делитель двух многочленов f(z) и (f(z) символом D[f(z),cp(z)]. Заметим, что из определения наибольшего общего делителя вытекает, что он определен с точностью до произвольного по- постоянного множителя. Возвращаясь к цели, сформулированной в начале настояще- настоящего параграфа, мы теперь легко можем проверить, что искомый многочлен F(z) имеет вид ™ = WWTWY G'22> В самом деле, пусть f(z) = (z-a)a(z-bf...(z-cy, G.23) где а, 6,... , с — различные корни. Тогда, согласно теореме 7.2, для многочлена f'{z) справедливо представление f'(z) = (z- a)a-\z -bf-1 ...(z- cy-^iz), G.24) где i/j(z) не содержит множителей (z — a), (z — b), ..., (z — c). Из сопоставления формул G.23) и G.24) очевидно, что D[f(z),f'(z)} = (z- a)a-l{z - bf-1 ...(z- of-1. G.25) Из сопоставления формул G.23) и G.25) в свою очередь очевидно, что многочлен F(z), определяемый формулой G.22), имеет вид F(z) = (z- a)(z -b)...(z-c). G.26)
§ 4 ВЫДЕЛЕНИЕ КРАТНЫХ КОРНЕЙ. АЛГОРИТМ ЕВКЛИДА 213 Тем самым доказано, что многочлен F(z), определяемый фор™ мулой G.22), имеет те же самые корни, что и многочлен /(я), но все кратности единица. Таким образом, задача выделения кратных корней сводит™ ся к построению по данному многочлену f(z) многочлена F(z), определяемого формулой G.22). Поскольку знаменатель формулы G.22) содержит наиболь- наибольший общий делитель двух многочленов f(z) и /;(^), возникает задача о нахождении наибольшего общего делителя двух мно- многочленов. Переходим к решению этой задачи. 2. Нахождение наибольшего общего делителя двух многочленов (алгоритм Евклида). Пусть даны два совер™ шенно произвольных многочлена f(z) и (f(z) и требуется най- найти их наибольший общий делитель. Не ограничивая общности, будем считать, что степень (f(z) не выше степени f(z). Тогда, поделив f(z) на <p(z) столбиком, мы придем к формуле G.13) (см. § 2) № = <p(z)q(z)+ri(z), G.271) в которой, как установлено в § 2, степень остатка r\{z) мень™ ше степени делителя (p(z). Это дает нам право снова поделить столбиком (p(z) на r\{z). В результате этого деления мы получим формулу, аналогичную формуле G.13): <p{z)=n{z)qi{z)+r2{z), G.272) в которой степень остатка V2{z) ниже степени делителя r\{z). Далее мы делим столбиком r\{z) на r2(z) и т. д. В результате получим r1(z)=r2(z)q2(z)+r3(zI G.273) rk-2(z) = r^i(z)g^i(z) + rk(z). G.27fc) Поскольку при каждом делении столбиком степень остатка бу- будет снижаться по крайней мере на единицу, повторив описанный процесс достаточно большое число к раз, мы на (к + 1)-м шагу получим остаток, равный нулю1), т. е. rk_l{z)=rk{z)qk{z). G.27fc+1) Докажем, что последний отличный от нуля остаток r^{z) явля- ется наибольшим общим делителем многочленов f(z) и <p(z). Достаточно доказать два утверждения: г) Если остаток не обратится в нуль в одном из промежуточных звеньев описанного процесса, то после некоторого количества к шагов мы получим остаток f'k(z) нулевой степени. Тогда следующий остаток rk+i(z) заведомо равен нулю (ибо любой многочлен делится на многочлен нулевой степени).
214 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНЫХ ФУНКЦИЯХ ГЛ. 7 1) многочлены f(z) и (p(z) делятся на rk(z) (это означает, что rk(z) является одним из делителей f(z) и (p(z)); 2) многочлен rfc{z) делится на любой делитель tq(z) много- многочленов f(z) и (f(z) (это означает, что rk(z) — наибольший общий делитель указанных многочленов). Для доказательства утверждения 1) заметим, что, в силу G.27 ), rk-i(z) делится на rk(z), а тогда, в силу G.27 ), rk-2(z) делится на rk(z) ... Поднимаясь вверх по цепочке равенств G.271)-G.27^), мы, наконец, докажем, что (p(z) и f(z) делятся на rk(z). Докажем теперь утверждение 2). Пусть tq(z) — любой де- делитель многочленов f(z) и tp(z). В силу равенства G.271) r\{z) делится на tq(z)j а тогда, в силу равенства G.27 ), T2(z) делит- делится на ro(z), в силу равенства G.273) r%{z) делится на ro(z) ... Опускаясь по цепочке равенств G.271)-G.27^), мы, наконец, до- докажем, что rk(z) делится на tq(z). Тем самым мы полностью обосновали описанный выше про- процесс нахождения наибольшего общего делителя двух многочле- многочленов. Этот процесс обычно называют алгоритмом Евклида. Пример. Найдем наибольший общий делитель двух мно- многочленов 1) f(z) = zA - 2z3 + 3z2 - 2z + 1 и ip(z) = 4z3 - 6z2 + 6z - 2. Поделив f(z) на ip(z) столбиком, будем иметь ^4_3 3,3 2 2 2 2Z +2Z 2Z +4Z -\z 3 3 3 +1 +i +1 \z 1 8 Далее мы должны были бы поделить cp(z) на обведенный пунк- пунктиром многочлен. Однако, поскольку наибольший общий де- делитель определен с точностью до произвольного постоянного множителя^ удобно умножить обведенный пунктиром остаток на 4/3 и поделить (f(z) на многочлен z2 — z + 1. В результате г) Легко видеть, что <p(z) = /''(z).
§ 5 РАЗЛОЖЕНИЕ ПРАВИЛЬНОЙ РАЦИОНАЛЬНОЙ ДРОБИ 215 получим 2 -z + l Az- остаток равен нулю. Таким образом, наибольший общий делитель многочленов f(z) и (p(z) равен z2 — z + 1, т. е. D[f(z),cp(z)]=z2-z + l. Замечание 1. В приведенном выше примере мы для простоты взяли многочлены f(z) и ip(z) с вещественными коэф- коэффициентами. Та же методика сохраняет силу и для многочленов с комплексными коэффициентами. Замечание 2. Следует отметить, что до настоящего времени практически отсутствуют устойчивые численные мето- методы вычисления корней произвольных многочленов с заданной точностью. Однако, имея предварительную информацию о рас- расположении искомого корня многочлена на некотором сегменте числовой оси, мы можем вычислить этот корень с интересующей нас точностью с помощью методов, изложенных в § 1 гл. 12. § 5. Разложение правильной рациональной дроби с комплексными коэффициентами на сумму простейших дробей Рациональной дробью называется отношение двух алге- алгебраических многочленов. Рациональная дробь называется пра- правильной, если степень многочлена, стоящего в числителе, мень- меньше степени многочлена, стоящего в знаменателе. В противном случае рациональная дробь называется неправильной. Как пра- вило, мы будем обозначать рациональную дробь символом , Q(z) понимая под P(z) и Q(z) алгебраические многочлены. P(z) Лемма 2. Пусть у^ — правильная рациональная дробь^ Q\z) знаменатель которой имеет корнем кратности а комплексное число а, т. е. Q(z) = (z- a)a<p(z), где (р(а) ф 0. G.28) Тогда для этой дроби справедливо следующее представление: Q[z) {z-a)« ^ {z-a)«-k<p{zy K'' *>
216 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 в котором А — комплексная постоянная^ равная , к — це- (р(а) лое число ^ 1, a i/j(z) — некоторый многочлен^ причем послед- последняя дробь в правой части G.29) является правильной. Доказательство. Обозначив через А постоянное число вида А = —^f J, рассмотрим разность ^W Р(?) _ А Q(z) {z-аУ Приводя указанную разность к общему знаменателю, будем иметь Р(г) _ А = P(z) - Аф) = Ф(г) = = Q(z) (z-a)° (z-a)°ip(z) {z-a)<*<p{zY где через Ф(-г) обозначен многочлен вида Ф(-г) = P(z) — Atp(z). Поскольку Ф(а) = Р(о,) — Aip(a) — 0, комплексное число а явля- является корнем, многочлена Ф(г) некоторой кратности к ^ 1, т. е. Ф(г) = {z - а)кф{г), где ф{а) ф 0. G.31) Вставляя представление G.31) в формулу G.30), будем иметь P(z) А ф{г) = Q[z) (z-a)" Тем самым формула G.29) доказана. Остается только убедиться в том, что дробь, стоящая в правой части G.32), является пра- правильной. Это непосредственно вытекает из того, что разность двух правильных дробей является правильной дробью2). Лемма 2 доказана. Из леммы 2 непосредственно вытекает следующая замеча- замечательная теорема, устанавливающая факт разложимости пра- правильной рациональной дроби на сумму простейших дробей. P(z) Теорема 7.8, Пусть —^ — правильная рациональная дробь^ знаменатель которой имеет вид Q(z) = (z- a)a(z -b)p...(z- сO. G.33) Тогда для этой дроби справедливо следующее представление: P(z) = Аг А2 Аа Q{z) (z - a)- (z- а)^1 ^ ' ' ' ^ (z - а) ^ , Вг , В2 (z-ЪУ (z-b)^1 (z-b) .................. + Cl+9l+ + (z-сУ 1) Число А имеет смысл, ибо (f(a) /0в силу G.28). 2) В этом легко убедиться, приводя разность правильных дробей к обще- общему знаменателю.
§ 6 РАЗЛОЖЕНИЕ АЛГЕБРАИЧЕСКОГО МНОГОЧЛЕНА 217 В этом представлении А\, А*}, ... , Aai B\, В^, ««« , -В/з, ••• , Ci, C2, ... , С7 — некоторые постоянные комплексные числа^ часть из которых может быть равна нулю. Доказательство. Сначала применим лемму 2 к дроби , имея в виду, что комплексное число а является кор- Q\z) нем Q(z) кратности а. При этом получим равенство G.32). К правой части этого равенства снова применим лемму 2, имея в виду, что либо комплексное число а является корнем знамена- знаменателя указанной правой части кратности а — к (при а — к > 0), либо, в силу разложения G.33), комплексное число Ъ являет- является корнем этого знаменателя кратности /5 (при а — к = 0). В результате получим равенство, аналогичное G.32), к правой ча- части которого снова можно применить лемму 2. Продолжая ана- аналогичные рассуждения далее (т. е. последовательно применяя P(z) лемму 2 по всем корням Q(z)), получим для дроби Q(z) ставление G.34). Теорема доказана. Замечание. Поскольку в лемме 2 число к может быть больше единицы и многочлен P(z) может иметь корни, совпа- совпадающие с корнями Q(z), то часть коэффициентов А\, ... , Aaj i?i, ... , Вр, С\, ... , Cj в формуле G.34) может быть равна нулю. § 6. Разложение алгебраического многочлена с вещественными коэффициентами на произведение неприводимых вещественных множителей Выше мы изучали разложение на сумму простейших дробей рациональной дроби с комплексными коэффициентами. Нашей окончательной целью является разложение рациональной дроби с вещественными коэффициентами на сумму простейших дро- дробей с вещественными коэффициентами. Для достижения этой цели мы должны прежде всего най- найти разложение алгебраического многочлена с вещественными коэффициентами на произведение неприводимых вещественных множителей. Этому и посвящен настоящий параграф. Пусть /(*) = zn + cxzn~x + c2zn~2 + ... + cn G.35) — приведенный алгебраический многочлен с вещественными коэффициентами с\, С2,... , сп. Прежде всего докажем следующую теорему. Теорема 7.4* Если комплексное число а является корнем алгебраического многочлена с вещественными коэффициента-
218 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 ми G.35), то и сопряженное ему комплексное число1) а так- также является корнем многочлена G.35). Более того^ если ком- плексный корень а имеет кратность A, wo и корень а имеет кратность А. Доказательство. Прежде всего докажем следую- следующее вспомогательное утверждение: если f(z) — многочлен с ве- вещественными коэффициентами, то комплексная величина f(z) является сопряженной по отношению к величине f(z). Доста- Достаточно доказать, что для любого номера п величина {z)n явля- является сопряженной по отношению к величине zn. Это последнее непосредственно вытекает из тригонометрической формы ком- комплексного числа. В самом деле, пусть z = p(cos в + г sin в). Тогда ~z = p[cos(—9) + г sin(—0)]. В силу формулы Муавра G.11) zn = рп (cos вп + г sin вп), = pn(cos0n — Из сопоставления двух последних формул вытекает, что {z)n является величиной, сопряженной по отношению к zn. Вспомо- Вспомогательное утверждение доказано. Пусть теперь комплексное число а является корнем много- многочлена f(z), т. е. f(a) = 0. В § 1 этой главы мы установили, что комплексное число равно нулю тогда и только тогда, когда равно нулю сопряженное ему число. Стало быть, из равенства f(a) = 0 и из доказанного выше вспомогательного утверждения вытекает, что /(а) = 0, т. е. число а является корнем f(z). Пусть дано, что кратность корня а равна А. Тогда в силу теоремы 7.2 /(а) = /'(а) = /B)(а) = ... = /^(а) = 0; /<А)(а) ф 0. G.36) Так как комплексное число равно нулю тогда и только тогда, когда равно нулю сопряженное ему число, то из доказанного выше вспомогательного утверждения и из соотношений G.36) вытекают следующие соотношения2): /(о) = f{a) = /B) (о) = ... = f{X-l\a) = 0, /W(a) ф 0. G.37) г) Всюду в дальнейшем мы будем обозначать комплексное число, сопря- сопряженное данному, тем же символом, что и данное число, но с черточкой наверху. ' ) При этом мы учитываем, что производная многочлена с вещественны- вещественными коэффициентами представляет собой многочлен также с вещественными коэффициентами.
§ 6 РАЗЛОЖЕНИЕ АЛГЕБРАИЧЕСКОГО МНОГОЧЛЕНА 219 В силу теоремы 7.2 соотношения G.37) означают, что число а является корнем f(z) кратности А. Теорема 7.4 доказана. Пользуясь теоремой 7.4, найдем разложение многочлена с ве- вещественными коэффициентами1) f(x) на произведение непри™ водимых вещественных множителей. Пусть многочлен f(x) име- имеет вещественные корни &i, &2? • • • ? ^т кратности /Зх, /?2, • • • , /Зт со- соответственно и комплексно сопряженные пары корней а\ и Щ, а2 ша21 ..., ап шап кратности Ai, A2,... , Ап каждая пара соот- соответственно. Тогда, согласно результатам § 3, многочлен f(x) может быть представлен в виде f(x) = (х- Ьг)^(х - b2f2 ...(х- Ьт)^(х - аг)х^х - «i)Al x х (х - а2)Х2 (х - а2)Аз ... (х - ап)Хп (х - ап)Хп, G.38) Обозначим вещественную и мнимую части корня а^ (к = = 1,2,... ,п) соответственно через щ и г?^, т. е. пусть а^ = = и^ + ivk • Тогда ak = Uk — ivk • Преобразуем для любого к = = 1,2,... , п выражение (х - ак)Хк(х - ак)Хк = [(х - ак)(х - ак)]Хк = = [(х ^щ^ тк)[х ^ик+ ivk)]Xk = [{х - ukf + v2k]Xk = = (x2+pkx + qk)Xk, G.39) где рк = -2ик, qk =uk +vk. Вставляя G.39) в G.38), окончательно получим следующее раз- разложение многочлена f(x) на произведение вещественных непри™ водимых множителей: f{x) = (х - Ъ{)^{х - b2f2 ...(х- Ьт)Рт(х2 +pix + gi)Al х х (ж2 + р2х + д2)Аз ... (х2 + рпх + qn)Xn. G.40) Мы приходим к выводу, что многочлен f(x) с вещественными коэффициентами распадается на произведение G.40) неприво™ димых вещественных множителей, причем множители, соответ- соответствующие вещественным корням, имеют вид двучленов в степе- степенях, равных кратности корней, а множители, соответствующие комплексным парам корней, имеют вид квадратных трехчленов в степенях, равных кратности этих пар корней. ) В дальнейшем нам придется иметь дело с многочленами от переменной, принимающей лишь вещественные значения. Поэтому для ее обозначения удобнее пользоваться буквой ж, а не z.
220 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 § 7. Разложение правильной рациональной дроби с вещественными коэффициентами на сумму простейших дробей с вещественными коэффициентами Имеют место следующие два утверждения. Р(х) Лемма 3. Пусть у^г4 — правильная рациональная дробь с вещественными коэффициентами^ знаменатель которой име- имеет вещественное число а корнем кратности а, т. е. Q(x) = (х- а)а<р(х), где (р(а) ф 0. Тогда для этой дроби справедливо следующее представление: р(х) - А , Ф(х) Q(x) (х - а)а (х- а)<*-к<р(х)' В этом представлении А — вещественное число^ равное А = = ^т^г, к — целое число ^ 1, а ф(х) — некоторый многочлен с вещественными коэффициентами, причем последняя дробь в правой части G.41) является правильной. Лемма 3 доказателв™ ства не требует, так как непосредственно вытекает из леммы 2. Следует только учесть, что, поскольку Р(х) и Q(x) — много™ члены с вещественными коэффициентами, а а — вещественный корень, многочлены <р(х) и ф(х) также имеют вещественные ко- коэффициенты и, стало быть, постоянная А = ; I является ве- <р(а) щественной. Р(х) Лемма 4- Пусть у^г4 — правильная рациональная дробь с Q{x) вещественными коэффициентами^ знаменатель которой Q(x) имеет комплексные числа a = u + ivua = u — iv корнями кратности А, т. е. Q(x) = (ж2 + рх + q) tp(x), где ср(а) ф 0, (р(а) ф 0, р=-2щ q = u2+v2. G.42) Тогда для этой дроби справедливо следующее представление: Р(х) = Mx + N ф(х) G АЧ) Q(x) (ж2 + рх + q)x (ж2 + рх + q)*-k<p(x)' К ' °} В этом представлении М и N — некоторые вещественные по- стоянные^ к — целое число ^ 1, а ф(х) — некоторый многочлен с вещественными коэффициентами^ причем последняя дробь в правой части G.43) является правильной. Доказательство леммы 4. Договоримся обозначать вещественную часть комплексной величины А сим™ волом Re [A], мнимую часть комплексной величины А символом
§ 7 РАЗЛОЖЕНИЕ ПРАВИЛЬНОЙ РАЦИОНАЛЬНОЙ ДРОБИ 221 Im [А]. Положим г) 1 ГР(аI АТ -о ГР(аI ит ГР(аI М = - Im -^ , ЛГ = Re -^ - - Im -^ . Нетрудно проверить, что указанные М и N являются решением следующего уравнения: Р{а) - (Ma + N)<p(a) = 0. G.44) В самом деле, поделив это уравнение на ^(а), и приравняв нулю действительные и мнимые части, мы получим два равенства из которых определяются написанные выше М и N. Рассмотрим теперь разность Р{х) _ Mx + N Q{x) {x Приводя указанную разность к общему знаменателю, будем иметь Р(х) _ Mx + N _ P(x)-(Mx + NL>(x) _ Ф(ж) Q(x) (x2 + рх + q)x (ж2 + рх + q)x(f(x) (ж2 + рх + д)А(^(ж) * G.45) Здесь через Ф(ж) обозначен многочлен с вещественными коэф- коэффициентами вида Ф(х) = Р{х) — (Mx + N)(p(x). Равенство G.44) позволяет утверждать, что комплексное число а, а стало быть, в силу теоремы 7.4, и сопряженное ему число а являются корня™ ми многочлена Ф(ж) некоторой кратности к ^ 1. В таком случае для многочлена Ф(ж) справедливо представление Ф(ж) = (ж2 +px + q)kф(x), G.46) где ф(х) — некоторый многочлен с вещественными коэффици™ ентами, не имеющий в качестве корней числа а и а. Вставляя представление G.46) в формулу G.45), получим представление G.43). Тот факт, что последняя дробь, стоящая в правой части G.43), является правильной, вытекает из того, что эта дробь равна разности двух правильных дробей. Лемма 4 доказана. Последовательное применение лемм 3 и 4 к дроби P(x)/Q(x) по всем корням знаменателя приводит нас к следующему заме- замечательному утверждению. 1) В силу G.42) (р(а) ф 0, так что отношение Р(а)/(р(а) рассматривать можно.
222 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Р(х) Теорема 7.5. Пусть — правильная рациональная Q(x) дробь с вещественными коэффициентами^ знаменатель кото- которой имеет вид Q(x) = (х - hf'(x - Ъ2)^ ...{х- (ж2 Тогда для этой дроби справедливо следующее разложение на сумму простейших дробей: Р(х) _ В' '1» Q{x) (x-bi) (m) R(m) 1 + _Ё2 + + + (x - bm) (x - bmJ ^ (x- B+ + ) B+ + J *** (ж2 +pix + gi)Al [ M[x + N{ | M^x + N^ | | B + + ) {2+ + J *** (ж2 + рпх + qn) (ж2 + рпх + qnJ """ (ж2 + рпх + qn)Xn ' G.47) A) A) (т) A) A) (п) В этом разложении В\ , В^ , ... , В \ , М^ , Ж-^ , ... , Мд , (п) Жд — некоторые вещественные постоянные^ часть из кото- которых может быть равна нулю. Замечание. Для конкретного определения только что указанных постоянных следует привести равенство G.47) к общему знаменателю и после этого сравнить коэффициенты при одинаковых степенях х в числителях. Примеры и разъяснения. 1°. Разложить на сумму простейших правильную дробь 2ж3 + 4ж2 + ж + 2 Убедившись в том, что квадратный трехчлен х + х + 1 имеет комплексные корни, ищем, согласно теореме 7.5, разложение в виде 2ж3 + 4ж2 + х + 2 Bi . ,В2 . Мх + JV (ж IJ ж2 + ж + Г V * ^ — 4 4 (ж - 1J(ж2 + ж + 1) ж - 1 (ж - IJ ж2 + ж + Г Приводя равенство G.48) к общему знаменателю, получим 2ж3 + 4ж2+ж + 2 _ Вг (ж3 - 1) + В2(х2 + ж + 1) + (Мж + N)(x2 - 2ж (ж-1J(ж2+ж + 1) (ж-1J(ж2 Сравнивая в числителях коэффициенты при ж0, ж1, ж2 и ж3, при™
§ 7 РАЗЛОЖЕНИЕ ПРАВИЛЬНОЙ РАЦИОНАЛЬНОЙ ДРОБИ 223 дем к системе уравнений х) Вг + М = 2, В2 + N - 2М = 4, -Вх + B2 + N = 2. Решая эту систему, найдем В\ = 2, В2 = 3^ М = 0^ N = 1. Окончательно получим 2ж3+4ж2+ж + 2 = _2_ 3 1 G лЦ) (ж - 1J(ж2 + ж + 1) ж - 1 (ж - IJ ж2 + х + 1* { } Только что проиллюстрированный метод отыскания разло- разложения правильной рациональной дроби называется методом неопределенных коэффициентов. Этот метод приводит к цели всегда; доказывать разрешимость полученной в результате при™ менения этого метода системы уравнений не нужно — разреши™ мость вытекает из теоремы 7.5. 2°. Проиллюстрируем метод неопределенных коэффициентов еще одним примером. Требуется найти разложение правильной дроби Зж4 + 2ж3 + Зж2 - 1 (ж^2)(ж2 + 1J * Так как квадратный трехчлен х2 + 1 имеет комплексные корни, ищем, согласно теореме 7.5, разложение в виде Зж4 + 2ж3 + Зж2 - 1 _ В Мгх + Ni M2x + N2 (ж-2)(ж2 + 1J ~ х-2 ж2 + 1 (ж2 + 1J * Последнее равенство приводим к общему знаменателю и после этого сопоставляем числители. Получим Зж4 + 2х3 + Зж2 - 1 = В(х4 + 2х2 + 1) + + (Мгх + JVi)O3 - 2ж2 + х - 2) + (М2х + Ж2)(ж - 2). Сравнивая коэффициенты при ж0, ж1, ж2, ж3 и ж , придем к си™ стеме уравнений Б + Мг = 3, JVi - 2Mi = 2, 2Л + Mi - 2Ni + M2 = 3, Ni - 2Mi +N2- 2M2 = 0, B-2Ni -2N2 = -1. г) При этом мы используем утверждение, сформулированное в сноске 2) на с. 209.
224 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Решая эту систему, найдем В = 3, Mi = О, N\ = 2, М~2 = 1, N2 = 0. Окончательно получим Зж4 + 2ж3 + Зж2 - 1 3 2 ж 2 + 1 B + 1J* (ж-2)(ж2 + 1J х-2 ( ) 3°. Метод неопределенных коэффициентов, как видно из рас- рассмотренных примеров, является довольно громоздким. Есте- Естественно поэтому в тех случаях, когда это возможно, найти другой, более простой метод отыскания коэффициентов в раз- разложении правильной рациональной дроби на сумму простей™ ших. Пусть знаменатель Q(x) правильной рациональной дро- дроби P(x)/Q(x) имеет вещественное число а корнем кратности а. Тогда среди простейших дробей, на сумму которых расклады- раскладывается дробь P(x)/Q(x), будет фигурировать дробь Укажем совсем простой метод вычисления коэффициента А при этой простейшей дроби. Привлекая лемму 3 и формулу G.41), мы убедимся в том, что коэффициент А равен А = Р{аIч>{а\ где ф) = Q(x)/(x - a)a. Мы приходим к следующему правилу: для вычисления коэффи- коэффициента А при простейшей дроби G.51), соответствующей ве- вещественному корню а многочлена Q(x) кратности а, следует вычеркнуть в знаменателе дроби —^ скобку (х — а)а и в остав- Q(x) шемся выражении положить х = а. Указанный прием нахождения коэффициента А обычно на- называют методом вычеркивания. Отметим, что этот прием при- применим лишь для вычисления коэффициентов при старших сте- степенях простейших дробей^ соответствующих вещественным корням Q(x). Метод вычеркивания особенно эффективен в случае, когда знаменатель Q(x) имеет лишь однократные вещественные кор- ни, т. е. когда Q(x) = (х — а\){х — а,2)... (ж — ап). Тогда, как мы знаем, справедливо разложение Р{х) = Аг | А2 | ^ | Ак к^ | Ап Q(x) х — а\ все коэффициенты которого могут быть вычислены по методу вычеркивания. Для вычисления коэффициента А^ следует вы- вычеркнуть в знаменателе дроби P(x)/Q(x) скобку (х — щ) и в оставшемся выражении положить х = а&. Пример. Найти разло^^ение дроби {х-\)х{х-2)ш
§ 8 ПРОБЛЕМА ИНТЕГРИРОВАНИЯ РАЦИОНАЛЬНОЙ ДРОБИ 225 Согласно теореме 7.5 пишем ж + 1 =^ + ^ + ^ (х-1)х(х-2) х-1 х х-2' Для отыскания А\ вычеркиваем в выражении G.52) скобку (х — — 1) и в оставшемся выражении берем х = 1. Получим А\ = —2. Аналогично находим А2 = 1/2, А% = 3/2. Окончательно получим ж + 1 _ -2 , J_ , 3 (х - 1)х(х - 2) ~ ж - 1 2ж 2(ж - 2)' § 8. Проблема интегрирования рациональной дроби Теперь мы подготовлены к тому, чтобы в общем виде решить проблему интегрирования рациональной дроби с вещественны- вещественными коэффициентами. Прежде всего, отметим, что эта проблема сводится к про™ блеме интегрирования только правильной рациональной дроби, ибо всякую неправильную рациональную дробь можно (посред- (посредством деления числителя на знаменатель «столбиком») предста™ вить в виде суммы алгебраического многочлена неправильной рациональной дроби. Пример. *42+*3+2 = {Х2 - 2Х) + »^» + 2' ибо х2 + х + 2 х4 - х3 + 1 ж4 + х3 + 2х2 х2 - 2х -2х3 - 2х2 + 1 - 2х2 - Ах остаток 1 + 4х Интегрировать многочлен мы умеем (напомним, что неопре- неопределенный интеграл от многочлена представляет собой некото™ рый многочлен степени, на единицу более высокой). Остается научиться интегрировать правильную рациональную дробь. В силу теоремы 7.5 проблема интегрирования правильной рацио™ нальной дроби сводится к интегрированию простейших дробей следующих четырех типов: х -— Ь' (х — Ь )^ ' (х2 + рх + д)' (ж2 + рж + д)А G.54) В.А. Ильин, Э.Г. Позняк, часть I
226 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНЫХ ФУНКЦИЯХ ГЛ. 7 Здесь /3 = 2, 3,... ; А = 2, 3,... ; В, М, Ж, Ь, р и g — некото- некоторые вещественные числа, причем трехчлен ж2 + рх + g не имеет Р2 ^ а вещественных корней, т. е. g — ^-— > и. Докажем, что каждая из четырех указанных дробей интегри- интегрируема в элементарных функциях. Дроби вида I и II элементарно интегрируются при помощи подстановки t = х — Ь. Мы получим Г JL. dx = В Г j = В In \t\ + С = В In \х - Ь | + С, G.55) [fJ-l)tP^± [fJ - I) [X - t))P^L G.56) Для вычисления интеграла от дроби вида III представим квад- /2 ч ( Р\2 ( Р2 ратный трехчлен в виде (х + рх + д)=ж + ?: + I G ~ — 2 V 2/ V 4 учитывая, что д — ?— > 0, введем в рассмотрение вещественную I 1г~ постоянную tt = +l/g^^r. Сделав подстановку t = ж + ^, будем V 4 2 иметь - Mi, 2 м 2 ff 2 ^П^ + рж 2tdt t2+a2 t2 + a2 -(N- + (iV 2N-. 2dq^ M с I ) 2c p" 4 — j MM / Mp\ 1 2 Jaj t Parctg - t2 f ' ( v g + a2 <") vtt/ f 2 | С 4 G.57) Остается вычислить интеграл от дроби вида IV. Используя вве- введенные выше обозначения t = х + -, а = \ Q ~ ^~i получим = M Г djt2+a2) У dt_ N_ Mp 2 2 / (*2+a2)A 'V 2 ) (i2+a^)A-
§ 8 ПРОБЛЕМА ИНТЕГРИРОВАНИЯ РАЦИОНАЛЬНОЙ ДРОБИ 227 Интересующий нас интеграл будет вычислен, если будут вычис™ лены интегралы dt (t2+a2)A* Интеграл I берется элементарно: г __ _ 1 \ _|_ г* __ _ 1 Интеграл Жд вычислен нами в примере 6 в конце § 2 гл. 6. Там мы получили для этого интеграла рекуррентную формулу F.12), позволяющую последовательно вычислить К\ для любо- любого А = 2, 3,... , опираясь на то, что Итак, нами вычислены интегралы от всех четырех простейших дробей G.54) и доказано, что каждый из этих интегралов пред- представляет собой элементарную функцию1). Тем самым мы при- приходим к следующей теореме, исчерпывающей проблему интегри™ рования рациональной дроби. Теорема 7.6. Всякая рациональная дробь интегрируется в элементарных функциях. В заключение этого параграфа мы остановимся на приме- примерах вычисления неопределенных интегралов от рациональных дробей. Вычислим неопределенные интегралы от трех дробей, рассмотренных в предыдущем параграфе G.49), G.50) и G.53). Пользуясь указанными тремя формулами, а так лее формулами G.55), G.56) и G.57), будем иметь: Л [ 2х3 + 4ж2 + х + 2 , - Г 2 J *- Г Idx+J ( — v 1 in 3 х-гу 3 х — [ 1 * 4 1 dx _ 2 2ж + 1 ) Точнее, выражается через логарифм, арктангенс и рациональную функцию.
228 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Зж4 + 2ж3 + Зж2 - 1 3 , . / 2dx . / x dx 3. I т -т-р -г ах = У ( 1)( 2) я - 2| + 2arctg2; - ^—^ + С. (ж — 1)ж(ж — 2) J х — 1 J 2ж у 2(ж — 2) = -2 In |ж - 1| + | In |ж| + | In |ж - 2| + С. § 9. Метод Остроградского М.В. Остроградским х) предложен остроумный метод выде- выделения рациональной части интеграла от правильной рациональ- рациональной дроби P(x)/Q(x). Анализируя вид интегралов от четырех простейших дробей G.54), можно сделать следующие выводы: 1) Интегралы от дробей вида I и III, знаменатели которых со- содержат двучлен или соответственно трехчлен в первой степени, являются нерациональными функциями (они равны логарифму или арктангенсу). 2) Интеграл от дроби вида II, знаменатель которой содержит двучлен в степени /5 > 1, является правильной рациональной дробью со знаменателем^ равным тому же двучлену в степе- степени /3 — 1. 3) Интеграл вида IV, подынтегральная функция которого со- содержит в знаменателе трехчлен в степени А, в конечном итоге2) равен сумме правильной рациональной дроби со знаменателем^ равным тому же трехчлену в степени А — 1, ti приводящегося /» к арктангенсу интеграла const Выводы 1), 2), 3) позволяют заключить, чему равна рацио™ нальная часть всего интеграла от правильной дроби P(x)/Q(xI которую мы, кроме того, будем считать несократимой. Пусть знаменатель Q(x) имеет вид Q{x) = (x-hf1 ... (x-bmfm(x2+pix + qi)Xl ... {x2+pnx+qn)K. G.58) 1) Михаил Васильевич Остроградский — русский математик A801-1861). 2) С учетом рекуррентной формулы F.12), полученной в конце § 2 гл. 6.
§ 9 МЕТОД ОСТРОГРАДСКОГО 229 Тогда рациональная часть интеграла от правильной рациональ- ной дроби P(x)/Q(x) равна сумме правильных рациональных дробей, знаменатели которых соответственно равны ух и\) , . . . , [X vm) , {X -\- р\х -\- qi) , . . . ... , {х2 + Рпх + qn)Xn-1. Рациональная часть интеграла от дроби P(x)/Q(x) пред- представляет собой, очевидно, правильную рациональную дробь P\(x)/Qi(x), знаменатель которой Qi(x) имеет вид Qx{x) = {x- bi)^-1 ... (ж - &m)^-V +Pix + qi)*1-1 - - - ...(x2+pnx + qn)X"-\ G.59) Подсчитаем теперь сумму тех простейших дробей, интегра™ лы от которых представляют собой нерациональные функции. Из выводов 1) и 3) вытекает, что эта сумма равна правильной рациональной дроби P2(x)/Q2(xI знаменатель Q2{x) которой равен Q2(x) = (х-Ьг)... (x-bm)(x2+Plx+qi)... (x2+pnx+qn). G.60) Таким образом, мы приходим к следующей формуле, впервые полученной М.В. Остроградским: В формуле Остроградского многочлены Q\{x) и Q2(x) определя- определяются формулами G.59) и G.60) и могут быть вычислены без раз- разложения многочлена Q{x) на произведение неприводимых мно- множителей. В самом деле, в силу результатов § 4 (см. формулу G.25)), многочлен Qi(x) представляет собой наибольший общий дели- делитель двух многочленов Q(x) и Qf(x) и может быть вычислен при помощи алгоритма Евклида (см. § 4). Многочлен Q2(x)j в силу формул G.58), G.59) и G.60), пред™ ставляет собой частное Q(x)/Qi(x) и может быть вычислен по- посредством деления Q(x) на Q\{x) «столбиком». Остается вычислить многочлены Р\{х) и Р2(х). Поскольку дроби Р\{х)IQ\{x) и P2(x)/Q2(x) являются правильными, мно™ гочлен Р\(х) естественно задать как многочлен с неопределен- неопределенными коэффициентами степени на единицу ниже, чем Q\(xI а Р2(х) — как многочлен с неопределенными коэффициента- коэффициентами степени на единицу ниже, чем Q2(x). Для вычисления ука- указанных неопределенных коэффициентов следует продифферен- продифференцировать формулу Остроградского G.61), привести результат дифференцирования к общему знаменателю и сопоставить ко- коэффициенты при одинаковых степенях х в числителях.
230 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНЫХ ФУНКЦИЯХ ГЛ. 7 Таким образом, метод Остроградского представляет собой остроумный прием интегрирования рациональной дроби без предварительного разложения этой дроби на сумму простейших. Этот прием особенно эффективен в том случае, когда корни Q(x) в основном являются кратными или когда вызывает за- затруднение нахождение корней Q(x). Пример. Методом Остроградского вычислить 6 — 7х ~~ х j ¦ ах. ж4 - 2ж3 + Зж2 - 2х + 1 «/ Имеем Q(x) = ж4 ~~ 2ж3 + Зж2 - 2ж + 1, Qf(x) = 4ж3-6ж2 + 6ж-2. Ищем Q\(x) как наибольший общий делитель многочленов Q(x) и Qf(x). Заметим, что наибольший общий делитель именно этих двух многочленов уже найден нами в примере, рассмотренном в конце § 4. Он равен дг(х) =х2 -х + 1. Поделив Q(x) на Qi(x) «столбиком», найдем Q2(x) =x2 -х + 1. Р\(х) и Р2{%) задаем как многочлены первой степени с неопре- неопределенными коэффициентами. Формула Остроградского G.61) принимает вид 6 - 7х - х2 j Ах + В . Г Cx + D Для определения коэффициентов А, ?», G, D продифференци™ руем формулу G.62). Получим 6 - 7х - х2 _ А(х2 -х + 1)-(Ах + В)Bх-1) Сх + Р ж4 - 2ж3 + Зж2 - 2х Результат дифференцирования приводим к общему знаменате™ лю, после чего сопоставляем числители. Получим Сравнивая коэффициенты при ж0, ж1, ж2 и ж3, получим систему уравнений -2В -
§ 10 ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ВЫРАЖЕНИЙ 231 Решая эту систему, найдем А = 2, В = 3, С = 0, D = 1. Таким образом, формула G.62) принимает вид 6 - 7х - х2 , _ 2х + 3 [ dx ¦ UX — — —¦ i ж4 - 2ж3 + Зж2 - 2х + 1 ж2 - ж + 1 / ж2 - ж + 1 Вычислив интеграл в правой части, окончательно найдем 6 - 7х - х2 , 2ж + 3 ,2 , 2ж - 1 , С4^2жЗ + Зж2^2ж + 1^ ж2^ж + 1 ' V3 Ь V3 G. § 10. Интегрирование некоторых иррациональных и трансцендентных выражений В предыдущих параграфах мы установили, что интеграл от любой рациональной дроби представляет собой элементарную функцию. В настоящем параграфе мы рассмотрим некоторые другие классы функций, интегрируемых в элементарных функ- функциях. Как правило, мы будем посредством некоторой подстанов- подстановки сводить интеграл от рассматриваемой функции к интегралу от рациональной дроби. Относительно указанной подстановки мы будем говорить, что она рационализирует интеграл от рас™ сматриваемой функции. 1. Интегрирование некоторых тригонометрических выражений. Договоримся всюду в дальнейшем символом R(x^y) обозначать любую рациональную функцию от двух ар™ гументов х и у 1). В этом пункте мы докажем интегрируемость в элементарных функциях любой функции вида i?(sinx,cosa:). G.63) Докажем, что интеграл от этой функции рационализируется подстановкой t = tg —. Действительно, А 2tg| 2f i-tg'f 1-t2 Sin Ж = ^jr = -, COS Ж = ?- = -, l+tg2f ! + *2' 1+tg'f 1+*2' ж = 2 arctg t, dx = 1+i2' 1) Рациональная функция от двух аргументов определяется следующим образом. Многочленом п-ш степени от двух аргументов хну называет™ ся выражение вида Рп(х,у) = аоо + cliox + o>oiy + в2ож + сьцху + а>02У + + ... + аопуп, где аоо, flio, «oi, • • • , «On — некоторые постоянные числа. Ра- Рациональной функцией от двух аргументов называется отношение вида Pn(xj y)/Qm(xj y)j где Рп(х, у) — произвольный многочлен от двух аргумен- аргументов степени n, a Qm(xjy) — произвольный многочлен от двух аргументов степени га.
232 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 так что Поскольку рациональная функция от рациональной функции представляет собой также рациональную функцию, то интеграл, стоящий в правой части последнего равенства, является инте- интегралом от рациональной дроби. Подстановка t = tg -, хотя и является универсальной подста™ новкой, рационализирующей интеграл от функции G.63), часто приводит к громоздким выкладкам. В связи с этим мы укажем несколько частных случаев, в которых интеграл от функции G.63) может быть рационализирован с помощью других более простых подстановок. Прежде всего отметим два элементарных свойства рациональной функ> ции двух аргументов R(u,v): 1°. Если рациональная функция R(ujv) не меняет своего значения при изменении знака одного из аргументов (например и), т. е. если R(—-u,v) = = R(ujv)j то эта рациональная функция может быть приведена к виду R^Ujv) = Ri(u2,v), где R\ — некоторая рациональная функция своих двух аргументов. (Эта функция содержит лишь четные степени и.) 2°. Если же при изменении знака и функция R(u, v) также меняет знак, т. е. R(—Ujv) = —R(u,v), то она приводится к виду R(u^v) = R2(u2, v)u. (Свойство 2° сразу вытекает из свойства 1°, если применить его к функции R(u,v)/u.) Рассмотрим теперь вопрос о рационализации интеграла от функции G.63) для некоторых частных случаев. I. Пусть R(u, v) меняет знак при изменении знака и. Тогда, согласно свойству 2°, / l^sin ж, cos x) dx = / R2 (sin2 ж, cos x) sin x dx = = — I R2O-— cos ж, cosx)d(cosx). Таким образом, интеграл от функции G.63) рационализируется подстанов- подстановкой t = cos ж. П. Пусть, далее, функция R(u,v) меняет знак при изменении знака v. Тогда, согласно тому же свойству 2°, / R(sinx, cos ж) dx = / Д3 (sin ж, cos2 ж) cos ж dx = / , 1 — sin x)d(sinx), т. е. интеграл от функции G.63) рационализируется подстановкой t = sin ж. III. Пусть, наконец, функция R(u, v) не меняет своего значения при одновременном изменении знаков и и v, т. е. R(—u, —v) = R(u, v).
10 ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ВЫРАЖЕНИЙ 233 Докажем, что в этом случае интеграл от функции G.63) рационализируется подстановкой t = tgx. В самом деле, в этом случае R(u,v) = r(-v,v) =Ri (-,v), R(-u, -v) = R f-(-v), -v) = Ri (-, -v) . Таким образом, *(!¦-)-«¦(;. Но тогда, согласно свойству 1°, Окончательно получим Отсюда / iZ(smx,cosa;) dx = / i?2(tgx,cos ж) dx где t = tgx, ж = arctgt, dx = eft 1+t2 Примеры. 1) Вычислить интеграл I\ = f , где а > 0, аф\. J 1 + a cos х Применяя универсальную тригонометрическую подстановку t = tgx/2, по- получим = zarctgt, ах = 1+t2' cos ж = 1+t2' h =2 f dt _ 2 f dt i (a+lL-t2(l-a)"a+lj 1 , 1 ~ «^ 1 + а Далее нужно отдельно рассмотреть два случая: 1) 0 < а < 1, 2) а > 1. В случае 0 < а < 1 В случае а > 1 г1 = ^=1п l+t\ : arctg /1 — а ж t 1-tA la — 1 x t la — 1 x t C. 2) Вычислить интеграл I2 = J ^ sin ж с!ж sin2 ж + 1
234 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Так как подынтегральная функция меняет знак при изменении знака sin ж, то, согласно I, следует сделать подстановку t = cos ж. В результате получим т 2 - [ ""У 1 - dt + dt In t + 72 t->/2 1 o fc 2\J i = ln > cos ж — ¦ ¦С. о. _, т [ sin ж cos о) Вычислить интеграл 1з = / —т J sin ж + с( -dx. Так как подынтегральная функция сохраняет значение при одновре- одновременном изменении знаков sin ж и cos ж, то, согласно III, следует сделать подстановку ? = tgsc. В результате получим J tA + 1 2 J С = \ ж) + С. 2. Интегрирование дробно-линейных иррационально- стей. В этом пункте мы докажем интегрируемость в элементар- элементарных функциях любой функции вида G.64) где а, 6, с и d — некоторые постоянные, п — любое целое по- положительное число. Функцию такого вида мы будем называть дробно-линейной иррациональностью. Докажем, что интеграл от функции G.64) при ad — be О рационализируется подстановкой t = f Г = аж + i CX + ? ж = dtn -Ь dx = . В самом деле, ¦dt, (a - ctnJ так что dx= R dtn -b . а — ctn ' (а - ctnJ ¦dt. Поскольку рациональная функция от рациональной функции представляет собой также рациональную функцию, то интеграл, стоящий в правой части последнего равенства, является инте- интегралом от рациональной дроби. Тем самым доказано, что инте- интеграл от дробно-линейной иррациональности G.64) рационализи- « # те/аж + руется подстановкой t = ' еж + d Пример. Вычислить интеграл / = . Сделав
10 ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ВЫРАЖЕНИЙ 235 подстановку получим t2dt , dx = Udt 1 = 2 ^fj = 2 dt-2 jf^ = 2t - 2arctgt = 2 — 2 arctg 3. Интегрирование биномиальных дифференциалов. Биноми- Биномиальным дифференциалом называют выражение вида хт(а + Ъхп)р dx, где а и & — любые постоянные, а показатели степеней т, п ж р — некоторые рациональные числа. Изучим вопрос об интегрируемости в элементарных функциях биномиальных дифференциалов. Прежде всего отметим три случая, когда интеграл от биномиального дифференциала допускает рационализирующую подстановку. 1°. Первый случай соответствует целому р. Биномиальный диффе- дифференциал представляет собой дробно-линейную иррациональность вида R (ж, у/х) dx, где г — наименьшее общее кратное знаменателей рациональ™ пых чисел тип. Стало быть, интеграл от биномиального дифференциала в этом случае рационализируется подстановкой t = у/х. 2°. Второй случай соответствует целому числу . Сделав подста- п новку z = хп и положив для краткости ^—^— — 1 = д, будем иметь I - f(a- -bz)pzqdz. G.65) Подынтегральная функция в правой части G.65) представляет собой дробно™линейную иррациональность вида Rlz, л/а + bz J, где s — знаме- знаменатель рационального числа р. Таким образом, во втором случае биномиальный дифференциал рацио- рационализируется подстановкой 3°. Третий случай соответствует целому числу m - •1 n + р 1. Подын- Подынтегральная функция в правой части G.65) представляет собой дробно- la + bz линейную иррациональность вида R , так что интеграл от биномиального дифференциала рационализируется подстановкой вида _ Ja + bz
236 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 В середине прошлого века П.Л. "Чебышев ) доказал, что указанными выше тремя случаями исчерпываются все случаи, когда биномиальный дифференциал интегрируется в элементарных функциях. Примеры. 1) Вычислить интеграл 1=1 ^— = I х ' (а + J х2\/а + Ъх2 J dx. Здесь т = —2, п = 2, р = -—1/2, так что (третий случай). Сделав подстановку fa будем иметь 1 = a J a a n = z, р = — — , так что 2 2) Вычислить интеграл I = I х A-х ) dx. В данном случае т = 5, = 3 (второй случай). Сделав подстановку tdt t = ^l-xz, x = ^l-V, dx = - — V будем иметь 1 = - ГA -t2Jdt = - {dt + 2 ft2dt- f t4dt = 4. Интегрирование квадратичных иррациональностей посредством подстановок Эйлера. В этом пункте мы дока- докажем интегрируемость в элементарных функциях любой функ- функции вида R (х, л/ах2 + Ъх + с) , G.66) где а, Ъ и с — некоторые постоянные. Функцию такого вида бу™ дем называть квадратичной иррациональностью. При этом мы, конечно, считаем, что квадратный трехчлен ах2 + Ъх + с не име- имеет равных корней (иначе корень из этого трехчлена может быть заменен рациональным выражением). Мы докажем, что интеграл от функции G.66) всегда рацио- рационализируется одной из так называемых подстановок Эйлера. Сначала рассмотрим случай, когда квадратный трехчлен ах2 + Ъх + с имеет комплексные корни. В этом случае знак ква- г) Пафнутий Львович Чебышев — великий русский матема A821™ 1894).
§ 10 ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ВЫРАЖЕНИЙ 237 дратного трехчлена совпадает со знаком а, и поскольку по смыс™ лу квадратный трехчлен (из которого извлекается квадратный корень) положителен^ то а > 0. Таким образом, мы имеем право сделать следующую подста™ новку: t = л/ах2 + bx + с + ж д/а. G.67) Подстановку G.67) обычно называют первой подстановкой Эй- Эйлера. Докажем, что эта подстановка рационализирует интеграл от функции G.66) для рассматриваемого случая. Возвышая в квадрат обе части равенства у ах2 + Ъх + с = t ~~ хл/а^ получим Ъх + с = t2 — 2^/atx, так что t2 — с / о . l i \/at2 + bt + сх/а х = ^^ , yaxz + Ъс + х = — v Таким образом, / i? ( ж, у ах2 + Ъх + с\ dx = В правой части под знаком интеграла стоит рациональная дробь. Рассмотрим теперь случай, когда квадратный трехчлен ах2 + + Ъх + с имеет несовпадающие вещественные корни жх и #2- В таком случае аж2 + кс + с = а(ж^Ж1)(ж^Ж2). Докажем, что в этом случае интеграл от функции G.66) рационализируется посредством подстановки t = ^аж2+Ьж + с, G.68) называемой обычно второй подстановкой Эйлера. В самом де- деле, возводя в квадрат равенство у ах2 + Ъх + с = t(x — x\) и сокращая полученное равенство на (ж —жх), получим а{х^Х2) = = t2(x — жх), так что , \/axz «Ж2 + ait / 9,i , х = — , \/axz + Ьж + с = t2 — a , _ 2a(Xl- X2)t х~ (i2_aJ
238 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Таким образом, /R f ж, у ах2 + Ьх + с\ dx = // _ /7 ПР п, I ПН1 -г ~§~ /1 ( ПТ* -% — ПР c%\~t \ /Л I Ti — (t2_oJ at- В правой части под знаком интеграла стоит рациональная дробь. /» Примеры. 1) Вычислить интеграл I = . 1 J х + л/х2 + х + 1 Поскольку квадратный трехчлен ж2 + ж + 1 имеет комплексные корни, сделаем первую подстановку Эйлера t = уж2 + ж + 1 + х. Возвышая в квадрат обе части равенства ух2 +ж + 1 = ? — ж, получим ж2 + х + 1 = t2 — 2tx + ж2 или х + 1 = t2 — 2tж, так что Таким образом, 2 f В С Неопределенные коэффициенты А, В и G легко вычисляют™ ся: т4 = 2, ?» = — 3, С = — 3. Окончательно получим = 2 In \/ж2 + ж + 1 + ж ° 1 — - In '2ж + 2\/ж^ 3 2х —. Поскольку 1 + v 1 — 2ж — х2 квадратный трехчлен 1 — 2ж — ж2 имеет вещественные корни х\ = — 1 + \/2 и Ж2 = — 1 — л/2, сделаем вторую подстановку Эйлера G.68) Возвышая в квадрат обе части равенства у/1 — 2ж — ж2 = t(x + + 1 + л/2), будем иметь ( - 1)(ж +1 - л/2) = ^2(ж + 1 + л/2), так что -г2(^+1)+^-1 / _ _ _ 2^ ж- ^^ , л/1 zx х - ^
10 ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ВЫРАЖЕНИЙ 239 -L \^ у -L Zi«uO «A/ г • 1Л Ju Таким образом, tdt Получаем интеграл от рациональной дроби, вычисление которо™ го предоставляем читателю. 5. Интегрирование квадратичных иррациональностей другими способами. Хотя подстановки Эйлера всегда рационализируют интеграл от функции G.66), но обычно эти подстановки приводят к весьма громозд- громоздким и сложным выкладкам. Ввиду этого на практике часто пользуются другими способами интегрирования функции G.66). Этим способам и по- посвящен настоящий пункт. Вводя обозначение у = л/ах2 + Ьх + с и имея в виду, что у2 представляет собой многочлен, мы можем представить функцию G.66) в виде суммы где R\(x) и R2(x) — некоторые рациональные функции одной переменной. Поскольку интеграл от R\{x) берется (в элементарных функциях), нам до- достаточно заняться вычислением интеграла от функции R2(x)/y. Мы уже знаем ), что всякую рациональную дробь R2(x) можно пред- представить в виде суммы многочлена Р(х) и правильной рациональной дроби Дз(ж). Правильную рациональную дробь Rs(x) в свою очередь можно раз- разложить на сумму простейших дробей. Имея это в виду, мы можем утвер- утверждать, что проблема интегрирования функции R'2(x)fy сводится к вычис- вычислению интегралов следующих трех типов: () / / р Р(х) dx, где Р(х) — многочлен. /ГУ т 7т— dx. где А и В — некоторые постоянные, а — натуральное (ж - А)ау число. III. / ^^ г^ dx, где М, N. р и а — некоторые постоянные, А — J {x2+px + q)xy Р2 натуральное число, причем q — > 0. Остановимся на вычислении интегралов типа I, II и III в отдельно- отдельности. I. Для вычисления интеграла типа I прежде всего установим рекур- рекуррентную формулу для интеграла [ J dx где m = 0,1,2,... У Для этого, предполагая, что т ^ 1, проинтегрируем следующее проверяе- проверяемое посредством дифференцирования тождество: гр / 1 \ гр / га—1 \/ if ii. i / 1\ (х у) = та^— + I т — — I о ^—^ + (т — 1)с См. начало 8 8.
240 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Интегрирование этого тождества приводит нас к равенству хт = malm + I га — — J blm-i + (ra — l)c/m_2. G.69) Беря в равенстве G.69) га = 1, найдем h = -y- ?-Io. G.70) а 2а Полагая затем в равенстве G.69) т = 2 ш используя уже вычисленное зна- значение 1\ (т. е. формулу G.70)), найдем 1>2 = -—2 Bяж — 36 )у Н 2 C6 ~" 4ас) Jo. Продолжая аналогичные рассуждения далее, мы придем к следующей общей формуле: Im =pm^1(x)y + cmh, G.71) где Pm-i(x) — некоторый многочлен степени га — 1, а ст — некоторая посто- постоянная. Если в интеграле типа I Р{х) представляет собой многочлен степе- степени 71, то интеграл типа I будет равен сумме интегралов Jo, Ji,... , In с неко™ торыми постоянными множителями (коэффициентами многочлена Р(х)). Стало быть, в силу равенства G.71) мы окончательно получим для инте- интеграла типа I следующую формулу: /Р(х) . „ , ч _ [ dx -^- dx = Qn^i(x)y + Co / —. У J У G.72) В этой формуле Qn—i(x) есть некоторый многочлен степени п — 1, а Со — некоторая постоянная. Для определения многочлена Qn-\(x) и постоян™ ной Со используется метод неопределенных коэффициентов. Многочлен Qn^i^x) записывается как многочлен с буквенными коэффициентами Qn-iix) = Ао + А1Х + ... + Ап^1Хп^\ Дифференцируя равенство G.72) и умножая результат дифференцирова- дифференцирования на |/, получим Р(х) = Qfn^1(x)(ax2 + Ьх + с) + \Qn^{x){2ax + Ь) + Со. G.73) В обеих частях равенства G.73) стоят многочлены степени гг. Приравнивая их коэффициенты, получим систему п+1 линейных уравнений, из которых определяются Ao,Ai,... ,An-i и Со. Разрешимость полученной системы вытекает из справедливости формулы G.72), уже доказанной нами. Оста- Остается добавить, что интеграл, стоящий в правой части G.72), приводится к табличному посредством линейной замены переменной t = х + ——. При /dx — с точностью до постоянного мно- У жителя сводится к одному из следующих двух интегралов: dt I = ln /¦ + С (k = const > 0) dt . t _^n == =arcsm- + C.
10 ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ВЫРАЖЕНИЙ 241 Пример. Вычислить интеграл х3 /¦ : d,X. у/1 + 2ж - х2 Для рассматриваемого интеграла формула G.72) имеет вид G.74) Дифференцируя эту формулу и умножая результат дифференцирования на л/1 + 2ж — ж2, получим ж3 = (Л1 + 2А2х)A + 2ж - ж2) + (Ао + Агх + л2ж2)A - ж) + Со. Сравнивая коэффициенты при ж , ж , ж , ж в правой и левой частях, по- получим систему уравнений 5л2 - 2Л1 = О, 2л2 + ЗЛ1 - Ао = О, Ах + л0 + Со = 0. Решая эту систему, найдем л2 = —1/3, А\ = —5/6, Ао = —19/6, Со = 4. Интеграл, стоящий в правой части G.74), вычисляем посредством замены t = х — 1. Получим f dx [ dt . t _ . х-1 „ I , = I , = arcsm ^^ + С = arcsm _ + С J VI + 2ж - ж2 J л/2-t2 лД л/2 Окончательно будем иметь /^,3 . |g g I . \ д^ ]_ . с?ж= ( ж ж2 ) л/1 + 2ж — ж2 + 4 arcsin ———h С. л/1 + 2ж - ж2 V 6 6 3 )У ^2 П. Переходим к вычислению интеграла типа П. Покажем, что этот интеграл сводится к интегралу типа I посредством замены t = ^—^—r. В ж — л самом деле, поскольку dt 2 1 (А а + АЬ + c)t ¦+ «Ж = — —, OjX + ОЖ + С = 2 мы полу^ л/(А2а + А& + c)t2 + BаЛ + & )t + a III. За" е ся, наконец, вычислением интеграла типа III. Прежде всего вычислим интеграл типа III для частного случая р = 0, Ь = 0, т. е. вычислим интеграл f Mx + N К = / , dx. J {x2 +q)xVax2 +c Этот интеграл распадается на сумму двух интегралов Т^ ъж С х dx f dx Кг = М . и К2 = N , J (ж2 +д)А\/аж2 +с J (ж2 +д)А\/аж2 + с
242 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Первый из этих интегралов может быть записан в виде d[x2) _ м_ г из чего видно, что подынтегральная функция представляет собой линейную (а не квадратичную) иррациональность относительно ж2. В силу доказан- доказанного в п. 2 интеграл К\ рационализируется подстановкой t = л/ах2 + с. Интеграл К2 может быть записан в виде 1) а>-а-; N г ( 1 Ч* А( 1 из чего видно, что подынтегральная функция представляет собой линейную иррациональность относительно 1/х . Стало быть, интеграл К2 рациона- рационализируется подстановкой г = а 1а + ——. Итак, для частного случая, когда у обоих квадратных трехчленов отсутствуют члены первой степени, инте- интеграл типа III нами рационализирован. Рассмотрим теперь интеграл типа III в общем случае и покажем, что его можно свести к интегралу изученного выше частного вида. Если коэф- коэффициенты квадратных трехчленов удовлетворяют соотношению Ь = ар, G.75) то для сведения интеграла типа III к интегралу изученного выше частного вида достаточно сделать замену х = t — —. В самом деле, при этом мы получим Г (Мх + N) dx _ Г J (х2 + рх + q)x\/ax2 + bx + с J 2 ар :dt. Сложнее осуществляется сведение интеграла типа III к интегралу изучен™ ного выше частного вида для случая, когда коэффициенты квадратных трехчленов не удовлетворяют соотношению G.75). В этом случае мы сна- сначала сделаем дробно™линейную подстановку Ж = ТТТ' G-76) выбрав постоянные /лиг/ так, чтобы в полученных квадратных трехчленах отсутствовали члены первой степени относительно t. Покажем, что та™ кие fi и v выбрать можно. В самом деле, сделав замену G.76), будем иметь 2 _ (g/i2 + bfi + c)t2 + [2/ii/Q + b(fi + u) + 2c]t + {аи2 ax +to + c^ (i+^J г) Мы считаем, что х ф 0.
§ 10 ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ВЫРАЖЕНИЙ 243 Таким образом, коэффициенты /х и и определятся из системы уравнений 2/ii/ + p(fi + v) + 2g = 0, 2fii/a + 5(/х + v) + 2c = 0 или из системы эквивалентных уравнений 2 (с — ад) ср — Ьа о — ар о ~~ ар Стало быть, jjl и и являются корнями квадратного уравнения о — ар о — ар Остается доказать, что квадратное уравнение G.77) имеет веществен- вещественные и различные корни. Для этого достаточно доказать, что дискриминант этого уравнения положителен, т. е. достаточно установить неравенство (с - адJ > (ср - bq)(b - ар). G.78) Легко убедиться в том, что неравенство G.78) эквивалентно следующему неравенству: [2(с + ад) - Ьр}2 > Dд - р2)Dас - ft2). G.79) Поскольку квадратный трехчлен (ж2 +px + q) имеет комплексные корни, то 4д - р2 > 0. Неравенство G.79) заведомо имеет место, если 4ас — Ь2 < 0. Докажем, что это неравенство справедливо и в случае, когда 4ас — Ъ2 > 0. В этом случае q > 0, ас > 0 и 4^асд > рЬ. Поэтому, учитывая, что ^ \/сщ, будем иметь [2(с + ад) - Ьр}2 ^ [4.ДЕБ - pb}2 = В написанной цепочке неравенств имеется хотя бы один знак строгого нера- неравенства >, ибо первый знак ^ обращается в знак = лишь при с = ад, но при с = ад, в силу того, что Ь ф ар, заведомо (рл/ас — Ьд/g) ф 0, и поэтому вто- второй знак ^ не обращается в знак =. Итак, нами доказано неравенство G.79), т. е. доказана возможность выбора таких /i и i/, при которых в полученных квадратных трехчленах отсутствуют члены первой степени относительно t. Сделав замену G.76) с указанными /i и i/, мы приведем интеграл типа III к виду G.80) I где ai, с\ и gi — некоторые постоянные, а P(t) — многочлен степени 2Л — Pit) — 1. Разложив ) дробь на сумму простейших, мы сведем вопрос {t2 + gi)A о вычислении интеграла G.80) к вычислению суммы интегралов вида Mki + Nk !¦ -dt (к = 1,2,... ,, х) При А > 1.
244 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 Каждый из этих интегралов относится к изученному выше частному ви- виду. Тем самым мы доказали интегрируемость (в элементарных функциях) интегралов всех трех типов I, II и III. Таким образом, еще раз помимо под- подстановок Эйлера доказана интегрируемость функции G.66) в элементарных функциях. /dx Этот (ж2 — ж + 1)\/х2 + ж + 1 интеграл относится к типу III. Поскольку для него нарушено соотношение G.75), мы должны прежде всего сделать замену G.76). В результате этой замены получим 2 _ (м2 + /1 + l)t2 + [2/iz/ + (/j + z/) + 2]t + {v2 + v + 1) Ж ~Т~ Ж "Т~ -L /1 \ 9 ' 2 _ (м2 - /i + l)t2 + [2/xi/ -(fj, + i/) + 2]t + (i/2 - и + 1) Постоянные /i и i/ находим из системы уравнений 2/xi/ + (/i + и) + 2 = 0, 2/м/ - (/i + и) + 2 = 0. Легко убедиться в том, что )/i = l, v = — 1. Таким образом, замена G.76) имеет вид ж = -1 t = t+1 , dx = , так что + х + 1 = г, ж - ж + 1 = tJ Рассматриваемый интеграл принимает вид A +t)dt 1 = 2 /1+/2, где /i =2 i (t2 + /2 = 2 Для вычисления интеграла I\ делаем подстановку и = 1, а для вы™ числения интеграла /2 делаем подстановку v = уЗ+ -т. В результате по- получим /i=2 / 2 = ^^ arctg ^^ + G = ^^ 1 = ^^ arctg V2 ¦x + l 2A - ¦с, dv 3v2 -I 2л/б In -С = In ж +ж + 1 (ж + 1J ж2 + ж - ¦с. г) Можно было бы положить наоборот: /л = — 1, v = 1.
§ 11 ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ 245 §11. Эллиптические интегралы К интегралам от квадратичных иррациональностей естественно примы- примыкают следующие интегралы: R (х, л/ах3 + Ьх2 + сх + d) dx, G.81) R (х, л/ах4 + Ьх3 + сх2 + dx + e) dx, G.82) подынтегральные функции которых содержат корень квадратный из мно- многочленов третьей или четвертой степени. Эти интегралы весьма часто встречаются в приложениях. Отметим сра- сразу же, что интегралы G.81) и G.82), вообще говоря, не являются элемен- элементарными функциями. Оба эти интеграла принято называть эллиптическими в тех случаях, когда они не выражаются через элементарные функции, и псевдоэллиптиче- псевдоэллиптическими в тех случаях, когда они выражаются через элементарные функции г). Ввиду важности для приложений интегралов G.81) и G.82) возник- возникла необходимость составления таблиц и графиков функций, определяемых этими интегралами. При произвольных коэффициентах а, Ь, с, d и е такие таблицы и графики составить очень трудно. Поэтому возникла задача о све- сведении всех интегралов вида G.81) и G.82) к нескольким типам интегралов, содержащих по возможности меньше произвольных коэффициентов (или, как говорят, о приведении интегралов G.81) и G.82) к канонической форме). Прежде всего, заметим, что интеграл G.81) сводится к интегралу G.82). В самом деле, кубичный трехчлен заведомо имеет хотя бы один веществен- вещественный корень жо, а поэтому его можно представить в виде ах + Ьх + сх + + d = а(х — хо)(х2 + рх + q). Сделав подстановку ж — жо = ±i2, мы, как легко видеть, преобразуем интеграл G.81) в G.82). Таким образом, нам достаточно рассмотреть лишь интеграл G.82). В силу результатов § 6 многочлен четвертой степени можно разложить на произведение двух квадратных трехчленов с вещественными коэффици- коэффициентами ах4 + Ьх3 + еж2 + dx + е = а(ж2 +рж + д)(ж2 + р' х + q). Всегда найдется некоторая линейная или дробно-линейная подстановка, уничтожающая у обоих квадратных трехчленов линейные члены2). Сде- Сделав такую подстановку, мы с точностью до слагаемого, представляющего собой элементарную функцию, преобразуем интеграл G.82) к виду 4 J /Г, G.83) где R — некоторая рациональная функция. Далее можно показать, что при любых комбинациях абсолютных значений и знаков постоянных А, т и т найдется замена, сводящая интеграл G.83) к так называемому канониче- каноническому интегралу О \ / н 1 О О \ ' \ * / 1) Названия происходят оттого, что впервые с этими интегралами встрети- встретились при решении задачи о спрямлении эллипса (см. пример 3 п. 6 § 1 гл. 11). 2) Это доказывается точно так же, как в п. 5 § 10.
246 ИНТЕГРИРОВАНИЕ В ЭЛЕМЕНТАРНВ1Х ФУНКЦИЯХ ГЛ. 7 в котором через к обозначена постоянная, удовлетворяющая условию 0 < < А; < 1. Любой канонический интеграл G.84) с точностью до слагаемого, пред- представляющего собой элементарную функцию, может быть приведен к сле- следующим трем стандартным интегралам: z2dz /7=_^_=,/ J A + hz2) dz (о < к < i). Интегралы G.85) принято называть эллиптическими интегралами соот- ветственно 1-го, 2-го и 3-го рода. Каждый из этих интегралов, как показано Лиувиллем ), представляет собой неэлементарную функцию. Эллиптиче- ские интегралы 1-го и 2-го рода содержат только один параметр &, прини- принимающий вещественные значения из интервала 0 < к < 1, а эллиптический интеграл 3-го рода, кроме того, содержит параметр h, который может при- принимать и комплексные значения. Лежандр2) подверг интегралы G.85) дальнейшему упрощению, сделав замену z = sin <p @ ^ <р ^ тг/2). С помощью этой замены первый из интегралов G.85) преобразуется ** G.86) J у/1 - 2 i у/1 - к2 sin2 Второй из интегралов G.85) при этой замене с точностью до постоянного множителя оказывается равным разности интеграла G.86) и следующего интеграла: ^^^^^^^_ / y/l - к2 sin2 (p dip. G.87) Третий из интегралов G.85) преобразуется к виду A + h sin2 (f)\/l — к2 si G.88) Интегралы G.86), G.87) и G.88) принято называть эллиптическими инте- интегралами соответственно 1-го, 2-го и 3-го рода в форме Леэюандра. Особенно важную роль в приложениях играют интегралы G.86) и G.87). Если считать, что оба эти интеграла обращаются в нуль при ip = 0, то по- получатся две вполне определенные функции, которые обычно обозначают символами F(k,cp) и E(k,ip). Лежандром и другими математиками изуче- изучены их свойства. Для них установлен ряд формул, составлены обширные таблицы и графики. Наряду с элементарными функциями функции Е и F прочно вошли в семейство функций, часто используемых в анализе. Здесь еще раз стоит отметить условность понятия элементарной функции. Вместе с тем следует подчеркнуть, что задачи интегрального исчисления вовсе не ограничива- ограничиваются изучением функций, интегрируемых в элементарных функциях. 1) Жозеф Лиувилль — французский математик A809-1882). 2) Адриан Мари Лежандр — французский математик A752-1833).
ГЛАВА 8 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ И ДИФФЕРЕНЦИРУЕМЫХ ФУНКЦИЯХ Понятия непрерывной функции и дифференцируемой функ- ции уже известны нам из глав 4 и 5. В настоящей главе будет установлен ряд важных свойств произвольных непрерывных и дифференцируемых функций. Для вывода этих свойств мы вве- введем новое определение предельного значения функции и дока™ жем эквивалентность этого определения старому определению, данному в гл. 4. § 1. Новое определение предельного значения функции 1. Новое определение предельного значения функ- функции. Его эквивалентность старому определению. Пусть, как и в § 2 гл. 4, функция у = /(ж) определена на некотором мно- множестве {ж}, и пусть а — некоторая точка, быть может, и не при- принадлежащая множеству {ж}, но обладающая тем свойством, что в любой е-окрестности точки а имеются точки множества {ж}. Напомним старое определение предельного значения функ™ ции, введенное в гл. 4: число Ъ называется предельным значени- значением функции /(ж) в точке х = а, если для любой сходящейся к а последовательности жх, Ж2, • • • ? хт • • • значений аргумента ж, элементы которой отличны от а, соответствующая последо- последовательность /(жх), /(#2), • • • •> f(xn)i • • • значений функции схо- сходится к Ъ. Сформулируем теперь новое определение предельного значения функции. Число Ъ называется предельным значе- значением функции f(x) в точке х = а, если для любого положи- положительного числа е найдется положительное число 81) такое^ что для всех значений аргумента ж, удовлетворяющих нера- ±ак как S зависит от е, то иногда пишут S = 5(е
248 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 венству 0 < |ж — а\ < S1 справедливо неравенство |/(ж) — Ь\ < е 1). Замечание 1. Ограничение 0 < |ж — а\ означает, что рассматриваются значения аргумента ж, отличные от а. Это ограничение становится понятным, если вспомнить, что изучае- изучаемая функция /(ж) может быть не определена в точке а. Отсут- Отсутствие этого ограничения сделало бы невозможным определение производной ff(a) как предельного значения функции F(x) = _ fix) - На) Ь+? ъ 0 х — а Замечание 2. С логической точки зрения главным в новом определении является то, что для каждого е > 0 найдется отвечающее этому е положительное число 5^ гарантирующее справедливость неравенства ^| -¦ ¦ |/(ж) —Ь|<? для всех значе™ ний аргумента ж, удовлетворяв ющих неравенству О < \х ~~ а\ < 8. Замечание 3. Привле- Привлекая идею приближения функ- функции /(ж) в окрестности точки 1 ! ! ^ ж = а с наперед заданной точ- а—5 а а+§ х ностью е, мы можем следую- следующим образом переформулиро™ Рис. 8.1 вать новое определение пре- предельного значения функции: число Ъ называется предельным значением функции /(ж) в точ- точке а, если для любой наперед заданной точности е можно указать такую ё-окрестность точки а, что для всех значе- значений аргумента х, отличных от а и принадлежащих указанной 6-окрестности, число Ь приближает значение функции /(ж) с точностью е (рис. 8.1). Теорема 8.1. Старое и новое определения предельного зна- значения функции эквивалентны. Доказательство. 1) Пусть сначала число Ь является предельным значением /(ж) в точке а по новому определению. Докажем, что это же число Ь является предельным значением /(ж) в точке а и по старому определению. Пусть {ж^} — любая сходящаяся к числу а последовательность значений аргумента, все элементы которой отличны от а. Требуется доказать, что со- соответствующая последовательность {f(xn)} значений функции сходится к числу Ь. Фиксируем любое е > 0. Согласно новому ) Старое определение предельного значения функции называют также определением предельного значения по Гейне, а новое определение — опре- определением предельного значения по Коши.
§ 1 НОВОЕ ОПРЕДЕЛЕНИЕ ПРЕДЕЛЬНОГО ЗНАЧЕНИЯ ФУНКЦИИ 249 определению предельного значения функции, для этого е и аи™ дется 8 > 0 такое, что \f(x)—b\<e для всех значений аргумен™ та ж, для которых 0 < |ж — а| < 8. Так как последовательность {хп} сходится к числу а, то для указанного числа 8 > 0 най™ дется номер N такой, что 0 < \хп — а\ < 8 при п ^ N. Стало быть, \f(xn) — b\ < 6 при п ^ Ж, а это и означает сходимость последовательности {f(xn)} к числу Ъ. 2) Пусть теперь число Ъ является предельным значением f(x) в точке а по старому определению. Докажем, что это же чис™ ло b является предельным значением f(x) в точке а и по новому определению. Предположим, что это не так. Тогда для некото- некоторого положительного числа е не найдется гарантирующего по- положительного числа <5, указанного в новом определении, т. е. для этого е и для сколь угодно малого положительного 8 найдется хотя бы одно значение аргумента х такое, что 0 < |ж — а| < <5, но \f(x)-b\>e. В силу сказанного мы можем взять последовательность 8п = = 1/п (п = 1,2,3,...) и утверждать, что для каждого ее эле- элемента 5п = 1/п найдется хотя бы одно значение аргумента хп такое, что О < \хп - а\ < i, но \f(xn) - Ъ | > е. (8.1) Левое из неравенств (8.1) означает, что последовательность {хп} сходится к числу а и состоит из элементов, отличных от а. Но тогда, согласно старому определению предельного значения функции, соответствующая последовательность {/(хп)} значе- значений функции сходится к числу 6, а этому противоречит правое из неравенств (8.1), справедливое для всех номеров п. Получен- Полученное противоречие доказывает теорему. Новое определение предельного значения функции позволя- позволяет нам сформулировать новое определение непрерывности функции в точке х = а1). Функция f(x) называется непре- непрерывной в точке х = а, если для любого положительного числа е найдется положительное число 8 такое^ что для всех значе- значений аргумента ж, удовлетворяющих неравенству \х — а\ < 8 справедливо неравенство \f(x)-f(a)\<e. (8.2) Замечание 4. В этом определении нет необходимо- необходимости накладывать ограничение 0 < |ж — а|, ибо при х = а левая часть неравенства (8.2) обращается в нуль и неравенство (8.2) заведомо справедливо. ) Конечно, при этом предполагается, что функция у = /(ж) определена и в самой точке а.
250 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. По аналогии с вышеизложенным формулируется новое опре™ деление предельного значения функции и доказывается эквива- эквивалентность этого определения старому определению и для случая^ когда одно или оба числа а иЪ обращаются в +оо или ^оо. Огра™ ничимся тем, что сформулируем новое определение предельного значения функции для случая, когда а = +оо: число Ь называ- называется предельным значением f(x) при х —>> +оо, если для любо- любого положительного числа е найдется положительное число А такое^ что для всех значений аргумента ж, удовлетворяющих неравенству х > Д справедливо неравенство \f(x) —b\ < e. Рисунок 8.2 разъясняет указанное определение. У* Ь+е 0 / \ / \ 1 1 у . i i А х Рис. 8.2 В заключение сформулируем новое определение правого и ле- левого предельных значений функции f(x) в точке а: число Ь на- называется правым (левым) предельным значением функции f(x) в точке а, если для любого положительного числа е найдется положительное число 5 такое^ что для всех значений аргумен- та ж, удовлетворяющих неравенству 0 < х — а < 6 @ < а — х < < E), справедливо неравенство \f(x) —b\ < е. Доказательство эквивалентности этого определения старому определению правого (левого) предельного значения совершен- совершенно аналогично доказательству теоремы 8.1. 2. Необходимое и достаточное условие существования предельного значения функции (критерий Коши). Поль- Пользуясь эквивалентностью старого и нового определений предель™ ного значения функции, установим необходимое и достаточное условие существования у функции f(x) предельного значения в точке а. Определение. Будем говорить^ что функция f(x) удовле- удовлетворяет в точке х = а условию Коши^ если для любого поло- положительного числа е найдется положительное число S такое^ о^ каковы бы ни были два значения аргумента х1 и ж/;, удов-
§ 1 НОВОЕ ОПРЕДЕЛЕНИЕ ПРЕДЕЛЬНОГО ЗНАЧЕНИЯ ФУНКЦИИ 251 летворяющие неравенствам 0 < |ж' — а| < #, 0 < |ж/# — а| < #, для соответствующих значений функции справедливо неравенство \f(x')-f(x")\<e. Теорема 8.2 (критерий Коши). Для того чтобы функ- функция f(x) имела конечное предельное значение в точке х = а, необходимо и достаточно^ чтобы функция f(x) удовлетворяла в этой точке условию Коши. Доказательство. 1) Необходимость. Пусть существует конечное предельное значение lim f(x) = b. Дока™ х—>а жем, что функция f(x) удовлетворяет в точке х = а условию Коши. Возьмем произвольное е > 0. Согласно новому определе™ нию предельного значения функции для положительного числа е/2 найдется положительное число 5 такое, что, каковы бы ни были значения аргумента х1 и ж/;, удовлетворяющие неравен- неравенствам 0< \х' — а\ <<5,0< \х" — а\ < E, для соответствующих значений функции справедливы неравенства \f{x') — b\ < е/2, \f(xff)^b | < е/2. Так как модуль суммы двух величин не превос™ ходит суммы их модулей, то из последних неравенств получим \f(x>)-f(x")\ = \[f(x>)-b]-[f(x")-b}\^ <\f(x')-b\ + \f(x")-b\<e. Тем самым доказано, что функция f(x) удовлетворяет в точке х = а условию Коши. 2) Достаточность. Пусть функция f(x) удовлетворяет в точке х = а условию Коши. Докажем, что функция f(x) имеет предельное значение в точке х = а. Пусть {хп} — любая сходя- сходящаяся к а последовательность значений аргумента, все элементы хп которой отличны от а. В силу старого определения пред ель™ ного значения функции достаточно доказать, что соответствую- соответствующая последовательность {f(xn)} значений функции сходится к некоторому числу Ь, причем это число b одно и то эюе для всех сходящихся к а последовательностей {хп} таких, что хп ф а. Докажем сначала сходимость любой последовательности {f(xn)}. Пусть задано произвольное е > 0. Возьмем то положи- положительное число $, которое соответствует этому е согласно условию Коши, и, пользуясь сходимостью последовательности {хп} к а, выберем для этого 5 номер N такой, что 0 < \хп — а\ < 5 при п ^ N. При этом для любого натурального р (р = 1,2,...) и подавно 0 < \хп^р — а\ < 6 при п ^ N. Последние два неравенства в силу условия Коши приводят к неравенству \f(xn^p) — f(xn)\ < е при п ^ N, т. е. доказывают
252 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 фундаментальность последовательности {f(xn)}. В силу кри™ терия Копти для последовательности (т. е. теоремы 3.19) после- последовательность {f(%n)} сходится к некоторому числу Ь. Докажем теперь, что все последовательности {/(жп)}, соот™ ветствующие всевозможным сходящимся к а последовательно- последовательностям {ж^}, имеют один и тот же предел Ь. Пусть {хп} и {xfn} — любые две сходящиеся к а последова- тельности значений аргумента, все элементы которых отличны от а. В силу доказанного выше обе последовательности {f(xn)} и {f(xrn)} сходятся. Обозначим предел первой из этих последо™ вательностей через 6, а второй — через У. Докажем, что Ъ = У. Рассмотрим сходящуюся к а последовательность Ж]_, Ж]_, X2i X21 • • • )ХП)ХП) . . . В силу доказанного выше соответствующая последовательность значений функции ДЖ1), fix1,), f(x2),f(x'2),..., f(xn), f(x'n),... является сходящейся. Но тогда в силу п. 1 § 4 гл. 3 все подпосле- довательности этой последовательности, в том числе {f(xn)} и {f{xfn)}, сходятся к одному и тому шее пределу^ т. е. Ь = У. Теорема 8.2 доказана. Аналогично формулируется условие Коши и устанавливается необходимое и достаточное условие существования предельного значения функции f(x) при х —> +оо и при х —>• ^оо. Ограни- Ограничимся формулировками для случая х —>• +оо. Будем говорить^ что функция f(x) удовлетворяет при х —>> —> +оо условию Коши^ если для любого положительного чис~ ла е найдется положительное число А такое^ что для любых двух значений аргумента х1 и ж/;, превосходящих А^ справедли- справедливо неравенство |/(V) — f{x")\ < e. В полной аналогии с теоремой 8.2 доказывается следующее утверждение: для того чтобы функция f(x) имела конечное предельное значение при х —> +оо, необходимо и достаточно, чтобы она удовлетворяла при х —> +оо условию Коши. § 2. Локальнам ограниченность функции, имеющей предельное значение В полном соответствии с определением множества веществен- вещественных чисел, ограниченного сверху (снизу) ¦'¦J, введем понятие функции, ограниченной на данном множестве сверху (снизу). Определение 1. Функция f(x) называется ограничен- ной сверху (снизу) на множестве {ж}, если найдется См. п. 5 § 1 гл. 2.
§ 2 ЛОКАЛЬНАЯ ОГРАНИЧЕННОСТЬ ФУНКЦИИ 253 такое вещественное число М (число га), что для всех значе- значений аргумента х из множества {х} справедливо неравенство f(x) < M (f(x) > m). При этом число М (число т) называется верхней (нижней) гранью функции f(x) на множестве {х}. Определение 2. Функция f(x) называется ограниченной с обеих сторон или просто ограниченной на множе- множестве {ж}, если она ограничена на этом множестве и сверху, и снизу^ т. е. если найдутся такие вещественные числа т и М, что для всех значений аргумента х из множества {х} спра- справедливы неравенства т ^ f(x) ^ М. Таким образом, ограниченность функции f(x) на множестве {х} фактически означает ограниченность множества всех зна- значений этой функции. Примеры. 1) Функция fix) = sec ж = ^— на полусегмен- 7 v 7 cos ж те [0, тг/2) сверху не ограничена, а снизу ограничена (в качестве нижней грани может быть взято любое число га ^ 1). 2) Функция Дирихле1) ограничена с обеих сторон на любом сегменте [а, Ь] (в качестве нижней грани можно взять любое чис- число га ^ 0, а в качестве верхней грани любое число М ^ 1). Теорема 8.3. Если функция f(x) имеет конечное пре- предельное значение в точке х = а, то существует некоторая 5-окрестность точки а2), такая^ что для всех значений аргу- мента из указанной S-окрестности функция f(x) ограничена^). Доказательство. Пусть Ь = lim f(x). Согласно х—>а новому определению предельного значения функции, для неко- некоторого положительного числа е найдется положительное число 5 такое, что \f(x) — Ь\ < 6, как только 0 < \х — а\ < E, или Ь — е < f(x) < Ь + е, как только а — 5 <х < а + с5 и хфа. (8.3) Если значение х = а не входит в область определения функ- ции, то теорема доказана (ибо неравенства (8.3) означают, что для всех значений аргумента х из E-окрестности точки а значе- значения функции f(x) заключены между b — е жЪ + е). Если же функция f(x) определена и при х = а и принима™ ет в точке а некоторое значение /(а), то, обозначив через га х) Напомним что функцией Дирихле называется функция, равная едини- единице для всех рациональных значений аргумента и нулю для всех иррацио- иррациональных значений аргумента. ) Напомним, что ё-окрестностью точки а называется интервал (а — — д,а + д), где д > 0. ) Мы не исключаем случая, когда функция у = /(ж) задана на некотором множестве {ж}, не заполняющем сплошь никакой ^-окрестности точки а.
254 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 наименьшее из двух чисел (Ь — е) и /(а), а М наибольшее из двух чисел (Ь + е) и /(а), можно извлечь из неравенств (8.3) следующие неравенства: т < f{x) < М, как только а^ё<х<а^гё. Последние неравенства означа- ют, что функция f(x) ограниче- ограничена всюду в E-окрестности точ- точки а. Теорема доказана. Иллю- Иллюстрацией к теореме 8.3 может служить рис. 8.3. Замечание. Свойство Рис. 8.3 функции, устанавливаемое тео- теоремой 8.3, называют локальной ограниченностью функции^ име- имеющей предельное значение. Следствие из теоремы 8.8. Если функция f(x) непре- непрерывна в точке х = а, то эта функция ограничена для всех значений аргумента из некоторой S-окрестности точки а. (Непрерывная в точке х = а функция имеет в этой точке ко- конечное предельное значение). § 3. Теорема об устойчивости знака непрерывной функции Теорема 8-4- Если функция f(x) непрерывна в точке х = а и если f(a) Ф 0, то существует такая 6-окрестность точки а, что для всех значений аргумента из указанной 5-окрестности функция f(x) не обращается в нуль и имеет знак^ совпадающий со знаком /(а). Доказательство. Так как функция непрерывна в точке а, то существует lim f(x) = Ь, причем Ь = f(o>) ф 0. Согласно новому определению предельного значения функции, для любого е > 0 найдется 6 > 0 такое, что b — е < f(x) < b + 6, как только г) а — 8 < х < а + 8. (8.4) Возьмем в качестве е положительное число, удовлетворяющее требованию е < \Ь\. При таком выборе е все три числа Ь — е, b + e и Ъ будут одного знака. Стало быть, в силу (8.4) всюду в E-окрестности точки а функция f(x) сохраняет знак числа Ь = = /(а). Теорема доказана. Иллюстрацией к теореме 8.4 может служить рис. 8.4. ) При этом нет необходимости исключать значение х = а, ибо для непре- непрерывной функции /(ж) значение /(а) = b также удовлетворяет левым из неравенств (8.4).
ПРОХОЖДЕНИЕ НЕПРЕРЫВНОЙ ФУНКЦИИ 255 Рис. 8.4 Замечание к теореме 8.4. Теорему 8.4 можно перенести на случай функции /(ж), непрерывной в данной точке х = а справа (слева). Пусть 5 — некото- некоторое положительное число. Договорим™ ся называть полусегмент [а, а+<5) пра- правой полуокрестностью точки х = а, а полусегмент (а — S^ a] левой полуокрестно- полуокрестностью точки х = а. Имеет место следующее утверждение: если функция f(x) непрерывна в точке х = а справа (слева) и если f(a) ^ 0, то найдется правая (левая) полуокрестность точ- точки х = а такая^ что для всех значений аргумента из указанной полуокрестности функция f(x) не обращается в нуль и имеет знак^ совпадающий со знаком /(а). Доказательство этого утверждения почти дословно повторяет доказательство теоремы 8.4, только вместо правых неравенств (8.4) мы получим неравенства а ^ х < а + S (а — 5 < х ^ а). § 4. Прохождение непрерывной функции через любое промежуточное значение 1. Прохождение непрерывной функции через нуль при смене знаков. Теорема 8.5. Пусть функция f(x) непрерывна на сегменте [а, Ь], и пусть значения этой функции на концах сегмента /(а) и f(b) суть числа разных знаков. Тогда внутри сегмента [а,Ь] найдется такая точка ?, значение функции в которой равно нулю. Доказательство. Ради определенности предположим, что f(a) < 05 f(b) > 0. Рассмотрим множество {х} всех значе- значений х из сегмента [а, Ь], для которых f(x) < 0. Это множество имеет хотя бы один элемент х = а (ибо f(a) < 0), и ограничено сверху (например, значением х = Ь). Согласно теореме 2.1 у множества {х} существует точная верхняя грань, ко™ торую мы обозначим через ?. Прежде всего, заметим, что точка ? является внутренней точкой сегмента [а, Ь], ибо из непрерывности функции f(x) на сегменте [а, Ь] и из условий /(а) < 0, f(b) > 0 в силу замечания к теореме 8.4 вытекает, что найдется правая полуокрестность точки х = а, в пределах которой f(x) < 0, и левая Рис. 8.5 Ь х
256 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 полуокрестность точки х = Ь, в пределах которой f(x) > 0. До™ кажем теперь, что /(?) = 0. Если бы это было не так, то по теореме 8.4 нашлась бы ^-окрестность ? — 5 < х < ? + 5 точки ?, в пределах которой функция f(x) имела бы определенный знак. Но это невозможно, ибо, по определению точной верхней грани, найдется хотя бы одно значение х из полусегмента ? — 5 < х ^ ^ ? такое, что f(x) < 0, а для любого значения х из интервала ? < х < ? + S f(x) ^ 0. Итак, /(?) = 0. Теорема доказана. Иллюстрацией к теореме 8.5 может служить рис. 8.5. 2. Прохождение непрерывной функции через любое промежуточное значение. Теорема 8.6. Пусть функция f(x) непрерывна на сегмен- сегменте [а,Ь], причем f(a) = A, f(b) = В. Пусть далее С — любое число^ заключенное между А и В. Тогда на сегменте [а, Ь] най- найдется точка ? такая^ что /(?) = С. Доказательство. Следует рассмотреть лишь случай, когда А ф В ш когда С не совпадает ни с одним из чисел А и В. Пусть ради определенности А < В, А < С < В. Рассмотрим функцию (f(x) = f(x) — С. Эта функция непрерывна на сегмен- сегменте [а,Ь] (как разность непрерывных функций) и принимает на концах этого сегмента значения разных знаков ip{a) = Да) -C = A^C<0, tp(b) = f(b) - С = В - О 0. По теореме 8.5 внутри сегмента [а, Ь] найдется точка ? такая, что </?(?) = /(?) — С = 0. Стало быть, /(?) = С. Теорема доказана. § 5. Ограниченность функции, непрерывной на сегменте Теорема 8.7 (первая теорема Вейерштрасса). Если функция f(x) непрерывна на сегменте [а, Ь], то она ограничена на этом сегменте. Доказательство. Докажем, что функция f(x) ограничена сверху на сегменте [а,Ь] (ограниченность снизу до™ казывается совершенно аналогично). Предположим противное, т. е. допустим, что f(x) не является ограниченной сверху на сегменте [а, Ь]. Тогда для любого натурального числа п (п = 1, 2,...) найдет- найдется хотя бы одна точка хп из сегмента [а, Ь] такая, что f(xn) > п (иначе f(x) была бы ограничена сверху на сегменте [а, Ь]). Таким образом, существует последовательность значений хп из сегмента [а,Ь] такая, что соответствующая последователь™ ность значений функции {f(xn)} является бесконечно большой. В силу теоремы Больцано^Вейерштрасса (см. теорему 3.17 из п. 4 § 4 гл. 3) из последовательности {хп} можно выделить под™ последовательность, сходящуюся к точке ?, принадлежащей, в
§ 6 ТОЧНЫЕ ГРАНИ ФУНКЦИИ 257 силу замечания 2 к указанной теореме, сегменту [а,Ь]. Обозна™ чим эту подпоследовательность символом {х^п} (п = 1, 2,...). В силу непрерывности функции f(x) в точке ? соответствующая подпоследовательность значений функции {f(%kn)} обязана схо™ диться к /(?). Но это невозможно, ибо подпоследовательность {f(xkn)}i будучи выделена из бесконечно большой последова- последовательности {/(жп)}, сама является бесконечно большой (см. п. 1 § 4 гл. 3). Полученное противоречие доказывает теорему. Замечание. Для интервала (или полусегмента) утвер- утверждение, аналогичное теореме 8.7, уже несправедливо, т. е. из непрерывности функции на интервале (или полусегменте) уже не вытекает ограниченность этой функции на указанном мно- множестве. Рассмотрим, например, функцию f(x) = 1/х на интер- интервале @,1) (или на полусегменте @,1]). Эта функция непрерыв™ на на указанном интервале (или полусегменте), но не является на нем ограниченной, ибо существует последовательность точек хп = 1/п (п = 2, 3,...), принадлежащих указанному интервалу (или полусегменту), такая, что соответствующая последователь- последовательность значений функции {f(xn)} = {n} является бесконечно большой. § 6. Точные грани функции и их достижение функцией, непрерывной на сегменте 1. Понмтие точной верхней и точной нижней граней функции на данном множестве. Рассмотрим функцию /(ж), ограниченную на данном множестве {х} сверху (снизу) 1). Ис- пользуя для множества всех значений этой функции введенное в п. 5 § 1 гл. 2 понятие точной верхней (точной нижней) грани, мы придем к следующему определению. Число М (число т) на- называется точной верхней (точной нижней) гранью функции f(x) на множестве {ж}, если выпол- выполнены следующие два требования: 1) для каждого значения х из множества {х} справедливо неравенство f(x) ^ M (f(x) ^ га); 2) каково бы ни было положительное число 6, найдется хотя бы одно значение х из множества {ж}, для которого справед- справедливо неравенство f(x)>M-e {f{x)<m + e). В этом определении требование 1) утверждает, что число М (число га) является одной из верхних (нижних) граней функции f(x) на множестве {ж}, а требование 2) говорит о том, что эта грань является наименьшей (наибольшей) и уменьшена (увели™ ) Определение функции, ограниченной на данном множестве сверху (снизу), было дано в начале § 2 этой главы. 9 В.А. Ильин, Э.Г. Позняк, часть I
258 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 чена) быть не может. Для обозначения точной верхней и точной нижней граней функции f(x) на множестве {х} употребляют следующую символику: М = snp{f(x)}, т = inf{/(x)}. {х} Ы Из доказанной в п. 5 § 1 гл. 2 теоремы 2.1 непосредственно выте- вытекает следующее утверждение: если функция f(%) ограничена на множестве {х} сверху (снизу), то у функции f(x) существует на этом множестве точная верхняя (точная нижняя) грань. Естественно, возникает вопрос, является ли точная верхняя (точная нижняя) грань функции достижимой^ т. е. существует ли среди точек множества {х} такая точка ж, значение функции в которой равно этой грани. Следующий пример показывает, что точная верхняя и точная нижняя грани, вообще говоря^ не являются достижимыми. Рассмотрим на сегменте [0, тг/2] функцию ,, ч | sinх при 0 < х < тг/2, f(x) = < [1/2 при х = 0 и х = тг/2. Эта функция ограничена на сегменте [0, тг/2] и сверху и снизу и имеет на этом сегменте точную верхнюю грань М = 1 и точную нижнюю грань т = 0. Однако ни в од™ У т ной точке сегмента [0, тг/2] эта функция не I у—sin а: принимает значений, равных этим граням i (рис. 8.6). Таким образом, рассмотрен™ q пая нами функция не имеет на сегменте ] [0, тг/2] ни максимального, ни минималь™ к х ного значений. ^ Обратим внимание на то, что рассмо™ тренная нами функция не является непре™ Рис- 8>6 рывной на сегменте [0, тг/2]. Это обстоя™ тельство не является случайным, ибо, как мы докажем в следу- следующем пункте, функция, непрерывная на сегменте, обязательно достигает в некоторых точках этого сегмента своих точных верхней и нижней граней. 2. Достижение функцией, непрерывной на сегменте, своих точных граней. Пусть функция f(x) непрерывна на некотором сегменте [а, Ь]. Тогда в силу теоремы 8.7 эта функция ограничена на этом сегменте и сверху, и снизу. Стало быть, в силу утверждения, сформулированного в предыдущем пункте, у этой функции существуют на сегменте [а, Ь] точная верхняя грань М и точная нижняя грань га. Докажем, что эти грани достижимы.
§ 6 ТОЧНЫЕ ГРАНИ ФУНКЦИИ 259 Теорема 8.8 (вторая теорема Вейерштрасса). Если функция f(x) непрерывна на сегменте [а,Ь], то она достигает на этом сегменте своих точных верхней и нижней граней (т. е. на сегменте [а,Ь] найдутся такие точки х\ и Х2, что f(xi) = М, f(x2) = га). Доказательство. Докажем, что функция f(x) достига- достигает на сегменте [а, Ь] своей точной верхней грани М (достижение точной нижней грани доказывается аналогично). Предположим противное, т. е. предположим, что функция f(x) не принимает ни в одной точке сегмента [а,Ь] значения, равного М. Тогда для всех точек сегмента [а, Ь] справедливо неравенство f(x) < ikf, и мы можем рассмотреть на сегменте [а, Ь] всюду положительную функцию Так как знаменатель М — f(%) не обращается в нуль и непре- рывен на сегменте [а, Ь], то по теореме 4.2 функция F(x) также непрерывна на сегменте [а,Ь]. В таком случае, согласно теореме 8.7, функция F(x) ограничена на сегменте [а, Ь], т. е. найдется поло^кительное число В такое, что для всех х из сегмента [а,Ь] F^ - w^W) < в- Последнее неравенство (с учетом того, что М — f(x) > 0) можно переписать в виде /(яКМ-1. Написанное соотношение, справедливое для всех точек х из сег™ мента [а, Ь], противоречит тому, что число М является точной верхней гранью (наименьшей из всех верхних граней) функции f(x) на сегменте [а, Ь]. Полученное противоречие доказывает теорему. Замечание 1. Для интервала и полусегмента утвер- утверждение, аналогичное теореме 8.8, не имеет места. В самом де- деле, в замечании к теореме 8.7 (см. § 5) мы привели пример функции, непрерывной на интервале (полусегменте) и не являю™ щейся на нем ограниченной (у такой функции точная верх- верхняя (или нижняя) грань не только не достигается, но даже не существует!). Замечание 2. После того как доказано, что функция /(ж), непрерывная на сегменте, достигает на этом сегменте сво- своих точных верхней и нижней граней, мы можем назвать точную верхнюю грань максимальным значением^ а точную нижнюю грань минимальным значением функции f(x) на этом сегменте и сформулировать теорему 8.8 в виде: непрерывная на сегменте
260 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. функция имеет на этом сегменте максимальное и минималь- минимальное значения1). Замечание З.К числу других свойств функции, непре- непрерывной на сегменте, относится свойство, называемое равномер- равномерной непрерывностью. Это свойство мы изучим в § 4 гл. 10. Здесь мы лишь отметим, что весь материал пп. 1и2§4гл. 10 может быть прочитан непосредственно вслед за материалом настояще- настоящего параграфа. § 7. Возрастание (убывание) функции в точке. Локальный максимум (минимум) 1. Возрастание (убывание) функции в точке. Будем предполагать, что функция f(x) определена всюду в некоторой окрестности точки с. Определение. Говорят, что функция f(x) возраста- возрастает (убывает) в точке с, если найдется такая окрестность точки с, в пределах которой f(x) > f(c) при х > с и f(x) < f(c) при х < с (f (х) < < /(с) при х > с и f(x) > f(c) при х < с). На рис. 8.7 изображена функция, возрастающая в точ- точке с и убывающая в точке d. Установим достаточное ус- условие возрастания (убывания) функции f(x) в точке с. Теорема 8.9, Если функ- функция f(x) дифференцируема в точке с и ff(c) > 0 (ff(c) < 0), гтш эта функция возрастает (убывает) в точке с. Доказательство. Докажем теорему для случая ff(c) > > 0 (случай fr(c) < 0 рассматривается совершенно аналогично). Поскольку У 0 Рис. 8.7 ) Отметим, что и разрывные на некотором сегменте функции могут иметь на этом сегменте максимальное и минимальное значения. Так, на- например, уже известная нам из § 1 гл. 4 функция Дирихле У = 1, если х рационально, 0, если х иррационально, разрывна в любой точке любого сегмента [а, 6], но имеет на этом сегменте максимальное значение, равное единице, и минимальное значение, равное нулю.
ВОЗРАСТАНИЕ (УБЫВАНИЕ) ФУНКЦИИ В ТОЧКЕ 261 то, по новому определению предельного значения функции, для любого е > 0 найдется положительное 5 такое, что f\c)-e< fix) - /(с) < f'{c) + е при 0 <\х — с\ <5. Возьмем в качестве е положительное число, меньшее /'(с). Тогда f'(c) - е > 0 и, стало быть, из (8.5) получим у fix) - /(с) > 0 при 0 < х — с < 6. (8.6) Рис. 8.8 Из (8.6) следует, что всюду в S-окрест- ности точки с /(ж) > f(c) при х > с и f(x) < f(c) при х < с. Возрастание функ- функции f(x) в точке с доказано. Замечание. Подчеркнем, что положительность (отрицательность) производной ff(c) не является необходи- необходимым условием возрастания (убывания) функции f(x) в точке с. В качестве примера укажем на функцию f(x) = ж3, которая возрастает в точке ж = 0 и тем не менее имеет в этой точке производную /;@) = 0 (график этой функции изображен на рис. 8.8). 2. Локальный максимум и локальный минимум функ- функции. Пусть снова функция /(ж) определена всюду в некоторой окрестности точки с. Определение. Говорят, что функция /(ж) имеет в точке с локальный максимум (минимум)^ если найдет- найдется такая окрестность точки с, в пределах которой значение f(c) является наибольшим (наимень- (наименьшим) среди всех значений этой функ- функции. На рис. 8.9 изображена функция /(ж), имеющая локальный максимум в точке с. Локальный максимум и локаль- локальный минимум объединяются общим названием локальный эк- рис> gj с т р е м у м. Установим необходимое условие экстремума дифференциру- дифференцируемой функции. Теорема 8.10. Если функция /(ж) дифференцируема в точ- точке с и имеет в этой точке локальный экстремум^ то /'(с) = 0. У о Касательная
262 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Доказательство. Так как функция f(x) имеет ло- кальный экстремум в точке с, то f(x) не может в этой точке ни возрастать, ни убывать. Стало быть, в силу теоремы 8.9 произ- производная /;(с) не может быть ни положительна, ни отрицательна, т. е. /'(с) = 0. Теорема 8.10 имеет простой геометрический смысл: она утверждает, что если в точке кривой у = /(ж), которой соот- соответствует локальный экстремум функции /(ж), существует ка- касательная к графику функции у = /(ж), то эта касательная па- параллельна оси Ох (см. рис. 8.9). § 8. Теорема о нуле производной Теорема 8.11 (теорема Роллм1)). Пусть функция f(x) непрерывна на сегменте [a, ft] и дифференцируема во всех вну- внутренних точках этого сегмента. Пусть1 кроме того, /(а) = = /(ft). Тогда внутри сегмента [а, ft] найдется точка ? такая^ что значение производной в этой точке /;(?) равно нулю. Кратко можно сказать, что между двумя равными значени- значениями дифференцируемой функции обязательно лежит нуль про- производной этой функции. Доказательство. Так как функция f(x) непре- непрерывна на сегменте [a, ft], то, согласно теореме 8.8, эта функция достигает на этом сегменте своего максимального значения М и своего минимального значения га. Могут представиться два случая: 1) М = га; 2) М > т. В случае 1) /(ж) = М = га = = const. Поэтому производная ff(x) равна нулю в любой точке сегмента [a, ft]. В случае М > га, по- поскольку /(а) = /(ft), можно утвер- утверждать, что хотя бы одно из двух значе- значений М или га достигается функцией в некоторой внутренней точке ? сегмен- сегмента [a, ft]. Но тогда функция /(ж) имеет в этой точке ? локальный экстремум. По- Поскольку функция f(x) дифференцируе- р ма в точке ?, то по теореме 8.10 /;(?) — = 0. Теорема полностью доказана. Теорема Ролля имеет простой геометрический смысл: если крайние ординаты кривой у = f(x) равны, то, согласно теореме Ролля, на кривой у = f(x) найдется точка, в которой касатель- касательная к кривой параллельна оси Ох (рис. 8.10). Как мы увидим ниже, теорема Ролля лежит в основе многих формул и теорем математического анализа. 0 i а Касательная 5 Ъ X г) Мишель Ролль — французский математик A652-1719).
§ 9 ФОРМУЛА КОНЕЧНЫХ ПРИРАЩЕНИЙ 263 § 9. Формула конечных приращений (формула Лагранжа) Большое значение в анализе и его приложениях имеет сле- следующая теорема, принадлежащая Лагранжу 1). Теорема 8.12 (теорема Лагранэюа). Если функция f(x) непрерывна на сегменте [а, Ь] и дифференцируема во всех вну- внутренних точках этого сегмента^ то внутри сегмента [а,Ь] найдется точка ? такая^ что справедлива формула f(b)-f(a) = f'(O(b-a). (8.7) Формулу (8.7) называют формулой Лагранэюа или формулой конечных приращений. Доказательство. Рассмотрим на сегменте [а, Ь] следующую вспомогательную функцию: F(x) = f(x) - f(a) - П lZa (x - «)• (8-8) Проверим, что для функции F(x) выполнены все условия тео- теоремы Ролля. В самом деле, F(x) непрерывна на сегменте [а,Ь] (как разность функции f(x) и линейной функции) и во всех вну- внутренних точках сегмента [а,Ь] имеет производную, равную F'(x) = Пх) - Ш^Ж. Из формулы (8.8) очевидно, что F(a) = F(b) = 0. Согласно теореме Ролля внутри сегмента [а, Ь] найдется точ- точка ? такая, что Т?1 (tX f1 (Р\ J\P)~ J\a) A /Q Q\ Ь -— a Из равенства (8.9) вытекает формула Лагранжа (8.7). Подчерк- Подчеркнем, что в формуле (8.7) вовсе не обязательно считать, что b > a. Замечание. Мы получили теорему Лагранжа как след- следствие теоремы Ролля. Заметим вместе с тем, что сама теоре- теорема Ролля является частным случаем теоремы Лагранжа (при ( () Для выяснения геометрического смысла теоремы Лагранжа f(b)-f(a) „ д, заметим, что величина ?А-^—±^L есть угловой коэффициент се- секущей, проходящей через точки A(a1f(a)) и B(b,f(b)) кривой у = /(ж), а /;(С) есть угловой коэффициент касательной к кри- кривой у = /(ж), проходящей через точку С(?,/(?)). Формула Ла- Лагранжа (8.7) означает, что на кривой у = f(x) между точками А ) Ж^озеф Луи Лаграыж — великий французский математик и механик A736-1813).
264 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 и В найдется такая точка G, касательная в которой параллельна секущей АВ (рис. 8.11). Часто бывает удобно записывать формулу Лагранжа в виде, несколько отличном от (8.7). Пусть f(x) удовлетворяет уело™ виям теоремы 8.11. Зафиксируем любое xq из сегмента [а,Ь] и зададим ему приращение Ах произ- вольное, но такое, чтобы значение (жо + "^ ^Ж) также лежало на сегменте [а, Ь]. Тогда, записывая формулу Лагранжа для сегмента [xq^xq + Дж], будем иметь О, (8.Ю) 0 а % Ь х где с, — некоторая точка, лежащая меж- между xq и жо + Ах. Молено утверждать, с' что найдется такое (зависящее от Дж) число в из интервала 0 < в < 1, что ? = xq + в Ах. Таким образом, формуле (8.10) можно придать вид f{x0 + Ах) - /Ы = Axf'(x0 + в Ах), (8.11) где в — некоторое число из интервала 0 < в < 1. Формула Ла- Лагранжа в виде (8.11) дает точное выражение для приращения функции через вызвавшее его произвольное конечное прираще™ ние Ах аргумента. Этот вид формулы Лагранжа оправдывает термин «формула конечных приращений». § 10. Некоторые следствия из формулы Лагранжа 1. Постоянство функцми, имеющей на интервале рав- равную нулю производную. Теорема 8A3. Если функция f(x) дифференцируема на ин- интервале (а,Ь) и если всюду на этом интервале ff(x) = 0, то функция f(x) является постоянной на интервале (а, Ь). Доказательство. Пусть xq — некоторая фиксированная точка интервала (а, Ь), а ж — любая точка этого интервала. Сегмент [жо,ж] целиком принадлежит интервалу (а,Ь). По- Поэтому функция f(x) дифференцируема (а стало быть, и непре- непрерывна) всюду на сегменте [жо,ж]. Это дает право применить к функции f(x) на сегменте [жд,ж] теорему Лагранжа. Согласно этой теореме внутри сегмента [жо, ж] найдется точка ? такая, что 0. (8.12) По условию производная функции f(x) равна нулю всюду в ин- интервале (а, Ь). Стало быть, /'(?) = 0 и из формулы (8.12) мы получим f(x) = f{xQ). (8.13)
§ 10 НЕКОТОРЫЕ СЛЕДСТВИЯ ИЗ ФОРМУЛЫ ЛАГРАНЖА 265 Равенство (8.13) утверждает, что значение функции f(x) в лю- любой точке х интервала (а, Ь) равно ее значению в фиксированной точке xq. Это и означает, что функция f(x) постоянна всюду на интервале (а, Ь). Теорема доказана. Теорема 8.13 имеет простой геометрический смысл: если ка™ сательная в каждой точке некоторого участка кривой у = f(x) параллельна оси Ох1 то указанный участок кривой у = f(x) представляет собой отрезок прямой, параллельной оси Ох. Замечание. Теорема 8.13 уже была использована нами в гл. 6 при доказательстве теоремы 6.1. Здесь мы еще раз под™ черкнем, что весь материал настоящей главы (в том числе и тео- теорема 8.13) совершенно не использует результатов глав 6 и 7. При повторном чтении этой книги гл. 8 можно читать непосредствен- непосредственно вслед за гл. 5, а уже затем возвратиться к чтению глав 6 и 7. 2. Условим монотонности функции на интервале. В качестве второго следствия формулы Лагранжа рассмотрим во™ прос об условиях, обеспечивающих неубывание (невозрастание) функции на данном интервале. Прежде всего, напомним определения неубывания, невозра- невозрастания, возрастания и убывания функции на данном интервале. 1°. Говорят, что функция f{x) не убывает (не возрастает) на интервале (а, 6), если для любых двух точек х\ и Х2 ин- интервала (а, Ь), удовлетворяющих условию х\ < Ж2, справедливо неравенство f(xi) < /Ы (f(Xl) > /Ы). 2°. Говорят, что функция f(x) возрастает (убывает) на ин- интервале (а,Ь), если для любых точек х\ и Х2 интервала (а, 6), связанных условием х\ < Ж2, справедливо неравенство f(xi) < /Ы (f(xi) > /Ы). Теорема 8.Ц. Для того чтобы дифференцируемая на ин- интервале (а, Ъ) функция f(x) не убывала (не возрастала) на этом интервале^ необходимо и достаточно^ чтобы производи ная этой функции была неотрицательной (неположительной) всюду на этом интервале. Доказательство. 1) Достаточность. Пусть f'(x) ^ 0 (^ 0) всюду на интервале (а, Ь). Требуется до- доказать, что f(x) не убывает (не возрастает) на интервале (а, Ъ). Пусть х\ и Х2 — любые две точки интервала (а,Ь), удовлетво- удовлетворяющие условию х\ < Х2- Функция f(x) дифференцируема (а стало быть, и непрерывна) всюду на сегменте [^1,^2]. Поэтому к f(x) можно применить на сегменте [^1,^2] теорему Лагранжа, в результате чего получим f(x2)-f(xi) = (x2-x1)f'(O, (8-14) где х\ < ? < Х2-
266 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 По условию /;(С) ^ 0 (^ 0), ^2 — х\ > 0. Поэтому правая часть (8.14) неотрицательна (неположительна), что и доказыва- доказывает неубывание (невозрастание) f(x) на интервале (а,Ь). 2) Необходимость. Пусть функция f(x) диффе- дифференцируема на интервале (а, Ь) и не убывает (не возрастает) на этом интервале. Требуется доказать, что f'(x) ^ 0 (^ 0) всю™ ду на этом интервале. Так как f(x) не убывает (не возрастает) на интервале (a, ft), то эта функция не может убывать (возра- (возрастать) ни в одной точке интервала (a, ft). Стало быть, в си- силу теоремы 8.9, производная ff(x) ни в одной точке интервала (a, ft) не может быть отрицательной (положительной), что и требовалось доказать. Теорема 8.15. Для того чтобы функция f(x) возрастала (убывала) на интервале (a, ft) достаточно, чтобы производная f'(x) была положительной (отрицательной) всюду на этом интервале. Доказательство проводится по той же схеме, что и доказательство достаточности в теореме 8.14. Пусть х\ и Х2 — любые две точки интервала (a, ft), удовлетворяющие условию х\ < Х2- Записывая для сегмента [#i,#2] формулу Лагранжа, получим равенство (8.14), но на этот раз в этом равенстве /;(С) > >0 (<0). Вследствие этого левая часть (8.14) положительна (отрица™ тельна), что и доказывает возрастание (убывание) f(x) на ин- интервале (a, ft). Замечание. Подчеркнем, что положительность (отри- (отрицательность) производной f'(x) на интервале (a, ft) не является необходимым условием возрастания (убывания) функции f(x) на интервале (а, ft). Так, функция у = ж3 возрастает на интерва™ ле (—1,+1), но производная этой функции f'(x) = Зж2 не явля- является всюду положительной на этом интервале (она обращается в нуль в точке х = 0). Вообще, легко доказать, что функция f(x) возрастает (убывает) на интервале (а, Ь), если производная этой функции f'(x) положительна (от- (отрицательна) всюду на этом ин- интервале, за исключением конечно- конечного числа точек^ в которых эта про- производная равна нулю. (Для доказа- доказательства достаточно применить те- теорему 8.15 к каждому из конечного числа интервалов, на которых ff(x) Ь ж строго положительна (отрицатель™ на) и учесть непрерывность f(x) в тех точках, в которых производная Рис. 8.12 равна нулю.) Установленную теоре™
§ 10 НЕКОТОРЫЕ СЛЕДСТВИЯ ИЗ ФОРМУЛЫ ЛАГРАНЖА 267 мой 8.15 связь между знаком производной и направлением из™ менения функции легко понять из геометрических соображе- соображений. Поскольку производная равна угловому коэффициенту ка- касательной к графику функции у = /(ж), знак производной ука™ зывает острый или тупой угол с положительным направлением оси Ох составляет луч касательной, лежащий в верхней полу- полуплоскости. Если ff(x) > 0 всюду на интервале (а, 6), то всюду на этом интервале луч касательной, лежащий в верхней полу- полуплоскости, составляет с Ох острый угол, стало быть и кривая у = f(x) идет вверх всюду на этом интервале (рис. 8.12). 3. Отсутствие у производной точек разрыва 1-го рода и устранимого разрыва. Применим теорему Лагранжа для выяснения одного замечательного свойства производной. Пре- жде всего докажем следующее утверждение. Пусть функция f(x) имеет конечную производную всюду в правой (левой) по- полуокрестности точки с и правую (левую) производную в самой точке с. Тогда1 если производная ff(x) имеет в точке с правое (левое) предельное значение^ то это предельное значение равно правой (левой) производной в точке с. Для доказательства этого утверждения рассмотрим любую последовательность {хп} значений аргумента, сходящуюся к с справа (слева). Учитывая, что, начиная с достаточно большого номера п, все хп принадлежат той полуокрестности, в которой функция f(x) имеет конечную первую производную, применим теорему Лагранжа к функции f(x) по сегменту 1) [с, хп] ([жп, с]). При этом получим — J Isrcj? {О.ID) хп с где через ?п обозначена некоторая точка, лежащая между сжхп. Пусть теперь в равенстве (8.15) п —>> оо. Тогда, очевидно, ?п —> с справа (слева). Поскольку по условию fr(x) имеет в точке с ко™ нечное правое (левое) предельное значение, правая часть (8.15), по определению предельного значения, обязана при п —>> оо стре- стремиться к указанному предельному значению. Стало быть, суще- существует предел при п -> оо и левой части (8.15). По определению правой (левой) производной этот предел равен f'(c + 0) (f'(c — — 0)). Итак, в пределе при п —> оо равенство (8.15) дает /'(с + 0)= lim f{x) (/'(c-0)= Hm f'(x)). ^+0 ^0 г) Все условия теоремы Лагранжа выполнены, ибо функция /(ж) диф- дифференцируема (а стало быть, и непрерывна) в любой точке сегмента [с, хп] ([жп,с]), за исключением точки с. Непрерывность /(ж) в точке с справа (слева) следует из существования ff (с + 0) (ff (с — 0)).
268 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Если дополнительно потребовать равенства /;(с + 0) = /;(с^0), то из существования пределов lim ff(x) и lim f'{x) будет ж^с+О х^с—О следовать непрерывность f'{x) в точке с. Применяя только что доказанное утверждение в каждой точ™ ке с некоторого интервала (а,Ь), мы придем к следующему утверждению: если функция f(x) имеет конечную производ- производную всюду на интервале (aJb)J то f'{x) не может иметь на этом интервале ни точек устранимого разрыва^ ни точек раз- разрыва 1-го рода. В самом деле, если в некоторой точке с интервала (а, Ь) су- существуют конечные правое и левое предельные значения /;(ж), то ff(x) непрерывна в точке с (в силу доказанного выше утвер- утверждения) . Если же хотя бы одного из указанных двух предельных значений не существует, то ff(x) имеет в точке с разрыв 2-го рода. Приведем пример функции, производная которой суще™ ствует и конечна всюду на некотором интервале и имеет в неко- некоторой точке этого интервала разрыв 2-го рода. Рассмотрим на интервале (—1,+1) функцию f x2cos^ при ж^О, f(x) = < х [ 0 при х = 0. Очевидно, что для любого ж / 0 производная этой функции существует и определяется формулой / (х) = 2^cos- + sin™. Существование производной /;@) в точке х = 0 непосредственно вытекает из существования предельного значения г /@ + Дж)-/@) та 1а lim ^ -1—*-^- = lim Ax cos -— = 0. Аж^О Аж Аж^О Аж Производная fr(x) не имеет в точке х = 0 ни правого, ни лево- левого предельного значения, ибо у слагаемого 2х cos — существует в точке х = 0 равное нулю предельное значение, а слагаемое . 1 sin — не имеет в этой точке ни правого, ни левого предельного значения (см. пример в конце п. 1 § 8 гл. 4). 4. Вывод некоторых неравенств. В заключение покажем, как с помощью теоремы Дагранжа могут быть получены неко- некоторые весьма полезные неравенства. В качестве примера уста- установим следующие два неравенства: Х\ — Ж2|, (8.16) \х\ — Х2\. (8-17) (Здесь под х\ и Х2 можно понимать любые значения аргумента.) Для установления неравенства (8.16) применим теорему Лагран™
§ 11 ОБОБЩЕННАЯ ФОРМУЛА КОНЕЧНЫХ ПРИРАЩЕНИЙ 269 жа к функции f(x) = sin ж по сегменту [жх,Ж2]. Получим smx2 = (xi - x2)fii). (8.18) Учитывая, что /;(С) = cos^ и что |cos^| ^ 1 для любого ?, получим, переходя в (8.18) к модулям, неравенство (8.16). Для установления неравенства (8.17) следует применить тео- теорему Лагранжа по сегменту [#i,#2] K функции f(x) = arctgx и учесть, что / (?) = -—— ^ 1. 1 + С §11. Обобщенная формула конечных приращений (формула Кошм) В этом параграфе мы докажем теорему, принадлежащую Ко™ ши и обобщающую установленную выше теорему Лагранжа. Теорема 8.16 (теорема Коши), Если каждая из двух функций f(x) и g(x) непрерывна на сегменте [а,Ь] и диффе- дифференцируема во всех внутренних точках этого сегмента и если, кроме того^ производная gr(x) отлична от нуля всюду внутри сегмента [а, 6], то внутри этого сегмента найдется точка ? такая^ что справедлива формула №-f(a) _ /'(О /O1Q4 g(b)^g(a)^g4C)e l j Формулу (8.19) называют обобщенной формулой конечных при- приращений или формулой Коши. Доказательство. Прежде всего докажем, что g (а) ф Ф g(b). В самом деле, если бы это было не так, то для функции g(x) были бы выполнены на сегменте [а, Ь] все условия теоремы 8.11 (Ролля) и по этой теореме внутри сегмента [а,Ь] нашлась бы точка ? такая, что g";(C) = 0- Последнее противоречит условию теоремы. Итак, g(a) Ф g(b), и мы имеем право рассмотреть следующую вспомогательную функцию: F(x) = f(x) - f(a) - ЖЬЖ[Я(Ж) - g(a)}. (8.20) В силу требований, наложенных на функции f(x) и g(x), функ- функция F(x) непрерывна на сегменте [а,Ь] и дифференцируема во всех внутренних точках этого сегмента. Кроме того, очевидно, что F(a) = F(b) = 0. Таким образом, для F(x) выполнены все условия теоремы 8.11 (Ролля). Согласно этой теореме внутри сегмента [а,Ь] найдется точка ^ такая, что Ff@ = 0. (8.21) Имея в виду, что Ff(x) = ff(x) — ^j-J-—^^g;(x), и используя
270 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 равенство (8.21), будем иметь W)8'® = °- (82) Учитывая, что gf(^) ф 0, из равенства (8.22) получим формулу Коши (8.19). Теорема доказана. Замечание 1. Формула Лагранжа (8.7) является част- частным случаем формулы Коши (8.19) при g(x) = х. Замечание 2. В формуле (8.19) вовсе не обязательно считать, что Ъ > а. § 12. Раскрытие неопределенностей (правило Лопиталм) 1. Раскрытие неопределенности вида -. Будем гово- говорить, что отношение двух функций представляет собой при 0 ё{х} х —>• а неопределенность вида -, если lim f(x) = Mm g(x) = 0. Раскрыть эту неопределенность — это значит вычислить пре™ т /О) / дельное значение lim ; ' (при условии, что это предельное зна- х^а g{x) чение существует). Следующая теорема дает правило для раскрытия неопреде™ 0 ленности вида -. Теорема 8.17 (правило Лопиталя1)). Пусть две функ- функции f(x) и g(x) определены и дифференцируемы всюду в неко- торой окрестности точки а, за исключением^ быть моэюет^ самой точки а. Пусть, далее, lim f(x) = lim g(x) = 0 х-—>а x—^a и производная gf(x) отлична от нуля всюду в указанной выше окрестности точки а. Тогда^ если существует (конечное или бесконечное) предельное значение2) ) Гильом Франсуа де Лопиталь — французский математик A661—1704). ) Отметим, что предельное значение (8.23) может не существовать, тогда /(ж) как предел отношения функций lim существует. Например, можно i x^ag(x) взять а = 0, /(ж) = х2 sin —, g(x) = sin ж. Таким образом, правило Лопиталя х «действует» не всегда.
12 РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ 271 то существует и предельное значение lira \ [, причем спра- х^а g{x) ведлива формула lim/M = lim№ (8.24) x-Hi g(x) x^ag'{x) Теорема 8.17 дает нам правило для раскрытия неопределен™ О ности вида -, сводящее вычисление пределвного значения отно™ шения двух функций к вв1числению пределвного значения от™ ношения их производных. Доказателвство. Пусть {хп} — произвольная последовательность значений аргумента, сходящаяся к а и со- состоящая из чисел, отличнв1х от а. Будем рассматривать эту по- последовательность, начиная с того номера п, с которого все хп принадлежат окрестности точки а, указанной в формулиров- формулировке теоремы. Доопределим функции f(x) и g(x) в точке а, по™ ложив их равными нулю в этой точке. Тогда, очевидно, f(x) и g(x) будут непрерывны на всем сегменте [а, жп] и дифференци- руемы во всех внутренних точках этого сегмента. Кроме того, gf(x) отлична от нуля всюду внутри этого сегмента. Таким обра- образом, для f(x) и g(x) на сегменте [а, жп] выполнены все условия теоремы 8.16 (Коши). Согласно этой теореме внутри сегмента [а, хп] найдется точка ^п такая, что /(-n) - /(a) = f\Zn) /о 9,л Учитывая, что, по нашему доопределению, /(a) = g(a) = 0, мы можем следующим образом переписать формулу (8.25): f\xn) / (?гг) /О c\f*\ ТШ-Т&ГУ (8-26) Пусть теперь в формуле (8.26) п —> оо. Тогда, очевидно, ^п —> а. Так как мы предположили существование предельного значения (8.23), правая частв (8.26) при п —> оо обязана стремиться к этому предельному значению. Стало быть, существует предел при п —> оо и левой части (8.26). По определению предельного fix) значения функции этот предел равен lim ^Ц—7. Таким образом, х^а g{x) в пределе при п —> оо равенство (8.26) переходит в равенство (8.24). Теорема доказана. Замечание 1. Если к условиям теоремы 8.17 добавить требование непрерывности производных ff(x) и gf(x) в точке а, то при условии g'{a) ф 0 формула (8.24) может быть переписана в виде Щ = Щ. (8.27) (x) g'{a)
272 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Замечание 2. Если производные ff(x) и gf(x) удовле™ творяют тем же требованиям, что и сами функции f(x) и g(x), то правило Лопиталя можно применять повторно (т. е. предель- предельное значение отношения первых производных функций f(x) и g(x) можно заменить предельным значением отношения вто- вторых производных этих функций). Мы получим при этом lim Щ = lim Щг = lim ^M. , g(x) Замечание 3. Теорема 8.17 легко переносится на случай, когда аргумент х стремится не к конечному, а к бесконечному пределу а = +оо или а = —оо. Ограничимся тем, что сформули- сформулируем теорему 8.17 для случая, когда а = +оо. Пусть две функ- функции f(x) и g(x) определены и дифференцируемы всюду на полу- полупрямой с < х < оо. Пусть^ далее^ lim f(x) = lim g(x) =0 ж^+оо ж^+оо и производная g (х) отлична от нуля на указанной полупря- f'(x) мой. Тогда, если существует предельное значение lim , {, fix) то существует и предельное значение lim , причем спра- ж^+ооЯ(ж) веоливо равенство Иш щ= Ит g(x) ж^+оо g (х) Примеры. 1 \ 1. 1 — cos ж -,. sin х 1 1 lim o = lim ^^ = -. ж^О ж2 ж^о 2ж 2 () 2) Следующее предельное значение вычисляется двукратным применением правила Лопиталя: -,. х — sin х 1. 1 — cos ж -, • sin x 1 lim = lim = lim ^^ = -. ж^О ж*5 х^О Зж2 ж^0 6ж 6 3) Трехкратным применением правила Лопиталя вычисляет- вычисляется предельное значение г ж4 г 4ж3 lim o = lim 2 + 2 2 o lim ж2 + 2 cos ж — 2 ж^О 2ж — 2 sin ж г 12ж2 г 24ж 1О = lim = lim = 12. 2 — 2 cos ж ж^О 2 sin ж 2. Раскрытие неопределенностм вида —. Будем гово- говорить, что отношение двух функций , ( представляет собой при g(x) х —)> а неопределенность вида —, если оо lim /(ж) = limg(a) = оо 1). (8.28) ж>а жУа г) Вместо сю можно брать +оо или —оо.
12 РАСКРЫТИЕ НЕОПРЕДЕЛЕННОСТЕЙ 273 Для раскрытия этой неопределенности, т. е. для вычис™ г /0*0 ления предельного значения lim ^-7—т> справедливо утвержде™ х^а g{x) g{) ние5 совершенно аналогичное теореме 8.17, а именно: если в формулировке теоремы 8.17 заменить требование lim/(ж) = = limg(x) = 0 на условие (8.28), то теорема 8.17 останется х—^а справедливой. Для доказательства рассмотрим произвольную последовательность {хп} значений аргумента, сходящуюся к а справа (или слева). Пусть хт и хп — любые два элемента этой последовательности с достаточно больши- большими номерами т и п, удовлетворяющими условию п > т. Применяя формулу Копти (8.19) по сегменту [хт,хп], мы можем утвер- утверждать, что на этом сегменте найдется точка ^тп такая, что _ f(x) _ f(xn)-f(xm) = f(xn) f(xn) = f{jmn) = g{Xn)-g(xm) g(Xn) Отсюда g(Xm) g(xn) 'jjrnn) fix) Если существует lim f. ' = А, то для любого е > 0 можно фиксировать х^а g [X) f(?mn) номер т столь большим, что при любом п > т дробь тте будет откло- О уъТПТЬ ) няться от числа А меньше чем на е/2. Далее, учитывая (8.28), мы можем для данного фиксированного m найти номер по такой, что при п ^ по дробь 1 — \ т! будет отклоняться от единицы меньше чем на Но тогда при Л\ I I ^^ / Хп) г Л е п ^ по дрооь —-—г- оудет отклоняться от числа А меньше чем на — + g{xn) 2 I Л\ ?/2 ? ?/2 А + \А\ —т— + — —т— = е. А это означает, что предельное значение А\+е/2 2 А\+е/2 lim —^-г существует и равно А. x^ag(x) Примеры. 1) lim л/xhix = lim (-1/2) ж 2 / д, = ^2 lim V^ = 0.
274 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 2) n-кратным применением правила Лопиталя вычисляется предельное значение г хп у пхп~г у два — = Iim = иш ех х . . . = Iim — = 0. х 3. Раскрытие неопределенностей других видов. Кроме 0 оо изученных выше неопределенностей видов - и —, часто ветре- 0 оо чаются неопределенности следующих видов: 0 • оо, оо — оо, 1°°, 0°, оо°. Все эти неопределенности сводятся к изученным выше двум неопределенностям путем алгебраических преобразований. По- Покажем это, например, по отношению к последним трем из ука™ занных выше неопределенностей. Каждая из этих неопределен- неопределенностей имеет вид y = f(x)gixK (8.29) где при х —> a f(x) стремится соответственно к 1, 0 или оо, a g(x) стремится соответственно к оо, 0 или 0. Логарифмируя выражение (8.29), получим (считая, что f(x) > 0) ]ny = g(x)]nf(x). (8.30) Для нахождения предельного значения выражения (8.29) доста- достаточно найти предельное значение выражения (8.30). Заметим, что в любом из трех рассматриваемых случаев вы- выражение (8.30) представляет собой при х —>> оо неопределенность вида 0-оо. Стало быть, достаточно научиться сводить неопреде- неопределенность вида О-оо к неопределенности вида - или —. Покажем, 0 оо как это делается. Итак, пусть z = (p(x) -ф(х), (8.31) причем Iim (f(x) = 0, Iim ф(х) = =Ьоо. Перепишем (8.31) в виде г = ф).ф(х) = *@-. (8.32) ф(х) Очевидно, выражение (8.32) представляет собой при х —>> неопределенность вида -. Наша цель достигнута. Примеры. 1) Вычислить Iim хх. Обозначим у = х Тогда lay = хInх = —т—. Применяя правило Лопиталя, будем I/ X
13 ФОРМУЛА ТЕЙЛОРА 275 иметь lim (In у) = lim —г- = lim , о = — lim x = 0. ^0+0 ж^0+0 1/х ж^0+0 1/х2 ж^0+0 Отсюда ясно, что lim у = 1. 1 2) lim(l + ar)^-i-* . Пусть у = A + ar)^-i-* . Тогда Ьу=(еЖ_11_ж)-1пA+Ж2). Пользуясь правилом Лопиталя, получим 2ж lim In у = lim — = lim = lim -, — '—r\j \c- ±J\- 2 ежA + ж2) + (еж - 1Jж Отсюда ясно, что lim у = е2. = Mm ..,. . O4 . , .. .4^ = 2. § 13. Формула Тейлора Устанавливаемая в этом параграфе формула является одной из основных формул математического анализа и имеет много™ численные приложения как в анализе, так и в смежных дисци™ п липах. Теорема 8.18 (теорема Тейлора1)). Пусть функция f(x) имеет в некоторой окрестности точки а производную порядка п + 1 (п — любой фиксированный номер) 2) . Пусть, далее^ х — любое значение аргумента из указанной окрестности, р — про- произвольное положительное число. Тогда между точками а и х найдется точка ? такая^ что справедлива следующая формула: где ), (8.33) it: 31 1) Брук Тейлор — английский математик A685-1731). 2) Отсюда вытекает, что сама функция f(x) и ее производные до порядка п непрерывны в указанной окрестности точки а. 3) Так как ? лежит между ж и а, то > 0, так что выражение i р определено для любого р > 0.
276 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Формула (8.33) называется формулой Тейлора (с центром в точ™ ке а), а выражение Rn+i(x) называется остаточным членом. Как мы увидим ниже, остаточный член может быть записан не только в виде (8.34), но и в других видах. Принято называть остаточный член, записанный в виде (8.34), остаточным чле- членом в общей форме1). Доказательство. Обозначим символом (р(х, а) многочлен относительно ж порядка п, фигурирующий в правой части (8.33), т. е. положим ф, а) = Да) + №(х - а) + ^М(ж - а 2 ... + ^—Ш{х-а)п. (8.35) Далее обозначим символом Rn+i(x) разность Rn-\-i(x) = f(x) — ш(х а). (8.36) Теорема будет доказана, если мы установим, что Rn+i(x) опре- определяется формулой (8.34). Фиксируем любое значение ж из окрестности, указанной в формулировке теоремы. Ради определенности будем считать, что х > а. Обозначим через t переменную величину, имеющую областью своего изменения сегмент [в, ж], и рассмотрим вспомо- вспомогательную функцию ф{Ь) следующего вида: ф(Ь) = f(x) - ф, t)-(x- tfQ(x), (8.37) где Подробнее i/j(t) можно записать так: il>(t)=f(x)-f(t)-?M(x-t)-... &U(x-t)n-(x-tfQ(x). (8.39) Наша цель — выразить Q(x), исходя из свойств введенной нами функции ф(г). Покажем, что функция ф{Ь) удовлетворяет на сегменте [а, ж] всем условиям теоремы 8.11 (Ролля). Из формулы (8.39) и из условий, наложенных на функцию /(ж), очевидно, что функция ф{г) непрерывна на сегменте [а,ж] ) Эту форму остаточного члена называют также формой Шлемильха— Роша.
§ 13 ФОРМУЛА ТЕЙЛОРА 277 и дифференцируема на этом сегменте1). Убедимся в том, что ф(а) = ф(х) = 0. Полагая в (8.37) t = а и принимая во внимание равенство (8.38), будем иметь ф(а) = f(x) - <р(х, а) - Rn+i(x). Отсюда на основании (8.36) получим ф(а) = 0. Равенство ф(х) = = 0 сразу вытекает из формулы (8.39). Итак, для функции ф{Ь) на сегменте [а, ж] выполнены все условия теоремы 8.11 (Ролля). На основании этой теоремы вну- три сегмента [а, х] найдется точка ? такая, что Ф'(О = 0. (8.40) Подсчитаем производную ф'{г). Дифференцируя равенство (8.39), будем иметь ... + ^рп(ж - t)n^1 - t ^(x - t)n +p{x - t)p^lQ{x). (8.41) Легко видеть, что все члены в правой части (8.41), за исключе™ нием последних двух, взаимно уничтожаются. Таким образом, г _ f)n _i_ n(r — i)p^1O(r) (Я 4-9) Полагая в формуле (8.42) t = ^ и используя равенство (8.40), получим Q{x) = (ж~^""Р+1/(п+1)(О- (8-43) Сопоставляя (8.43) и (8.38), окончательно будем иметь Rn+i(x) = {x- a)pQ(x) = (ж-°)Р(а!-^п"Р+1/("+!)(g). Теорема доказана. Найдем разложение по формуле Тейлора простейшей функ™ ции — алгебраического многочлена п-го порядка. Пусть f(x) = Сохп + da;™ + ... + Cn.lX + Сп. Тогда, поскольку /^те+1^(ж) = 0, остаточный член Rn^i(x) = 0 и формула Тейлора (8.33) принимает вид т = т + ш(ж _ а) + qt* {х _ а? +... + tM{x _ аГ. (8.44) ) Функция f(t) и ее производные до порядка п непрерывны на сегмен- сегменте [а, ж], a f^n+1\t) существует и конечна на этом сегменте (см. сноску 3) на с. 275).
278 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 (Здесь в качестве а можно взять любую точку бесконечной пря™ мой.) Таким образом, формула Тейлора позволяет представить любой многочлен f(x) в виде многочлена по степеням (ж — а), где а — любое вещественное число. Пусть теперь f(x) — произвольная функция^ удовлетворяю™ щая условиям теоремы 8.18. Постараемся выяснить, какими свойствами обладает многочлен (8.35), фигурирующий в фор™ муле Тейлора для этой функции. Как и выше, будем обозначать этот многочлен символом (р(х, а). Символом (р(п\х, а) обозначим n-ю производную (р(х, а) по х. Дифференцируя формулу (8.35) по ж и затем полагая х = а, мы получим следующие равенства: <р(а,а) = /(а), ?/(а,а)=//(а), Таким образом, фигурирующий в формуле Тейлора для произ- произвольной функции f(x) многочлен (р(х^а) обладает следующим свойством: он сам и его производные до порядка п включитель- включительно равны в точке х = а соответственно f(x) и ее производным до порядка п. § 14. Различные формы остаточного члена. Формула Маклорена 1. Остаточный член в форме Лагранжа, Коши и Пе- ано. Выше мы установили формулу Тейлора с остаточным чле- членом в общей форме. Здесь мы установим другие возможные представления для остаточного члена. Два из этих представле- представлений мы получим в качестве частных случаев из общей формы остаточного члена. Прежде всего несколько преобразуем формулу для остаточ™ ного члена (8.34). Поскольку точка ? лежит между точками а и ж, найдется такое число в1) из интервала 0 < в < 1, что ? — а = в(х — а). При этом ? = а + 9{х — а), х — ^ = (х — а)A — в). Таким образом, формула (8.34) может быть переписана в виде Rn+i(x) = (*-«)+^-'>~Уп+1)[о + в(х - а)}. (8.45) Рассмотрим теперь два важных частных случая формулы (8.45): ) Следует подчеркнуть, что ?, а стало быть, и в зависят не только от х и 71, но также и от р.
§ 14 РАЗЛИЧНЫЕ ФОРМЫ ОСТАТОЧНОГО ЧЛЕНА 279 1) р = п + 1; 2) р = 1 (напомним, что в формулах (8.34) и (8.45) в качестве р может быть взято любое положительное число). Первый из этих частных случаев (р = п + 1) приводит нас к остаточному члену в форме Лагранэюа Rn+i{x) = {X{~f^f{n+l)[a + в{х - а)}. (8.46) Эта форма остаточного члена наиболее употребительна в прило- приложениях. Остаточный член в форме Лагранжа напоминает следу- следующий, очередной член формулы Тейлора, лишь только (п + 1)-я производная функции f(t) вычисляется не в точке а, а в некото- некоторой промежуточной между а ж х точке ? = а + в(х — а). Второй из указанных выше частных случаев (р = 1) приводит нас к остаточному члену в форме Коши Rn+1(x) = (*-°)n+\i-e)nf(n+i)[a + в{х _ о)]_ (847) Так как формы Лагранжа и Коши отвечают разным значениям р, а в зависит от р, то значения в в формулах (8.46) и (8.47) являются, вообще говоря, различными. Для оценки некоторых функций форма Коши является более предпочтительной, чем форма Лагранжа. Обе формы остаточного члена (Лагранжа и Коши) обычно используются в тех случаях, когда требуется при тех или иных фиксированных значениях ж, отличных от а, при- приближенно вычислить функцию f(x). Естественно приближенно заменить f(x) многочленом (р(х, а) и численно оценить сделанную при этом ошибку. Наряду с этим встречаются задачи, в которых нас интересует не численная ве- величина указанной ошибки, а лишь порядок ее относительно малой величины (х — а). Для этой цели удобна другая форма записи остаточного члена (так называемая форма Пеано1))^ к установлению которой мы и переходим. Пусть функция f(x) имеет производные до порядка (п — 1) в некоторой окрестности точки а и производную порядка п в самой точке а. Обозначим, как и выше, символом Rn+\(x) разность функции f(x) и многочлена (8.35) и докажем, что для Rn+i(x) справед- справедливо следующее равенство Rn+i(x) = о[(х - а)п]. (8.48) Это последнее равенство и называют остаточным членом, представленным в форме Пеано. Так как при сделанных нами предположениях многочлен (8.35) и его производные до порядка п включительно совпадают 1) Джузеппе Пеано — итальянский математик A858—1932).
280 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 в точке х = а соответственно с функцией f(x) и ее производим™ ми, взятыми в той же точке х = а, то справедливы равенства Дп-ы(а) = 0, <+1(а) = 0, ... , в?-р{а) = 0, i#Ji(<0 = 0, (8.49) и нам остается доказать, что из равенств (8.49) вытекает пред- представление (8.48). Для этого достаточно с помощью равенств (8.49) доказать, что lim Д*+1(ДО = о. (8.50) х^а (х - а)п Так как каждая из функций Rn^i(x) и (х — а)п дифференци™ руема (п — 1) раз всюду в некоторой окрестности точки а, спра- справедливы равенства (8.49) и любая производная функции (х — а)п до порядка (п — 1) включительно обращается в нуль только в точке а, то для раскрытия неопределенности, стоящей в ле- левой части (8.50), молено (п — 1) раз последовательно применять теорему Лопиталя 8.17, в результате чего мы получим lim Rn+l{x) = lim R'n+l{x} , = ... = lim Rf+^{x) (8.51) x^a {x — a)n x^a n • (x — a)n^1 x^-a nl(x — a) Учитывая предпоследнее равенство (8.49), мы можем пере- переписать (8.51) в виде lim ^±# = 1 Mm i^+"i1JW-fi?V"i1)W> (ж - a)n n\ Так как производная i?^:1(a) существует и в силу последнего соотношения (8.49) равна нулю, то предельное значение в пра- правой части последнего равенства существует и равно нулю, что и завершает доказательство равенства (8.50). Тем самым вывод представления (8.48) завершен. В заключение запишем полностью формулу Тейлора с оста- остаточным членом в форме Пеано (8.52) 2. Другам запись формулы Тейлора. Часто записыва- записывают формулу Тейлора (8.33) в несколько ином виде. Положим в (8.33) а = жо, (х — а) = Ах и возьмем остаточный член в форме Лагранжа (8.46). При этом х = х® + Аж, и мы получим /(я* + Ах) - /Ы = ^Ах + ^f^(AxJ + ...
§ 15 ОЦЕНКА ОСТАТОЧНОГО ЧЛЕНА 281 (Здесь в — некоторое число из интервала 0 < в < 1.) Форму™ ла Тейлора (8.53) является естественным обобщением формулы Лагранжа (8.11) (см. § 9). Формула Лагранжа (8.11) получается из формулы (8.53) в частном случае п = 0. 3. Формула Маклорена. Принято называть формулой Ма- клорена1) формулу Тейлора (8.33) с центром в точке а = 0. Та™ ким образом, формула Маклорена дает представление функции в окрестности точки х = 0. Запишем формулу Маклорена для произвольной функции f(x) с остаточным членом в форме Ла- Лагранжа, Копти и Пеано2): lM l^ I^M ), (8.54) где остаточный член имеет вид: 1) в форме Лагранжа ^^/ (O<0<1); (8.55) 2) в форме Копти3) b^A» (O<0<1); (8.56) 3) в форме Пеано Rn+1{x)=o{xn). (8.57) (Мы использовали формулы (8.46), (8.47) и (8.48).) Перейдем к оценке остаточного члена в формуле Тейлора^ Маклорена, к отысканию разложения по формуле Маклорена важнейших элементарных функций и к рассмотрению различ- различных приложений этой формулы. § 15. Оценка остаточного члена. Разложение некоторых элементарных функций 1. Оценка остаточного члена для произвольной функ- цим. Оценим для произвольной функции f(x) остаточный член в формуле Маклорена (8.54), взятый в форме Лагранжа (8.55). х) Колин Маклорен — английский математик A698-1746). 2) При этом предполагается, что /(ж) имеет в окрестности точки х = = 0 (п + 1)-ю производную, а для остаточного члена в форме Пеано — в окрестности точки х = 0 (п — 1)-ю производную, а в самой точке х = 0 п-ю производную. 3) Еще раз подчеркнем, что значения в в формулах (8.55) и (8.56), вообще говоря, различны.
282 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Предположим, что рассматриваемая нами функция f(x) обладает следующим свойством: существует такое веществен- вещественное число М, что для всех номеров п и для всех значений аргу- аргумента х из рассматриваемой окрестности точки х = 0 спра- справедливо неравенство \f{n)(x)\ ^M. (8.58) Функцию, обладающую указанным свойством, будем назы- называть функцией^ совокупность всех производных которой огра- ограничена в окрестности точки х = 0. Из неравенства (8.58) вытекает, что \f{n){9x)\ <M, (8.59) и поэтому из формулы (8.55) следует, что Итак, мы получаем следующую универсальную оценку остаточ- остаточного члена для функции^ совокупность всех производных кото- которой ограничена числом М в окрестности точки х = 0: . (8.60) Напомним, что при любом фиксированном х х п+1 lim = 0 { + 1)! {п + 1)! (см. пример 3 п. 3 § 3 гл. 3). Отсюда вытекает, что, выби™ рая достаточно большой номер п, мы можем сделать правую часть (8.60) как угодно малой. Это дает нам возможность при- применять формулу Маклорена для приближенного вычисления функций, обладающих указанным свойством, с любой напе- наперед заданной точностью. Приведем примеры функций, сово- совокупность всех производных которых ограничена в окрестности точки х = 0: 1) f(x) = еж, f(n\x) = ex. Совокупность всех производных этой функции ограничена на любом сегменте [—г, г] (г > 0) чис- числом М = ег. 2) f(x) = cos ж или f(x) = sin ж. Совокупность всех производ- производных каждой из этих функций ограничена всюду на бесконечной прямой числом М = 1. 2. Разложение по формуле Маклорена некоторых элементарных функций. A. f(x) = еж. Поскольку f^(x) = еш, /(те)@) = 1 для любо™ го п, формула Маклорена (8.54) имеет вид ^ ^ (8.61)
§ 15 ОЦЕНКА ОСТАТОЧНОГО ЧЛЕНА 283 где остаточный член в форме Лагранжа равен На любом сегменте [—г,+г] (г > 0), в силу того, что \е | < ег, получим следующую оценку для остаточного члена: )\<j^er. (8.62) Б. /(ж) = sin ж. Поскольку f^n\x) = sin (х + п— ), V ^ / w . тг / 0 при четном га, /W@) =sinn-= < n^i ^ 1 (—1) 2 при нечетном га, формула Маклорена (8.54) имеет вид |! |!^ ^^ ж), (8.63) где п — нечетное число, а остаточный член в форме Дагранжа равен Rn+2{x) = ^JyT sin (вх + п| + тг) @ < в < 1). Очевидно, что на любом сегменте [—г, +г] (г > 0) для остаточ™ ного члена справедлива следующая оценка: \Rn+2(x)\ < j?^. (8.64) В. /(ж) = cos ж. Поскольку /^(ж) = cos (ж + п—), ы тг Г 0 при нечетном п, /^ ^@) =cosn^ = < п z I (—lj 2 при четном п, формула Маклорена (8.54) имеет вид со8Ж = 1-^ + ^-^ + ... + (-1)^ + Rn+2(x), (8.65) где п — четное число, а остаточный член в форме Лагранжа равен На любом сегменте [—г, +г] (г > 0) получаем для остаточного члена оценку (8.64).
284 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Г. f(x) = In A + х). Поскольку при п ^ 1 f(n){x) = (_1)n-l^J^ формула Маклорена (8.54) имеет вид ^2 ™3 «.4 п A + ж) = ж- —+ — - — + ...+ (-1)п х— + Дп+1(ж). (8.66) Z о 4 77 Остаточный член на этот раз запишем и оценим и в форме Ла- гранжа, и в форме Кошт Rn+\{x) = (тг + 1)A + еж)„+1 (в форме Лагранжа), (8.67) Rn+l{x) = {-l)nxn+lj^ffr г) (в форме Коши). (8.68) Для оценки функции In (I + x) для значений ж, принадлелсащих сегменту 0 ^ х ^ 1, удобнее исходить из остаточного члена в форме Лагранжа (8.67). Переходя в формуле (8.67) к модулям, получим для всех х из сегмента 0 ^ х ^ 1 ;)| < ^i- (8-69) Из оценки (8.69) очевидно, что для всех х из сегмента 0 ^ х ^ 1 Rn+i{x) —> 0 при п —> оо. Оценим теперь функцию 1пA + ж) для отрицательных зна- значений х из сегмента —г ^ х ^ 0, где 0 < г < 1. Для этого будем исходить из остаточного члена в форме Коши (8.68). Перепишем этот остаточный член в виде Принимая во внимание, что для рассматриваемых значений х — < 1, и переходя в формуле (8.70) к модулям, будем иметь \Rn+i(x)\ < ^-. (8.71) Так как 0 < г < 1, то оценка (8.71) позволяет утверждать, что lim Rn+i — 0. ) Еще раз отметим, что в формулах (8.67) и (8.68) значения в являются, вообще говоря, различными.
§ 16 ПРИМЕРЫ ПРИЛОЖЕНИЙ ФОРМУЛЫ МАКЛОРЕНА 285 Д. f(x) = A + ж)а, где а — вещественное число. Посколвку f^\x) = а(а - 1)... (а - п + 1)A + х) /W@) = а(а - 1)... (а - п + 1), формула Маклорена (8.54) имеет вид )а~п х + ... 1)[ап + 1)Ж" + Rn+l(x), (8.72) 71. где остаточный член в форме Лагранжа равен {1 (8.73) В частном случае, когда а = п — целое число, Rn^i(x) = 0, и мы получим известную из элементарного курса формулу бинома Ньютона A + х)п = 1+™х + 1^р1х2 + ... + хп. (8.74) Если нужно получить разложение не двучлена A + х)п, а дву- двучлена (а + ж)п, то можно вынести ап за скобку и воспользоваться формулой (8.74). При этом получим Таким образом, общий случай бинома Ньютона является част- частным случаем формулы Маклорена. Е. /(ж) = arctga;. Можно убедиться в том, что ^{п) (О ^ при четном п, 1 (—1)~2~(п — 1)! при нечетном п. Таким образом, формула Маклорена (8.54) с остаточным членом в форме Пеано (8.57) имеет вид arctgж = ж-— + — - — + ... +(-1) 2 — + о(ж"). (Здесь п — нечетное число.) § 16. Примеры приложений формулы Маклорена 1. Алгоритм вычисления числа е. В п. 4 § 3 гл. 3 мы вве- ли число е как предел lim ( 1 + — ) и получили для е грубую
286 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 оценку (см. формулу C.7) из гл. 3) 2 ^ е ^ 3. Теперь мы ука™ жем, как вычислить число е с любой интересующей нас степенью точности. Воспользуемся формулой Маклорена (8.61) и оценкой остаточного члена (8.62), положив в этих формулах х = г = 1. Получим где Выбирая в формулах (8.75) и (8.76) достаточно большое п, мы можем оценить с помощью этих формул число е с любой инте- интересующей нас степенью точности. 2. Реализация алгоритма вычисления числа е на элек- электронной машине. Указанный в предыдущем пункте алго™ ритм вычисления числа е легко реализуется на электронно™ вычислительных машинах. Мы приведем результат вычисления числа е по формуле (8.75) при п = 400 на электронно-вычислительной машине БЭСМ-61). Вычисления велись с 600 знаками после запятой. ) Для читателей, знакомых со стандартным алгоритмическим языком АЛГОЛ, приведем записанную на этом языке программу вычислений: Система Алгол-БЭСМб, вариант 10-12-69 begin Integer г, с, р, n, m; Integer array а, 6, е [0 : 601]; т : = 400; marg C9, 50, 39, 10, 0, 0); е [0] : = 1; Ь [0] : = 1; for г : = 1 step I until 601 do a [i] : = Ь [i] : = е [г] : = 0; for n : = 1 step I until m do begin for г : = 0 step 1 until 600 do а Щ: = ЬЩ; с: = a JO]; for г = 0 step 1 until 600 do begin b [i] : = с -=- n; с : = (c — n) x b[i] x 10 + а [г + 1] end p : = 0 for г : 600 step — 1 until 0 do begin с : = e[i] + b[i] +p; p : = 0 if с < 10 then e [г] : = с else begin e [г] : = с — 10; p : = 1 end end end for n : = 1 step 1 until 6 do begin output ('10/', 'zd.\ e[0]); for г : = 1 step 1 until 590 do output ('zd', е[г]) end end
§ 16 ПРИМЕРЫ ПРИЛОЖЕНИЙ ФОРМУЛЫ МАКЛОРЕНА 287 Учитывая возможные ошибки округления, мы отбросили по™ еледние 10 знаков и приводим результат вычисления с 590 зна- знаками после запятой: 2,718281 828459 045235 360287 471352 662497 757247 093699 959574 966967 627724 076630 353547 594571 382178 525166 427427 466391 932003 059921 817413 596629 043572 900334 295260 595630 738132 328627 943490 763233 829880 753195 251019 011573 834187 930702 154089 149934 884167 509244 761460 668082 264800 168477 411853 742345 442437 107539 077744 992069 551702 761838 606261 331384 583000 752044 933826 560297 606737 113200 709328 709127 443747 047230 696977 209310 141692 836819 025515 108657 463772 111252 389784 425056 953696 770785 449969 967946 864454 905987 931636 889230 098793 127736 178215 424999 229576 351482 208269 895193 668033 182528 869398 496465 105820 939239 829488 793320 36 ... Отметим, что на проведение всех вычислений ушло около одной минуты машинного времени. 3. Использование формулы Маклорена длм асимпто- асимптотических1) оценок элементарных функций и вычисле- вычисления пределов. Формула Маклорена является мощным сред- средством для получения асимптотических оценок элементарных функций и вычисления пределов. В гл. 4 мы установили следующие асимптотические формулы для элементарных функций: 3-77) Формулы (8.77) дают представление элементарных функций при малых значениях |ж|. Первые четыре из формул (8.77) оцени™ вают соответствующие элементарные функции с точностью до членов 1-го порядка относительно малой величины ж, а послед™ няя из формул (8.77) — с точностью до членов 2-го порядка относительно х. Оценок (8.77) оказывается достаточно для вычисления про- простейших пределов. Однако для вычисления более сложных пре- пределов, в которых определяющую роль играют члены более вы™ сокого порядка относительно малой величины ж, формул (8.77) cos х = 1 — — + о(х ) Формулу или оценку, характеризующую поведение /(ж) при ж —>• а (здесь при ж —)¦ 0), называют асимптотической.
288 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 оказывается уже недостаточно. Так, например, при помощи формул (8.77) невозможно ввхчислить пределвное значение 1« S1H Ж X /су fyo\ lim , , (8.78) ибо по виду знаменателя можно заключить, что здесь опреде- определяющую роль играют члены 3-го порядка относительно х. Таким образом, для вычисления тонких пределов необходимо получить более точные асимптотические оценки для функций, стоящих в левых частях формул (8.77). Такие оценки немедленно вытекают из формулы Маклорена (8.54), если в этой формуле взять остаточный член в форме Пеа- но (8.57). Записывая формулы Маклорена (8.63), (8.72), (8.66), (8.61) и (8.65) и беря в каждой из этих формул остаточный член в форме Пеано, получим следующие асимптотические оценки: ? n-is» n (8J9) 3 * * * v / n у? (Здесь в первой из формул (8.79) п — любое нечетное число, а в последней из формул (8.79) п — любое четное число.) Форму™ лы (8.79) оценивают соответствующие элементарные функции с точностью до членов любого порядка п относительно малой величины х. Эти формулы являются эффективным средством для вычисления ряда тонких предельных значений. Приведем примеры использования асимптотических формул (8.79). 1°. В качестве первого примера рассмотрим уже записанное выше предельное значение (8.78). Привлекая первую из формул (8.79) (взятую при п = 3), будем иметь lim — = lim ^ = lim — — + о х^О х3 х^о ж3 ш^о1 3! 2°. ;J 3! Т r e^x I2 — cos ж
§ 16 ПРИМЕРЫ ПРИЛОЖЕНИЙ ФОРМУЛЫ МАКЛОРЕНА 289 Исходя из вида знаменателя, можно заключить, что опреде™ ляющую роль должны играть члены 4™го порядка относитель- относительно х (ибо sinx = x + o(x)). Пользуясь формулами (8.79), можем записать со8ж = 1-^ + ^ + о(ж5), (8.80) sinx = х + о(х), (8.81) Стало быть, при z = —х2/2 получим .82) В силу формул (8.80), (8.81) и (8.82) искомое предельное значе™ ние может быть переписано в виде 4 = lim 2 L 2 24 = ж4 + о(ж4) 8 24 12 Здесь символом а(х) мы обозначили величину °^4', являю™ ж щуюся бесконечно малой при х —> 0. 3е 1 = lim cos ж + — V 2 х / = lim у. Логарифмируя выра^кение для у, будем иметь Обозначим через у величину1) у = (cosж + ^—\ х . Тогда In 1/ = , In cos х + — I . x(slnx —ж) \ 2 # 1 # ж In cos ж + — Вычислим lim In у = lim ) При малых ж выражение I cos ж -\ 1 заведомо V А / 10 В.А. Ильин, Э.Г. Позняк, часть I положительно.
290 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Ж2 Х^ ^ Х^ А Поскольку cos ж = 1 — — + —¦ + о(х ), sin ж = х — — + о(х ), получим infl + ^+o^ lim In у = lim —-—j ^O ^O х Учтем теперь, что In (I + z) = z + o(z). Из этой формулы Таким образом, lim In у = lim -^ = lim - Отсюда I = lim у = е~*. ДОПОЛНЕНИЕ ВЫЧИСЛЕНИЕ ЭЛЕМЕНТАРНЫХ ФУНКЦИЙ В настоящем Дополнении мы изучим вопрос о вычислении значений простейших элементарных функций. Для вычисления значений всех указанных функций используются два вида алгоритмов, первый из которых основан на разложении вычисляемой функции по формуле Тейлора, а второй — на разложении ее в цепную или непрерывную дробь г). Первый алгоритм позволяет составить единую про- программу вычислений значений логарифмической и обратных тригонометри- тригонометрических функций. Второй алгоритм лежит в основе универсальной програм- программы вычислений остальных простейших элементарных функций. Помимо обоснования указанных алгоритмов, мы проведем оценку числа итераций, обеспечивающих заданную точность вычислений. 1. Вычисление логарифмической и обратных тригонометриче- тригонометрических функций. Вычисление этих функций основано на применении фор- формулы Тейлора. Мы подробно рассмотрим вопрос о вычислении логарифма и арктангенса. Вычисление значений arcctga;, агевтж и arccosx легко сводит- сводится к вычислению арктангенса с помощью следующих известных формул: 71 • х arcctga: = —¦ — arctgx, arcsinsc = arctg 2 v 1 — x2 x arccos x = arcctg . :. ) Сведения о непрерывных дробях читатель может найти в учебнике А.П. Киселева «Алгебра» (Учпедгиз, 1959, с. 188-201).
ДОПОЛНЕНИЕ 291 1. Вычисление In а. Представим число а > 0 в следующей форме: а = 2РМ, (8.83) где р — целое число, a M удовлетворяет условиям | < М < 1. (8.84) Отметим, что представление а в форме (8.83) единственно. Используя фор- формулу (8.83), получим для In а следующее выражение: (8.85) Полагая M = i=i±? (8.86) и подставляя это выражение для М в (8.85), преобразуем формулу (8.85) для In а к следующему виду: A \ 1 4- т р- ^ J In 2 Ч™ In y^^ ' (8-87) 1 + х Разложим функцию In по формуле Маклорена. Легко убедиться, что это разложение с остаточным членом в форме Лагранжа имеет следующий вид: 1 4- т 2т3 2т5 2т2п+1 li±? 2+*L + ^ + + ^ W) (888) где 2п+1 Г 1 1 8'89) а число в заключено строго меж:ду нулем и единицей. Для приближ:енного вычисления In а используется следующая формула: 2п+1 \ j (8.90) 1 + X которая получается из (8.87) путем замены In частью формулы Ма™ клорена (8.88) для этой функции без остаточного члена R2n+2(x). Заметим, что число х в приближенной формуле (8.90) для In а определяется из фор™ мулы (8.86) с учетом ограничений (8.84), наложенных на М. Перейдем к оценке погрешности формулы (8.90). Так как приближен™ ное значение In а, вычисляемое по формуле (8.90), отличается от точного значения, вычисляемого по формуле (8.87), на величину остаточного члена -Д2та+2(ж), то для выяснения погрешности достаточно оценить этот остаточ- остаточный член. Во-первых, выясним границы изменения х. Из формулы (8.86) получаем 10*
292 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Из (8.91) следует, что для значений М", удовлетворяющих неравенствам (8.84), абсолютная величина ж удовлетворяет условию г) \х\ < 0,172. (8.92) Заметим теперь, что структура остаточного члена R'2n+2(%) такова, что оценка для отрицательных и положительных значений ж может быть про- проведена одинаковым способом (из формулы (8.89) видно, что замена х на —х не изменяет структуры R2n+2(x)). Поэтому достаточно получить оценку -R2n+2 (ж) для х ^ 0. Учитывая это и неравенство (8.92), получим, заменяя в правой части (8.89) величину х числом 0,172, величину единицей, 1 1 а величину числом , следующую оценку: Д72Jта+2.Г дней формуле внесем @,172Jп+2 в квад 0,172 A-0,172J В последней формуле внесем @,172Jп+2 в квадратные скобки. Так как < 0,208, получим следующую оценку для R2n+2(x): X и, X I /j \М2п + 2{Х)\ ^ . (8.9J) При вычислении In а на электронно-вычислительной машине 2) формулу (8.90) берут обычно при п = 6. Точность вычислений для этого случая fa oqn @Д72I4 + @,208I4 оценивается, как видно из (8.93), числом — , которое не 14 превышает 1,625 • 100. 2. Вычисление arctg а. Очевидно, можно ограничиться случаем положительных значений аргумента, ибо, полагая \а\ = ж, найдем arctg a = sgn a • arctg ж. Укажем теперь стандартные преобразования, с помощью которых вы- вычисление arctg ж для значений аргумента ж, не меньших 1/8, приводится к вычислению арктангенса для значений аргумента, меньших 1/8. Пусть сначала х ^ 1. Положим у = arctg ж, т. е. ж = tgt/, и х\ = tg(y — fjpr у — \ х — 1 — arctg 1). Из последней формулы получаем х\ = = < 1. Так tgy + l х + 1 7Г как arctg ж = arctg I + arctg ж i = —¦ + arctg Ж1, то вычисление arctg ж для 4 значений ж ^ 1 приводится к вычислению arctg жi при 0 < х\ < 1. Обратимся теперь к случаю, когда аргумент удовлетворяет неравен- неравенствам — ^ ж < 1. 8 Пусть к\ = 1, &2 = 1/2, кг = 1/4, к^ = 1/8. Очевидно, для некоторого i = 1, 2, 3, 4 выполняются неравенства ki^x<2ki. (8.94) ) Так как ж является функцией от М, то вопрос сводится к разысканию максимального значения модуля функции (8.91) на сегменте [1/2,1]. ) Именно так вычисляется In а на электронно-вычислительной машине БЭСМ-б.
ДОПОЛНЕНИЕ 293 Положим у = arctgж, т. е. ж = tgy и х% = tg (г/ — arctgfc). Из этой формулы получаем Хг = tgy-fe = *-fc 1 + fctgy 1+^ж Так как ж > 0, то 1 + 1^ж > 1, кроме того, согласно правому из неравенств (8.94), ж — ki < 2ki — ki = ki. Поэтому ив последнего выражения для Xi получаем неравенство Xi < ki. Поскольку arctgx = arctgfc + arctgЖi, то вычисление arctgж для значений ж, удовлетворяющих неравенствам (8.94), приводится к вычислению arctgXj при 0 < Xi < ki. Повторяя описанные преобразовании аргумента ж самое большее четыре раза, мы приведем вычисление arctgж для значений ж из полуинтервала 1/8 ^ ж < 1 к вычислению арктангенса для значений аргумента, меньших 1/8. Для вычисления arctgж при ж < 1/8 используется формула Маклорена ж3 ж5 ж2п+1 arctgx = х — -- + ¦--- ... + (—l)n + R2n+2(x). При вычислениях обычно последнюю формулу берут при п = 6 и отбра- отбрасывают остаточный член г). Программа вычислений для логарифма и арк- арктангенса общая. При пользовании этой программой для арктангенса надо ж2те + 1 лишь позаботиться о перемене знаков у соседних членов . 2. Вычисление тригонометрических функций, показательной функции и гиперболических функций. Вычисление этих функций основано на применении цепных (или, как их еще называют, н е- прерывных) дробей. Необходимые нам свойства этих дробей приводятся ниже в п. 1. Вычисление всех перечисленных функций связано с определенной цеп- цепной дробью, которая получается при разложении функции thsc. Поэтому мы подробно рассмотрим вычисление значений функции thx, а затем ука- укажем, каким образом вычисляются остальные функции. 1. Некоторые сведения о цепных дробях. Конечной р цепной дробью —р- называется выражение вида ^ = &о + ^а-, ¦ (8-95) 62 + Величины «21,B2,... , ап обычно называются частными числителями^ а boj fei,... ,bn — частными знаменателями. Цепные дроби 7Г = Т' 7Г = Ьо + 7Г' 7Г = Ьо Н аТ' • * • ^8'96^ Ь>2 ) Именно так поступают, например, при вычислениях на электронной машине БЭСМ-6.
294 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 р называются подходящими дробями для дроби "рг™"- Qn Если положить Р-1 = 1, Q—i = 0, то из выражений (8.96) для подхо- дящих дробей —— (к = 1, 2,... , п) можно получить следующие формулы, Qk связывающие Рк с Pk^i и Рк^2 и Qk с Qk-i и Qk-2- Qk = р Нам понадобится специальная формула для дроби —р, определяемой Qn соотношением (8.95). Для установления этой формулы сравним две подхо- подходе рк рк^1 т. * „ дящие дроби —— и — . Разность этих дробен, очевидно, равна Qk Qk^i Рк Pk Числитель правой части (8.98) в силу (8.97) может быть записан в виде PkQk^i - QkPk^i = (ЬкРк-! + akPk-2)Qk-i - (bkQk^i + akQk-2)Pk-i = = -ak[Pk-iQk-2 - Qk-iPk-2]. (8J9) Последовательно используя соотношение (8.99) для значений к, (к — t), (к — — 2), ... , 1 и учитывая, что Р—\ = 1, Q—i = 0, Qo = 1, мы придадим дроби (8.98) следующий вид: ^^ ^ (8.100) ¦¦" Qk-iQk Так как Qn Qo \Qi QoJ \Q2 QiJ '" \Qn Qn то с помощью (8.100) мы и получим необходимую нам специальную фор™ , Рп мулу для дроби ——: Q ЦГгг V0V1 V1V2 ЦГгг—1<^п 2. Разложение функции thя; в цепную дробь. Исполь- Используемый в этом пункте способ разложения функции th ж в цепную дробь был предложен Шлёмильхом ) для разложения в цепную дробь функции tgx. Рассмотрим функцию у = ch у/х для значений х > 0. Очевидны сле- следующие тождества, получаемые последовательными дифференцирования- дифференцированиями данной функции и простыми преобразованиями: = sh V», 2yfcy" + 4= - -^= = 0. 2^ 1)Schlomilch О. Ueber den Kettenbrach fur tgx. // Zs. Math. u. Phys. 1857. V. 2. S. 137-165.
ДОПОЛНЕНИЕ 295 Из последнего соотношения получаем тождество, справедливое для всех ж > 0: Аху" + 2у - у = 0. (8.102) Последовательно дифференцируя тождество (8.102), будем иметь 4хуш + 6у" - у' = 0, .................. (8.103) 4ху(п+2) + Dп + 2)|/(п+1) - у{п) = 0. y(n+i) Обозначим отношение , л через Un+i- Тогда из последнего соотно™ у{п) шения (8.103) получим тождество 4хип+2 + 4п + 2 = , из которого вытекает соотношение "п+1 = 0 .^ (8.104) 2п + 1 + 2жггте+2 t/; th /x Так как 11-1 = — = -=-, то соотношение (8.104) при п = 0 может быть I/ 2уж записано в следующей форме: 2хи2 В правой части этой формулы заменим U2 его выражением, полученным с помощью (8.104) при п = 1. В результате получим формулу 1 + 3 + 2хи3 В последнем соотношении мы можем заменить из его выражением, по™ лученным с помощью (8.104) при п = 2. Такого рода операции мы мо- можем провести любое конечное число раз. В результате получим разложение функции th у/х в цепную дробь. Заменяя в этом разложении у/х на ж, най- найдем нужное нам разложение функции th. ж в конечную цепную дробь. Это разложение имеет вид ?Ц . (8.105) 5 + 2п + 1 + 2х2ип+2 3. Вычисление значений функции thx. Оцен- Оценка погрешности вычислений. Вычисление значений функции th х на электронно-вычислительной машине обычно производится с помощью формулы (8.105), в которой отбрасывается член 2х ип+2- При этом п берется равным 6 (п = 6), значения же х по абсолютной величине ограничиваются числом тг/4.
296 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 Мы проведем оценку погрешности для любого номера п. Обозначим приближенное значение функции thx, полученное из (8.105) путем отбрасывания члена 2х un+2j через thx. Для выяснения точности вычислений мы должны, очевидно, оценить разность th. ж — thsc. Заметим, что th. ж и th ж представляют собой цепные дроби, которые мы обозначим соответственно — и — • Qn+i Qn+1 Выпишем значения частных числителей а«, a,i и частных знаменателей bi, bi для этих дробей (черточкой сверху мы будем обозначать величины, относящиеся к дроби -zr-—). Имеем 0>1 = п\ = Ж, B2 :=:: <^2 :=: Ж , . . . , fln + 1 :=: Q<n-\-\ = Ж , 5q = ?>о := О, Ъ\ = bi = 1, ... , bn = bn = 2ti — 1, (8.106) Г> "о __ __ Так как для дробей —р— и =^— Q-i = <Э^Х =0 и Qo = Q0 = 1, то с помо™ щью формул (8.106) и соотношений (8.97) получаем следующие равенства: 1-_ и 2- 2j_--- п- п»_ (8.107) Qn+i = Bп +1 + 2ж2адп+2)<Зп+ х2дп^г, Qn+1 = Bw +l)Qn+ x2Qn^x. Представим теперь каждую из дробей п и п в виде (8.101). Из фор™ Qn+i Qn+1 мул (8.106) и (8.107) ясно, что эти представления будут отличаться лишь Рп+1 Pn+i последними слагаемыми. Поэтому разность — _ будет равна раз™ Qn+i Qn+1 ности последних слагаемых представлений этих дробей по формуле (8.101). Так как разность рассматриваемых дробей равна thx — thx, то, используя (8.106), получим следующую формулу: Это соотношение с помощью формул (8.107) легко преобразовывается к следующему виду: QnQn+1 l2x*Qnun+2 + Bn Для получения нужной нам оценки воспользуемся следующими двумя нера- неравенствами, которые будут доказаны ниже. При х ^ 0 для любого к ^ 1 справедливо неравенство: Qk ^ Bfc-l)!! (8.109) При х > 0 величина ип+2 положительна: ип+2 > 0. (8.110)
ДОПОЛНЕНИЕ 297 Перейдем теперь к оценке разности thx — thx при ж > 0. Так как при ж > 0 nn+2 > 0 (см. (8.110)) и любое Qk > 0 (см. (8.109)), то выражение в квадратных скобках в правой части равенства (8.108) не превосходит еди- единицы. Далее, из (8.109) получаем следующее неравенство: ЯпЯп+1>[Bп-1)Щ2Bп + 1). Поэтому при х > 0 для любого номера п справедлива следующая оценка погрешности: Остановимся на оценке погрешности при п = 6 для значений ж, удовлетво- удовлетворяющих неравенствам 0 < х < тг/4. При п = 6 число 2тг — 1 равно 11, а число 2п + 1 равно 13. Так как (тг/4) < 0,8, то ж13 < @,8I3 < 5,6 • 10~2. Легко подсчитать, что 11!! = 10 395. Поэтому, учитывая, что 2-6 + 1 = 13, из формулы (8.111) получим, что ошибка в приближенном вычислении thsc для п = 6 не превышает 4 • 10~ Докажем теперь неравенства (8.109) и (8.110). Доказательство неравенства (8.109). Докажем сначала неотрицательность любого Qk. Из формул (8.106) вы- вытекает неотрицательность Ьк и а& при х ^ 0 для любого к ^ п. Мы уже отмечали, что Q_1 = 0, Qo = 1. Отсюда и из второй из формул (8.97) вытекает неотрицательность Qk для любого к ^ п. Из второй формулы (8.97), а также из неотрицательности аи и Qk вы™ текает неравенство Qk^bkQ^. (8.112) Так как Qo = 1, а Ь& = 2к — 1 при 1 ^ Jc ^ п, то последовательно из неравенства (8.112) получаем Q1 ^ 1, Q2 ^ 3, ..., Qk ^ Bк — 1)!!. Справедливость неравенства (8.109) установлена. Доказательство неравенства (8.110). Достаточно доказать, что все производные функции у = ch л/х при х > > 0 положительны. Очевидно, тем самым мы докажем неравенство (8.110), (п+2) Умножая последнее соотношение (8.103) на , мы можем перепи- переписать это соотношение в виде , те-1/2 rTl+1/2?/ri+1VrH — - ?i(n) (Я11Ч) Х У Vх/ ~~ л У уо.ИО) L J 4 Убедимся теперь в том, что Ито[жп+1/21/(п+1)(ж)] = 0. (8.114) Для этого достаточно убедиться в том, что величина хпу{п+1)(х) (8.115) ограничена при ж —»¦ 0 + 0. Из соотношений у = ch л/х жу' = — вытекает, что у (ж) и |/;(ж) ограничены при ж —»¦ 0 + 0. Но тогда из (8.102) вытекает, что и величина ху2{х) ограничена при ж —» 0 + 0.
298 ОСНОВНЫЕ ТЕОРЕМЫ О НЕПРЕРЫВНЫХ ФУНКЦИЯХ ГЛ. 8 После этого из последнего соотношения (8.103) по индукции получается, что величина (8.115) ограничена при х —»¦ 0 + 0 для любого номера п. Тем самым соотношение (8.114) доказано. Докажем теперь, что для любого номера п производная У{п\х) (8.116) положительна при х > 0. Очевидно, что у^°\х) = у(х) = ch у/х положи™ тельна при х > 0. Предположим, что для некоторого номера п величина (8.116) положительна при х > 0. Убедимся тогда, что и у^п+1\х) положи- положительна при х > 0. Из (8.113) заключаем, что производная в левой части (8.113) положительна при х > 0, т. е. функция хп+1 ^ 2 у^п+1\х) возрастает при х > 0. Но тогда из (8.114) следует, что эта функция положительна при х > 0. Итак, у^п+1\х) > 0 при х > 0, и неравенство (8.110) доказано. 4. Вычисление гиперболического синуса, гиперболического косинуса и показатель- показательной функции. В дальнейшем символом Sn(t) мы будем обозначать следующую цепную дробь: Sn(t) = 1 + * t (8.117) 5 + 2п- Обычно для электронно-вычислительной машины составляют программу вычисления этой цепной дроби. Используя эту программу, можно без за- затруднений составить программу вычислений гиперболического тангенса, ибо, как было выяснено в предыдущем пункте, приближенное значение thx может быть вычислено по формуле щ- <8Л18> причем в предыдущих пунктах было также выяснено, что с увеличением п точность вычислений возрастает и погрешность стремится к нулю. Вычисление функций sh.2x, сЬ.2ж, е х может быть редуцировано к вы- вычислению гиперболического тангенса с помощью формул 2 th х . 1+Й12ж 2х 1+tha sii 2х = о , ся х = о , е = _ . 1-th2 х 1-th2 x 1-thx Из этих формул и из соотношения (8.118) получаются следующие формулы для приближенных значений перечисленных функций: 2Sn{x2)-x Sj{x2) + x2 2x Sn{x2) + x SU2JJ 52BJ' 6 ^SB)' Ясно, что с помощью этих формул и программы вычислений для Sn(t) легко составляются программы для вычисления sh2x, сЬ2ж и е х. 5. Вычисление тригонометрических функ- функций. По аналогии с разложением в цепную дробь функции th x строится разложение для функции
ДОПОЛНЕНИЕ 299 Рассмотрим функцию у = cos л/х для значений х > 0. Очевидны следую- следующие соотношения, получаемые последовательными дифференцированиями этой функции и простыми преобразованиями: 2у/ху = -sin-s/ж, 2у/ху" + —= = ^7П=- \/ X Zy/X Из последнего соотношения получаем тождество 4жу" + 2у' + у = 0. Последовательно дифференцируя это тождество, будем иметь 4яу'" + 6у" + у' = 0, 4ж|/(п+2) + Dп + 2)|/(п+1) + у{п) = 0. y(«+i) Обозначим отношение , л через un+i- Тогда из последнего равенства У{п) получим равенство 4хип+2 + 4?г + 2 = — ^-^, из которого вытекает соотно- шение -1/2 2п + 1 + Отсюда, в полной аналогии с рассуждениями для гиперболического танген- тангенса, получаем следующее разложение функции tg x в цепную дробь: х t 1 + 3 + 5 + Приближ:енное значение tg ж получается из этой формулы путем отбрасыва- отбрасывания члена 2ж2/мп+2- С учетом выражения (8.117) это приближенное значение может быть найдено по формуле ( Как и в случае гиперболического тангенса, можно убедиться, что с уве- увеличением п точность вычислений по формуле (8.119) возрастает и погреш- погрешность стремится к нулю. С помощью известных из курса элементарной математики формул 2 t&x 1 — tg2 x sin2x = s— и cos 2ж = s— и соотношения (8.119) получаем сле- l+tg2x l+tg2x l \ У дующие формулы для вычисления приближенных значений sin 2x и cos 2x: SHI ZX tt — -, COS ZX й 9 , tt -. Si{2) 2 S2{2J В заключение заметим, что точность вычислений всех функций, ука- указанных в последних двух пунктах, для шести итераций (п = 6) будет не меньше 10"" при условии, что аргумент х по абсолютной величине не пре- превышает тг/4.
ГЛАВА 9 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ. НАХОЖДЕНИЕ МАКСИМАЛЬНОГО И МИНИМАЛЬНОГО ЗНАЧЕНИЙ ФУНКЦИИ § 1. Участки монотонности функции. Отыскание точек экстремума 1. Отыскание участков монотонности функции. В § 10 предыдущей главы мы уже установили ряд условий, обеспечи- обеспечивающих возрастание (или соответственно убывание, невозра- невозрастание и неубывание) функции f(x) на некотором интервале (а, Ь). Для удобства сформулируем еще раз найденные условия: 1°. Для того чтобы дифференцируемая на интервале (а,Ь) функция f(x) не убывала (не возра- возрастала) на этом интервале, необходи- необходимо и достаточно, чтобы производная этой функции ff(x) была неотрицатель- неотрицательна (неположительна) всюду на этом ин- интервале. 2°. Для того чтобы дифференциру- дифференцируемая функция f(x) возрастала (убы- (убывала) на интервале (а, Ь), достаточно, чтобы производная f'(x) была положи- положительна (отрицательна) всюду на этом интервале. Таким образом, изучение вопроса об участках монотонности дифференциру- дифференцируемой функции f(x) сводится к исследо- Рис> 9.1 ванию знака первой производной этой функции. В качестве примера рассмотрим вопрос об отыскании участ- участков монотонности функции f(x) = ж3 — Зж2 — 4. Поскольку
§ 1 ОТЫСКАНИЕ ТОЧЕК ЭКСТРЕМУМА 301 ff(x) = Зж2 — 6х = Зх(х — 2), то, очевидно, f'{x) положительна при ^оо < х < 0, отрицательна при 0 < х < 2, положительна при 2 < х < +оо. Таким образом, рассматриваемая функция возрастает на каж- каждой из полупрямых (—оо,0) и B,+оо) и убывает на интервале @,2). График этой функции изображен на рис. 9.1. 2. Отыскание точек возможного экстремума. В п. 2 § 7 предыдущей главы мы ввели понятие локального максимума (минимума) функции f(x) и установили необходимое условие наличия у функции f(x) в данной точке локального максимума (минимума). Для удобства сформулируем еще раз определения и результаты, установленные в указанном пункте. Пусть функция f(x) определена всюду в некоторой окрестно- окрестности точки с. Говорят, что функция f(x) имеет в точке с локаль- локальный максимум (минимум), если найдется такая окрестность точки с, в пределах которой значение /(с) является наиболь- наибольшим (наименьшим) среди всех других значений этой функции. Локальный максимум и локальный минимум объединяются общим названием экстремум. Следующая теорема устанавливает необходимое условие экс- экстремума дифференцируемой функции: если функция f(x) диф~ ференцируема в точке с и имеет в этой точке экстремум^ то Г (с) = 0. Таким образом, для отыскания у дифференцируемой функ- функции f(x) точек возможного экстремума следует найти все корни уравнения ff(x) = 0 (т. е. найти все нули производной ff(x)). Впредь мы будем называть корни уравнения ff(x) = 0 точками возможного экстремума функции f(x) l). Заметим, однако, что, поскольку равенство нулю первой про- производной является лишь необходимым2) условием экстремума, нужно дополнительно исследовать вопрос о наличии экстрему- экстремума в каждой точке возможного экстремума. Для проведения та- такого дополнительного исследования следует установить доста- достаточные условия наличия экстремума^ к чему мы и переходим. 3. Первое достаточное условие экстремума. Теорема 9.1. Пусть точка с является точкой возможно- возможного экстремума функции /(ж), и пусть функция f(x) дифферен- ) Иногда корни уравнения f'{x) = 0 называют стационарными точками. ) Что это условие не является достаточнвхм, видно хотя бы из рассмо- рассмотрения функции у = х . Эта функция не имеет экстремума в точке ж = О, в которой f'{x) = 0.
302 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 цируема всюду в некоторой окрестности точки с. Тогда, если в пределах указанной окрестности производная f'(x) положи- тельна (отрицательна) слева от точки с и отрицательна (по- (положительна) справа от нее то функция f(x) имеет в точке с локальный максимум (минимум). Если же производная f'(x) имеет один и тот же знак слева и справа от точки с, то экстремума в точке с нет. Доказательство. 1) Пусть сначала производная f'(x) в пределах рассматриваемой окрестности положительна (отрицательна) слева от с и отрицательна (положительна) спра- справа от с. Требуется доказать, что значение /(с) является наиболь- наибольшим (наименьшим) среди всех значений f(x) в рассматриваемой окрестности. Обозначим через х® любое значение аргумента из рассматриваемой окрестности, отличное от с. Достаточно дока- доказать, что Функция f(x) дифференцируема (а стало быть, и непрерывна) на сегменте [с,х®\. Применяя к f(x) по сегменту [с,х®\ теорему 8.12 Лагранжа, будем иметь f(c)-f(xo) = f'@(c-x0), (9.1) где ? — некоторое значение аргумента между еж х®. Поскольку производная /;(С) положительна (отрицательна) при х® < с и отрицательна (положительна) при х® > с, правая часть (9.1) положительна (отрицательна). 2) Пусть теперь производная ff(x) имеет один и тот же знак слева и справа от с. Обозначая, как и выше, через х® любое зна- значение аргумента, отличное от с, и повторяя проведенные выше рассуждения, мы теперь докажем, что правая часть (9.1) имеет разные знаки при х® < с и при х® > с. Это доказывает отсут- отсутствие экстремума в точке с. Вытекающее из теоремы 9.1 правило молено кратко сформу- сформулировать так: 1) если при переходе через данную точку с воз- возможного экстремума производная f'(x) меняет знак с плюса на минус (с минуса на плюс), то функция f(x) имеет в точке с локальный максимум (минимум); 2) если же при переходе че- через данную точку с возможного экстремума производная fr(x) не меняет знака, то экстремума в точке с нет. Примеры. 1) Предполагая, что консервная банка имеет форму круглого цилиндра радиуса г и высоты h, определить, при каком соотношении между г и h консервная банка с посто- постоянной площадью полной поверхности имеет наибольший объем. Обозначим площадь полной поверхности консервной банки через S. Тогда 2жг2 + 2ттгк = S = const. (9.2)
ОТЫСКАНИЕ ТОЧЕК ЭКСТРЕМУМА 303 Из этого равенства находим, что h = — — г. 2тгг Таким образом, мы можем выразить объем V консервной банки как функцию радиуса г: V = тгг2к = —г — тгг3. Задача сведена к отысканию максимума функции V(r) = —г — ттг . Приравнивая нулю производную Vf(r) = — — Зтгг и учитывая, что г > 0, находим точку возможного экстремума г = (9.3) Хотя по смыслу задачи ясно, что единственная точка возмож- возможного экстремума является точкой максимума функции F(r), мы можем строго убедиться в этом, используя теорему 9.1 и заме- замечая, что производная Vf(r) = Зтг ( — — \6тг положительна при о х г < yS/Жж и отрицательна при г > \/Щ%ж. Установим теперь, при каком соотношении между радиусом т и высотой h реализуется наибольший объем V(r) консервной банки. Для этого поделим равенство (9.2) на г2 и в пра- правой части полученного при этом равен™ ства воспользуемся соотношением (9.3). При этом получим — = 2, т. е. h = 2г. Таким образом, наибольший объем будет у той консервной банки, у кото- рой высота равна диаметру1). 2) Найти точки экстремума функции f(x) = (х- 2M. Поскольку f'(x) = Ъ{х - — 2L, то единственной точкой возмож- возможного экстремума является точка х = 2. Так как f {х) положительна, как слева, так и справа от этой точки, то функция f(x) = (х — 2M вовсе не имеет точек экстре- экстремума (график функции f(x) = (х — 2M изображен на рис. 9.2). 4. Второе достаточное условие экстремума. Иногда вызывает затруднение исследование знака первой производной ff(x) слева и справа от точки возможного экстремума. На этот случай мы укажем другое достаточное условие наличия экстре- экстремума в данной точке с возможного экстремума, не требующее Рис. 9.2 ) Решенная нами задача показывает, что в интересах экономии жести целесообразно изготовлять консервные банки с высотой, равной диаметру.
304 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 исследования знака f'{x) в окрестности с, но зато предполагаю- предполагающее существование в точке с отличной от нуля конечной вто- второй производной fB\x). Теорема 9.2. Пусть функция f(x) имеет в данной точке с возможного экстремума конечную вторую производную. Тогда функция f(x) имеет в точке с максимум^ если /^(с) < 0, и минимум, если /'2'(с) > 0. Доказательство. Из условия f^2\c) < 0 (> 0) и из теоремы 8.9 вытекает, что функция ff(x) убывает (возрастает) в точке с. Поскольку по условию ff(c) = 0, то найдется такая окрестность точки с, в пределах которой f'{x) положительна (отрицательна) слева от с и отрицательна (положительна) спра- справа от с. Но тогда по предыдущей теореме f(x) имеет в точке с максимум (минимум). Замечание. Теорема 9.2 имеет, вообще говоря, бо- более узкую сферу действия, чем теорема 9.1. Так, теорема 9.2 не решает вопроса об экстремуме для случая, когда вторая про- производная f^(x) не существует в точке с, а также для случая, когда /'2'(с) = 0. В последнем случае для решения вопроса о наличии экстремума нужно изучить поведение в точке с про- производных высших порядков, что будет сделано нами в § 4 этой главы. Примеры. 1. В чашку, имеющую форму полушара ра- радиуса г, опущен однородный стержень длины 1 (рис. 9.3). Пред- Предполагая, что 2г < I < 4г, найти положение равновесия стержня. Положению равновесия стерж- стержня соответствует минимальное зна- значение его потенциальной энергии, т. е. наинизшее положение центра его тяжести О (поскольку стержень является однородным, центр тяже- тяжести его совпадает с его серединой). Обозначая через ОК перпендику- перпендикуляр к плоскости, на которой стоит чашка, мы сведем задачу к отыска- отысканию того положения стержня АВ, при котором отрезок О К име- имеет минимальную длину. Прежде всего вычислим длину отрезка О К как функцию угла а наклона стержня к плоскости, на ко- которой стоит чашка. Пусть DL параллельно ОК, а ОС перпен- перпендикулярно OK (D — точка, в которой стержень опирается на край чашки). Из прямоугольного треугольника EAD следует, что AD = = ED cos a = 2rcosa. По условию АО = 1/2. Таким образом, OD = AD - АО = 2r coso - 1/2. - 9-3
§ 1 ОТЫСКАНИЕ ТОЧЕК ЭКСТРЕМУМА 305 С другой стороны, DC = DL — OK = r — ОК. Поэтому из прямоугольного треугольника О DC имеем DC r-OK sin a = OD 2r cos a -1/2' Таким образом, длина отрезка OK, которую мы обозначим через / (а), равна / (а) = г + - sin а — г sin 2a. Переходим к отысканию того значения угла о, которое до- доставляет минимум f(a). (Понятно, что мы можем ограничиться значениями угла а из первой четверти.) Так как / (а) = - cos а— — 2r cos 2а = - cos а + 2т — 4r cos2 а, то точки возможного экс™ тремума находятся как решения квадратного уравнения 4r cos2 а — - cos а — 2г = 0. Поскольку cos а в первой четверти положителен, то нам приго- пригоден только положительный корень этого уравнения cosa0 = ^— . (9.4) lor Хотя по смыслу задачи и ясно, что единственная точка возмож- возможного экстремума «о является точкой минимума функции /(о), мы установим это строго при помощи теоремы 9.2. Достаточно убедиться в том, что /^(«о) > 0. Поскольку /^ (а) = — - sin a + 4r sin 2а = 8r sin a (cos a — —- 2 V lor то, в силу (9.4), 128r2 Тем самым установлено, что положению равновесия стержня от- отвечает угол наклона его к плоскости, на которой стоит чашка, определяемый формулой (9.4). 2. Найти экстремальные значения функции f(x) = ж3 — Зж2 — — 4. Эту функцию мы уже исследовали в п. 1 настоящего пара- параграфа (см. рис. 9.1). Так как f'(x) = Зж2 — 6х = Зх(х — 2), то функция f(x) имеет две точки возможного экстремума: х\ = 0 и Х2 = 2. Поскольку знак /;(ж) слева и справа от этих точек легко выясняется, можно решить вопрос об экстремуме при помощи теоремы 9.1 (первого достаточного условия). Но мы предпочи- предпочитаем привлечь теорему 9.2 (второе достаточное условие). Имеем = 6ж - 6, /B)@) = -6 < 0, /2)B) = 6 > 0.
306 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 Таким образом, функция f(x) имеет максимум в точке 0 и ми™ нимум в точке 2. Экстремальные значения этой функции равны /max = /@) = -4, /min = /B) = -8. 5. Экстремум функции, недифференцируемой в дан- данной точке. Общам схема отыскания экстремумов. До сих пор мы решали вопрос о наличии у функции f(x) экстремума в такой точке с, в которой функция f(x) дифференцируема. В этом пункте мы изучим вопрос о наличии в точке с экстрему™ ма у такой функции, которая не дифференцируема в точке с, но дифференцируема всюду в некоторой окрестности справа и слева от с. Оказывается, теорема 9.1 может быть обобщена на случай такой функции. Именно, имеет место следующее утверждение. Теорема 9.3. Пусть функция f(x) дифференцируема всю- всюду в некоторой окрестности точки с, за исключением^ быть может^ самой точки с, и непрерывна в точке с. Тогда, если в пределах указанной окрестности производная f'(x) положительна (отрицательна) слева от точки с и от- отрицательна (положительна) справа от точки с, то функция f(x) имеет в точке с локальный максимум (минимум). Если же производная ff(x) имеет один и тот шее знак слева и спра- справа от точки с, то экстремума в точке с нет. Доказательство в точности совпадает с доказатель- доказательством теоремы 9.1. Только на этот раз применимость к функции f(x) по сегменту [с, xq] теоремы Лагранжа устанавливается сле- следующим образом: по условию функция f(x) дифференцируема (а стало быть, и непрерывна) всюду на полусегменте (с, xq] и, кроме того, непрерывна в точке с. Тем самым f(x) непрерывна всюду на сегменте [с, xq] и дифференцируема во всех внутренних точках этого сегмента. Примеры. 1. Найти точ- уА ки экстремума функции f(x) = = |ж|. Эта функция дифференциру- дифференцируема всюду на бесконечной прямой, кроме точки х = 0, и непрерывна в точке х = 0, причем производная ff(x) = 1 при х > 0 и равна — 1 при х < 0. Теорема 9.1 к этой функции неприменима, а согласно теореме 9.3 она имеет минимум при х = 0 Рис 9.4 (рис. 9.4). 2. Найти точки экстремума функции у = ж2/3. Эта функция непрерывна на всей бесконечной прямой и дифференцируема всюду на этой прямой, за исключением точки х = 0. Производ™
ОТЫСКАНИЕ ТОЧЕК ЭКСТРЕМУМА 307 ная при равна / 2 1 У = o~uz В предыдущем примере производная имела в точке х = 0 раз- разрыв 1-го рода1); на этот раз производная имеет в точке х = О разрыв 2™го рода («бесконечный скачок»). Из выражения для производной следует, что эта производная отрицательна слева от точки х = 0 и положительна справа от этой точки. Стало быть, теорема 9.3 позволяет утверждать, что рассматриваемая функция имеет минимум в точке х = = 0 (график рассматриваемой функ- функции изображен на рис. 9.5). 3. Найти точки экстремума функ- функции 1, при х Ф и, О при х = и. 0 Рис. 9.5 Легко видеть, что эта функция непрерывна на всей бесконечной пря- прямой. В самом деле, единственной «со- «сомнительной» точкой является точка х = 0, но и в этой точке функция непрерывна, ибо lim у = lim у = 0. Далее, очевидно, что рассматриваемая функция дифферен- дифференцируема на всей бесконечной прямой, кроме точки х = 0. Всюду, кроме этой точки, производная определяется формулой У = тт т Легко видеть, что предел lim ^0 + -е х 1/х = lim не суще- существует, так что функция у = f(x) недифференцируема в точке х = 0. Поскольку производная у! положительна и слева, и спра- справа от точки х = 0, рассматриваемая функция, согласно теореме 9.3, не имеет экстремума в точке х = 0, а стало быть, и вооб- вообще не имеет экстремумов. (График рассматриваемой функции изображен на рис. 9.6.) ) В том смысле, что эта производная хоть и не существовала в точке х = = 0, но имела в этой точке конечные правое и левое предельные значения, не совпадающие между собой.
308 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 Рис. 9.6 Переходим к общей схеме отыскания точек локального экс™ тремума. Предположим, что функция f(x) непрерывна на ин- тервале1) (а,Ь) и ее производная f'{x) существует и непре- непрерывна на этом интервале всюду ^ кроме конечного числа точек. Кроме того, предположим, что производная ff(x) обращает- обращается в нуль на интервале (а, Ь) лишь в конечном числе точек. Иными словами, мы пред- предполагаем, что на интерва- интервале (а, Ь) имеется лишь ко- конечное число точек, в ко™ х торых производная f{x) не существует или обращается в нуль. Обозначим эти точ- точки символами #1, #2,... , хп (а < х\ < Х2 < • • • < хп < Ь). В силу сделанных предполо™ жений производная ff(x) сохраняет постоянный знак на каж- каждом из интервалов (а,жх), (ж]_,Ж2), •••? (#П5Ь). Стало быть, во- вопрос о наличии экстремума в каждой из точек х\1Х21... ^хп может быть решен (в утвердительном или отрицательном смысле) при помощи теоремы 9.3. Здесь мы не будем приводить примера, иллюстрирующего общую схему отыскания точек локального экстремума. Такой пример будет приведен нами в § 6. § 2. Направление выпуклости графика функции Предположим, что функция f(x) дифференцируема в любой точке интервала (а, Ь). Тогда, как установлено в п. 4 § 1 гл. 5, существует касательная к графику функции у = /(ж), проходя- проходящая через любую точку М(ж,/(ж)) этого графика (а < х < 6), причем эта касательная не параллельна2) оси Оу. Определение. Будем говорить, что график функции у = = f(x) имеет на интервале (а, Ъ) выпуклость^ направлен- направленную вниз (вверх), если график этой функции в пределах ука- указанного интервала лежит не ниже (не выше) любой своей касательной. Замечание 1. Термин «график лежит не ниже (или не выше) своей касательной» имеет смысл, ибо касательная не параллельна оси Оу. На рис. 9.7 изображен график функции, имеющий на интер- интервале (а, Ь) выпуклость, направленную вниз, а на рис. 9.8 изо™ ) Вместо интервала можно рассматривать полупрямую, бесконечную прямую и другое множество. 2) Ибо угловой коэффициент ее, равный производной /;(ж), конечен.
НАПРАВЛЕНИЕ ВЫПУКЛОСТИ ГРАФИКА ФУНКЦИИ 309 бражеы график функции, имеющий выпуклость, направленную вверх. Рис. 9.7 Рис. 9.S Теорема 9-4- Если функция у = f(x) имеет на интервале (а, Ь) конечную вторую производную и если эта производная неотрицательна (неположительна) всюду на этом интерва- интервале, то график функции у = f(x) имеет на интервале (а,Ь) выпуклость, направленную вниз (вверх). Доказательство. Для определенности рассмотрим случай, когда вторая производная f^(x) ^ 0 всюду на (а,Ъ). Обозначим через с любую точку интервала (а, Ь) (рис. 9.9). Тре- Требуется доказать, что график функции у = f(x) лежит не ниже касательной, проходящей че~ рез точку M(c^f(c)). За- Запишем уравнение указанной касательной, обозначая ее те- текущую ординату через Y. Поскольку угловой коэффи- коэффициент указанной касательной равен /;(с), ее уравнение име- имеет вид 1) Y-f(c) = f'(c)(x-c). (9.5) Разложим функцию f(x) в окрестности точки с по формуле Тейлора, беря в этой формуле п = 1. Получим nt — t(^\ — ?(Л j_ / \С) fry, _ Л _l_ J VW | Рис- 2! (9.6) где остаточный член взят в форме Лагранжа, ^ заключено меж- между с и ж. Поскольку по условию f(x) имеет вторую производную на интервале (а, Ь), формула (9.6) справедлива для любого х из интервала (а, Ь) (см. § 13 гл. 8). ) В выпуске 8 настоящего курса доказано, что уравнение прямой, прохо- проходящей через точку М(а,Ь) и имеющей угловой коэффициент к, имеет вид Y-b = k(x-a).
310 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 Сопоставляя (9.6) и (9.5), будем иметь y-Y = ^u{x-cf. (9.7) Поскольку вторая производная по условию ^ 0 всюду на (а,Ь), то правая часть (9.7) неотрицательна, т. е. для всех ж из (а, Ь) у — Y ^ 0 или у ^ Y. Последнее неравенство доказывает, что график функции у = = /(ж) всюду в пределах интервала (а, Ъ) лежит не ниже каса- касательной (9.5). Аналогично доказывается теорема для случая f^(x) ^ 0. Замечание 2. Если всюду на интервале (a, b) /^(ж) = = 0, то, как легко убедиться, у = f(x) — линейная функция, т. е. график ее есть прямая линия. В этом случае направление выпуклости можно считать произвольным. Теорема 9.5. Пусть вторая производная функции у = f(x) непрерывна и положительна (отрицательна) в точке с. То- Тогда существует такая окрестность точки с, в пределах кото- рой график функции у = f(x) имеет выпуклость^ направленную вниз (вверх). Доказательство. По теореме 8.4 об устойчивости зна- знака непрерывной функции найдется такая окрестность точки с, в пределах которой вторая производная /^(ж) положительна (от- (отрицательна). По предыдущей теореме график функции у = f(x) имеет в пределах этой окрестности выпуклость, направленную вниз (вверх). Таким образом, направление выпуклости графика функции полностью характеризуется знаком второй производной этой функции. Пример. Исследовать направление выпуклости графика функции у = f(x) = ж3 — Зж2 — 4. Эту функцию, мы уже рассма™ тривали в пп. 1 и 4 предыдущего параграфа (см. рис. 9.1). Из вида второй производной /^(ж) = бж^б = 6(ж — 1) вытекает, что эта производная отрицательна при х < 1 и положительна при х > 1. Таким образом, выпуклость графика функции у = = ж3 — Зж2 — 4 направлена вверх на участке (—оо, 1) и вниз на участке A, оо). § 3. Точки перегиба графика функции 1. Определение точки перегиба. Необходимое условие перегиба. Пусть а, Ь и с — некоторые три числа, связанные неравенствами а < с < Ъ. Предположим, что функция у = /(ж) дифференцируема на интервале (а, Ь), т. е. существует касатель- касательная к графику этой функции во всех точках, абсциссы которых принадлежат интервалу (а, Ъ). Предположим, кроме того, что
ТОЧКИ ПЕРЕГИБА ГРАФИКА ФУНКЦИИ 311 график функции у = f(x) имеет определенное направление вы™ пуклости на каждом из интервалов (а, с) и (с,Ь). Определение, Точка М(е,/(е)) графика функции у = }'{х) называется точкой перегиба этого графика^ если су- существует такая окрестность точки с оси абсцисс, в пределах которой график функции у = = f(x) слева и справа от с имеет разные направления вы- выпуклости. На рис. 9.10 изображен гра- график функции, имеющий пере- перегиб в точке М(с^ /(с)). Иногда при определении точки перегиба графика функ- ции у = f(x) дополнитель- дополнительно требуется, чтобы указанный ъфик всюду XQ X Рис. 9.10 делах достаточно малой окрестности точ- точки с оси абсцисс слева и справа от с лежал по разные сторо- стороны от касательной к этому графику в точке М(с,/(с)). Ниже мы докажем, что это свойство будет вытекать из данного нами определения в предположении, что производная ff(x) является непрерывной в точке с. Докажем следующие две леммы. Лемма 1. Пусть функция у = f(x) имеет производную ff(x) всюду в 5-окрестности точки с, причем эта производ- производная непрерывна в точке с. Тогда, если график функции у = f(x) имеет на интервале (с, с + S) выпуклость^ направленную вниз (вверх), то всюду в пределах интервала (е, с + 5) этот график лежит не ниже (не выше) касательной к графику, проведенной в точке M(c,f(c)). Доказательство. Рассмотрим последовательность {хп} точек интервала (с, с+E), сходящуюся к точке с. Через каж- каждую точку Мп(хп, f (хп)) графика функции у = f(x) проведем касательную к этому графику, т. е. прямую1) Yn = f(xn) + f'(xn)(x-xn). Так как по условию график функции у = f(x) имеет на интер- интервале (с^с + ё) выпуклость, направленную вниз (вверх), то для любого номера п и любой фиксированной точки х интервала (с, с + 6) имеем f(x)-Yn = f(x)-f(xn)-f(xn)(x-xn)^0 «О). (*) ) Мы используем уравнение прямой, проходящей через данную точку Мп.(хп., f{xn)) и имеющей угловой коэффициент, равный ff(xn). Текущую ординату этой прямой обозначаем через Yn.
312 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 Из условия непрерывности f'{x) (и тем более f(x)) в точке с и из определения непрерывности из п. 1 § 3 гл. 4 вытекает, что существует предел lim (f(x) - Yn) = lim {f(x) - f(xn) - f'(xn)(x - xn)} = = f(x)-f(c)-f'(c)(x-c). Из существования последнего предела в силу неравенства (*) и теоремы 3.13 из § 1 гл. 3 получим, что f(x)-f(c)-f'(c)(x-c)>0 (<0). Если обозначить через Y текущую ординату касательной (9.5), проходящей через точку М{с^ /(с)), то последнее неравенство можно переписать в виде: f(x) — Y ^ 0 (^ 0). Итак, переходя в неравенстве (*) к пределу при п —> оо и используя теорему 3.13 из гл. 3, мы получим, что f(x)-Y>0 КО) для любой фиксированной точки х из интервала (с, с + ё)^ при- причем Y обозначает текущую ординату касательной, проведенной через точку Ж(с,/(с)). Лемма доказана. Замечание. Аналогично формулируется и доказывает- доказывается лемма 1 и для случая, когда график функции имеет опреде- определенное направление выпуклости не на интервале (с, с + ё), а на интервале (с — <5, с). Лемма 2. Пусть функция у = f(x) имеет производную ff(x) в некоторой окрестности точки с, причем эта производ- производная непрерывна в точке с. Тогда^ если график функции у = f(x) имеет перегиб в точке M(c,f(c)), то в пределах достаточно малой 8-окрестности точки с этот график слева и справа от с лежит по разные стороны от касательной^ проведенной через точку М(с^ /(с)). Для доказательства этой леммы следует вы- выбрать S > 0 настолько малым, чтобы на каждом из интервалов (с — $, с) и (с, с+<5) график функции у = f(x) имел определенное направление выпуклости (это направление будет различным на интервалах (с — ё^с) и (с, с + ё)). После этого для доказательства леммы 2 остается применить лемму 1 к функции у = f(x) по каждому из интервалов (с — $, с) и (с, с + ё). Лемма 2 позволяет нам установить необходимое условие пере- перегиба графика дважды дифференцируемой в данной точке функ- функции. Теорема 9.6 {необходимое условие перегиба графика дваэюды дифференцируемой функции). Если функция у = = f(x) имеет в точке с вторую производную и график этой функции имеет перегиб в точке M(c,f(c)), то f^(c) = 0.
§ 3 ТОЧКИ ПЕРЕГИБА ГРАФИКА ФУНКЦИИ 313 Доказательство. Пусть, как и выше, Y — текущая ордината касательной Y = /(с) + /'(с)(ж — с), проходящей через точку графика М(с^/(с)). Рассмотрим функцию F(x) = f(x) -Y = f(x) - /(с) - f'(c)(x - с), равную разности /(ж) и линейной функции /(с) + ff(c)(x — с). Эта функция F(x), как и функция /(ж), имеет в точке с вто- рую производную (а потому имеет первую производную в неко- некоторой окрестности с, причем эта первая производная непрерыв- на в точке с). В силу леммы 2 в малой окрестности точки с график функции у = /(ж) лежит слева и справа от с по разные стороны от касательной, проходящей через точку М(с^ /(с)), а следовательно, функция F(x) в малой окрестности точки с име- имеет слева и справа от с разные знаки. Стало быть, функция F(x) не может иметь в точке с ло- локального экстремума. Предположим теперь, что f^2\c) ф 0. Тогда, поскольку F'(x) = f'{x) — /;(с), F^2\x) = f^2\xI выполняются условия F'{c) = 0, F^2\c) ^0и функция F(x) в силу теоремы 9.2 имеет в точке с локальный экстремум. Полученное противоречие дока- доказывает, что предположение f^'(c) Ф 0 является неверным, т. е. /B)(с) = 0. Теорема доказана. Тот факт, что обращение в нуль второй производной являет- является лишь необходимым условием перегиба графика дважды дифференцируемой функции, вытекает, например, из рассмотрения графика функции у = ж4. Для этой функции вто- вторая производная у^ = 12ж2 обращается в нуль в точке ж = 0, но ее график не имеет перегиба в точке М@, 0). В силу теоремы 9.6 для отыскания всех точек перегиба гра- графика дважды дифференцируемой функции у = /(ж) нужно рас- рассмотреть все корни уравнения f^2\x) = 0. Поскольку равенство нулю второй производной является лишь необходимым условием перегиба, то нужно дополнительно иссле- исследовать вопрос о наличии перегиба в каждой точке, для которой f^2\x) = 0. Для проведения такого исследования следует уста- установить достаточные условия перегиба, к чему мы и переходим. 2. Первое достаточное условие перегиба. Теорема 9.7. Пусть функция у = /(ж) имеет вторую про- производную в некоторой окрестности точки с и f^'(c) = 0. Го- гда^ если в пределах указанной окрестности вторая производ- производная /^(ж) имеет разные знаки слева и справа от с, то график этой функции имеет перегиб в точке M(c,f(c)).
314 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 Доказательство. Заметим, во-первых, что график функции у = /(ж) имеет касательную в точке М(с^ /(с)), ибо из условий теоремы вытекает существование конечной производ- производной /;(с). Далее, из того, что /^(ж) слева и справа от с имеет разные знаки, и из теоремы 9.4 заключаем, что направление выпуклости слева и справа от с является различным. Теорема доказана. Пример. Найти точки перегиба графика функции у = ж3 — — Зж2 — 4. Эту функцию мы неоднократно рассматривали выше (график ее изображен на рис. 9.1). Поскольку fB\x) = бж^б = = 6 (ж — 1), то единственное значение аргумента, для которого возможен перегиб, есть х = 1. Этому значению аргумента соот- соответствует точка графика МA, —6). Так как /^(ж) имеет разные знаки при х > 1 и при х < 1, то точка МA, —6) является точкой перегиба графика рассматриваемой функции. 3. Второе достаточное условие перегиба. На случай, когда нежелательно исследование знака второй производной в окрестности точки с, мы сформулируем второе достаточное условие перегиба, предполагающее существование у функции у = /(ж) в точке с конечной третьей производной. Теорема 9.8. Если функция у = /(ж) имеет в точке с ко- конечную третью производную и удовлетворяет в этой точке условиям f^'(c) = 0, f^'(c) ф 0, то график этой функции име- имеет перегиб в точке M(c,f(c)). Доказательство. Из условия /^(с) Ф 0 и из теоремы 8.9 вытекает, что функция /^(ж) либо возрастает, либо убывает в точке с. Так как /'2'(с) = 0, то и в том, и в другом случае найдется такая окрестность точки с, в пределах которой f^(x) имеет разные знаки слева и справа от с. Но тогда по предыдущей теореме график функций у = /(ж) имеет перегиб в точке М(е, /(с)). Замечание. Конечно, теорема 9.8 имеет более узкую сферу действия, чем теорема 9.7. Так, теорема 9.8 не решает вопроса о наличии перегиба для случая, когда у функции у = = /(ж) не существует конечной третьей производной, а также для случая, когда f^\c) = 0. В последнем случае для решения вопроса о наличии перегиба нужно изучить поведение в точ- точке с производных высших порядков, что будет сделано нами в § 4 этой главы. Возвратимся к примеру, рассмотренному в предыдущем пункте, и покажем, что вопрос о наличии перегиба у графи™ ка функции у = ж3 — Зж2 — 4 может быть решен и при помощи теоремы 9.8. В самом деле, /®(ж) =6^0, стало быть, точка ЖA, —6) является точкой перегиба, согласно теореме 9.8.
4 ТРЕТЬЕ ДОСТАТОЧНОЕ УСЛОВИЕ ЭКСТРЕМУМА И ПЕРЕГИБА 315 4. Некоторые обобщения первого достаточного условия переги- перегиба. Прежде всего, заметим, что в условиях теоремы 9.7 можно отказаться от требования двукратной дифференцируемости функции у = /(ж) в самой точке с, сохраняя это требование лишь для точек, лежащих в некоторой окрестности слева и справа от с. При этом следует дополнительно предпо- предположить существование конечной производной /'(с). Доказательство теоремы 9.7 с указанными изменениями дословно сов™ падает с доказательством, приведенным выше. Далее, можно договориться при определении точки перегиба не исклю- исключать случая, когда касательная к графику в рассматриваемой точке парал- параллельна оси Оу ). При такой договоренности в теореме 9.7 можно отказать- отказаться даже от требования однократной дифференцируемости функции /(ж) в самой точке с и сформулировать эту теорему следующим образом. Пусть функция у = /(ж) имеет конечную вторую производную всюду в некоторой окрестности точки с, за исключением, быть может, самой точки с. Пусть, далее, функция у = /(ж) непрерывна в точке с и гра- график этой функции имеет касательную2) в точке M(c,f(c)). Тогда, если в пределах указанной окрестности вторая производная f^2\x) имеет раз- разные знаки слева и справа от точки с, то график функции у = /(ж) имеет перегиб в точке M(c,f(c)). Доказательство сформулированного утвержде- утверждения полностью аналогично доказательству теоре- теоремы 9.7. Пример. Найти точки перегиба графи- графика функции у ¦=¦ х ' . Эта функция имеет вто- вторую производную всюду на бесконечной прямой, за исключением точки ж = 0. В точке ж = 0 рас- рассматриваемая функция непрерывна, но уже первая производная обращается в бесконечность. Однако график функции у = ж1^3 имеет в точке @, 0) каса- касательную, параллельную оси Оу3) (рис. 9.11). Так как вторая производная У B) Г = 2 1 Рис. 9.11 9 ж5/3 имеет слева и справа от точки ж = 0 разные знаки, то график функции у = ж ' имеет перегиб в точке @, 0). § 4. Третье достаточное условие экстремума и перегиба Теорема 9.9. Пусть п ^ 1 — целое число и пусть функция у = f(x) имеет производную порядка п в некоторой окрест- окрестности точки с и производную порядка п + 1 в самой точке с. Пусть^ далее^ справедливы следующие соотношения: /B)(С) = = о, 0. (9.8) 1) Этот случай соответствует бесконечному значению ff (с). 2) Хотя бы параллельную оси Оу. ) Это вытекает, например, из того, что график обратной функции ж = у имеет в этой точке касательную ж = 0.
316 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 Тогда, если п является четным числом, график функ- функции у = f(x) имеет перегиб в точке M(c,f(c)). Если же п является нечетным числом и, кроме того, /;(е) = О, функция у = f(x) имеет локальный экстремум в точке с, точ~ нее, имеет в точке с локальный минимум при /^+1^(с) > 0 и локальный максимум при /^+1^(с) < 0. Доказательство. 1) Пусть сначала п является четным числом. При п = 2 доказываемая теорема совпа- совпадает с уже доказанной теоремой 9.8, так что нужно провести доказательство только для четного n ^ 4. Пусть четное п удовлетворяет условию п ^ 4. Из условия j(n+1)(c) ф о и из теоремы 8.9, примененной к функции f^(x), вытекает, что эта функция f(n'(x) либо возрастает, либо убы- убывает в точке с. Поскольку, кроме того, f^n\c) = 0, то и в том, и в другом случае найдется достаточно малая окрестность точки с, в пределах которой f^n\x) справа и слева от с имеет разные знаки. Заметив это, разложим функцию f^(x) в окрестности точ- точки с по формуле Тейлора с остаточным членом в форме Лагран™ жа. Мы получим, что для всех х из достаточно малой окрестно- окрестности точки с между с и х найдется точка ? такая, что (х-с) + ... Соотношения (9.8) позволяют придать последнему равенству следующий вид: /B)/ \ _ / П (С) / _ с\п-2 /q q\ (п- 2)! Так как в пределах достаточно малой окрестности точки с функ- функция /(п) (х) имеет разные знаки при х < с и при х > с и так как ? всегда лежит между с и ж, то мы получим, что и /^(С) (а5 в силу четности п, и вся правая часть (9.9)) имеет разные знаки при х < с и при х > с. Но тогда и левая часть (9.9), т. е. f^(x) в пределах достаточно малой окрестности с имеет разные знаки при х < с и при х > с. В силу теоремы 9.7 это означает, что график функции у = f(x) имеет перегиб в точке Ж(с,/(с)), и для случая четного п теорема доказана. 2) Пусть теперь п ^ 1 является нечетным числом и дополни- дополнительно предполагается, что /;(с) = 0. Так как при п = 1 дока- доказываемая нами теорема совпадает с уже доказанной выше тео-
§ 4 ТРЕТЬЕ ДОСТАТОЧНОЕ УСЛОВИЕ ЭКСТРЕМУМА И ПЕРЕГИБА 317 ремой 9.2, то достаточно провести доказательство для нечет™ н о г о п ^ 3. Пусть нечетное п удовлетворяет условию п ^ 3. Ради опреде- определенности, проведем рассуждения для случая /^+1^(с) > 0, ибо для случая /(п+1)(с) < 0 они проводятся аналогично. Из условия /^+1^(с) > 0 и из теоремы 8.9, примененной к функции /^(ж), вытекает, что эта функция f^n\x) возрастает в точке с. Поскольку, кроме того, f^n\c) = 0, то это означает, что найдется достаточно малая окрестность точки с, в преде- пределах которой f(n\x) отрицательна слева от с и положительна справа от с. Заметив это, разложим функцию ff(x) в окрестности точки с по формуле Тейлора с остаточным членом в форме Лагранжа. Мы получим, что для всех х из достаточно малой окрестности точки с между с и х найдется точка ? такая, что _ )П2 /(С) , _ ) •••+ (п-2)}[Х С) + {п-\)\ Соотношения (9.8) и дополнительное условие /'(с) = 0 позво- позволяют переписать равенство (9.10) в виде Так как ? всегда лежит между с и ж, то для всех х из доста™ точно малой окрестности точки с производная /'п'(?) отрица- отрицательна при х < с и положительна при х > с. При нечетном п чис™ ло п^ 1 является четным, а поэтому вся правая (а, стало быть, и левая) часть (9.11) для всех х из достаточно малой окрестности с отрицательна слева от с и положительна справа от с. На основании теоремы 9.1 это означает, что функция f(x) имеет локальный минимум в точке с. Итак, для случая /(п+1)(с) > 0 вторая часть теоремы доказана. Так как случай j(ri+1)(c) < о рассматривается совершенно аналогично, то тео- теорема полностью доказана. Пример. Исследовать на экстремум и перегиб функ- функцию f(x) = (х — с)те+1. Легко видеть, что /;(с) = f^2\c) = ... ... = /W(c) = 0, f{n+l){c) = (n + 1)! > 0. Согласно теоре™ ме 9.9 при четном (п + 1) функция имеет минимум в точке х = с (рис. 9.12), а при нечетном (п + 1) график функции имеет перегиб в точке М(с, 0) (рис. 9.13).
318 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 (с;0) У=(х-с}' п+1 М(с;0) х Рис. 9.12 Рис. 9.13 § 5. Асимптоты графика функции Определение 1. Говорят, что прямая х = а является вер- вертикальной асимптотой графика функции у = /(ж), если хотя бы одно из предельных значений lim f(x) или lim f(x) равно +оо или ^оо. Пример. График функции у = - имеет вертикальную асимптоту х = 0, ибо lim - = +00, lim - = ^00 (рис. 9.14). ^ ' , Г\ i Г% /-vis ' . Г\ f\ пр» ^ * J — у «Л/ У ж Предполо^ким далее, что функция у = f(x) определена для сколь угодно больших зна- значений аргумента. Ради опреде- определенности будем рассматривать сколь угодно большие значения положительного знака. Определение 2. Говорят, что прямая "? Y = kx + b (9.12) является наклонной асимптотой графи- графика функции у = f(x) при х —)> —> +оо, если функция f(x) пред- ставима в виде f{x) = (9.13) Рис. 9.14 где lim a(x) = 0.
АСИМПТОТЫ ГРАФИКА ФУНКЦИИ 319 Теорема 9.10. Для того чтобы график функции у = f(x) имел при х —> +оо наклонную асимптоту (9.12), необходимо и достаточно, чтобы существовали два предельных значения Mm и [f(x)-kx]=b. (9.14) Доказательство. 1) Необходимость. Пусть график функции у = f(x) имеет при х = +оо асимптоту (9.12), т. е. для f(x) справедливо представление (9.13). Тогда 1 • lim 1 • КХ —|— С/ —Г" LXyJUJ ж^+оо х ж^+оо lim lf(x) — kx] = lim [b + а(ж)] = b. х=-1 Ь . а(х) \ х х J = к. 2) Достаточность. Пусть существуют предельные зна- значения (9.14). Второе из этих пре- предельных значений дает право утвер- утверждать, что разность f(x) — кх — Ъ является бесконечно малой при х —>> —>• + оо. Обозначив эту бесконечно малую через а(ж), получим для f(x) представление (9.13). Теорема дока- доказана. Замечание. Аналогич- Аналогично определяется наклонная асимпто™ та и доказывается теорема 9.10 и для случая х —>> ^оо. Пример. График функции ZjJu I JL у = = 2x — 1 + 2x 1 + имеет ж+1 ж+1 наклонную асимптоту Y = 2х — 1 и при ж —)> +оо, и при х —)> ^оо и, кро- кроме того, имеет вертикальную асим- асимптоту х = — 1 (рис. 9.15). В самом деле, Mm X = lim lim [f(x)-2x}= lim -1 + lim f(x) = +00, lim f(x) = — oo. Наряду с линейной асимптотой (9.12) рассматривают также и асимпто- асимптоты более сложного вида. Говорят, что парабола п-ro порядка, определяемая многочленом 17" ТЬ % Til — 1 i 1 i /« и л^\ У = апж + ап-\х +... + «1Ж + ао, (9.12 )
320 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 является асимптотой графика функции у = /(ж) при ж —»¦ +оо, если функ- функция /(ж) представима в виде /(ж) = апхп + ап^1Хп~г + ... + а\х + «о + о(ж), где lim о;(ж) = 0. Легко доказать следующее утверждение. Для того чтобы график функции у = /(ж) имел при ж —>¦ +оо асим- асимптоту (9.12 ), необходимо и достаточно^ чтобы существовали следующие п + 1 предельных значений: f(r) f(r) — а гп lim = q hm J . =an-i,... ж--> + оо Жп ж--> + оо -|»n-i ' .. /(ж) - (апжп + an^ixn~l + ... + а2ж2) ... , lim = <2i, lim [/(ж) — (апжп + ап-гж"'™1 + ... + а\х)\ = ао- § 6. Схема исследования графика функции В этом параграфе мы изложим схему, по которой целесооб- целесообразно проводить исследование графика функции, и приведем пример, иллюстрирующий эту схему. Для качественного исследования графика функции у = /(ж) целесообразно прежде всего провести следующие исследования: 1°. Уточнить область задания функции. 2°. Выяснить вопрос о существовании асимптот (вертикаль- (вертикальных и наклонных). 3°. Найти области возрастания и убывания функции и точки экстремума. 4°. Найти области сохранения направления выпуклости и точки перегиба. 5°. Найти точки пересечения графика функции с осью Ох. По полученным данным легко строится эскиз графика функ- функции. В качестве примера построим график функции 2ж3 - 5ж2 + 14ж - 6 /п - гч Будем следовать изложенной выше схеме. 1°. Поскольку функция (9.15) представляет собой рациональ- рациональную дробь, то она определена и непрерывна всюду на бесконеч- бесконечной прямой, кроме точки х = 0, в которой обращается в нуль знаменатель. 2°. Выясним вопрос о существовании асимптот. Очевидно, что г 2ж3 - 5ж2 + 14ж - 6 lim — = ^оо, ж^0±0 4ж2 поэтому график функции имеет вертикальную асимптоту х =
6 СХЕМА ИССЛЕДОВАНИЯ ГРАФИКА ФУНКЦИИ 321 = 0. Далее, из существования пределов 14ж - 6 r fix) г 2ж3 - 5ж lim ^^- = lim d d ж—>-dioo ж X-^ltOQ 4ж3 5 14 - - 21 lim /(ж) — 77 = Mm — — Ъх ¦ 4ж2 = lim 14 ж 2 _ _Ь ~ ~ 4 вытекает, что и при х —>• +оо, и при ж —>• ^оо график функции ж 5 имеет наклонную асимптоту Y = - — -. 3°. Для нахождения областей возрастания и убывания вы- вычислим первую производную функции (9.15) / _ ж3 - 7ж + 6 _ (ж - 1)(ж - 2)(ж + 3) 2ж3 2ж3 Имея в виду, кроме того, что сама функция и первая производи ная не существуют при х = 0, мы получим следующие области сохранения знака у1: Область значений ж Знак у1 Пове ™ттт™ фуБ —оо < ж < —3 + -3 < ж < 0 0 < ж < 1 + 1 <ж < 2 2 < ж < сх) + ет Из приведенном таолицы очевидно, что функция имеет сле- следующие точки экстремума: 1) максимум при х = —3, причем /(—3) = —49/12, 2) максимум при х = 1, причем /A) = 5/4, 3) минимум при х = 2, причем /B) = 9/8. 4°. Для нахождения областей сохранения направления вы- выпуклости вычислим вторую производную B) 7ж - 9 Имея в виду, что сама функция и ее производные не существу™ ют в точке х = 0, мы получим следующие области сохранения знака у B). 11 В.А. Ильин, Э.Г. Позняк, часть I
322 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 Область значений х Знак уB) Направление выпук- выпуклости графика -оо < х < 0 вверх 0 < х < 9/7 — вверх 9/7 < х < оо + вниз Из приведенной таблицы очевидно, что график функции име™ ет перегиб в точке (9/7,/(9/7)). Легко подсчитать, что /(9/7) = = 913/756. 5°. Остается найти точки пересечения графика с осью Ох. Эти точки соответствуют вещественным корням уравнения 2х3 - Ъх2 + Ux - 6 = 0. Легко видеть, что 2ж3 - Ъх2 + 14ж - 6 = 2 (х - !) (ж2 - 2ж + 6). По- скольку квадратный трехчлен (ж2 — 2х + 6) имеет комплексные корни, то рассматриваемое уравнение имеет только один веще- вещественный корень х = 1/2, так что график функции пересекает ось Ох в точке A/2,0). По полученным данным строим эскиз графика рассматриваемой функции (рис. 9.16). -3 Рис. 9.16
ОТЫСКАНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ 323 § 7. Отыскание максимального и минимального значений функции. Краевой экстремум 1. Отыскание максимального и минимального значе- значений функции. Рассмотрим функцию у = /(ж), определенную и непрерывную на сегменте [a, ft]. До сих пор мы интересова- интересовались лишь отысканием локальных максимумов и минимумов этой функции, а теперь поставим задачу об отыскании мак- симального и минимального значений f(x) на сегменте [а, ft]. Подчеркнем, что в силу теоремы Вейерштрасса (см. § 6 гл. 8) функция f(x) обязательно достигает в некоторой точке сегмен- сегмента [a, ft] своего максимального (минимального) значения. Ради определенности остановимся на отыскании максимального зна- значения f(x) на сегменте [a, ft]. Максимальное значение функции f(x) может достигаться ли- либо во внутренней точке xq сегмента [a, ft] (тогда оно совпадает с одним из локальных максимумов функции /(ж), см. рис. 9.17), либо на одном из концов сегмента [а, ft] (рис. 9.18). Отсюда ясно, что для нахождения максимального значения функции f(x) на сегменте [a, ft] нужно сравнить между собой значения f(x) во всех точках локального максимума и в граничных точках сег- сегмента а и ft. Наибольшее из этих значений и будет максималь- максимальным значением f(x) на сегменте [a, ft]. Аналогично находится и минимальное значение f(x) на сегменте [а, ft]. У XQ Рис. 9.17 Рис. 9.18 Если желательно избежать исследования точек возможного экстремума, то можно просто сравнить между собой значения f(x) во всех точках возможного экстремума и в граничных точ™ ках а и ft. Наибольшее (наименьшее) из этих значений и будет максимальным (минимальным) значением функции f(x) на сег- сегменте [a, ft]. Отметим далее, что если f(x) имеет на сегменте [a, ft] лишь одну точку локального экстремума1), являющуюся точкой ло- локального максимума (минимума), то без сравнения значения 1) Именно такой случай часто встречается на практике.
324 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 О Ъ х f(x) в этой точке с f(a) и f(b) можно утверждать, что это зна- чение является максимальным (минимальным) значением f(x) на сегменте [а, Ь] (рис. 9.19). Аналогичными средствами реша- решается вопрос об отыскании макси- максимального (и минимального) значения функции у = f(x) на интервале, по- полупрямой и бесконечной прямой (при условии, что это значение существу™ ет). Может случиться, что функция f(x) вовсе не имеет на сегменте [а, Ь] (или полупрямой а ^ х < оо) точек возможного экстремума. В таком случае f(x) является монотонной на этом сегмен- сегменте (полупрямой) и ее максимальное и минимальное значения достигаются на концах этого сегмента (на конце этой полупря- полупрямой). Этот последний случай мы проиллюстрируем физическим примером. Пусть требуется определить, какое сопротивление х нужно включить в цепь последовательно с данным сопротивле- сопротивлением г, чтобы на г выделилась наибольшая мощность (при этом напряжение v® батареи считается постоянным, см. рис. 9.20). По закону Ома ток I в цепи равен I = vq/(t + x). Стало быть, по то- тому же закону падение напряжения vr на сопротивлении г равно vr = Ir = vqtI'{r + x). Таким () Рис. 9.19 Щ I I I —> X г образом, мощность w(x), вы- выделяемая на сопротивлении г, равна w(x) = Ivr = VqT I (r + жJ. Рис. 9.20 Поскольку по физическому смыслу сопротивление х не может быть отрицательно, то задача сводится к отысканию наибольшего значения функции w(x) на полупрямой х ^ 0. Вычислив производную этой функции // \ ^^п Т W (X) = — . 4Q , v / (г + ж)з' убедимся в том, что w1 (х) < 0 всюду на полупрямой ж^Ои то- точек возможного экстремума нет. Таким образом, функция w(x) убывает всюду на полупрямой х ^ 0 и ее максимальное значение на этой полупрямой достигается при х = 0 и равно Vq/г (рис. 9.21). Это совершенно ясно и из физических соображений. В качестве второго примера рассмотрим задачу об отыскании максимального и минимального значений функции у = sin x2 на сегменте — д/тг ^ х ^ л/бтг/2.
ОТЫСКАНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ 325 w{x) Рис. 9.21 Рис. 9.22 Поскольку у' = 2 cos х1, указанная функция имеет на рассма™ триваемом сегменте три точки возможного экстремума х = 0 и х = ±^/тг/2. Сравнивая значения функции в указанных точках и на концах сегмента /@) = 0, убедимся в том, что максимальное значение рассматриваемой функции равно +1 и достигается в двух внутренних точках сет- мента х\ = ^утг/2 и Х2 = +утг/2, а минимальное значение рассматриваемой функции равно — \/2/2 и достигается на пра- правом конце сегмента у5тт/2. График рассматриваемой функции изображен на рис. 9.22. 2. Краевой экстремум. Пусть функция у = f(x) определе- определена на некотором сегменте [а, Ь]. Будем говорить, что эта функ™ ция имеет в граничной точке Ъ этого сегмента краевой максимум (краевой минимум), если найдется левая полуокрестность точ- точки Ь, в пределах которой значение f(b) является наибольшим (наименьшим) среди всех других значений этой функции. Ана- Аналогично определяются краевой максимум и краевой минимум в граничной точке а сегмента [а, Ь]. Краевой максимум и краевой минимум объединяются общим названием краевой экстремум. Имеет место следующее достаточное условие краевого экс- экстремума: для того чтобы функция у = f(x) имела в точ~ ке Ъ сегмента [а,Ь] краевой максимум (краевой минимум) до- статочно, чтобы эта функция имела в точке Ъ положитель- положительную (отрицательную) левую производную1). (Доказательство аналогично доказательству теоремы 8.9.) Из указанного доста- достаточного условия краевого экстремума непосредственно вытекает ) Для граничной точки а достаточным условием краевого максимума (краевого минимума) является отрицательность (положительность) правой производной в точке а.
326 ГЕОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ ГРАФИКА ФУНКЦИИ ГЛ. 9 следующее необходимое условие краевого экстремума функции^ имеющей в точке Ъ левую производную: для того чтобы функ- функция у = /(ж), обладающая в точке b левой производной^ имела в этой точке краевой максимум (краевой минимум), необходимо, чтобы указанная производная была неотрицательной (неполо- (неположительной). В заключение докажем следующее замечательное утверждение. Теорежа 9.11 (теорежа Дарбу1)). Пусть функция /(ж) имеет ко- конечную производную всюду на сегменте [а, 6] 2), и пусть f (а + 0) = А, /'(Ь — 0) = В. Тогда, каково бы ни было число С, заключенное метсду А и В, на этом сегменте найдется точка ? такая, что /;(С) = С 3). Доказательство. Сначала докажем следующее утверждение: если F(x) имеет конечную производную на [а, 6] и если F'(а + 0) hF'E- — 0) — числа разных знаков, то на сегменте [а, 6] найдется точка ? такая, что F'{^) = 0. Пусть для определенности F'{а + 0) < 0, F'' (Ь — 0) > 0. Тогда функ- ция F(x) имеет краевой максимум на обоих концах сегмента [а,Ь]. Но это означает, что минимальное значение F{x) на сегменте [а, 6] достигается в некоторой внутренней точке ? этого сегмента (функция F(x) дифференци- дифференцируема, а стало быть, и непрерывна на сегменте [а, Ь] и поэтому достигает на этом сегменте своего минимального значения). В указанной точке ? функ- функция F{x) имеет локальный минимум, и поэтому F'(?) = 0. Для доказательства теоремы 9.11 остается положить F(x) = f{x) — Сх и применить к F(x) только что доказанное утверждение. Замечание. Из теоремы 9.11 мы еще раз заключаем, что произ- производная не может иметь точек разрыва первого рода (скачков). 1) Гастон Дарбу — французский математик A842-1917). 2) Под этим понимается, что /(ж) имеет производную в любой внутренней точке сегмента [а, Ь] и, кроме того, имеет левую производную в точке Ь и правую производную в точке а. ) Подчеркнем, что непрерывность производной f'(x) при этом не пред- предполагается.
ГЛАВА 10 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ В гл. 1 мы рассмотрели физическую задачу о вычислении пути, пройденного материальной точкой, двигающейся вдоль оси Оу, по известной скорости этой точки и геометрическую за- задачу о вычислении площади криволинейной трапеции (т. е. фи- фигуры, лежащей между графиком функции у = f(x) и сегментом [а, Ь] оси Ох). Рассмотрение указанных двух задач естественно привело нас в гл. 1 к необходимости введения нового матема™ тического понятия — понятия определенного интеграла. Кроме рассмотренных двух задач к понятию определенного интеграла приводит и ряд других важных физических и геометрических задач. Настоящая глава посвящена изложению теории опреде- определенного интеграла, а в следующей главе дается применение этой теории к некоторым геометрическим и физическим задачам. § 1. Интегральные суммы. Интегрируемость Пусть функция f(x) задана на сегменте [а,Ь], а < Ь. Обозна- Обозначим символом Т разбиение сегмента [а,Ь] при помощи некото™ рых не совпадающих друг с другом точек а = xq < х\ < ... ... < хп = b на п частичных сегментов [жо,жх], [жх,^]? ••• ..., [xn-i,xn]. Точки жо, #!,... , хп будем называть точками раз- разбиения Т. Пусть ^ — произвольная точка частичного сегмента [ж^_1,Жг], a Axi — разность Xi — a^_i, которую мы в дальнейшем будем называть длиной частичного сегмента [a^_i,Xj]. Определение 1. Число 1{ж^,^}, где 1{х» о = да г=1 называется интегральной суммой функции f(x)j соответствующей данному разбиению Т сегмента [а,Ь] и данному выбору промежуточных точек ^ на частичных сег~
328 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 У ментах [xi-i,Xi]. В дальнейшем через А мы будем обозначать длину максимального частичного сегмента разбиения Т, т. е. А = max Аж^. Выясним геометрический смысл интегральной суммы. Для этого рассмотрим криволинейную трапецию^ т. е. фигуру, ограниченную графиком функции f(x) (для простоты будем считать эту функцию по- положительной и непре- непрерывной) , двумя ордина- ординатами, проведенными в точках а и b оси аб- абсцисс, и осью абсцисс (рис. 10.1). Очевидно, интегральная сумма I{xij^i} представляет со™ бой площадь ступенча- ступенчатой фигуры, заштрихо- заштрихованной на рис. 10.1. Рис. 10.1 Определение 2. Число I называется пределом ин- интегральных сумм I{xi,?i} при А —> 0; если для любого положительного числа е можно указать такое положитель- положительное число S х), что для любого разбиения Т сегмента [а, Ь], мак- максимальная длина А частичных сегментов которого меньше E, независимо от выбора точек ^ на сегментах [xi-i,Xi] выпол- выполняется неравенство Для обозначения предела интегральных сумм употребляется символика / = lim I\Xi1 ?Л. Определение 3. Функция f(x) называется интегри- интегрируемой (по Риману2)) на сегменте [а, 6], если существу- существует конечный предел I интегральных сумм этой функции при А —> 0. Указанный предел I называется определенным инте- интегралом от функции f(x) no сегменту [а, Ь] и обозначается сле- следующим образом: ъ I = f(x)dx. а Наглядные геометрические представления показывают3), что определенный интеграл численно равен площади криволиней- г) Так как число S зависит от е, то иногда пишут 6 = S(e). 2) Бернгард Риман — немецкий математик A826-1866). 3) См. § 4 гл. 1.
§ 1 ИНТЕГРАЛЬНЫЕ СУММЫ. ИНТЕГРИРУЕМОСТЬ 329 ной трапеции, определяемой графиком функции f(x) на сет- менте [а, Ь]. В гл. 11 мы докажем справедливость этого утверж™ дения. Приведем пример интегрируемой функции. Докажем, что функция f(x) = с = const интегрируема на любом сегменте ь [а,Ь], причем /cdx = c(b — а). В самом деле, так как /(&) — с а при любых «^, то + ... + сАхп = = с(Ахг + Ах2 + ... + Ахп) = ф - а), и поэтому lim 1{ж^^} = сF — а). Выясним вопрос об интегрируемости неограниченных на сег- сегменте [а, Ь] функций. Докажем следующее утверждение: неограниченная на сег- сегменте [а^Ь] функция f(x) не интегрируема на этом сегменте. Доказательство. Пусть функция f(x) не ограни™ чена на сегменте [а, Ь]. Тогда она не ограничена на некотором частичном сегменте [ж&_1,жд;] любого данного разбиения Т сег- сегмента [а, Ь]. Поэтому слагаемое /(?&)Дж& интегральной суммы I{xi,?i}, отвечающей этому разбиению Т, может быть сделано как угодно большим по абсолютной величине за счет выбора точки ?&. Отсюда вытекает, что интегральные суммы /{ж^<^}, отвечающие любому разбиению Т, не ограничены 1) и поэтому не существует конечного предела интегральных сумм. Сообразуясь с доказанным утверждением, будем рассматри- рассматривать лишь ограниченные на сегменте [а,Ь] функции. Возникает вопрос: всякая ли ограниченная на сегменте [а, Ь] функция яв- является интегрируемой на этом сегменте? Следующий пример показывает, что это, вообще говоря, не так. Убедимся, что заве- заведомо ограниченная на сегменте [а,Ь] функция Дирихле^ значе- значения которой в рациональных точках равны единице, а в ирраци- иррациональных — нулю, не интегрируема на сегменте [а, Ь]. Действи- Действительно, если для любого разбиения Т со сколь угодно малым А выбрать точки ^ рациональными, то, очевидно, /{ж^,^} = = Yl SHi)^xi = ]C ^xi = ^ ~~ ai если же для того же разбиения i=l г=1 Т точки ?i выбрать иррациональными, то /{я^,^} = 0. Поэто- г) Чтобы убедиться в этом, достаточно фиксировать точки ^ на всех ча- частичных сегментах разбиения Т, за исключением сегмента [#&_!,#&]. Тогда в интегральной сумме 7{жг,?г} будет изменяться лишь слагаемое /(^)Аж^, которое может быть как угодно большим по абсолютной величине.
330 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 му для функции Дирихле не существует предела интегральных сумм, т. е. эта функция не интегрируема. В дальнейшем мы докажем интегрируемость всех непрерыв™ ных функций и широкого класса разрывных функций. § 2. Верхние и нижние суммы 1. Понмтие верхней и нижней сумм. Пусть функция f(x) ограничена на сегменте [а,Ь] и Т — разбиение этого сегмента точками а = х® < х\ < ... < хп = Ь. Обозначим через Mi и mi соответственно точную верхнюю и точную нижнюю грани этой функции на сегменте [a^_i,a^]. Суммы S = MiAxi + М2Ах2 + ... + МпАхп = U s = miAxi + ГП2АХ2 + ... + mnAxn = называются соответственно верхней и нижней сум- суммами функции f(x) для данного разбиения Т сегмента [а, Ь]. Очевидно, что любая интегральная сумма /{ж^<^} данного разбиения Т сегмента [а,Ь] заключена между верхней и ниж~ ней суммами S и s этого разбиения. Понятия верхней и нижней сумм становятся особенно яс™ ными, если обратиться к геометрическим представлениям. Для простоты рассмотрим положительную и непрерывную функцию f(x) и криволинейную трапецию, определяемую этой функци™ ей (рис. 10.2 и 10.3). Если Т — некоторое разбиение сегмента [а, 6], то числа Mi и т\ представляют собой в случае непрерыв- непрерывной функции f(x) максимальное и минимальное значения этой функции на частичном сегменте [я^_1,а^] разбиения Т. Поэтому верхняя сумма S равна площади, заштрихованной на рис. 10.2 ступенчатой фигуры, которая содержит криволинейную тра- трапецию, а нижняя сумма s равна площади, заштрихованной на рис. 10.3 ступенчатой фигуры, которая содержится в криволи™ нейной трапеции (эта трапеция на рисунках 10.2 и 10.3 обведена жирной линией). Как уже говорилось, из наглядных геометрических представ- представлений вытекает, что интеграл численно равен площади криво- криволинейной трапеции. С другой стороны, очевидно, что если раз- разность между верхними и нижними суммами может быть сделана как угодно малой, то эти суммы могут стать как угодно близки- близкими к площади криволинейной трапеции. Поэтому можно ожи- ожидать, что для интегрируемости функции необходимо и доста™
ВЕРХНИЕ И НИЖНИЕ СУММЫ 331 Рис. 10.2 Рис. 10.3 точно, чтобы разность между верхней и нижней суммами могла быть как угодно малой. Строгое доказательство этого будет да- дано в следующем параграфе. 2. Свойства верхних и нижних сумм. Докажем справед- справедливость следующих свойств верхних и нижних сумм: 1°. Для любого фиксированного разбиения Т и для любого е > 0 промежуточные точки ^ на сегментах [xi-i,Xi] можно выбрать так, что интегральная сумма /{ж^?г} будет удовле- удовлетворять неравенствам 0 ^ S — 1{ж^^} < е. Точки ^ можно выбрать также и таким образом, что интегральная сумма будет удовлетворять неравенствам 0 ^ 1{ж^,^} — s < e. Пусть Т — некоторое фиксированное разбиение сегмента [а, Ь]. Докажем, например, возможность выбора по данному е > 0 то- точек ^ так, что будет выполняться неравенство 0 ^ S—I{xi,?i} < < е. По определению точной грани Mi для данного е > 0 на сегменте [a^_i,#j] можно указать такую точку ^, что 0 ^ М{- f(?i) < e/(b -a), i = 1, 2,... , п. Умножая эти неравенства на Axi и затем складывая, получим Справедливость свойства 1° установлена. 2°. Если разбиение Т' сегмента [а, Ъ] получено путем добав- добавления новых точек к точкам разбиения Т этого сегмента, то верхняя сумма S1 разбиения Т1 не больше верхней суммы S раз- разбиения Т, а нижняя сумма sf разбиения Т1 не меньше нижней суммы s разбиения Т, ш. е. 5 ^ s\ Sf ^ S. Так как разбиение Т1 может быть получено из разбиения Т пу- путем последовательного добавления к последнему новых точек, то, очевидно, сформулированное свойство достаточно доказать для случая, когда к разбиению Т добавляется одна точка. Пусть эта точка х1 располагается на сегменте [a^_i, Xj\ разбиения Т сег™
332 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 мента [а, Ь]. Обозначим через М[ и М" точные верхние грани функции f(x) на сегментах [ж^ьж;] и [V,a^], через Ах[ и Ах" длины этих сегментов и через S и Sf верхние суммы разбие- разбиения Т и разбиения Т;, полученного добавлением к разбиению Т точки х1. Отметим, что Axi = Ах'^ + Ах". Кроме того, если Mi — точная верхняя грань значений функции f(x) на сегмен- сегменте [а^_1,я^], то Mi ^ М[ и Mi ^ М", поскольку очевидно, что точная верхняя грань функции на части сегмента [xi-i,Xi] не превосходит точную верхнюю грань Mi этой функции на всем сегменте [xi-i^Xi]. Поэтому, учитывая, что суммы S и Sf раз- различаются лишь слагаемыми MiAxi и М^Ах^ + М"'Ах", получим S-Sf = МгАхг - (М-Ах'{ + М"Ах'1) = = {Мг - Ml)Axft + (Mi - M'^Ax'l > 0, т. е. S1 ^ S. Доказательство для ни^кних сумм проводится ана™ логично. 3°. Пусть Т1 и Т1' — любые два разбиения сегмента [а,Ь]. Тогда нижняя сумма одного из этих разбиений не превосходит верхнюю сумму другого. Именно, если s;, Sf и s/;, S/f — соот- соответственно нижние и верхние суммы разбиений Т' и Т'1\ то з' < S" з" з' S", з" < S'. Выше мы установили, что нижняя сумма данного разбиения не превосходит верхнюю сумму этого разбиения. Пусть Т — разби- разбиение сегмента [а, Ь], полученное объединением разбиений 1) Т; и Т/;, а 5 и S — верхняя и нижняя суммы разбиения Т. Так как разбиение Т может быть получено из разбиения Т1 добавлением к нему точек разбиения Т/;, то по свойству 2° и отмеченному свойству нижней и верхней суммы одного и того же разбиения имеем s1 S ^ S1. Но разбиение Т может быть также получено из разбиения Т" добавлением к нему точек разбиения Т1. Поэтому Сравнивая установленные выше неравенства с только что полу- полученными, убедимся, что sf ^ S"', sf/ ^ S1. Справедливость свойства 3° установлена. 4°. Множество {S} верхних сумм данной функции f(x) для всевозможных разбиений сегмента [а,Ь] ограничено снизу. Множество {s} нижних сумм ограничено сверху. г) При этом общие точки разбиений Т1 и Т" учитываются один раз.
§ 2 ВЕРХНИЕ И НИЖНИЕ СУММЫ 333 Это свойство непосредственно следует из свойства 3°. Дей™ ствительно, любая верхняя сумма не меньше некоторой фик- фиксированной нижней суммы, следовательно, множество {S} верхних сумм ограничено снизу. Любая нижняя сумма не пре™ восходит какую-либо верхнюю сумму, и поэтому множество {s} нижних сумм ограничено сверху. Обозначим через / точную нижнюю грань множества {S} верхних сумм, а через 1_ — точ- точную верхнюю грань множества нижних сумм: 7 = inf{S}, J = sup{s}. Числа I и I называются соответственно верхним и нижним ин- интегралами Дарбу от функции f(x). Докажем, что / ^ /. Пусть J > /. Тогда разность / — / есть положительное число, кото- которое мы обозначим через е, так что I_ — I = е > 0. Из опреде- определения точных граней / и / вытекает, что существуют числа S1 и sff, представляющие собой соответственно верхнюю и нижнюю суммы некоторых разбиений Т! и Т1! сегмента [а, Ь], такие, что / + - > S и/™- <s . Вычитая второе неравенство из первого и учитывая, что I — I = е, получим s" > Sf. Но это последнее неравенство противоречит свойству 3° верхних и нижних сумм. 5°. Пусть разбиение Т1 сегмента [а,Ь] получено из разбие- разбиения Т добавлением к последнему р новых точек, и пусть s;, Sr и S, S — соответственно нижние и верхние суммы разбиений Т' иТ'. Тогда для разностей S — Sf и sf — s1) может быть полу- чена оценка, зависящая от максимальной длины А частичных сегментов разбиения Т, числа р добавленных точек и точных верхней и нижней граней Мит функции f(x) на сегменте [а,Ь]. Именно, S-Sf^(M- m)pA, sf - 5 < (М - т)рА. Для того чтобы убедиться в справедливости этого свойства, до- достаточно доказать приведенные неравенства для случая, когда к разбиению Т добавляется одна точка х1. Пусть эта точка на™ ходится на сегменте [ж^х,ж^] разбиения Т. Тогда этот сегмент разделится на два сегмента [ж^х,ж;] и [ж;,ж^], длины которых мы обозначим соответственно через Ах^ и Ах". Пусть Mi, M[ и М" — соответственно точные верхние грани функции f(x) на сегментах [a^_i,a;j], [а^_1,ж'] и [ж;,ж^]. Так как Axi = Ах^ + Ах" и верхние суммы S и S1 разбиений Т и Т1 различаются лишь слагаемыми МгАхг и М^Аж- + Mf Ах", то S - S1 = М^(Аж- + + Ах1!) - (MlAxft + Mf'Ax'!) = (Мг - М^Ахгг + (Мг - Mf)Ах1!. 1) Отметим, что в силу свойства 2° эти разности неотрицательны.
334 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 Далее, т ^ М- ^ Mi ^ М и т ^ М" ^ Mi ^ М1), поэтому Mi - Ml ^ М - т и Mi - М" ^ М - га. Следовательно, S - -Sf ^ (М-т)(Да^ + Да#) = (М-т)Ах{. Поскольку Ахг ^ Д, то Я — S1 ^ (Af — т)А. Это неравенство совпадает с первым из неравенств, приведенных в формулировке свойства 5°, при р = = 1. Доказательство для нижних сумм проводится аналогично. 6°. Лемма Дарбу, Верхний I и нижний I интегралы Дарбу от функции f(x) no сегменту [а,Ь] являются соответственно пределами2) верхних и нижних сумм при А —)> 0. Доказательство. Докажем, например, что lim S = I. Для случая М = га, т. е. для случая f(x) = с = const, лемма очевидна, поскольку S = I = I = s. Будем поэтому считать, что М > т. Так как / — точная нижняя грань множества верхних сумм, то для любого данного е > 0 можно указать такое разби- разбиение Т* сегмента [а, Ь], что верхняя сумма 5* этого разбиения будет отличаться от / меньше, чем на е/2: 5*-7<е/2. A0.1) Обозначим через р число точек разбиения Т*, лежащих стро- строго внутри сегмента [а, Ь]. Пусть Т — любое разбиение сегмен- сегмента [ft, 6], максимальная длина А частичных сегментов которого подчинена условию А < & = о/я/ Л A0°2) 2(М - m)p x J и S — верхняя сумма этого разбиения. Добавим к этому разбие™ нию внутренние точки разбиения Т*. В результате мы получим разбиение Т;, верхняя сумма S1 которого в силу свойства 5° и условия A0.2) для А удовлетворяет неравенству O^S-S' ^(М- тп)рА < е/2. A0.3) С другой стороны, это разбиение Т1 можно рассматривать как разбиение, полученное в результате добавления к разбиению Т* г) Выше, при доказательстве свойства 2°, мы уже отмечали, что точная верхняя грань функции на части сегмента не превосходит ее точной верхней грани на всем сегменте. Отметим также, что точная нижняя грань функции на всем сегменте не превосходит ее точной верхней грани на любой части этого сегмента. ' ) Понятие предела верхних или нижних сумм определяется в полной аналогии с понятием предела интегральных сумм. Именно, число I назы- называется пределом верхних сумм S при А —>¦ 0, если для любого положитель- положительного числа е можно указать такое положительное число S, что при А < 6 выполняется неравенство \S — 1\ < е.
§ 3 КРИТЕРИЙ ИНТЕГРИРУЕМОСТИ ФУНКЦИИ 335 внутренних точек разбиения Т. Поэтому, в силу свойства 2°, I^S'^S*. Отсюда следует, что 0 ^ S" — / ^ ?* — /, т. е., согласно неравен- неравенству A0.1), 0 ^ Sf - К е/2. Складывая это неравенство с неравенством A0.3), получим 0^ S-7 < е. A0.4) Таким образом, мы установили, что для любого данного е > > 0 молено указать такое S > 0 (можно, например, положить S = —г- г— J, что верхние суммы S разбиений Т сегмента [а, Ь], для которых максимальная длина А частичных сегмен- сегментов меньше S (см. A0.2)), удовлетворяют неравенству A0.4). Но это означает, что верхний интеграл / Дарбу является пределом верхних сумм. Для нижних сумм доказательство аналогично. Лемма Дарбу доказана. § 3. Необходимое и достаточное условие интегрируемости Установленные свойства верхних и нижних сумм позволяют сформулировать в весьма простой форме необходимое и доста™ точное условие интегрируемости функции. Именно, имеет место следующая основная теорема. Теорема ЮЛ. Для того чтобы ограниченная на сегмен- сегменте [а,Ь] функция f(x) была интегрируемой на этом сегменте^ необходимо и достаточно, чтобы для любого е > 0 нашлось такое разбиение Т сегмента [а,Ь], для которого Доказательство. 1) Необходимость. Пусть функция f(x) интегрируема на сегменте [а,Ь]. Обозначим через / предел интегральных сумм этой функции. По определению предела интегральных сумм для любого е > 0 можно указать такое 6 > 0, что для любого разбиения Т, удовлетворяющего условию А < E, независимо от выбора точек ^ на частичных сегментах разбиения выполняется неравенство |/{а*,&}-/|<?/4. A0.5) Зафиксируем одно такое разбиение Т. По свойству 1° (см. п. 2 предыдущего параграфа) для данного разбиения Т можно ука™ зать такие две интегральные суммы (иными словами, можно так
336 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 выбрать точки ^ и ?" на каждом частичном сегменте [a^-i,^]), что Отметим, что обе интегральные суммы /{а^,^} и /{#?,?"} удо- удовлетворяют неравенству A0.5). Из соотношения 5 - s = (S - 1{хг, ?}) + (I{xuQ - I) + неравенства A0.5) и неравенств S—I{xi^[} ^ -, I{xi,?i} — s ^ - вытекает, что Необходимость условий теоремы доказана. 2) Достаточность. Так как для любого разбиения Т справедливы неравенства s^/^/^S'h для любого е > 0, согласно условию теоремы, можно указать такое разбиение, что S — s ^ е^ тоО^/^/^е. В силу произвольности е получим, что 1_ = I. Общее значение чисел / и / обозначим через / и докажем, что это число I является пределом интегральных сумм функ- функции f(x). Действительно, в силу леммы Дарбу (см. п. 2 § 2) это число / есть общий предел при А —>• 0 верхних и нижних сумм. Поэтому для любого е молено указать такое $, что при А < 6 выполняются неравенства I — s < е/2 и S — I < е/2, т. е. при А < <5, S — s < б, причем s ^ / ^ S. Любая интегральная сум- сумма I{xi^i\ данного разбиения Т заключена между верхней и нижней суммами s ^ /{ж^, ^i} ^ S. Таким образом, при А < S ве- величины I и I{xi^i} заключены между числами S и 5, разность ме^кду которыми меньше е. Отсюда вытекает, что при А< 5 \1{хи&}-1\<е. Следовательно, число / есть предел интегральных сумм. Теоре- Теорема доказана. В дальнейшем нам понадобится несколько иная форма за- записи необходимого и достаточного условия интегрируемости. Пусть Mi и гп{ — точные грани значений функции f(x) на [xi^i^Xi]. Число u)i = Mi— nii называется колебанием функции f(x) на сегменте [ж^1,ж^]. От- Отметим, что так как Mi ^ га^, то колебание uji является неотри- неотрицательным числом. Запишем теперь разность 5~5в следующей форме: S — S =
НЕКОТОРЫЕ КЛАССЫ ИНТЕГРИРУЕМЫХ ФУНКЦИЙ 337 Поскольку Wj ^ 0 и Axi > 0, то каждое слагаемое в последней сумме неотрицательно. Можно сформулировать необходимое и достаточное условие интегрируемости функции в следующей форме. Для того чтобы функция f(x) была интегрируемой на сег- сегменте [а, Ь], необходимо и достаточно^ чтобы для любого е > О нашлось такое разбиение Т сегмента [а,Ь], для которого шгАхг ^ е. г=1 § 4. Некоторые классы интегрируемых функций В этом параграфе мы докажем интегрируемость непрерыв™ ных на сегменте функций, некоторых разрывных функций и монотонных функций. Для доказательства интегрируемости непрерывных функций нам понадобится важное свойство непре™ рывных на сегменте функций, которое устанавливается в бли- ближайшем пункте. 1. Свойство равномерной непрерывности функции. Определение, Функция f(x) называется равномерно непрерывной на множестве {х} х), если для любого положительного числа е можно указать такое положитель- ное <5, зависящее только от в, что для любых двух точек х1 и х" множества {ж}, удовлетворяющих условию \xff — х'\ < J, выполняется неравенство \f(x/f) — /(V)| < e. Замечание. Главное в этом определении то, что для любого е > 0 найдется 6 > 0, гарантирующее выполнение нера- неравенства \f(xff) ^ f(x')\ < e сразу для всех х1 и х" из множества {х} при единственном условии \xff — xf\ < S. Для разъяснения свойства равномерной непрерывности рас- рассмотрим следующие примеры: 1) Функция f(x) = у/х равномерно непрерывна на полупря™ мой х ^ 1. В самом деле, по теореме Лагранжа имеем для любых 1 !1 х1 \f(x") - f(x')\ = х" - xf\ = (последнее неравенство вытекает из того, что ? заключено меж™ ду х1 и ж/;, и поэтому ? > 1). Следовательно, если по данному 6 > 0 выбрать любое <5, удовлетворяющее условию 0 < 8 ^ 2е, то при \х" — х'\ < S выполняется неравенство \f{x") — f(%f)\ < ) При этом предполагается, что множество {ж} плотно в себе (см. конец 3 гл. 2).
338 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 < 6, т. е. на множестве х ^ 1 функция f(x) = л/х равномерно непрерывна. 2) Функция f(x) = х2 не является равномерно непрерывной на множестве х ^ 1. Достаточно доказать, что для некоторо- некоторого е > 0 нельзя выбрать 6 > 0, гарантирующего выполнение неравенства \f(xff) — f(x')\ < е для всех ж' ) 1 и ж" ) 1 при единственном условии \х" — х!\ < 8. Мы докажем, что на самом деле даже для любого е > 0 нельзя выбрать указанного выше 5. Фиксируем е > 0 и рассмотрим любое положительное S. Выбе- ?, ж" = ж' + ?. Тг-» '-" ~" - S о 2 теорему Лагранжа, получим рем х1 > -, х11 = х + -. Тогда |жя — ж;| = - < 8. Используя Так как ? заключено между ж' и /, то ( > -, и поэтому из последнего равенства вытекает неравенство \f(x")-Hx')\>e, хотя \х"—х'\ < E. Таким образом, функция f(x) = ж2 не является равномерно непрерывной на множестве х ^ 1. 3) Функция f(x) = sin- не является равномерно непрерыв- непрерывной на интервале @,1). Докажем, что для любого 6, удовлетво™ ряющего условиям 0 < е < 2, нельзя указать S > 0, гарантирую- гарантирующего выполнение неравенства |/(ж/;) — f(xf)\ < 6 < 2 для всех ж; и х" из интервала @,1) при единственном условии \х" — х'\ < 5. су Чтобы убедиться в этом, достаточно положить х1 = -. — и Dк + 3)тг су xff = — — и для любого S > 0 выбрать к столь большим, что Dк + 1)тг < S. Для указанных точек ж; и х" при любом fc разность \xff — \f(x")-f(x')\ = Sill ^- — Sin — = 2 Докалсем следующую основную теорему. Теорема 10.2 (теорема о равномерной непрерывно- непрерывности). Непрерывная на сегменте [а, Ъ] функция f(x) равномерно непрерывна на этом сегменте. Доказательство. Предположим, что непрерывная на сегменте [а, Ъ] функция f(x) не является равномерно непрерыв- непрерывной на этом сегменте. Тогда для некоторого е > 0 не выполня- выполняются условия, сформулированные в определении равномерной непрерывности. Это означает, что для указанного е > 0 и лю- любого положительного числа 5 на сегменте [а, Ь] найдутся точки
§ 4 НЕКОТОРЫЕ КЛАССЫ ИНТЕГРИРУЕМЫХ ФУНКЦИЙ 339 х1 и х1' такие, что \хи — х'\ < 5, но \f(xff) — f{%')\ ^ ?• Поэто™ му для каждого 6 = 1/п, п = 1,2,..., найдутся точки х'п и х1^ сегмента [а, Ь] такие, что |ж^ — ж^| < 1/п, но |/(ж^) — /0*4I ^ ^ 6. Так как {х'п} — последовательность точек сегмента [а,Ь], то из нее, согласно теореме Больцано-Вейерштрасса, можно вы- выделить сходящуюся к некоторой точке с этого сегмента подпо- подпоследовательность {х!к } (см. замечание 2 п. 4 § 4 гл. 3). Очевид- Очевидно, подпоследовательность {х'к } последовательности {х1^} так- также сходится к с. Так как функция f(x) непрерывна в точке с, то пределы последовательностей {f(xk )} и {f(x'k )} равны /(с), и поэтому последовательность {f(xk ) — f(xfk )} является беско- бесконечно малой. Но этого не может быть, поскольку все элементы f(xk ) — f(xk ) указанной последовательности удовлетворяют неравенству \f(xk ) — f[x'k )| ^ е. Таким образом, предположе- предположение о том, что непрерывная на сегменте [а, Ь] функция не явля- является равномерно непрерывной, ведет к противоречию. Теорема доказана. Следствие. Пусть функция f(x) непрерывна на сегменте [а,Ь]. Тогда для любого положительного числа е можно ука- указать такое S > 0, что на каждом принадлежащем сегменту [а, Ь] частичном сегменте [с, d], длина d — c которого меньше J, колебание ш1) функции f(x) меньше е. Доказательство. В силу только что доказанной тео- теоремы непрерывная на сегменте [a, ft] функция /(ж) равномерно непрерывна на этом сегменте. Поэтому для любого е > 0 можно указать 6 > 0 такое, что для любых х1 и х11 из сегмента [a, ft], удо- удовлетворяющих условию |ж;/ — ж'| < E, выполняется неравенство 1/() /() сегменту [a, ft < е. Докажем, что на каждом принадлежащем частичном сегменте [с, d], длина d — с которого меньше указанного J, колебание ш функции f(x) меньше е. В самом деле, поскольку функция f(x) непрерывна на сегменте [с, d], то на этом сегменте можно указать такие точки х1 и х11\ что /(V) = гтг, a f(x") = М, где т и М — точные нижняя и верхняя грани f(x) на сегменте [c^d] (см. теорему 8.8). Так как \х" — х'\ < 5 (ибо длина сегмента [е, d] меньше <5), то \f(x/f) — - f{x')\ < 6. Но f(xff) - f(xf) =М-т = ш. Поэтому ш < 6. Замечание. Множество {ж} точек числовой прямой называется замкнутым, если оно содержит все свои предельные точки2). Справедли™ ) Напомним, что колебанием ш функции /(ж) на сегменте [с, d] назы™ вается разность М — т между точной верхней и точной нижней гранями функции /(ж) на этом сегменте. 2) Определение предельной точки множества дано в п. 6 § 4 гл. 3.
340 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 во следующее утверждение. Непрерывная на замкнутом ограниченном ) множестве {ж} функция /(ж) равномерно непрерывна на этом множе- множестве. Доказательство этого утверждения аналогично доказательству тео- теоремы 10.2. 2. Лемма Гейне^Бореля. Другое доказательство теоремы о рав- равномерной непрерывности. Точка ж множества {ж} называется внутрен- внутренней точкой этого множества, если она принадлежит некоторому интервалу, все точки которого принадлежат множеству {ж}. Множество {ж} называет- называется открытым, если все точки этого множества внутренние. Мы будем говорить, что данное множество {ж} покрыто системой Е открытых множеств2), если каждая точка ж этого множества принадле- принадлежит по крайней мере одному множеству системы Е. Докажем следующую лемму. Лежта Гейне-Бореля3). Если сегмент [а, 6] покрыт бесконечной системой Е открытых множеству то из этой системы можно выде- выделить конечную подсистему Е множеств, которая также покрывает сег- сегмент [а, 6]. Доказательство ). Пусть {ж} — множество таких точек сегмента [а, 6], что если ж принадлежит этому множеству, то сегмент [а, ж] покрывается некоторой конечной подсистемой Е; множеств системы S. До™ кажем, что множество {ж} совпадает с сегментом [а,Ь]. Так как точка а покрыта некоторым множеством системы Е и это множество открытое, то оно покрывает также некоторый сегмент [а, ж], все точки которого, соглас- согласно вышесказанному, принадлежат множеству {ж}. Множество {ж}, очевид- очевидно, ограничено. Пусть ж = sup {ж}. "Убедимся, что ж принадлежит множе- множеству {ж} и что ж = Ь. В самом деле, ж покрыто некоторым множеством системы Е и, следовательно, этим же множеством покрыты все точки неко- некоторого интервала (ж — е,х + е). Так как ж = sup {ж}, то имеются точки множества {ж}, как угодно близкие к ж, и поэтому найдется точка ж этого множества, принадлежащая интервалу (ж — е, ж + е). Из определения мно- множества {ж} вытекает, что сегмент [а, ж;] покрывается некоторой конечной подсистемой Е; множеств системы Е. Присоединяя к Е; множество, покры- покрывающее точку ж, мы получим конечную подсистему Е множеств системы Е, которая покрывает сегмент [а, ж]. Следовательно, ж принадлежит {ж}. Если допустить, что ж < Ь, то подсистема S покрывала бы все точки некоторого сегмента [а, ж/;], где ж < х" < ж + е, и поэтому точка х" принадлежала бы множеству {ж}. Но этого не может быть, так как ж — точная верхняя грань множества {ж}. Таким образом, множество {ж} совпадает с сегментом [а, Ь]. Лемма доказана. г) Определение ограниченного множества дано в п. 6 § 4 гл. 3. 2) Если множество {ж} состоит из одной точки, а система Е содержит лишь одно открытое множество, то мы будем говорить, что это множество покрывает указанную точку. 3) Э. Гейне A821-1881) — немецкий математик. Эмиль Борель A871™ 1956) — французский математик. 4) Это доказательство леммы Гейне-Бореля принадлежит французскому математику Анри Лебегу A875-1941). Отметим, что Лебегом был указан и обоснован более общий, чем излагаемый в этой главе, подход к проблеме интегрирования. Соответствующее понятие интеграла носит наименование интеграла Лебега.
§ 4 НЕКОТОРЫЕ КЛАССЫ ИНТЕГРИРУЕМЫХ ФУНКЦИЙ 341 Замечание. Можно следующим образом обобщить лемму Гейне— Бореля. Если замкнутое1) ограниченное множество {ж} покрыто беско- бесконечной системой Е открытых множеству то из этой системы можно выделить конечную подсистему Е множеств, которая также покрывает множество {ж}. Дадим теперь другое доказательство теоремы 10.2. Доказательство теоремы о равномерной непрерыв- непрерывности. Продолжим /(ж) на всю прямую, положив ее равной f(b) при ж > Ь и равной /(а) при х < а. Так как /(ж) непрерывна в каждой точке сегмента [а, Ь], то для любой точки ж этого сегмента и любого заданного е > 0 можно указать такое ё1 > 0, зависящее, вообще говоря, от ж, что для всех точек ж;, удовлетворяющих условию ж — ж < ё , выполняется неравенство |/(ж ) — — f(x)\ < е/2. Таким образом, сегмент [а, Ь] покрыт бесконечной системой S интервалов {х — ё1 /2^ х + ё'/2) 2), из которой можно выделить, в силу леммы Гейне—Бореля, конечную подсистему X интервалов, также покрывающую сегмент [а,Ь]. Пусть ё — минимальное значение ё'/2 для этой конечной подсистемы S интервалов. Пусть теперь жиж — любые точки сегмента [а, 5], удовлетворяющие условию ж — ж | < <5, и ж — центр того интервала {х — ё'/2, ж+<5;/2), 8 ^ ё'/2, системы Е, который покрывает точку х . Так как ж;-ж| < ё' 12 < 8' и |ж/;-ж| < ё\ то |/(ж;)-/(ж)| < е/2 и |/(ж/;)-/(ж)| < е/2 и поэтому |/(Ж") - f(x')\ < |/(Ж") - /(х)| + |/(Ж') - /(ж)| < е/2 + е/2 = е. Итак, для любого заданного е > 0 мы указали такое 8 > 0, что для лю- любых точек х1 и х!1 сегмента [«,&], удовлетворяющих условию |ж/; — ж;| < 8, выполняется неравенство |/(ж/;) — /(ж;)| < е. Следовательно, функция /(ж) равномерно непрерывна на сегменте [а, 6]. Теорема доказана. 3. Интегрируемость непрерывных функций. Докажем следующую основную теорему. Теорема 10.3. Непрерывная на сегменте [а, Ь] функция f(x) интегрируема на этом сегменте. Доказательство. Пусть дано любое е > 0. В силу равномерной непрерывности функции f(x) на сегменте [а, Ь] для положительного числа в/(ft — а) молено указать такое 6 > 0, что при разбиении Т сегмента [a, ft] на частичные сегменты [ж^-х, ж^]5 длины Дж? которых меньше 5, колебание щ функции f(x) на каждом таком частичном сегменте будут меньше е/(ft — а) (см. следствие из теоремы 10.2). Поэтому для таких разбиений Т S — s = }^ ouiAxi < 1 \^ Axi = e. ^-^ о — а ^-^ г=1 г=1 Следовательно, для непрерывной на сегменте [ft, ft] функции f(x) выполнены достаточные условия интегрируемости. г) См. замечание в предыдущем пункте. 2) Мы берем интервалы (ж — ef/2, ж + ё1 /2) вместо (ж — ё\ ж + ё1) для удобства дальнейших рассуждений.
342 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 4. Интегрируемость некоторых разрывных функций. Мы будем говорить, что точка х покрыта интервалом, если эта точка принадлежит указанному интервалу. Докажем следую- следующую теорему. Теорема 10.4-- Если функция f(x) определена и ограничена на сегменте [а,Ь] и если для любого положительного числа е можно указать конечное число интервалов, покрывающих все точки разрыва этой функции и имеющих общую сумму длин меньше 6, то }'{х) интегрируема на сегменте [а, Ь]. Доказательство. Пусть дано любое е > 0. Покро- Покроем точки разрыва функции f(x) конечным числом интервалов, сумма длин которых меньше N, где М и т — точные 2(М — т) верхняя и нижняя грани f(x) на сегменте [а, Ь] (случай М = т можно исключить, так как тогда f(x) = с = const). Точки сегмен- сегмента, не принадлежащие указанным интервалам, образуют множе™ ство, состоящее из конечного числа непересекающихся сегмен- сегментов. На каждом из них функция f(x) непрерывна и поэтому равномерно непрерывна. Разобьем каждый такой сегмент так, чтобы колебание aji функции f(x) на любом частичном сегмен- сегменте разбиения было меньше — -. Объединяя эти разбиения и 2 (о ~~ а) интервалы, покрывающие точки разрыва функции /(ж), мы по- получим разбиение Т всего сегмента [а, Ь]. Для этого разбиения п слагаемые суммы ^2 UJi^xi (равной S — s) разделяются на две г=1 группы ^2 U)i^xi и ^2 шг^хг] причем в первую группу входят все слагаемые, отвечающие частям разбиения Т, образованным из интервалов, покрывающих точки разрыва, а во вторую — остальные слагаемые. Так как колебания uji = Mi — mi для сла- слагаемых первой группы удовлетворяют неравенству щ ^ М — т, то (М- тп)У^ Axi < (М - m)- e e '2(М-т) 2 Для слагаемых второй группы Ш{ < — -. Поэтому Таким образом, У + У ^ UJiAxi < e. п S — s = У ^UjAxj = У ^ г=1 Итак, для указанной в условии теоремы функции f(x) выполне™ ны достаточные условия интегрируемости. Теорема доказана.
НЕКОТОРЫЕ КЛАССЫ ИНТЕГРИРУЕМЫХ ФУНКЦИИ 343 У' +1 i up !! ' ii ¦ и ¦ !! >> ii пи ii in ! Up jijlji _-?0 4 Следствие. Ограниченная на сегменте [а,Ь] функция /(ж), имеющая лишь конечное число точек разрыва, интегрируема на этом сегменте1). В частности^ кусочно непрерывная на данном сегменте функция интегрируема на этом сегменте. Замечание. Очевидно, что если функция f(x) интегри- интегрируема на сегменте [a, ft], a функ- функция g(x) отличается от функции f(x) лишь в конечном числе то- точек, то функция g(x) также инте- интегрируема на сегменте [a, ft], при- ь ь чем J f(x) dx = f g(x) dx. a a Рассмотрим пример интегри- интегрируемой функции, имеющей беско- Рис- 10-4 нечное число точек разрыва. Пусть на сегменте [0,1] задана функция /(ж) (рис. 10.4) 1 ( 1 1 1 1 о 1 на полусегментах —, , п = 1, z,.., \ 2п 2п — 1J 1 ( 1 1 1 1 О -1 на полусегментах , — , п = I, z,.., в точке х = 0. Указанная функция имеет разрывы 1-го рода во всех точ™ ках хп = 1/п, п = 2,3,... Фиксируем любое е > 0. По- Покроем точку х = 0 (в любой окрестности этой точки нахо- находится бесконечное число точек разрыва функции) интервалом (—s/4, s/4). Вне этого интервала находится лишь конечное чис- число р 2) точек разрыва функции, каждую из которых мы по- покроем интервалом длины меньше —. Сумма длин интервалов, покрывающих все точки разрыва рассматриваемой функции, меньше ™+р^ = е. Следовательно, функция f(x) интегрируема на сегменте [0,1]. 1) Если р — число точек разрыва, то достаточно покрыть каждую точку разрыва интервалом длины е/2р. 2) Это число р зависит, конечно, от е.
344 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 5. Интегрируемость монотонных ограниченных функций. Теорема 10.5. Монотонная на сегменте [а, ft] функция f(x) интегрируема на этом сегменте1). Доказательство. Ради определенности докажем теоре™ му для неубывающей на сегменте [а, ft] функции f(x). Зададим- Зададимся произвольным положительным числом е и разобьем сегмент [a, ft] на равные части, длины которых меньше (слу™ чай /(a) = /(ft) можно исключить, так как тогда f(x) = const). п Оценим для этого разбиения разность S — s = ^ uJiAxi. Имеем г=1 п п i=l i=l п Но для неубывающей функции ]Р uji = /(ft) — /(ft), поэтому S — s < e. Теорема доказана. § 5. Основные свойства определенного интеграла Докажем справедливость следующих свойств определенного интеграла: 1°. Мы будем считать, что а Г f(x)dx = 0. A0.6) ь Отметим, что формула A0.6) должна рассматриваться как со- соглашение. Ее нужно рассматривать как естественное распро™ странение понятия определенного интеграла на сегмент нулевой длины. 2°. Мы будем считать, что при а < b a b Г f(x)dx = -f f(x)dx. A0.7) Ъ а Эта формула также должна рассматриваться как соглаше- соглашение. Она представляет собой естественное обобщение понятия интеграла на случай, когда сегмент [a, ft] при а < ft пробегается ) Отметим, что если функция монотонна на сегменте [а, 6], то ее значе- значения заключены между /(а) и f(b). Поэтому определенная на сегменте [а, Ь] монотонная функция ограничена на этом сегменте.
§ 5 ОСНОВНЫЕ СВОЙСТВА ОПРЕДЕЛЕННОГО ИНТЕГРАЛА 345 в направлении от Ь к а (в этом случае в интегральной сумме все разности Axi = Х{ — Х{-\ имеют отрицательный знак). 3°. Пусть функции f(x) и g(x) интегрируемы на сегменте [а, Ь ]. Тогда функции / (ж) + g (х), / (ж) — g (ж) и /(х) g (x) также интегрируемы на этом сегменте, причем ь ь ь Jlf(x) ±g(x)] dx = J f(x) dx ±Jg(x) dx. A0.8) a a a Докажем сначала интегрируемость функции f(x) zbg(x) и спра- справедливость формулы A0.8). При любом разбиении сегмента [а^Ь] и любом выборе точек ^ для интегральных сумм спра- справедливо соотношение п п п ?[/(&) ±g(&)]Да* = ?/(&)Дач ± 5>(&)ДЖг, 1 = 1 1 = 1 1 = 1 а поэтому из существования предела правой части следует суще™ ствование предела левой части. Следовательно, функция /(ж) =Ь ±g(ж) интегрируема и имеет место формула A0.8). Докалсем теперь, что произведение интегрируемых функ- функций является интегрируемой функцией. Так как функции f(x) и g(x) интегрируемы на сегменте [а,Ь], то они и ограничены на этом сегменте (см. утверждение п. 1 § 1), так что |/(ж)| ^ А ш \g(x)\ ^ В. Рассмотрим любое заданное разбиение Т сегмента [а, Ь]. Пусть х1 и х" — произвольные точки частичного сегмента [жг_1,Жг]. Имеем тождество f(x")g(x")-f(x')g(x') = = [f{x") - f(x')]g(x") + [g(x") -g( Так как \f(x")g(x") - f(x')g(x')\ < с*, \J(x") - f(x')\ < где cjj, uii^ uji — соответственно колебания функций f(x)g(xI /(ж), g(x) на сегменте [жг_х,Жг], то, согласно указанному тожде- тождеству -1"), Поэтому п ) В этом тож:дестве точки х и х" мож;но выбрать так, что левая часть будет как угодно мало отличаться от ил.
346 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 Поскольку /(ж) и g(x) интегрируемы на сегменте [а, Ь], для лю- любого заданного е > 0 можно указать такое разбиение Т этого п е п _ ? сегмента, что ]Р о^Аж^ < —— и ^ с^Д#г < —-. Следовательно, i=l Ш г=1 2Л для этого разбиения п i=l Поэтому произведение интегрируемых функций является инте™ грируемой функцией. 4°. Если функция /(ж) интегрируема на сегменте [а,Ь], то функция с fix) (с = const) интегрируема на этом сегменте, при- причем ъ ъ Г с/(ж) dx = c I fix) dx. A0 J) a a Действительно, интегральные суммы функций /(ж) и с fix) от™ личаются постоянным множителем с. Поэтому функция с fix) интегрируема и справедлива формула A0.9). 5°. Пусть функция /(ж) интегрируема на сегменте [а, Ь]. То- Тогда эта функция интегрируема на любом сегменте [с, d], содер™ жащемся в сегменте [а, Ь]. Так как функция /(ж) интегрируема на сегменте [а,Ь], то для любого е > 0 существует такое разбиение Т сегмента [а, Ь], что S — s < е (см. теорему 10.1). Добавим к точкам разбиения Т точки с и А В силу свойства 2° верхних и нижних сумм (см. п. 2 § 2) для полученного разбиения Т* тем более справедливо неравенство S — s < е. Разбиение Т* сегмента [а,Ь] порожда™ ет разбиение Т сегмента [с, d]. Если 5и5 — верхняя и нижняя суммы разбиения Т, то S — И ^ S — s^ поскольку каждое неотри™ цательное слагаемое о^Дж^ в выражении 5^5 = ^<х^Дж^ будет также слагаемым в выражении для S — s. Следовательно, S — ^5 < е, и поэтому функция /(ж) интегрируема на сегменте [с, d]. 6°. Пусть функция /(ж) интегрируема на сегментах [а^с] и [с, Ь]. Тогда эта функция интегрируема на сегменте [а, 6], причем Ь с Ь fix) dx = J fix) dx J fix) dx. A0.10) а а с Рассмотрим сначала случай, когда а < с < Ъ. Так как функция /(ж) интегрируема на сегментах [а, с] и [с, Ь], то существуют та™ кие разбиения этих сегментов, что разность S — s для каждого из них меньше е/2. Объединяя эти разбиения, мы получим раз™
§ 6 ОЦЕНКИ ИНТЕГРАЛОВ. ФОРМУЛЫ СРЕДНЕГО ЗНАЧЕНИЯ 347 биение сегмента [а, Ь], для которого разность S — s будет мень™ ше е. Следовательно, функция f(x) интегрируема на [а, Ь]. Бу- Будем включать точку с в число делящих точек сегмента [а, Ь] при каждом его разбиении. Тогда интегральная сумма для f(x) на [ft, Ь] равна сумме интегральных сумм для этой функции на [ft, с] и [с, Ь]. В пределе мы получим формулу A0.10). Если точка с лежит вне сегмента [a, ft], то сегмент [а, Ь] есть часть сегмента [а, с] (или [с, Ь]) и поэтому, в силу свойства 5°, функция f(x) интегрируема на [a, ft]. Рассмотрим случай а < < Ь < с. Тогда Ь с с ff{x)dx+ Г f{x)dx= f f{x)dx. a b Q> Отсюда, используя свойство 2° и формулу A0.7), мы опять по™ лучим соотношение A0.10). Легко убедиться в справедливости этого соотношения и при с < а < Ь. § 6. Оценки интегралов. Формулы среднего значения 1. Оценки интегралов. В этом пункте мы получим неко- некоторые оценки для определенных интегралов, подынтегральные функции которых подчинены тем или иным условиям. 1°. Пусть интегрируемая на сегменте [а,Ь] функция f(x) неотрицательна на этом сегменте. Тогда ь а Действительно, каждая интегральная сумма такой функции ь неотрицательна, и поэтому предел / = j f(x)dx интегральных а сумм также неотрицателен J. Замечание 1. Если f(x) интегрируема на сегменте [a, b] и f(x) ^ ттг, то ь f(x) dx ^ га(Ь — а). г) Допустим, что предел I интегральных сумм отрицателен. Тогда соглас- согласно определению предела J, для числа е = |/| найдется интегральная сумма I{xij^i}j для которой |/{жг,?г} — 1\ < \1\- Из этого неравенства вытекает, что I\_Xi,^i} < 0, а мы только что убедились, что каждая интегральная сумма неотрицательна. Следовательно, предел J неотрицателен.
348 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 В самом деле, функция /(ж) —га ^ Ои интегрируема на сегменте ь [а, Ь]. Поэтому /[/(ж) — га] dx ^ 0. Отсюда а Ъ Ъ Ъ I /(ж) dx ^ § mdx = га / dx = т(Ъ — а) а а а (см. свойство 3° и пример из § 1). 2°. ?Ъш функция /(ж) непрерывна, неотрицательна и не равна тождественно нулю на сегменте [а, Ь], wo ь /(ж)с!ж > с> 0. Действительно, так как функция /(ж) неотрицательна и не рав- равна тождественно нулю, то на сегменте [а, Ь] найдется такая точ- точка ?, что /(С) — 2fc > 0. Тогда по теореме об устойчивости знака непрерывной функции молено найти такой сегмент [р, д], содер- содержащий точку ^ в пределах которого значения функции /(ж) будут не меньше числа к > 0. Поэтому, в силу только что сде- сделанного замечания, я I f(x)dx > k(q-p) > 0. р Согласно свойству 6° определенных интегралов ъ р q ъ Г Г Г Г / f(x)dx= / /(ж)йж+ / /(ж)йж+ / f(x)dx. j j j j a a p q q Поэтому, поскольку /(ж) ^ 0 и J /(ж) с!ж ^ с > 0, где с = k(p—q), р ь f(x)dx ^ с > 0. а 3°. .EVym функции /(ж) ti я (ж) интегрируемы на сегменте [а, Ь] ti /(ж) ^ g(#) всюду на этом сегменте^ то ъ ъ [ /(ж) dx ^ g(x) dx.
ОЦЕНКИ ИНТЕГРАЛОВ. ФОРМУЛЫ СРЕДНЕГО ЗНАЧЕНИЯ 349 Действительно, функция f(x) — g(x) ) 0 и интегрируема на сегменте [а, Ь]. Отсюда, в силу свойства 1°, и вытекает справед™ ливость указанной оценки. Замечание 2. Если функция f(x) интегрируема на сег- сегменте [а, Ь], то функция \f(x)\ также интегрируема на этом сегменте, причем f(x)dx \f(x)\dx. Докажем сначала интегрируемость модуля \f(x)\ интегриру™ емой функции f(x). Обозначим через Mi и rrii точные грани f(x) на сегменте [ж^1,ж^], а через М[ и т[ точные грани |/(ж)| на том же сегменте. Легко убедиться в том, что М| — т^ ^ Mi — — rrii (достаточно рассмотреть три возможных случая: 1) случай, когда Mi и rrii неотрицательны; 2) случай, когда Mi и rrii непо™ ложительны; 3) случай, когда Mi > 0, rrii ^ 0)- Из полученного неравенства вытекает, что S1 — sf ^ S — s. Таким образом, если для некоторого разбиения S — s < e, то для этого разбиения S1 — s1 < е, т. е. для |/(ж)| выполнено достаточное условие инте- интегрируемости 1). Докажем теперь интересующую нас оценку. Так как — |/(ж)| ^ < fix) < \f{x)\, то -J\f(x)\dx < Jf(x)dx < !\f(x)\dx, а это и означает, что Jf(x)dx <J\f(x)\dx. 4°. Пусть функции f{x) и g(x) интегрируемы на сегменте [а^Ь] и g(x) ^ 0. Тогда, если М и т — точные грани f(x) на сегменте [а, Ь], то т g(x) dx ^ / f(x)g(x) dx^M I g(x) dx. A0.11) Справедливость A0.11) вытекает из того, что для всех х из сегмента [а,Ь] справедливы неравенства mg(x) ^ f(x)g(x) ^ ) Из интегрируемости функции |/(ж)| не следует, вообще говоря, интегри- Г 1 для рациональных ж, руемость /(ж). Например, функция /(ж) = < I — 1 для иррациональных ж, неинтегрируема на сегменте [0,1], тогда как |/(ж)| = 1 — интегрируемая на этом сегменте функция.
350 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 ^ Mg(x) (см. оценку 3° из настоящего пункта и свойство 4° из § 5). Замечание 3. В дополнении 1 к этой главе мы по- получим несколвко важнвхх неравенств для сумм и определеннвхх интегралов. 2. Первая формула среднего значения. Пусть функция f(x) интегрируема на сегменте [а, Ь], и пусть т и М — точ- точные грани f(x) на сегменте [а, Ь]. Тогда найдется такое чис- число /i, удовлетворяющее неравенствам т ^ /i ^ M, что ъ f (x) dx =/j,(b — а). A0.12) а Ъ В самом деле, полагая g(x) = 1 и учитывая, что J 1 • dx = b — а (см. пример п. 1 § 1), получим из A0.11) а ь т(Ъ -а)^ Г f(x) dx ^ М(Ъ - а). а 1 Ь Обозначая через /i число J /(ж) йж, мы и получим формулу A0.12). Если функция f(x) непрерывна на сегменте [а, Ь], то суще™ ствуют такие точки р и q этого сегмента, что f(p)=m~af(q) = = М (см. теорему 8.8), и поэтому, в силу теоремы 8.6, на сег- сегменте [р, д], а стало быть, и на [а, Ь] найдется точка ? такая, что /(?) = /i. В этом случае формула A0.12) примет вид ь ¦а). A0.13) Эта формула называется первой формулой среднего значения. 8. Первая формула среднего значения в обобщен- обобщенной форме. Докажем следующее утверждение. Пусть функ- функции f(x) и g(x) интегрируемы на сегменте [а, 6], и пусть т и М — точные грани f(x) на сегменте [а, Ь]. Пусть^ кроме того^ функция g(x) ^ 0 (или g(x) ^ 0) на всем сегменте [а, Ь]. То- Тогда найдется такое число /i, удовлетворяющее неравенствам т ^ /i ^ М, ^шо ь ь g(a;)rfa;. A0.14)
§ 6 ОЦЕНКИ ИНТЕГРАЛОВ. ФОРМУЛЫ СРЕДНЕГО ЗНАЧЕНИЯ 351 В частности, если f(x) непрерывна на сегменте [а, Ь], то на этом сегменте существует такое число ?, что A0.15) Формула A0.15) называется первой формулой среднего значения в обобщенной форме. ь Докажем справедливость формулы A0.14). Если Jg(x)dx = а Ъ = 0, то, в силу неравенств A0.11), f f(x)g(x)dx = 0 и поэтому а Ь в качестве /л мы можем взять любое число. Если J g(x) dx > 0, а Ъ то, разделив все части неравенств A0.11) на J g(x) dx, получим а ъ I' f(x)g(x)dx т < 2_ ^ М. Jg(x)dx а Ъ J f{x)g{x)dx Полагая /i равным а , мы и получим формулу A0.14). Jg(x)dx а Если f(x) непрерывна на сегменте [а, Ь], то, каково бы ни было число /j, заключенное между т и Ж, на этом сегменте найдется точка ? такая, что /(?) = /i, т. е. формула A0.14) пе- переходит в формулу A0.15). Замечание 4. Если функция f(x) не является непре™ рывной, то формула A0.15), вообще говоря, неверна. В самом деле, пусть, например, ?( , \ т: ПРИ 0 < ^ ^ ^^ . , ( 1 при 0 ^ ж ^ ~, [ 1 при - < х ^ 1, [ - при - < ж ^ 1. Тогда, как легко убедиться, число /л в формуле A0.14) равно 2/3. Таким образом, для любого ? из сегмента [0,1] /(С) 7^ /л. 4. Вторам формула среднего значения. Справедливо следующее утверждение. Если на сегменте [а, Ь] функция g(x)
352 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 монотонна, a f(x) интегрируема, то на этом сегменте суще- существует такое число ?, что ъ i ь J f(x)g(x)dx = g(a) J f(x)dx + g(b) J f(x)dx. A0.16) a a ? Формула A0.16) называется второй формулой среднего значе- значения или формулой Бонне1). Сформулированное утверждение доказывается в дополнении 2 к настоящей главе. § 7. Существование первообразной длм непрерывной функции. Основные правила интегрирования 1. Существование первообразной длм непрерывной функции. Прежде чем перейти к доказательству теоремы о су™ ществовании первообразной для непрерывной функции, введем понятие интеграла с переменным верхним пределом. Пусть функция f(x) интегрируема на любом сегменте, содер- содержащемся в интервале (ft, ft), и пусть с — некоторая фиксирован- фиксированная точка этого интервала. Тогда, каково бы ни было число х из интервала (a, ft), функция f(x) интегрируема на сегменте [с, ж]. Поэтому на интервале (ft, ft) определена функция F(x) = I f(t)dt которую называют интегралом с переменным верхним преде- пределом. Докажем следующую теорему. Теорема 10.6. Любая непрерывная на интервале (а,Ь) функция f(x) имеет на этом интервале первообразную. Одной из первообразных является функция X F(x) = f f{t)dt, где с — любая фиксированная точка интервала (a, ft). Доказательство. Достаточно доказать, что для любого фиксированного х из интервала (а, Ь) существует предельное значение lim — -1 ^-L. причем это предельное значение Ао Ах ' F F А 1) Бонне A819-1892) — французский математик. ) Мы обозначили переменную интегрирования буквой t, поскольку бук- буквой х обозначен верхний предел интегрирования.
§ 7 СУЩЕСТВОВАНИЕ ПЕРВООБРАЗНОЙ 353 равно f(x). Имеем, в силу свойства 6° определенных интегралов (см. § 5I), х-{-Ах х F(x + Ax)-F(x)= I f(t)dt- I f(t)dt = С С х х-{-Ах х х-{-Ах = Jf(t)dt+ I f(t)dt-Jf(t)dt= I f(t)dt. По формуле A0.13) среднего значения находим ж+Аж F(x + Ах) - F(x) = Г где ? — число, заключенное между числами х и х + Ах. По- Поскольку функция f(x) непрерывна в точке ж, то при Ах —> 0 /(?) —> f(x). Поэтому из последней формулы находим F(x + Ах) - F(x) r " Г = li Теорема доказана. Замечание 1. Аналогично доказывается теорема о существовании первообразной у непрерывной на сегменте [а,Ь] функции. Отметим, что в этом случае в качестве нижнего пре™ дела интегрирования с можно взять а. Замечание 2. При доказательстве теоремы 10.6 мы установили существование производной от интеграла с перемен™ ным верхним пределом и доказали, что эта производная равна подынтегральной функции f(t)dt\ =f(x). A0.17) Замечание 3. Отметим, что если функция f(x) интегри™ руема на любом сегменте, содержащемся в интервале (а, Ь), то интеграл с переменным верхним пределом представляет собой непрерывную на интервале (а, Ь) функцию от верхнего предела. Чтобы убедиться в этом, докажем, что приращение AF = X Ах) — F(x) функции F(x) = J f(t)dt стремится к нулю при ) Приращение Аж мы берем столь малым, что (ж + Аж) принадлежит (а,Ъ). 12 В.А. Ильин, Э.Г. Позняк, часть I
354 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 Ах —> 0. Имеем, в силу формулы A0.12), ж+Аж AF = F(x + Ах) - F(x) = Г где число /i заключено между точной верхней и нижней гранями функции f(x) на сегменте [ж,ж + Ах]. Из последней формулы вытекает, что и AF —>> 0 при Ах —> 0. Замечание 4. Интеграл с переменным верхним пределом часто используется для определения новых функций. Мы уже отмечали в гл. 6, что первообразные некоторых элементарных функций не выражаются через элементарные функции и не яв~ ляются поэтому элементарными функциями. Напомним, что к числу неэлементарных функций относятся, например, функции XX /е"* dt, / cos t2dt. о о 2. Основная формула интегрального исчисления. Мы доказали, что любые две первообразные данной функции f(x) отличаются на постоянную (см. теорему 6.1). Поэтому, согласно теореме 10.6 и замечанию 1 к этой теореме, можно утверждать, что любая первообразная Ф(ж) непрерывной на сегменте [а,Ь] функции f(x) имеет вид Ф(х)= / f(t)dt + C, J a где С — некоторая постоянная. Полагая в последней формуле сначала х = а, а затем х = Ь и используя свойство 1° определенных интегралов, найдем ъ Ф(а) = С, Ф(Ъ) = J f(x)dx + Cl), а Из этих равенств вытекает соотношение ь Г f(x) dx = Ф(Ь) - Ф(а), A0.18) а называемое основной формулой интегрального исчисления2). х) В этой формуле переменную интегрирования мы обозначили буквой ж, поскольку верхний предел имеет фиксированное значение Ь. 2) Эту формулу называют также формулой Ньютона-Лейбница.
СУЩЕСТВОВАНИЕ ПЕРВООБРАЗНОЙ 355 Итак, для вычисления определенного интеграла от непрерыв- непрерывной функции f(x) нужно составить разность значений про- произвольной ее первообразной для верхнего и нижнего пределов интегрирования. Отметим, что основная формула интегрального исчисления открывает широкие возможности для вычисления определен- определенных интегралов, поскольку задача вычисления определенного интеграла сводится к задаче разыскания первообразной функ- функции. Методы разыскания первообразных были достаточно полно разработаны нами в главах 6 и 7 этого курса. Так как во многих случаях разыскание первообразных пред™ ставляет собой трудную задачу, естественно поставить вопрос о приближенных методах вычисления определенных интегралов. В гл. 12 будут указаны некоторые методы приближенного вы™ числения определенных интегралов. Формулу A0.18) иногда записывают в иной форме. Именно, разность Ф(Ь) — Ф(а) обозначают символом Ф{х)\ьа. Тогда f(x) dx = Ф(х) A0.19) Рассмотрим несколько примеров: ь ъ 1) 2) 3) 4) 5) sin ж dx dx -, — = mx X e~x dx - dx 1 + x2 — cos X 2 = ln2- l = —e~x = arctg x l 0 1 0 = cos a — cos b; 1/2 dx = arcsina; 7r. I' 6) dx = In [x + = In C + \/l0 12*
356 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 3. Замена переменной под знаком определенного ин- интеграла. Пусть выполнены следующие условия: 1) функция f(x) непрерывна на сегменте [а,Ь]; 2) сегмент [а,Ь] является множеством значений некото- рой функции х = g(t), определенной на сегменте а ^ t ^ /3 и имеющей на этом сегменте непрерывную производную; 3)g(a)=a,g(/3)=b. При этих условиях справедлива формула /3 = Jf\g(t)]g'(t)dt. A0.20) Формула A0.20) показывает, что если вычислен интеграл, сто- стоящий в левой части этой формулы, то вычислен и интеграл, стоящий в правой части, и наоборот. Указанная формула назы- называется формулой замены переменной под знаком определенного интеграла. Рассмотрим некоторую первообразную Ф(х) функции f(x). По формуле A0.18) имеем A0.21) Так как функции Ф(х) и х = g(t) дифференцируемы на соответ™ ствующих сегментах, то сложная функция <^(g(t)) дифференци™ руема на сегменте [а, /3]. Поэтому, применяя правило дифферен- дифференцирования сложной функции, получим t), A0.22) причем производная Ф; вычисляется по аргументу х: = Ф;(ж), где х = g(t). Поскольку Фг(х) = /(ж), то при х = g(t) получим <l}f(g(t)) = f(g(t)). Подставляя это значение <l>f(g(t)) в правую часть равенства A0.22), получим Следовательно, функция (^(g^^j определенная и непрерывная на сегменте [а, /3], является на этом сегменте первообразной для функции /(g(t))g;(t), и поэтому, согласно формуле A0.18), Р
§ 7 СУЩЕСТВОВАНИЕ ПЕРВООБРАЗНОЙ 357 Так как g(C) = Ь, a g(ot) = в, то Сравнивая последнюю формулу с формулой A0.21), мы убежда- убеждаемся в справедливости формулы A0.20). 2 Примеры. 1) Рассмотрим интеграл / In ж — . Положим J х 1 х = е*. Так как t = 0 при ж = 1, t = In 2 при х = 2, то 2 In 2 lux— = I tat = — X 0 In 2 = i In2 2. 7Г 2) Рассмотрим интеграл / sin^/ж^^. Пусть х = t2. Тогда 7Г2/4 = тг2/4 при t = тг/2, х = тг2 при t = тг. Поэтому 7г/2 7Г ?=2. 2 4. Формула интегрирования по частям. Пусть функ- функции и(х) и v(x) имеют непрерывные производные на сегменте [а, Ь]. Тогда имеет место следующая формула интегрирования по частям для определенных интегралов: u(x)vf(x) dx = [u(x)v(x)]\ba - / v(x)u(x) dx. A0.23) Так как v'(x) dx = dv и uf(x) dx = du, то эту формулу записы- записывают еще следующим образом: ь ъ [udv = [uv]\ba - fvdu. A0.24) a a В справедливости этих формул убедиться нетрудно. Действи™ тельно, функция u(x)v(x) является первообразной для функции
358 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 u(x)vf(x) + v(x)u''(x). Поэтому, в силу A0.19): ь [u{x)v'{x) +v(x)ur(x)]dx = [u(x)v(x)] Отсюда, используя свойство 3° определенных интегралов (см. § 5), мы и получим формулы A0.23) и A0.24). Примеры. 2 2 1) / Inxdx = ж In ж l 2 2 — \x\nx — х] = 21п2 — 1, х 1 2) I xex dx = xea l l l f 3) I arctg xdx = x arctg ж о х dx = J-In л/2. 5. Остаточный член формулы Тейлора в интеграль- интегральной форме. Применим формулу A0.23) для вывода формулы Тейлора функции f(x) с остаточным членом в интегральной форме. Пуств функция f(x) имеет в некоторой ^окрестности точки а непрерывную производную (п + 1)-го порядка, и пуств х — любая данная точка из этой 6-окрестности. Убедимся, что число X -t)ndt A0.25) является остаточнвш членом формулв! Тейлора для функции f(x) с центром разложения в точке а. Таким образом^ формула A0.25) дает представление остаточного члена формулы Тей- Тейлора для функции }'{х) в интегральной форме. Для доказательства заметим, что f'(t)dt. К интегралу J ff(i)dt применим формулу A0.23) интегрирова™ а ния по частям, полагая u(t) = ff(t) л v(t) = —(х — t) (так как х
§ 7 СУЩЕСТВОВАНИЕ ПЕРВООБРАЗНОЙ 359 фиксировано, то v'dt = dt). Имеем X f'(t) dt = -f'(t){x -t)X+ f f"(t)(x -t)dt = a a x = f'(a)(x-a) + Jf"(t)(x-t)dt. Подставляя найденное выражение для J fr(t)dt в приведенную а выше формулу для /(ж), получим X f{x) = /(а) + /'(а)(х - а) + j f"(t)(x - t) dt. a x К интегралу J f"(t)(x — t) dt также можно применить формулу а интегрирования по частям, полагая u(t) = fff(t) и v(t) = — - (ж— — iJ (так как х фиксировано, то v'dt = (x — t) dt). После неслож- несложных преобразований найдем X Jf'(t)(x-t)dt = ^(x-aJ + ± a и поэтому f(x) = f(a) + m(x-a) + ^(x-af + ±f f^{t){x - tfdt. a Дальнейшее интегрирование по частям будем производить до тех пор, пока не придем к формуле f{x) = fia) + Ш(Ж - а) + ^ix - а 2 Эта формула показывает, что Rn+i(x) действительно являет- является остаточным членом формулы Тейлора для функции f(x) с центром разложения в точке а (см. § 13 гл. 8). Используя инте™ тральную форму A0.25) остаточного члена формулы Тейлора,
360 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 легко получить остаточный член формулы Тейлора в форме Ла™ гранжа. Именно по обобщенной форме A0.15) формулы средне- среднего значения получим nl a Rn+1(x) = 1 / f{n+1)(t)(x - t)ndt = /П^@ I (x- t)ndt = ]-{x-a) (n+l)! Полученное выражение и представляет собой остаточный член в форме Лаграыжа1) (см. формулу (8.46) из § 14 гл. 8). ДОПОЛНЕНИЕ 1 НЕКОТОРЫЕ ВАЖНЫЕ НЕРАВЕНСТВА ДЛЯ СУММ И ИНТЕГРАЛОВ 1. Вывод одного предварительного неравенства. Пусть А и В — любые неотрицательные числа, арир — любые два числа, оба превосхо- превосходящие единицу и связанные соотношением —| = 1 (такие числа будем р р' называть сопряженными). Тогда АВ <С — + —. A0.26) р р' Найдем максимальное значение функции /(ж) = ж p -— х/р на полупрямой х ^ 0. Поскольку /(ж) = -(х1/р^г - 1)= ™(ж^1/р' - 1), то f(x) > 0 при 0<х<1и/(ж)<0 при х > 1. Поэтому функция имеет максимум в точке х = 1, причем ее максимальное значение /A) = 1 — — = -—-. Итак, для всех р р1 х ^ 0 р ^ р1' Положив в последнем неравенстве ж = АРВР 2) и умножив обе части этого неравенства на Вр , получим неравенство A0.26). ) Отметим, что при указанном выводе остаточного члена в форме Ла- Лагранжа на производную (в + 1)-го порядка накладываются несколько боль- большие ограничения, чем в § 14 гл. 8. Однако, если использовать доказанную в конце гл. 9 теорему Дарбу (о прохождении производной через все промежу- промежуточные значения), то получим остаточный член в форме Лагранжа лишь при условии существования и интегрируемости f^n+l\x). ) Здесь мы считаем, что 1? > 0, ибо при В = 0 справедливость неравен- неравенства A0.26) не вызывает сомнений.
ДОПОЛНЕНИЕ 1 361 2. Неравенство Гёльдера1) для сумм. Пусть ai,a2,... ,an и 61,62,-•• , 6те — какие угодно неотрицательные числа, а р и р' имеют тот же смысл, что и выше. Тогда справедливо следующее неравенство: (Ю.27) которое называется неравенством Гёльдера для сумм. Докажем сначала, что если Ai,A2,... , Ап; Bi, ?»2, • • • , ?»п — какие угод- угодно неотрицательные числа, удовлетворяющие неравенствам A0.28) г=1 г=1 то для этих чисел справедливо неравенство Y^AiBi^l. A0.29) В самом деле, записывая для всех пар чисел Ai и В% неравенства A0.26) и суммируя эти неравенства по всем г от 1 до п, получим Тем самым неравенство A0.29) доказано. Положим теперь Л - .?"¦ Легко видеть, что числа Aj и i?f удовлетворяют неравенствам A0.28), а поэтому для этих чисел справедливо неравенство A0.29), которое в данном случае можно записать так: И 1/?' Из последнего неравенства вытекает неравенство Гёльдера A0.27). Замечание. В частном случае р = р1 = 2 неравенство Гёльдера переходит в следующее неравенство: г = 1 Л (ю.зо) ) Гёльдер A859—1937) — немецкий математик. ) Мы считаем, что хотя бы одно из чисел а% и хотя бы одно из чисел Ь% отличны от нуля, ибо в противном случае формула A0.27) доказательства не требует.
362 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 Неравенство A0.30) называется неравенством Буняковского1) для сумм. 3. Неравенство Минковского2) для сумм. Пусть ai,a2,... ,a,n', &i, &2, • • • ,Ьп — какие угодно неотрицательные числа, а число р > 1. Тогда справедливо следующее неравенство: Vp г п I 1/р ?"¦] называемое неравенством Минковского для сумм. Прежде всего преобра- преобразуем сумму, стоящую в левой части A0.31). Можно записать п п п \T~"V к \р \ л ( к \р~^- \ л к ( к \р~^- г = 1 г = 1 г = 1 К каждой из сумм, стоящих в правой части, применим неравенство 1 р —- 1 Гёльдера. При этом, так как (р — 1)р =ри ~ = , получим 1/р р-1/р [те -IP-1/P J^ (ai + bi)p\ , получим неравенство Минковского A0.31). 4. Интегрируемость произвольной положительной степени мо- модуля интегрируемой функции. Докажем следующую теорему. Теорема 10.7. Если функция /(ж) интегрируема на сегменте [а, 6], то и функция |/(ж)|г, где г — любое положительное вещественное число, тактсе интегрируема на сегменте [а, 6]. Доказательство. Достаточно доказать теорему для случая г < 1, ибо если г > 1, то функцию |/(ж)|г можно представить в виде произведения |/(яО| |/(ж)|г , гДв [г] — целая часть г, а г -— [г] < 1. В силу замечания 2 п. 1 § 6 функция |/(ж)| интегрируема на сегменте [а, 6], а поэтому, в силу свойства 3° § 5, функция |/(ж)рг-' интегрируема на этом сегменте. Но тогда, iir/ мг —Гг1 1 в силу того же свойства и интегрируемости функции |/ \х)\ , функция |/(ж)|г также интегрируема на сегменте [а, 6]. Итак, докажем теорему для случая г < 1. Положим г = 1/р и заметим, что р > 1. Так как функция |/(ж)| интегрируема на сегменте [а,Ь], то для любого е > 0 найдется такое г) Виктор Яковлевич Буняковский A804-1889) — русский математик. 2) Герман Минковский A864-1909) — немецкий математик и физик.
ДОПОЛНЕНИЕ 1 363 разбиение Т этого сегмента, для которого п ]Г(Мг - тг)Ахг < ер(Ь - а) A0.32) Здесь через Mi и mi обозначены точные грани функции |/(ж)| на частичном сегменте [жг—1,Жг]. Достаточно доказать, что сумма S-s = A0.33) меньше е. Оценим эту сумму с помощью неравенства Гель дера A0.27), полагая в нем аг = (М?/р - пг1г/р)(АхгI/р1 Ьъ = (АхгI/р\ Получим [ Докахсем теперь, что [Мгг/Р - гп]1р)р <: (Mi - гты). A0.35) Последнее неравенство посредством деления на Mi г) приводится к сле- следующему: / В справедливости последнего неравенства легко убедиться, учитывая, что 0 ^ yt ^ 1' а Р ^ ¦'¦• Используя неравенство A0.35) и учитывая, что Mi г = 1 мы получим из неравенства A0.34) следующее неравенство: Отсюда, используя неравенство A0.32) и учитывая, что 1/р + 1/j/ = 1, найдем Теорема доказана. 5. Неравенство Гёльдера длм интегралов. Пусть /(ж) и g(#) — любые две интегрируемые на сегменте [а, Ь] функции, арир — любые два числа, оба превосходящие единицу и связанные соотношением 1/р + 1/р = = 1. Тогда справедливо следующее неравенство: о / f(x)g(x)dx 1/р J\f(x)\pdx J\g(x)\p'dx A0.36) 1) Можно считать, что Mi > 0, ибо если Mi = 0, то rrii = 0, и неравенство A0.35) справедливо.
364 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 называемое неравенством Гёльдера для интегралов. Отметим, что суще- существование интегралов в правой части неравенства A0.36) гарантируется теоремой 10.7, а интеграла в левой части — свойством 3° § 5. Докажем сначала, что если А(х) и В(х) — две неотрицательные и инте- интегрируемые на сегменте [а,Ь] функции, удовлетворяющие неравенствам ь ь Г Ap(x)dx^l1 Г Bp\x)dx^l, A0.37) о J A{x)B{x) A0.38) В самом деле, в любой точке х сегмента [а, 6] справедливо неравенство A0.26) Отсюда, в силу оценки 3° из § 6 и формул A0.37) следует, что ъ ь ъ [ А(х)В(х) dx^^- [ Ар(х) dx + — Г Вр' (x)dx^- + — = l. J Р J p' J P P' Неравенство A0.38) доказано. Полагая А{х) = \№\ [/|/(ar)|"darj мы придем к следующему неравенству: :, В{х) = \g(x)\ f\g(x)\v'dx / \f(x)\\g(x)\dx^ 1/Р J\f(x)\pdx j\g(x)fdx l/pf Так как, в силу замечания 2, п. 1 § 6, ъ ъ jf{x)g(x)dx ^ J \f(x)\\g(x)\dx, то неравенство Гёльдера A0.36) для интегралов установлено. Замечание. В частном случае р = р = 2 неравенство Гёльдера для интегралов переходит в следующее неравенство: о о о J f{x)g{x)dx < j\f(x)\*dx J\g{x)\*dx, a ) о \ а называемое неравенством Коши-Буняковского для интегралов. A0.39)
ДОПОЛНЕНИЕ 2 365 6. Неравенство Минковского для интегралов. Для любых неотри™ цательных и интегрируемых на сегменте [а, 6] функций /(ж) и g(x) и для любого числа р > 1 справедливо следующее неравенство: f{x)dx 1/р о Jgp(x)dx 1/р , A0.40) называемое неравенством Минковского для интегралов. Для получения этого неравенства нужно исходить из формулы [f{x)+g{x)Y'dx = If{x)[f{x)+g{x)Y'-1dx и применить неравенство Гель дера к интегралам, стоящим в правой части этой формулы. Детали рассуждений предоставляем читателю. По индукции из неравенства A0.40) можно получить следующее нера- неравенство для п функций fi(x), /2(ж), .. ., /п(ж), неотрицательных и интегри- интегрируемых на сегменте [а, 6]: b f fn{x)dx 1/p ДОПОЛНЕНИЕ 2 ДОКАЗАТЕЛЬСТВО УТВЕРЖДЕНИЯ ИЗ П. 4 § 6 Для удобства сформулируем еще раз утверждение из п. 4 § 6. Если на сегменте [а, Ь] функция g(x) монотонна, а /(ж) интегрируема, то на этом сегменте существует такое число ?, что f{x)g{x)dx = g{ f{x)dx f{x)dx. A0.16) г) Предварительно докажем следующее вспомогательное предложение. ) Лем,м,а Абеля2). Пусть v\ S V2 0 и ui,U2,... ,ип — любые числа. Если суммы Si = и\ + U2 + • • • + щ при любом г заключены между А и В, то сумма viui -\-v2U2-\-• • .-\~vntin заключена между числами Av\ и Bv\. Доказательство. Имеем щ = Si, щ = Si — Si-i. Поэтому 2 — Si) + ... + vn(Sn — Sn-i) = - V3) + • • • + Sn-l(vn-l - Vn) + S V2U2 + ... + vnun = viSi + = Sl(vi - V2) + S Х) Для удобства мы сохраняем нумерацию приведенной формулы. 2) Нильс Генрих Абель A802—1829) — норвежский математик.
366 ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ГЛ. 10 Так как v% ^ 0 и v% —Vi+i ^ 0, то, заменяя в последнем соотношении каждое Si сначала на А, а потом на В, получим неравенства A[(vi - v2) + (v2 ~~ v3) + • • • + (vn-i ~~ vn) + vn] ^ v\ui + v2u2 + ... + vnun ^ ^ B[(V1 - V2) + (V2 ~ V3) + • • • + (Vn-i - Vn) + Vn]. Отсюда, замечая, что выражения в квадратных скобках равнв! i?i, получим Av\ ^ vitti + V2U2 + ... + vnun ^ Bv\. Лемма доказана. Замечание. При доказательстве леммы Абеля мы использовали преобразование суммы Y2 vkUk, которое обычно называют \ k=i Абеля. Более полные сведения о преобразовании Абеля и важные примене™ ния этого преобразования можно найти в п. 2 § 5 гл. 13. Доказательство утверждения из п. 4 § 6. Допустим, что функция g(x) не возрастает на [а,Ь] и неотрицательна на этом сегменте. Имеем, в силу интегрируемости f(x)g(x) 1), J f(x)g(x)dx = lim У^ f(xi-i)g(xi-i)Axi, где А = Пусть Mi и mi — точные грани /(ж) на [жг-1,Жг]. Тогда, поскольку g(x) неотрицательна, справедливы неравенства п п п ^migixi-^Axi ^ ^/(xi-^gixi-^Axi ^ ^ Мгё(хг^)Ахг. A0.41) г = 1 г = 1 г = 1 Так как g(x) не возрастает на [а, 6], то разность не превышает числа g(a) ^(Mi — rrii)Axi. Поскольку функция /(ж) инте™ f = l п п грируема, сумма Yl (Mi —nii)Axi = Yl ^iAxi стремится к нулю при А —»¦ 0. г=1 г=1 Отсюда и из неравенств A0.41) вытекает, что для любых чисел /if, удовле- удовлетворяющих неравенствам mi ^ /if ^ Mj, каждая из сумм п тг п *S^ mig(xi-\)Axi, *S^ u,ig(xi-i)Axi, \^ Mig(xi^i)Axi ъ имеет своим пределом при А —»¦ 0 интеграл J f(x)g(x) dx. Согласно форму- а ле A0.12) числа /if, mi ^ /if ^ iWf, мож:но выбрать так, что J f(x)dx = X = ^Аж^ Так как функция F(x) = J f(t)dt непрерывна на сегменте [а, 6] х) См. свойство 3° § 5.
ДОПОЛНЕНИЕ 2 367 (см. замечание 3 п. 1 § 7), то числа Si = ^ /1^Аж^ = J f(t)dt заключе™ k = l a ны между точной нижней гранью тп и точной верхней гранью М функции F(x) на сегменте [а, 6]. Положим v\ = g(a), V2 = g(xi), ..., vn = g(xn~i), u\ = /iiAsci, ..., un = finAxn. Так как vi ^ ^2 ^ • • • ^ vn ^ 0 и сум- мы Si = J^ ^fe заключены между m и М", то, в силу леммы Абеля, сумма k=i п S я(ж^1)м^жг заключена между mg(a) и Mg(a). Но тогда и предел при г = 1 А —-> 0 этой суммы заключен между mg(a) и ilfg"(a), т. е. справедливы неравенства ъ (а)т ^ / f(x)g(x)dx ^ g(a)M. Непрерывная функция F(x) = J /(t) dt принимает любое значение А, за™ a ключенное между ее точными гранями т и М, т. е. найдется такая точка ?, что Поэтому J /(x)g (ж) dx = g (a) J /(s) dx. A0.42) a a Если невозрастающая функция g(x) имеет и отрицательные значения, то функция h{x) = g{x) —g(b) невозрастающая и имеет неотрицательные зна- значения. Поэтому, в силу A0.42), Отсюда путем несложных преобразований мы и получим формулу A0.16).
ГЛАВА 11 ГЕОМЕТРИЧЕСКИЕ И ФИЗИЧЕСКИЕ ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА § 1. Длина дуги кривой 1. Понмтие плоской кривой. Наиболее естественно рас™ сматривать кривую как след движущейся точки. В этом пункте мы придадим этому представлению о кривой математический смысл и введем понятие так называемой простой кривой. Пусть функции ip(t) и ф{Ь) непрерывны на сегменте [а,/3] (аргумент этих функций в дальнейшем будем называть параметром). Если рассматри™ вать параметр t как время, то указанные функции определи™ ют закон движения точки М с У о x=cp(t) координатами а A1.1) Рис. 11.1 по плоскости (рис. 11.1) 1). Множество {М} точек М, отвечаю- отвечающих всевозможным значениям параметра t из сегмента [а, /3] естественно рассматривать как след точки М, движущейся по закону A1.1). Отметим, что множество {М}, представляющее собой след движущейся точки, может не соответствовать нашим наглядным представлениям о кривой. Можно, например, ука- ) Здесь и в дальнейшем мы будем называть плоскостью совокупность всевозможных упорядоченных пар (ж, г/) чисел жиг/ (каждую такую пару мы будем называть точкой плоскости). Числа ж и у называются координа- координатами точки (ж, г/). Для краткости мы будем также обозначать точку (ж, г/) одной буквой М. Запись М(х,у) означает, что точка М имеет координаты х и у.
ДЛИНА ДУГИ КРИВОЙ 369 зать такие непрерывные функции ip(t) и ^(i), заданные на сет- менте [0,1], что след точки М, движущейся по закону х = <р(?), у = t^(i), будет заполнять целый квадрат. Поэтому естественно выделить такие множества {М}, которые соответствуют нашим наглядным представлениям о кривой. Таким образом, мы при™ ходим к понятию простой кривой. Множество {М} всех точек М, координаты х и у кото- которых определяются уравнениями A1.1), будем называть про- простой плоской кривой L, если различным значениям параметра t из сегмента [а, /3] отвечают различные точки этого множе- ства. Мы будем также употреблять следующую терминологию: «уравнения A1.1) определяют простую плоскую кривую L» и «простая плоская кривая L параметризована при помощи урав- уравнений A1.1)». Каждую точку множества {М}^ фигурирующего в определе- определении простой плоской кривой, мы будем называть точкой этой кривой, причем точки, отвечающие граничным значениям а и /3 параметра i, будем называть граничными точками простой кривой. Примером простой кривой может служить график непрерыв™ ной на сегменте [а, /3] функции у = f(x). В самом деле, этот гра- график можно рассматривать как след точки М, движущейся по закону х = t, у = /(?), a ^t ^ ^ причем, очевидно, различным значениям параметра t отвечают различные точки графика. Замечание 1. Простые кривые не исчерпывают всех точечных множеств, заслуживающих наименования «кривая». Однако для наших целей достаточно понятия простой кривой. Замечание 2. Одна и та же простая кривая L может быть параметризована различными способами. Мы будем рас- рассматривать всевозможные параметризации простой кривой L, получающиеся из данной параметризации путем представления параметра t в виде непрерывных строго монотонных функций другого параметра s. Замечание 3. Важным понятием является понятие простой замкнутой кривой. Такая кривая образуется следую- следующим образом. Пусть L\ и L2 — две простые кривые, причем: 1) граничные точки кривой L\ совпадают с граничными точка- точками кривой L2] 2) любые не граничные точки кривых L\ и L2 различны. Кривая L, полученная объединением кривых L\ и L2 и называется простой замкнутой кривой. 2. Параметрическое задание кривой. В математическом анализе и его приложениях удобно рассматривать кривые, за- задаваемые параметрически. Наглядными истоками такого спо- способа задания кривой служит представление о кривой как о геометрическом месте последовательных положений движу-
370 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 щейся точки. Например, геометрическое место последователь™ пых положений точки М с координатами х и у, движущейся по закону х = а- ^оо < t < оо, A1.2) представляет собой кривую, называемую строфоидой (рис. 11.2). Заметим, что движущаяся по строфоиде точка М попадает в одно и то же положение х = 0, у = О дважды при t = -1 и t = 1. Так как мы рассматриваем последовательные по- положения движущейся точки, то естествен- естественно считать различными точки строфоиды, отвечающие различным значениям пара- параметра t. Строфоида не является простой кри- кривой. Нетрудно, однако, убедиться, что область изменения параметра t молено разбить на части таким образом, что соот- соответствующие части строфоиды будут про- простыми кривыми. Именно, разобьем число- числовую прямую ^оо < t < оо на сегменты [п — 1, п], где п — любое целое число. Оче- Рис. 11.2 видно, если мы будем рассматривать пара- параметр t на таком сегменте, то соответствующая часть строфоиды будет простой кривой. Мы воспользуемся этой идеей разбиения на части для мате- математического определения понятия кривой, задаваемой парамет- параметрически. Будем считать, что множество {t} представляет собой либо сегмент, либо полусегмент, либо интервал, либо числовую пря- прямую, либо открытую или замкнутую полупрямую. Введем понятие разбиения множества {?}. Будем говорить, что конечная или бесконечная система сегментов {[?г-ъ^г]} раз- разбивает множество {?}, если: 1) объединение всех этих сегментов представляет собой все множество {?} и 2) общими точками лю- любых двух сегментов системы могут быть лишь их концы. Рассмотрим примеры разбиений некоторых из указанных вы- выше множеств {?}. 1. Система сегментов [0, 1/3], [1/3, 2/3], [2/3, 1], очевидно, разбивает сегмент [0,1]. 2. Система сегментов [0,1/2], [1/2,3/4], [3/4,7/8], ... [суП -| лП + 1 -I "I —и—' —^+1— > ''' Разбивает полусегмент [ОД). 3. Система сегментов {[п — 1, п]}, где п — любое целое число, очевидно, разбивает всю числовую прямую.
ДЛИНА ДУГИ КРИВОЙ 371 Перейдем теперь к определению понятия кривой, задаваемой параметрически. Пусть функции ip(t) и ip(t) непрерывны на множестве {t} г). Будем говорить, что уравнения x = <p{t), у = №) A1.3) задают параметрически кривую L, если существует такая си- система сегментов {[^_i,^]}, разбивающих множество {?}, что для значений t из каждого данного сегмента этой системы уравнения A1.3) определяют простую кривую. При этом точки кривой L рассматриваются в определенном порядке в соответствии с возрастанием параметра t. Именно, если точка Mi соответствует значению параметра ii, а точка М~2 — значению #2, т0 М\ считается предшествующей М~2, если t\ < #2- Отметим, что точки, отвечающие различным значени- значениям параметра^ всегда считаются различными. Иными словами, кривую, задаваемую параметрически, мож- можно рассматривать как объединение простых кривых, причем эти простые кривые последовательно пробегаются точкой Ж, коор- координаты которой определяются соотношениями A1.3), когда па- параметр t монотонно пробегает множество {?}. Замечание 1. Простую кривую можно рассматривать как кривую, заданную параметрически. В этом случае система сегментов, разбивающих сегмент [а, /3], сводится к одному этому сегменту. В качестве примера рассмотрим кривую L, задаваемую па- параметрически уравнениями х = cost, у = sint, A1-4) где t изменяется на сегменте [0,4тг]. Очевидно, система сегмен- сегментов [0, тг], [тг, 2тг], [2тг, Зтг], [Зтг,4тг] разбивает сегмент [0,4тг], при- причем для значений t из каждого указанного сегмента данной системы уравнения A1.4) определяют простую кривую (полу- (полуокружность). Наглядно ясно, что в рассматриваемом примере кривая L представляет собой дважды обходимую окружность. Замечание 2. Рассмотренный пример и пример строфои- строфоиды показывают, что кривая, задаваемая параметрически, может иметь точки самопересечения и даже целые участки самонале- самоналегания. Замечание 3. В случае кривой, задаваемой пара- параметрически при помощи уравнений A1.3), мы будем также го- говорить о параметризации указанной кривой при помощи этих уравнений. Одна и та же кривая L может быть параметри- параметризована различными способами. Мы будем рассматривать все- 1) Множество {?} представляет собой одно из указанных выше множеств.
372 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 возможные параметризации кривой L, получающиеся из лю- любой данной параметризации путем представления параметра t в виде непрерывных, строго возрастающих функций друго- другого параметра s. Отметим, что лишь при таких преобразо- ваниях параметра сохраняется порядок следования точек на кривой L. 3. Понятие пространственной кривой. Понятие про- пространственной кривой вводится в полной аналогии с понятием плоской кривой. Первоначально вводится понятие простой про- пространственной кривой как множества {М} точек пространства, координаты ж, у и z которых определяются уравнениями A1.5) при условии непрерывности функций </?(?), ip(t), x(t) и условии несовпадения точек множества {М}, отвечающих различным значениям параметра t. Понятие простой пространственной кривой и понятие разбие- разбиения множества {?} изменения параметра, так же как и в плоском случае, приводят к понятию пространственной кривой, задава- задаваемой параметрически уравнениями A1.5) при условии монотон- монотонного изменения параметра t на множестве {?}. Отметим, что вся тер- 2/| 1уГ_ пж минология, введенная в предыдущих пунктах, ес- естественным образом пере- переносится на пространствен- пространственные кривые. 4. Понятие длины дуги кривой. В этом пункте мы введем понятие длины дуги кривой, задан- заданной параметрически. Пусть кривая L задает- задается параметрически уравне- уравнениями A1.3) х = <?>(?), у = щ - -<jb- 1У- У I I I I i 1 w i /7 i [/ i хо^^ i i i\ i i /У 1 1 . ф(t0) to f 112 tn Рис. 11.3 где параметр t изменяется на сегменте [ск,/3]. Пусть Т — произволь- произвольное разбиение сегмента [а, /3] точками а = to < t\ < t^ < • • • ,,, < tn = /3. Обозначим Mq, Mi, M2, ... , Mn соответствующие точки кривой L (рис. 11.3). Возникающую при этом ломаную
ДЛИНА ДУГИ КРИВОЙ 373 MqM\M2 ... Мп будем называть ломаной1), вписанной в кри™ вую L и отвечающей данному разбиению Т сегмента [а,/3]. Так как длина 1{ звена М.\—\М.{ этой ломаной равна то длина J(ti) всей этой ломаной равна п п Ци) = $> =? У/Ыи) - Фг-г)]2 + №U) - ^-i)]2- A1.6) г=1 i=l Определение. Если множество {l(ti)} длин вписанных в кривую L ломаных^ отвечающих всевозможным разбиениям Т сегмента [а,/3], ограничено^ то кривая L называется спрямляемо й, а точная верхняя грань I множества {l(ti)} называется длиной дуги кривой L. Замечание 1. Из определения кривой L, заданной пара™ метрически, и определения длины дуги I такой кривой следует, что длина I положительна, I > 0. Замечание 2. Существуют неспрямляемые кривые. В дополнении к этой главе мы приведем пример плоской кривой, любая часть которой неспрямляема. В дальнейшем мы будем часто пользоваться следующей леммой. Лемма. Пусть 1 (U) — длина ломаной^ вписанной в кри- кривую L и отвечающей разбиению Т* сегмента [а,/3], а 1{и) — длина ломаной^ вписанной в кривую L и отвечающей разбие- разбиению Т, полученному из разбиения Т* посредством добавления нескольких новых точек. Тогда I (ti) ^ l(U). Доказательство. Очевидно, достаточно рассмотреть случай, когда к разбиению Т* добавляется одна точка 7- Лома™ ная, отвечающая разбиению Т, отличается от ломаной, отвечаю- отвечающей разбиению Т*, лишь тем, что одно звено Mi-\Mi заменяется ) Будем называть прямой линию, определяемую параметрическими уравнениями х = at + 6, у = ct + d. Постоянные a, 6, с и d заведомо можно выбрать так, чтобы прямая проходила через две данные точки М\{х\,у\) и М2(ж2,1/2)- Участок прямой между точками М\ и М2 естественно назвать отрезком, а совокупность конечного числа примыкающих друг к другу от- отрезков естественно назвать ломаной. 2) Мы использовали формулу для расстояния между двумя точками Mi-i и Mf, координаты которых равны соответственно Xi-i=(f{ti-i), Уъ-1 = 1p(ti-l) И Xi = <p(U), Уг=ф(и).
374 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 двумя звеньями М.{—\С и С Mi (С — точка кривой, соответствую ющая значению j параметра t). Так как длина стороны М{-\М{ треугольника Mi-\CMi не превосходит суммы длин двух других его сторон l) M^iC и С Mi, то Т (U) ^ 1{и). Перечислим некоторые свойства спрямляемых кривых: 1°. Если кривая L спрямляема, то длина I ее дуги не зависит от параметризации этой кривой. 2°. Если спрямляемая кривая L разбита при помощи конеч- конечного числа точек Mq, М\, ••• •> ^п2) ^а конечное число кри~ вых Li, то каждая из этих кривых Li спрямляема и сумма длин li всех кривых Li равна длине I кривой L. 3°. Пусть кривая L задана параметрически уравнениями A1.3). Обозначим l(t) длину дуги участка Lt кривой L, точки которого определяются всеми значениями параметра из сег- сегмента [а, ?]. Функция l(t) является возрастающей и непрерыв- непрерывной функцией параметра t. Эту функцию I = l(t) будем назы- называть переменной дугой на кривой L. 4°. Переменная дуга I может быть выбрана в качестве пара- параметра. Этот параметр называется натуральным параметром. Справедливость свойства 4° непосредственно вытекает из свойства 3°. В самом деле, так как переменная дуга I = l(t) является возрастающей и непрерывной функцией параметра t, то и параметр t может быть представлен в виде монотонной и непрерывной функции t = /(I) переменной дуги I, и поэтому переменная дуга I может быть выбрана в качестве параметра. Доказательство свойств 1°— 3°. 1°. Пусть имеются две параметризации кривой L, a t и s — парамет- параметры этих параметризаций, определенные соответственно на сегментах [а, /3] и [а, 6]. Так как t представляет собой строго монотонную и непрерывную функцию от s, a s — строго монотонную и непрерывную функцию от t, то каждому разбиению Т сегмента [а, /3] соответствует определенное разбие- разбиение Р сегмента [а,Ь] и наоборот. Очевидно, что вписанные в L ломаные, отвечающие соответствующим разбиениям сегментов [о,/3] и [а,Ь], тожде- тождественны, и поэтому их длины l(ti) и l(si) равны. Следовательно, множества {l(ti)} и {/(si)} тождественны. Отсюда вытекает, что длина дуги кривой не зависит от параметризации этой кривой. 2°. Очевидно, свойство 2° достаточно доказать для случая, когда кри™ вая L разбита точкой С на две кривые L\ ш L2. Обозначим j значение пара- параметра t, которому отвечает точка С. Тогда точки кривой L\ соответствуют значениям параметра t из сегмента [a, j], а точки кривой 1/2 соответствуют значениям параметра t из сегмента ру?/^]- Пусть Т\ ж Т2 — произвольные разбиения указанных сегментов, а Т — разбиение сегмента [а, /3], получен- ) Этот геометрический факт легко может быть доказан чисто аналити™ ческим способом. ) При этом точки Mo, -Mi,... , Мп соответствуют значениям to, ti,... , tn параметра t, удовлетворяющим условиям а = to < ti < ... <tn = p.
ДЛИНА ДУГИ КРИВОЙ 375 ное объединением разбиений Т\ и Тг. Если l\(ti), /2(^1) и К^О — длины ломаных, вписанных в кривые Li, L2 и L и отвечающих разбиениям Ti, T2 и Т указанных выше сегментов, то очевидно h(ti) + h(ti) = KU). A1.7) Поскольку числа fi(ii), 7г(^г) и I(ti) положительны, то из равенства A1.7) и спрямляемости кривой L следует, что множества iji(ti)} и {Ь(^г)} длин впи- вписанных в кривые h\ и 1/2 ломаных, отвечающих всевозможным разбиениям сегментов [0,7] и hs/^L ограничены, т. е. кривые L\ и ?<2 спрямляемы. От- Отметим, что из равенства A1.7) и из определения длины дуги кривой следует, что длины Ii, /2 и I дуг кривых Li, Ьг и L удовлетворяют неравенству х) h+h^l A1.8) Предположим, что /i + I2 < /. Тогда число l-(li+!2) = e A1.9) положительно. Из определения длины I дуги кривой L вытекает, что для положительного числа е можно указать такое разбиение Т сегмента [а, /3], что длина I (ti) ломаной, вписанной в кривую L и отвечающей этому раз- разбиению, удовлетворяет неравенству I —I (ti) < е. Добавим к разбиению Т* точку 7 и обозначим полученное разбиение через Т. Тогда, в силу леммы этого параграфа, длина 1(U) ломаной, отвечающей разбиению Т, удовлетво- удовлетворяет неравенству l — l(ti) < е. Так как разбиение Т сегмента [a, f3] образовано объединением некоторых разбиений Ti и Т2 сегментов [а, 7] и [7? /^]? т0 Дли™ ны l\(ti) и 12(ti) ломаных, отвечающих этим разбиениям, удовлетворяют соотношению A1.7). Поэтому справедливо неравенство I — [Ii(tf) Ч-7г(^г)] < < е. Так как l\(ti) + I2(^г) ^ /i + /2, то тем более справедливо неравенство I — (h + h) < s. Но это неравенство противоречит равенству A1.9). Поэто- Поэтому предположение, что h + h < I, неверно, а следовательно, в силу A1.8), h + I2 = I- Справедливость свойства 2° установлена. 3°. Из свойства 2° и замечания 1 этого пункта следует, что переменная дуга I = l(t) является строго возрастающей положительной функцией па- параметра t. Для доказательства непрерывности функции l(t) воспользуемся следующими утверждениями: 1) Пусть г — любое фиксированное положительное число, t — произ- произвольная точка сегмента [а,/9], а М — соответствующая точка кривой L. Существует такая ломаная, вписанная в кривую L, которая имеет точ- точку М своей вершиной и длина которой отличается от длины кривой L меньше чем на е/2. 2) Указанная ломаная моэюет быть выбрана так, что длина каждого ее звена будет меньше е/2. 3) Пусть ломаная выбрана так, как указано в утверждениях 1) и 2). Тогда часть кривой L, стягиваемая любым звеном рассматриваемой ло- ломаной, имеет длину меньше е. "Убедимся, что из сформулированных утверждений и монотонности функции l(t) вытекает ее непрерывность в любой фиксированной точке t ) Из равенства A1.7) вытекает, что для любых разбиений Т± и Т^ сег- сегментов [а, 7] и [7, Р] справедливо неравенство l\(ti) + /2(^1) ^ I- Отсюда и из определения точной верхней грани получим неравенство A1.8).
376 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 этого сегмента (в точках а и /3 функция I(t) непрерывна соответственно справа и слева). Нам нужно доказать, что для любого е > 0 можно указать такое 8 > О, что при \Ab\ < ё выполняется неравенство Рассмотрим то разбиение Т сегмента At) - l(t)\ которому отвечает лома- ломаная, обладающая перечисленными в утверждениях 1) и 2) свойствами. Обо- Обозначим через S минимальную из длин двух частичных сегментов [tk-i,tk], [tk,tk+i] разбиения Т, примыкающих к точке t = tk сегмента [а,/3]. Пусть приращение At аргумента удовлетворяет условию \At\ < 8. Ради опреде- определенности будем считать, что At > 0. Так как t <, t -{- At < t + 8 ^ t^+i, то в силу строгого возрастания функции l(t) справедливы неравенства !(t) < l(t + At) < !(t + 8) ^ I(tfc+i). В силу утверждения 3 справедливо неравенство Отсюда и из предыдущих неравенств вытекает, что при 0 < At < 8 спра- справедливо неравенство l(t + At) - !(t) < е. Случай At < 0 рассматривается аналогично. Перейдем теперь к доказательству утверждений 1), 2) и 3). Доказательство утверждения 1). Пусть е — любое фик- фиксированное положительное число. Так как длина 1(/3) всей кривой L, опре- определяемой параметрическими уравнениями A1.3), является точной верхней гранью длин вписанных в эту кривую ломаных, отвечающих всевозможным разбиениям сегмента [а,/3], то для данного е > 0 можно указать такое раз- разбиение Т** сегмента [а,/3], для которого длина соответствующей ломаной, вписанной в кривую L, отличается от 1{/3) меньше чем на е/2. Добавим к разбиению Т** точку t. В силу леммы этого параграфа и определения дли- длины дуги длина ломаной, отвечающей полученному разбиению Т* сегмента [а,/3], отличается от 1(/3) меньше чем на е/2, и эта ломаная имеет своей вершиной точку М кривой, которая соответствует точке t сегмента [а,/3]. Доказательство утверждения 2). Так как непрерыв- непрерывные на сегменте [а, /3] функции ip(t) и tp(t) равномерно непрерывны на этом сегменте, то по заданному е > 0 можно указать такое 6 > 0, что для лю- любого разбиения Т сегмента [ск,/3] с длинами частичных сегментов [ti-i,ti], меньшими <5, выполняются неравенства \(p(ti) — ip(ti—\)\ < , \i/j(ti) — 2V2 — ip(ti-i)\ < —-=. Поскольку длина li звена ломаной, отвечающей данно- 2у2 му разбиению, равна y/[(f(U) — Lp(ti^i)}2 + [ip(ti) ~~ -0(ti-— i)]2, то, очевидно, li < е/2. Рассмотрим теперь любое фиксированное разбиение Т! сегмен- сегмента [а, /3] с длинами частичных сегментов, меньшими 8, и добавим к нему точки разбиения Т* (см. доказательство утверждения 1). В результате мы получим разбиение Т, которому отвечает ломаная, вписанная в кривую L и удовлетворяющая всем условиям утверждения 2). Доказательство утверждения 3). Пусть лома- ломаная MqMi ... Mfc_iMfcM|«4-i • • • Мп удовлетворяет условиям утверждений 1) и 2). Убедимся, что длина каждой части кривой L, стягиваемой любым зве- звеном рассматриваемой ломаной, меньше е. В самом деле, пусть Ik — длина части Mk~iMk кривой L, a Ik — длина звена Mk~\Mk ломаной. Тогда, в
§ 1 ДЛИНА ДУГИ КРИВОЙ 377 п _ силу условий утверждения 1), выполняется неравенство ^ (Ik — Ik) < s/2. k=i Поскольку каждое слагаемое 4 — h последней суммы неотрицательно, то (h —^к)< s/2. Отсюда и из неравенства /& < е/2 и вытекает требуемое неравенство h < е. Понятие длины дуги пространственной кривой, заданной па™ раметрическими уравнениями A1.5), вводится в полной анало- аналогии с понятием длины дуги плоской кривой. Рассматриваются длины l(ti) ломаных, вписанных в кривую L, причем очевидно, что п KU) = ?У [?>(*<) - 4>{U-i)Y+ Шг) - Ф(и-г)]*+ \x(U) -x(U-i)]2. г=1 Пространственная кривая L, определяемая уравнениями A1.5), называется спрямляемой^ если множество {l(t^)} длин ломаных, вписанных в эту кривую, ограничено. Точная верхняя грань I этого множества называется длиной дуги кривой L. Отметим, что пространственные спрямляемые кривые обла- обладают перечисленными в этом пункте свойствами 1°, 2°, 3° и 4°. Доказательство этих свойств проводится совершенно аналогич- аналогично доказательству для плоских кривых. 5. Достаточные условия спрммлмемости кривой. Фор- Формулы длм вычисления длины дуги кривой. Теорема 11.1. Если функции х = (p(t) и у = ф(г) имеют на сегменте [а, /3] непрерывные производные, то кривая L, опреде- определяемая параметрическими уравнениями A1.3), спрямляема и длина I ее дуги может быть вычислена по формуле i = I у/^ЩТфЩм. (пло) а Доказательство. Докажем сначала, что кривая L спрямляема. Для этого преобразуем выражение A1.6) длины l(ii) ломаной, вписанной в кривую L и отвечающей произволь- произвольному разбиению Т сегмента [а,/3]. Так как функции cp(t) и ф(г) имеют на сегменте [а, /3] производные, то, в силу формулы Ла- гранжа, (p(ti) - (p(U-i) = <р'(тг)Д*г, где ti-\ < п < % Д^ = U— - U-!, и ф{и) - ф(и-г) = ф'(т?)Аи, где U-г < гf < U. Подста^ вляя найденные выражения для (f(ti) — tp(ti-i) и ф(и) — ^) в правую часть выражения A1.6), получим УЧп) + Ф^фАи. A1.11) г=1 По условию функции (p(t) и ф{Ь) имеют на сегменте [а,/3] непре™ рывные производные. Следовательно, эти производные ограни™
378 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 чены, и поэтому существует такое Ж, что для всех t из сегмента [а,/3] справедливы неравенства |^;(t)| ^ М и \фг(^\ ^ М. Но тогда из формулы A1.11) вытекает, что + M2At% = MV2j2At* = МлД(/3 - а). г=1 г=1 Таким образом, множество {l(ti)} длин вписанных в кривую L ломаных, отвечающих всевозможным разбиениям Т сегмента [а,/3], ограничено, т. е. кривая L спрямляема. Обозначим че- через I длину этой кривой. Докажем, что длина I кривой L может быть вычислена по формуле A1.10). Заметим, что правая часть формулы A1.11) похожа на интегральную сумму A1.12) г=1 интегрируемой функции y^f12 (t) + ф'2 (t), причем эта сум- сумма I{iijTi} отвечает разбиению Т сегмента [«,/3] и данному вы- выбору точек щ на частичных сегментах [^_i,^] этого разбиения. Докажем^ что для любого положительного е > 0 можно ука- указать такое 5 > 0, что при А < S (А = maxAt^) выполняется неравенство \Ци)-1\<е/2, A1.13) где / = J y/ipf2(t) + ф'2{1) dt — предел при А —>- 0 интегральных о сумм A1.12). Иными словами, докажем^ что при достаточно «мелких» разбиениях Т сегмента [а,/3] длины l(ti) ломаных, вписанных в кривую L и отвечающих этим разбиениям^ как угодно мало отличаются от интеграла /, стоящего в правой части формулы A1.10). Отметим, во-первых, что A1.14) 1) Для получения неравенств A1.14) мы воспользовались неравенством |Va2 +б^-^ТИ < \Ь*-Ь\, где о2 = р>2(п), Ъ*2 = ф'2(т*) и Ь2 = ф'2{п) и неравенством \ф'(т*) — ф'(ji)\ ^ Mi — mi. Второе из этих неравенств очевидно, так как разность любых значений функции не больше разности ее точных граней. Докажем первое из указанных неравенств. Имеем |Ь*2^Ь2| = 2 + б*2 + л/а2 + Ь2 |6*-6|]6*+6] \ъ*\ + \ъ\
ДЛИНА ДУГИ КРИВОЙ 379 где Mi и nii — точные грани функции ф1 (t) на частичном сегмен™ те [ti^ijti]. В силу A1.11), A1.12) и A1.14) справедливы нера™ венства \l{ti)-I{ti,Ti}\ = = S-s, A1.15) i=l где S и s — верхняя и нижняя суммы функции ф1 {t) для раз- разбиения сегмента [а,/3]. Так как функции y(pl2(t) + t/?/2(i) и ф'{1) интегрируемы на сегменте [а, /3] (это вытекает из непрерывности производных (ff (i) и ф1 {t) на сегменте [а,/3]), то из определения интегрируемости и из теоремы 10.1 (см. § 1 и § 3 гл. 10) выте™ кает, что для любого е > 0 можно указать такое 5 > 0, что при А < S (А = max Ati) выполняются неравенства \I{U, тг}-1\<е/4 и S - s < е/4. A1.16) Поэтому при А < E, в силу A1.15) и A1.16), справедливы нера™ венства Щ) - I\ = \l(U) - I{tun} + I{ttJn} - I\ ^ \l(U) - - I{ti,Ti}\ + \1{и,п} - /| < e/4 + e/A = e/2. Таким образом, справедливость неравенства A1.13) доказана. Докажем теперь, что среди всевозможных ломаных^ длины l(ti) которых удовлетворяют неравенству A1.13), имеются ло- маные^ длины которых отличаются от длины I дуги кривой L меньше чем на е/2. Так как I — точная верхняя грань множества (I(t^)} длин ломаных, вписанных в кривую L и отвечающих всевозможным разбиениям сегмента [а, /3], то найдется такое разбиение Т* это™ го сегмента, что длина /*(tj) соответствующей ломаной удовле- удовлетворяет неравенствам 0^l-l*(U) <е/2. A1-17) Разобьем теперь каждый из частичных сегментов [?j_i,?j] раз- разбиения Т* на столь мелкие части, чтобы максимальная длина А разбиения Т сегмента [ск,/3], полученного объединением указан™ ных разбиений, была меньше <5, А < д. Очевидно, что длина
380 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 l(ti) ломаной, отвечающей разбиению Т, удовлетворяет нера™ венству A1.13). Так как вершины ломаной, отвечающей раз- разбиению Т*, являются также вершинами ломаной, отвечающей разбиению Т, то в силу леммв! этого параграфа длина l(ti) удо™ влетворяет неравенствам 0 < l*(U) ^ l(ti) ^ I, и поэтому в силу неравенства A1.17) выполняется неравенство O^l-lfa) <е/2. A1.18) Итак, мы доказали, что среди ломаных, длины l{ti) которых удовлетворяют неравенству A1.13), имеются ломаные, длины l(ti) которых удовлетворяют неравенству A1.18). Сопоставляя неравенства A1.13) и A1.18), получим следующее неравенство: \1-1\ <е. В силу произвольности е отсюда вытекает, что 1 = 1. Теорема доказана. Замечание 1. Если функции (p(t) и ф{Ь) имеют на сегменте [а, /3] ограниченные производные, то кривая L, определяемая уравнениями A1.1), спрямляема. В самом деле, в процессе доказательства теоремы A1.1) мы установили, что при условии ограниченности производных функций <p(t) и ф(?) длины l(ti) ломаных, вписанных в кривую L и отвечающих всевоз- всевозможным разбиениям Т сегмента [а,/3], ограничены. Замечание 2. Формула A1.10) для вычисления длины дуги справедлива, если производные (р* (b) и ф'(t) определены и интегрируемы на сегменте [а,/3]. В самом деле, из интегрируемости этих производных сле- следует их ограниченность и поэтому, в силу замечания 1, спрямляемость кри- кривой L. Заметим далее, что для вывода неравенств A1.14), A1.15) и A1.16), а следовательно, и неравенства A1.13) достаточно лишь существования и интегрируемости производных ip'(t) и ф'(Ь), так как отсюда, согласно до- дополнению 1 к гл. 10, вытекает интегрируемость функции \/V/2(t) +t//2(i). Все остальные рассуждения такие же, как и в доказательстве теоремы 11.1. Замечание 3. Если кривая L является графиком функции у = /(ж), имеющей на сегменте [а,Ь] непрерывную производную /;(ж), то кривая L спрямляема и длина I дуги L может быть найдена по формуле ь I = Г ^/l + ff2(x)dx. A1.19) Для доказательства заметим, что график рассматриваемой функции представляет собой кривую, определяемую парамет- параметрическими уравнениями ж = t, ?/ = /(t), a ^ t ^ 6 и при этом, очевидно, выполнены все условия теоремы 11.1. Поэтому, пола- полагая в формуле A1.10) <p(t) = t, ф{Ь) = f(t) и заменяя переменную интегрирования t на ж, мы получим формулу A1.19). Отметим
ДЛИНА ДУГИ КРИВОЙ 381 также, что если кривая L определяется полярным уравнением г = г@), 9\ ^ в ^ 02 и функция г (в) имеет на сегменте [#i,02] непрерывную производную, то кривая L спрямляема и длина I дуги L может быть найдена по формуле 02 I = Г л/г2(в)+гг2(в)Aв, A1.20) Для доказательства воспользуемся формулами перехода от по- полярных координат к декартовым х = г(в) cos0, у = г(в)зтв. Таким образом, мы видим, что кривая L определяется парамет- параметрическими уравнениями, причем функции (р = г (в) cos в и ф = = г (в) sin в удовлетворяют условиям теоремы 11.1. Подставляя в A1.10) указанные значения (р и ф, мы получим формулу A1.20). Сформулируем достаточные условия спрямляемости про- пространственной кривой. Если функции (p(t), ф(г) и x(t) имеют на сегменте [а,/3] непрерывные производные^ то кривая L, определяемая уравне- ниями A1.5), спрямляема и длина I ее дуги может быть най- найдена по формуле Доказательство аналогично доказательству теоремы 11.1. Замечание 4. Если функции <p{t), ip(t) и х(^) имеют ограничен™ ные на сегменте [а, /3] производные, то кривая L, определяемая уравнени- уравнениями A1.5), спрямляема. Если при этом производные указанных функций интегрируемы на сегменте [а,/3], то длина I дуги кривой L может быть вычислена по формуле A1.21) (см. замечания 1 и 2). 6. Дифференциал дуги. Пусть функции х = cp(t) и у = = ф{Ь) имеют на сегменте [а,/3] непрерывные производные. В этом случае, в силу теоремы 11.1, переменная дуга l(t) предста- представляется следующей формулой: t l(t) = Г vV2(r)+V>/20")dT. (П-22) а Так как подынтегральная функция в правой части формулы A1.22) непрерывна, то функция l(t) дифференцируема, причем
382 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 (см. п. 1 § 7 гл. 10). Возводя обе части последнего равенства в квадрат и умножая затем на dt2, получим формулу [/'(t) dt}2 = У [i] dtf + [ф'Ц) dtf. A1.23) Поскольку l'(t) dt = dl, (ff(t) dt = dx, ф'{1) dt = dy, то из A1.23) найдем dl2 = dx2 + dy2. A1.24) Из формулы A1.24), в частности, следует, что если за параметр выбрана переменная дуга I, т. е. х = g(l) и у = /гA), то Отметим, что при условии непрерывности производных функ- функций х = (p(t)j у = ф(г) и z = x(t) Для дифференциала dl ду~ ги пространственной кривой, определяемой параметрическими уравнениями A1.5), справедлива формула dl2 = dx2 + dy2 + dz2* A1.26) Из формулы A1.26) следует, что если за параметр выбрана пе- переменная дуга I, то 2 dyf (dzY2 ^г (п27) 7. Примеры вычисления длины дуги. 1°. Длина дуги циклоиды1) х = a(t — suit), у = аA — cost), 0 ^ t ^ 2тг. В рассматриваемом случае cpf = аA — cost), ф' = a slut. Поэтому по формуле A1.10) 2тг 2тг 2тг I = / ау A — costJ + sin tdt = 2а sin-dt = ^ = 8а. ^ Zd -f. jf^l-f- *# s~* f О 1 T"! _ /| | Zj_/1 f^OlQ — '2 2 0 0 0 2°. Цепной линией называется график функции у = ach — 2). Найдем длину участка цепной линии, отвечающего сегменту [О,ж]. Имеем по формуле A1.19) X -I ) Циклоида — плоская кривая, которую описывает точка окружности радиуса а, катящейся без скольжения по прямой линии. ) Наименование цепная линия связано с тем, что форму рассматривае- рассматриваемой кривой имеет тяжелая цепь, подвешенная за концы.
§ 2 ПЛОЩАДЬ ПЛОСКОЙ ФИГУРЫ 383 х2 у2 3°. Найдем переменную дугу эллипса — + ^- = 1,а>Ь, от™ считываемую от точки Mq@,6). Рассмотрим параметрические уравнения эллипса х = asini, у = bcost, 0 ^ t ^ 2тг. По форму- формуле A1.22) имеем t о l(t) = Г ^^2{т)+ф12{т)йт = Г л/a2 cos2 т + Ь2 sin2 rdr = о t г = а / VI - е2 sin2 т dr = a?^(e, t). «/ о тт л/а2 - Ь2 Число е = называется эксцентриситетом эллипса. Неопределенный интеграл J у 1 — е2 sin2 tdt, обращающийся в нуль при t = 0, называется эллиптическим интегралом 2™го ро™ да и обозначается E(e1t) (см. § 11 гл. 7). § 2. Площадь плоской фигуры1) 1. Понмтие квадрируемости плоской фигуры. Пло- Площадь квадрируемой плоской фигуры. Понятие площади плоской фигуры, являющейся многоугольником2), известно из курса элементарной математики. В этом пункте мы введем поня™ тие площади плоской фигуры Q — части плоскости, ограничен- ограниченной простой замкнутой кривой Ь3). При этом кривую L будем называть границей фигуры Q. Мы будем говорить, что многоугольник вписан в фигуру Q, если каждая точка этого многоугольника принадлежит фигуре Q или ее границе. Если все точки плоской фигуры и ее границы принадлежат некоторому многоугольнику, то будем говорить, что указанный многоугольник описан вокруг фигуры Q. Ясно, что площадь любого вписанного в фигуру Q много™ угольника не больше площади любого описанного вокруг фигу- фигуры Q многоугольника. Пусть {Si} — числовое множество площадей вписанных в плоскую фигуру Q многоугольников, a {Sd} — числовое множе™ ) Во второй части настоящего курса читатель найдет широкое примене- применение понятий площади плоской фигуры и произвольного множества точек плоскости. 2) Многоугольником мы будем называть часть плоскости, ограниченную простой замкнутой ломаной линией. ) Отметим, что простая замкнутая плоская кривая L разделяет плос- плоскость на две части — внутреннюю и внешнюю. Это утверждение было до- доказано французским математиком Жорданом A838-1922).
384 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 ство площадей описанных вокруг фигуры Q многоугольников. Очевидно, множество {Si} ограничено сверху (площадью любо- любого описанного вокруг фигуры Q многоугольника), а множество {Sd} ограничено снизу (например, числом нуль). Обозначим че- через Р_ точную верхнюю грань множества {Si}, а через Р — точ™ ную нижнюю грань множества {Sd}- Числа Р_ и Р называются соответственно нижней площадью и верхней площадью фигу- фигуры Q. Отметим, что нижняя площадь Р_ фигуры Q не больше верхней площади Р этой фигуры, т. е. Р_ ^ Р. В самом деле, предположим, что верно противоположное неравенство Р_ > Р. Р — ~Р Тогда, полагая ~ = е > 0 и учитывая определение точных граней, мы найдем такой вписанный в фигуру Q многоуголь™ Р + ~Р ник, площадь Si которого будет больше числа Р_ — е = = , р + р т. е. = < Si, и такой описанный вокруг фигуры Q много- угольник, площадь bd которого меньше числа г + е = = Р + ~Р т. е. Sd < = . Сопоставляя полученные два неравенства, най- найдем, что Sd < Si, чего не может быть, так как площадь Sd лю- любого описанного многоугольника не меньше площади Si любого вписанного многоугольника. Введем понятие квадрируемости плоской фигуры. Определение. Плоская фигура Q называется квадриру- е м о й1 если верхняя площадь Р этой фигуры совпадает с ее нижней площадью Р_. При этом число Р = Р_ = Р называется площадью фигуры Q. Замечание. В дополнении к этой главе будет приведен пример неквадрируемой фигуры. Справедлива следующая теорема. Теорема 11.2. Для того чтобы плоская фигура Q была ква- дрируемой^ необходимо и достаточно^ чтобы для любого поло- положительного числа е можно было указать такой описанный вокруг фигуры Q многоугольник и такой вписанный в фигуру Q многоугольник, разность Sd — Si площадей которых была бы меньше б, Sd — Si < e. Доказательство. 1) Необходимость. Пусть фигура Q квадрируема, т. е. Р_ = Р = Р. Так как РиР- точные верхняя и нижняя грани множеств {Si} и {S^}, то для любого числа е > 0 можно указать такой вписанный в фигуру Q многоугольник, площадь Si которого отличается от Р_ = Р меньше чем на е/2, т. е. Р — Si < е/2. Для этого же е > 0 можно
§ 2 ПЛОЩАДЬ ПЛОСКОЙ ФИГУРЫ 385 указать такой описанный многоугольник, площадь Sd которого отличается от Р = Р меньше чем на е/25 т. е. Sd — Р < е/2. Складывая полученные неравенства, найдем, что Sd — Si < e. 2) Достаточность. Пусть Sd и Si — площади много™ угольников, для которых Sd — Si < e. Так как Si ^ P^^ P ^ Sd, то Р — Р. < е. В силу произвольности е отсюда вытекает, что Р_ = = Р. Таким образом, фигура квадрируема. Теорема доказана. Мы будем говорить, что граница плоской фигуры Q име- имеет площадь^ равную нулю, если для любого положительного числа е > О можно указать такой описанный вокруг фигу- фигуры Q многоугольник и такой вписанный в фигуру Q много™ угольник, разность Sd ~~ Si площадей которых меньше е. Оче- видно, теорему 11.2 можно также сформулировать следующим образом. Для того чтобы плоская фигура Q была квадрируемой^ необ- необходимо и достаточно^ чтобы ее граница имела площадь^ равную нулю. Замечание. Во всех приведенных нами рассуждени- рассуждениях вместо плоской фигуры молено рассматривать произвольное множество точек плоскости. Установим достаточный признак квадрируемости плоской фигуры. Теорежа 11.3. Если граница L плоской фигуры Q представляет собой спрямляемую кривую^ то фигура Q квадрируема. Доказательство. Пусть I* — длина кривой L. Будем счи- считать, что кривая L параметризована с помощью натурального параметра I, О ^ I ^ I*, причем, поскольку кривая L замкнута, ее граничные точки, отве- отвечающие значениям 0 и I* параметра I, совпадают. Пусть е — произвольное положительное число. Разобьем сегмент [0,1 ] точками 0 = /о < h < • • • < ln = I* на п равных частей длины меньше е/Ш . Рассмотрим ломаную MqMi ... Мп (Мо = Мп), вписанную в кривую L и отвечающую указанному разбие- разбиению сегмента [0, /*]. Точки Mo, Mi,... , Мп раз- разбивают кривую L на части Li, L2,... , Ln, дли- длины которых равны (I*/п) < (е/91*). Очевидно, длины звеньев Mi-iMi указанной выше лома- ломаной MqMi ... Мп не больше I /п. Поместим каж- каждое звено Mi—iMi внутрь квадрата со стороной 31 /п так, как это указано на рис. 11.4. Лег- Легко убедиться, что дуга Li, стягиваемая звеном Рис. 11.4 Mi—iMi, располагается внутри этого квадрата, ибо расстояние от любой точки, расположенной вне или на границе это- этого квадрата, до каждой из точек Mi—i и Mi не меньше I /п, и поэтому, если бы какая-либо точка М дуги Li была вне или на границе указанно- указанного квадрата, то вписанная в эту дугу ломаная M^iMM^ имела бы длину, не меньшую 21 /п, т. е. большую, чем длина I /п дуги Li, чего не может быть. Объединение всех таких квадратов, построенных на всех звеньях ло- 13 В.А. Ильин, Э.Г. Позняк, часть I
386 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 маной М® М\ ... Мп, представляет собой многоугольную фигуру, содержа- содержащую кривую L, причем очевидно, что граница этой фигуры представляет собой объединение границ вписанного в фигуру Q многоугольника и опи- описанного вокруг Q многоугольника. Очевидно также, что разность Sd — Si площадей этих многоугольников равна площади указанной фигуры, а пло- площадь этой фигуры не превосходит суммы S площадей описанных выше 9I*2 I* / квадратов. Так как S = п—— = 91 — < е (последнее неравенство следует /* е \ п п V из того, что — < ——j^- 1, то Sd ~~ Si < г. Поэтому, согласно теореме 11.2, фигура Q квадрируема. Теорема доказана. 2. Площадь криволинейной трапеции. Криволинейной трапецией называется фигура, ограниченная графиком задан- заданной на сегменте [а,Ь] непрерывной и неотрицательной функ™ ции /(ж), ординатами, проведенными в точках а и 6, и отрезком оси Ох между точками а ш b (рис. 11.5). Докажем следующее утверждение. Криволинейная трапеция представляет собой квадрируе- мую фигуру^ площадь Р которой может быть вычислена по формуле ь = Jf(x)dx. A1.28) Доказательство. Так как непрерывная на сег- сегменте [а,Ь] функция интегрируема, то для любого положитель- положительного числа е можно указать такое разбиение Т сегмента [а, Ь], что разность S — s < 6, где S и s — соответственно верх- верхняя и нижняя суммы раз- разбиения Т. Но S и s равны соответственно Sd и Si, где Sd и Si — площади ступен- ступенчатых фигур (многоугольни- (многоугольников), первая из которых со- содержит криволинейную тра- трапецию, а вторая содержится в криволинейной трапеции (на рис. 11.5 изображены также и ф У' 0 а X о я / 1 X 2 \ X / та—1 X ъ п Х Рис. 11.5 ры). Так как Sd — S% указанные ступенчатые фигу- < 6, то, в силу теоремы 11.2, криво- криволинейная трапеция квадрируема. Поскольку предел при А —)> ъ 0 верхних и нижних сумм равен J f(x)dx и s S, а то площадь Р криволинейной трапеции может быть найдена по формуле A1.28).
ПЛОЩАДЬ ПЛОСКОЙ ФИГУРЫ 387 Замечание. Если функция f(x) непрерывна и непо ь ложительна на сегменте [a, ft], то значение интеграла J f{x)dx а равно взятой с отрицательным знаком площади криволинейной трапеции, ограниченной графиком функции /(ж), ординатами в точках а и Ь и отрезком оси Ох между точками а и ft. Поэтому, ь если f(x) меняет знак, то f f(x) dx равен сумме взятых с опре™ а деленным знаком площадей криволинейных трапеций, располо™ женных выше и ниже оси Ох, причем площади первых берутся со знаком +, а вторых — со знаком —. 3. Площадь криволинейного сектора. Пусть кривая L задана в полярной системе координат уравнением г = г@), а ^ в ^ /3 (рис. 11.6), причем функция г (в) непрерывна и неотрицательна на сегменте [а, /3]. Плоскую фигуру, ограничен- ограниченную кривой L и двумя лучами, составляющими с полярной осью углы а и /3, мы будем называть криволинейным сектором. Докажем следующее утвер- утверждение. Криволинейный сек- сектор представляет собой ква- дрируемую фигуру, площадь Р которой может быть вычис- вычислена по формуле Р=\ Iг2(в)ёв. A1.29) Доказательство. [ ] Рис. 11.6 Д Рассмотрим разбиение Т сег- сегмента [о, /3] точками а = 0® < 6\ < ... < вп = [3 ш для каж- каждого частичного сегмента [0j_i,0j] построим круговые секторы, радиусы которых равны минимальному ri и максимальному Ri значениям г (в) на сегменте [<9^i,^]. В результате получим две веерообразные фигуры, первая из которых содержится в кри- криволинейном секторе, а вторая содержит криволинейный сектор (эти веерообразные фигуры изображены на рис. 11.6). Площади указанных веерообразных фигур равны соответствен- Si и 1 но - 2 1 и - 2 - Отметим, что первая из этих сумм г=1 2 г=1 г является нижней суммой s для функции -г (в) для указанно- указанного разбиения Т сегмента [о,/3], а вторая сумма является верх™ ней суммой S для этой же функции и этого же разбиения. Так как функция -г (в) интегрируема на сегменте [а, /3], то разность 13*
388 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 S — s = Sd — Si может быть как угодно малой. Например, для любого фиксированного е > 0 эта разность может быть сделана меньше е/2. Впишем теперь во внутреннюю веерообразную фи- фигуру многоугольник Qi с площадью Si, для которого Si —Si < -, 4 и опишем вокруг внешней веерообразной фигуры многоуголь- многоугольник Qd площадью S^, для которого Sd — Sd < -г1)- Очевидно, 4 первый из этих многоугольников вписан в криволинейный сек- сектор, а второй описан вокруг него. Так как справедливы нера- неравенства Р г2(в) de<sd< sd, (п.зо) то, очевидно, Sd — Si < e. В силу произвольности е, отсюда вы- вытекает квадрируемость криволинейного сектора. Из неравенств A1.30) вытекает справедливость формулы A1.29). 4. Примеры вычисления площадей. 1°. Найти пло- площадь Р фигуры F, ограниченной графиками функций у = ха и х = уа j а ^ 1 (рис. 11.7). Поскольку фигура F симметрич- симметрична относительно биссектрисы первого координатного угла, то ее площадь может быть получена посредством вычитания из 1 (площадь квадрата) удвоенной площади криволинейной трапе- трапеции, определяемой графиком функции у = ха на сегменте [0,1]. Таким образом, по формуле A1.28) = 1 -2 а + 1 о 2°. Через три точки с координатами (—/г, уо)? @,2/1)? (^2/2) проходит только одна парабола у = т4ж2 + Вх + D (или прямая, если эти точки лежат на одной прямой). Действительно, система уравнений относительно А, В, D2) Ah2 - Bh + D = |/o, Ah2 + Bh + D = y2 г) Рассматриваемые веерообразные фигуры состоят из круговых секто- секторов. Каждый сектор квадрируем, и поэтому квадрируемы и веерообразные фигуры. Поэтому для этих фигур можно найти многоугольники, площади Si и Sd которых удовлетворяют указанным неравенствам. ) Эти уравнения представляют собой условия расположения точек (—h, 2/0), @, уг) и (h, 2/2) на параболе у = Ах2 + Вх + D.
ПЛОЩАДЬ ПЛОСКОЙ ФИГУРЫ 389 Рис. 11.7 имеет единственное решение. Именно: Выразим площадь Р криволинейной трапеции, определяемой указанной параболой, ординатами в точках (—/i, 0) и (Л, 0) и от™ резком оси Ох между этими точками (рис. 11.8), через ординаты Уо> 2/1 и 2/2- Так как по формуле A1.28) а Р = [(Ах2 = [^ + Щ- + Dx 2Ah3 2Dh, то, учитывая выражения для А и D, найдем 3°. Найти площадь Р трилистника г = a cos W (рис. 11.9). Из чертежа яс- ясно, что вся площадь трилистника рав™ на увеличенной в шесть раз площади заштрихованной части трилистника, которая отвечает изменению в от 0 до тг/6. Поэтому по формуле A1.29) 7г/б 2 COS Рис. 11.9
390 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 § 3. Объемы тел и площади поверхностей 1. Понятие кубируемости и объема. Пусть Е — некото™ рое конечное тело 1). Рассмотрим всевозможные многогранники, вписанные в тело Е, и всевозможные многогранники, описан- описанные вокруг тела Е. Вычисление объема многогранника сводит™ ся к вычислению объемов тетраэдров (треугольных пирамид). Поэтому мы будем считать известным понятие объема много- многогранника. Пусть {V^} — числовое множество объемов вписанных в те- тело Е многогранников, а {У^} — числовое множество объемов описанных вокруг Е многогранников. Множество {Vi} ограниче- но сверху (объемом любого описанного многогранника), а мно- множество {Vd} ограничено снизу (например, числом нуль). Обо- Обозначим У_ точную верхнюю грань множества {И}, а V точную нижнюю грань множества {Ki}. Числа V_ и V называются соот- соответственно нижним объемом и верхним объемом тела Е. Отметим, что нижний объем V_ тела Е не больше верхне- верхнего объема V этого тела, т. е. F^F. Чтобы убедиться в спра- справедливости этого, достаточно провести рассуждения, аналогич- аналогичные тем, которые были сделаны для доказательства неравенства Р^Р (см. п. 1 § 2). Введем теперь понятие кубируемости тела. Определение. Тело Е называется кубируемым, если верхний объем V этого тела совпадает с нижним объемом V_. При этом число V = \^= V называется объемом тела Е. Справедлива следующая теорема. Теорема 11.4' Для того чтобы тело Е было кубируемым, необходимо и достаточно^ чтобы для любого положительно- положительного числа е можно было указать такой описанный вокруг тела Е многогранник и такой вписанный в тело Е многогранник^ разность V^ ~~ Vi объемов которых была бы меньше е. Доказа- Доказательство этой теоремы вполне аналогично доказательству тео- теоремы 11.2 (см. п. 1 § 2). 2. Кубируемость некоторых классов тел. Будем назы- называть цилиндром тело, ограниченное цилиндрической поверхно- поверхностью с образующими, параллельными некоторой оси, и двумя плоскостями, перпендикулярными этой оси. Эти плоскости в пе- пересечении с цилиндрической поверхностью образуют плоские фигуры, называемые основаниями цилиндра, а расстояние h между основаниями цилиндра называется высотой цилиндра (рис. 11.10). г) Телом мы будем называть часть пространства, ограниченную замкну- замкнутой непересекающейся поверхностью.
ОБЪЕМЫ ТЕЛ И ПЛОЩАДИ ПОВЕРХНОСТЕЙ 391 Докажем следующее утверждение. Если основанием цилин- цилиндра Е является квадрируемая фигура Q, то цилиндр представ- ляет собой кубируемое тело, причем обпем V цилиндра Е равен Ph, где Р — площадь основания Q, a h — высота цилиндра. Так как фигура Q квадрируема, то для любого положительного числа е мож- можно указать такие описанный и вписан- вписанный в эту фигуру многоугольники, раз- разность Sd — Si площадей которых будет меньше e/h. Объемы Vd и Vi призм с высотой /г, основаниями которых служат указанные выше многоугольники, равны соответственно S^h и S{h. Поэтому Vd — — V{ = (Sd — Si)h < - h = e. Так как эти призмы являются соответственно описанным и вписанным в рассматриваемое тело Е многогранниками, то в силу теоре- теоремы 11.4 тело Е кубируемо. Поскольку Vi ^ Ph ^ F^, то объем цилиндра равен Ph. Из доказанного утверждения вытекает кубируемость сту- ступенчатых тел (ступенчатым телом называется объединение ко™ нечного числа цилиндров, расположенных так, что верхнее осно- основание каждого предыдущего из этих цилиндров находится в од- одной плоскости с нижним основанием последующего цилиндра, см. рис. 11.11). Рис. 11.10 Рис. 11.11 Рис. 11.12 Замечание. Справедливо следующее очевидное утверж- утверждение. Если для любого положительного числа е можно ука- указать такое описанное вокруг тела Е ступенчатое тело и та- такое вписанное в Е ступенчатое тело^ разность Vd — Vi объемов которых меньше 6, то тело Е кубируемо.
392 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 Используем это замечание для доказательства кубируемости тела вращения (рис. 11.12). Именно, докажем следующее ут™ верждение. Пусть функция у = f(x) непрерывна на сегменте [a, ft]. Тог- Тогда тело Е, образованное вращением вокруг оси Ох криволиней- криволинейной трапеции, ограниченной графиком функции /(ж), ордина- ординатами в точках а и Ъ и отрезком оси Ох от а до ft, кубируемо и его объем V моэюет быть найден по формуле V = f2(x)dx. A1.31) Доказательство. Пусть Т — разбиение сегмента [а, ft] точками а = х® < х\ < ... < хп = ft, mi и Mi — точные грани f(x) на сегменте [a^-b#i]- На каждом таком сегменте построим два прямоугольника с высотами mi и Mi (на рис. 11.12 изобра™ жены эти прямоугольники только на одном сегменте [ж^1,ж^]). Мы получим две ступенчатые фигуры, одна из которых содер™ жится в криволинейной трапеции, а другая содержит ее. При вращении криволинейной трапеции и этих ступенчатых фигур мы получим тело Е и два ступенчатых тела, одно из которых содержится в Е, а другое содержит Е. Объемы Vi и Vd этих ступенчатых тел равны соответственно m и ж Mi г=1 г=1 —а х2/3+|/2/3=а2/3 Очевидно, эти выражения представляют собой верхнюю и нижнюю суммы для функции тг/2(ж). Так как эта функция интегрируема, то разность указан- указанных сумм для некоторого разбие- разбиения Т сегмента [а,Ь] будет мень™ ше данного положительного числа е. Следовательно, тело Е кубируемо. Поскольку предел указанных сумм ь а х равен ж / f2{x)dx1 то объем V тела а Е может быть найден по формуле A1.31). 3. Примеры вычисления объ- объемов. 1°. Объем тела, полученного вра™ щением вокруг оси Ох астроиды Рис. 11.13
ОБЪЕМЫ ТЕЛ И ПЛОЩАДИ ПОВЕРХНОСТЕЙ 393 ж 2/з 2/з = а2/з (рис> 11>13). Так как у = (а2/3 - ж2/3K/2, то 105 2°. Объем тела, полученного вращением вокруг оси Ох сину- синусоиды на сегменте [0, тг]. Имеем V = 7Г 7Г 7Г /sin хdx = тг I — — cos 2x 4. Площадь поверхности вращения. Рассмотрим поверх™ ность П, образованную вращением вокруг оси Ох графика функ- функции у = /(ж), заданной на сегменте [а, Ь] (рис. 11.14). Определим понятие квадрируемости поверхности вращения П. Пусть Т — разбиение сегмента [а, Ь] точками а = х® < х\ < ... < хп = Ь, и пусть Ao,Ai,... , Ап — соответствующие точки графика функ- функции f(x). Построим ломаную А®А\ ... Ап. При вращении этой ломаной вокруг оси мы получим поверхность П(А^), составлен- составленную из боковых поверхностей усеченных конусов. Обозначим че™ рез P(xi) площадь поверхности П(^). Если yi — ординаты f(x) в точках Xi, a k — длина звена А\-\А{ ломаной А®А\... Ап, то = 27Г A1.32) Сформулируем следующие определения. 1°. Число Р называется пре- пределом площадей Р(ж^), если для любого данного положительно- го числа е можно указать та- такое положительное число #, что для любого разбиения Т сегмен- сегмента [а, Ь], максимальная длина А частичных сегментов которого меньше <5, выполняется неравен- неравенство \P(xi) — Р\ < е. 2°. Поверхность вращения П называется квадрируемой^ если существует предел Р площадей P(xi). При этом число Р называ- ется площадью поверхности П. Докажем следующее утверж™ дение. J Рис. 11.14
394 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 Если на сегменте [а,Ь] функция f(x) имеет непрерывную производную /;(ж), то поверхность П, образованная вращением графика этой функции вокруг оси Ох, квадрируема и ее площадь Р может быть вычислена по формуле ъ Р = 2п If{x)^l + fa{x)dx> A1.33) а Доказательство. Длина \{ звена А{—\А{ лома- ломаной AqAi ...An равна ^/(х{ - Жг-iJ + (Уг — Уг-iJ- По формуле Лагранжа имеем уг -уъ-i = f(xi) - fjxj-i) = f(€i)(xj -Xi-i)- Полагая Х{ — Х{-\ = Дж^, получим \{ = у 1 + //2(^)Аж^. Поэтому, согласно A1.32), тг | ^[{уг-г - ffo)) + (yi - №))]^1 + 7гШАхг 1. A1.34) Первая сумма в правой части соотношения A1.34) представляет собой интегральную сумму функции 2тг/(ж)д/1 + //2(ж), кото- которая, в силу условий утверждения, интегрируема и имеет предел ь Р = 2тг J f(x)y/l + f/2(x) dx. Докажем, что выражение в фигур- а ных скобках в правой части соотношения A1.34) имеет предел, равный нулю. В самом деле, пусть е — любое положительное число. Так как функция f(x) равномерно непрерывна на сегмен- сегменте [а, Ь], то по данному е > 0 можно указать такое 6 > 0, что при А < 6 (А = max Axi) выполняются неравенства |уг-1~/(?г)| < е и |Уг ~ /(?г)| < ?• Если М — максимальное значение функции у1 + //2(ж) на сегменте [а, Ь], то для выражения в фигурных скобках в правой части соотношения A1.34) получаем оценку 2Me В силу произвольности е > 0 предел указанного выражения ра- равен нулю. Итак, мы доказали существование предела Р площа™
§ 4 ФИЗИЧЕСКИЕ ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА 395 дей P(xi) и установили, что этот предел может быть вычислен по формуле A1.33). Утверждение доказано. Замечание 1. Квадрируемость поверхности вращения мож- можно доказать при более слабых условиях. Достаточно потребовать, чтобы функция f'{x) была определена и интегрируема на сегменте [а,Ь]. Из это- этого предположения вытекает интегрируемость функции f(x)^/l + //2(ж) (см. дополнение 1 к гл. 10). Дальнейшие рассуждения ничем не отличаются от рассуждений, проведенных при доказательстве утверждения этого пункта. Замечание 2. Если поверхность II получается посредством вращения вокруг оси Ох кривой L, определяемой параметрическими урав- уравнениями х = (p(t), у = tjj(t), a ^ t ^ /3, то осуществляя замену переменных под знаком определенного интеграла в формуле A1.33), получим следую- следующее выражение для площади Р этой поверхности /5 Р = 2тг IфA)^ЩТфЩdt. A1.35) а Рассмотрим примеры вычисления площадей поверхностей вращения. 1°. Найдем площадь Р поверхности эллипсоида вращения. Пусть эллипс 2 2 — + 7j = 1 вращается вокруг оси Ох. Рассмотрим сначала случай а > b (вращение вокруг большой оси эллипса). Так как в этом случае /(ж) = > -, найдем 2тг / f(x)\fl + ff2(x)dx = 2тг™ I yd2 — e2x2 dx = 2жЬ (b -\— arcsine J . J aJ V e / /6^ Если а < о, то, полагая е = \ / ——— и проводя соответствующие вычисле- вычисления, получим 2b e 1 - 2°. Найдем площадь Р поверхности, образованной вращением вокруг оси Ох циклоиды, определяемой параметрическими уравнениями х = a(t — — skit), у = аA — cost), 0 ^ t ^ 2тг. По формуле A1.35) имеем [ t/j(t)^(p/2(t) + %j)l2{t)dt = 2У2тга2 A(l-cost) ^/2 й+ - § 4. Некоторые физические приложения определенного интеграла 1. Масса и центр тмжести неоднородного стержнм. Рассмотрим неоднородный стержень, расположенный на сегмен™
396 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 те [а^Ь] оси Ох. Пусть р(х) — линейная плотность стержня1). Обозначим через Т разбиение сегмента [а,Ь] точками а = х® < < х\ < ... < хп = Ь. Выберем на каждом частичном сегменте п \xi-i,Xj\ точку ?з и составим сумму ]Р р(^)Аж^. Так как каждое слагаемое этой суммы представляет собой приближенное значе- значение массы части стержня на сегменте [a^_i,a^], то указанную сумму естественно принять за приближенное значение массы всего стержня. Согласуясь с этими предварительными рассуж- рассуждениями, мы определим массу М всего стержня как предел п сумм J2 p[ii)^xi пРи стремлении к нулю А = max Аж^, т. е. г=1 Ъ как интеграл f p(x)dx. Таким образом, ъ М= f p(x)dx. A1.36) ft Для определения центра тяжести неоднородного стержня вос- воспользуемся формулой для координаты центра тяжести системы {wii(xi)} материальных точек, имеющих массы wii и располо™ женных в точках Xi оси Ох. Именно, координата хс центра тя- тяжести системы {wii} может быть найдена по формуле п I п ТП\Х\ \~ ТП'2Х'2 ~т~ • • • ~т~ ГОпЖп "\" """^ / *\" "^ / ¦* ¦* c\t-7\ хс = ^^^^^^^^^^^^^^^^ = у ТП{Х{ / у wii. A1.о7) mi + ni2 + ... + mn ^-^ / ^-^ г=1 / г=1 Рассмотрим разбиение Т сегмента [а, Ь] точками а = х® < х\ < ... ... <хп = Ь и вычислим массу wii части стержня, расположен- расположенной на сегменте [#j_i,#j]. Имеем по формуле A1.36) wii = ь% = J p{x)dx. Применяя формулу A0.13) среднего значения, получим так^«е, что mi = p(?i)Axi. Считая, что масса wii сосре- сосредоточена в точке ?i сегмента [ж^х,ж^], мы можем рассматривать неоднородный стержень как систему материальных точек с мас- массами т^, расположенных в точках ^ сегмента [а, Ь]. Поскольку i=l г) Если Am — масса части стержня на сегменте [ж, ж + Аж], то отноше- отношение Am/Ах называется средней линейной плотностью стержня на этом сегменте. Линейной плотностью р(х) называется предел р(х) = lim —?—. Аж^О Аж
ДОПОЛНЕНИЕ 397 то по формуле A1.37) найдем приближенное выражение для ко™ ординаты хс центра тяжести неоднородного стержня A1.38) Выражение, стоящее в числителе правой части соотношения A1.38), представляет собой интегральную сумму для функции хр{х) на сегменте [а, Ь]. В соответствии с проведенными рас™ суждениями мы определим координату хс центра тяжести неод- неоднородного стержня по формуле ь j xp{x) dx хс=а- . A1.39) fp(x)dx а 2. Работа переменной силы. Пусть материальная точка перемещается из точки а оси Ох в точку Ъ этой оси под действи- действием силы i*1, параллельной оси Ох. Будем считать, что эта сила является функцией от ж, определенной на сегменте [а, Ь]. Пусть Т — разбиение сегмента [а,Ь] точками а = х® < х\ < ... < хп = = Ь. Выберем на каждом частичном сегменте [жг-ъ xi] точку ^ и будем считать приближенным значением работы А переменной п силы F(x) на сегменте [a, ft] выражение ^ F(^)Ax^. Согласу- г=1 ясь с этими предварительными рассуждениями, мы определим работу А переменной силы F(x) на сегменте [в, ft] как интеграл ь J F(x)dx. Таким образом, ъ А= Г F(x)dx. A1.40) ДОПОЛНЕНИЕ ПРИМЕР НЕКВАДРМРУЕМОЙ ФИГУРЫ 1. Будем называть полуоткрытым треугольником множество точек треугольника, из границы 1) которого удалены точки двух его сторон и двух вершин, прилегающих к этим сторонам. Рассмотрим построение кривой L, которая будет частью границы неквадрируемой фигуры Q. Это построение производится путем последовательных удалений определенных полуоткры- полуоткрытых треугольников из некоторого данного равнобедренного прямоугольного 1) Граница треугольника — множество точек его сторон и вершин.
398 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 треугольника Т, который для удобства дальнейших рассуждений мы обо- обозначим Т[0,1]. Координаты вершин этого треугольника равны @, 0), A,1), B,0) (рис. 11.15). Опишем теперь процесс последовательных удалений из треугольника Т[0, 1] определенных полуоткрытых треугольников: У A,1) @,0) B,0) x @,0) B,0) х Рис. 11.15 Рис. 11.16 1. Удаляется полуоткрытый треугольник, одна вершина которого имеет координаты A,1), а две другие расположены на оси Ох. Площадь Si уда™ ляемого треугольника равна 1/4. Полученная в результате фигура изобра- изображена на рис. 11.16. Она состоит из двух треугольников Т[0,1/2] и Т[1/2,1], площади которых равны друг другу. 2. Из треугольников Т[0,1/2] и Т[1/2,1] удаляется по одному треуголь- треугольнику, сумма S'2 площадей которых равна 1/8. Полученная в результате фи- фигура изображена на рис. 11.17. Она состоит из четырех треугольников: Т[0,1/4], Т[1/4,1/2], Т[1/2,3/4], Т[3/4,1], площади которых равны друг ДРУГУ- У @ J л 0) r[l/4,l/2]J3 Ж ш ТРД/4] Рис. 1) 11.17 /4] B 4,1] ,0)х @ У ,0) 1\3/ Т[1/43 Т[0,1/8] 1 A,1) 11/8,1/4] Т[3/4,7/8]Т[7/8Д] ж Рис. 11.18 3. Из каждого указанного треугольника удаляется по одному треуголь- треугольнику, сумма Ss площадей которых равна 1/16. Полученная в результате фигура изображена на рис. 11.18. Она состоит из восьми треугольников: , Г[1/4,3/8], Г[3/8,1/2], Г[1/2,5/8], Т[5/8,3/4], Т[3/4,7/8], площади которых равны друг другу. 4. Из каждого указанного треугольника удаляется по одному треуголь- треугольнику, сумма Sa площадей которых равна 1/32. Полученная в результате фи-
ДОПОЛНЕНИЕ 399 гура изображена на рис. 11.19. Она состоит из шестнадцати треугольников равной площади. Каждый из этих треугольников мы обозначим символом ^[Ir.^T^l. p = 0,l,...,15. Дальнейший процесс удаления треугольников очевиден. Перейдем теперь к определению кривой L. Треугольники Т —-, (р и п — любые неотрицательные целые числа, удовлет- удовлетворяющие условию р < 2П), полученные в У описанном выше процессе, обладают еле™ 1 р, r^l Pi Fi + 1] дующим свойством: пусть I , ^ —, j L2ni 2ni J Г P2 P2 + 11 L2n2 ' 2n2 J ких, что два треугольника та- 2 ^ F J Pi ^ P2 ^ P2 + 1 . Pi + 1 w ' < < < . 2ni 2П2 2П2 2ni Тогда второй из этих треугольников со- @>0) B,0) х держ:ится в первом. Отметим также сле- следующее очевидное свойство треугольни- рис \\\^ ков Т —, : при п —>- (X) их диаметры1) стремятся к нулю. Пусть 1 "^ 9«^' 9?г г? ^ = 1? 2,..., — стягивающаяся система треугольников (это означает, что треугольник, отвечающий индексу к, содержит треуголь- треугольник, отвечающий индексу к + 1, и при к —>• со диаметры треугольников стремятся к нулю). Каждая такая стягивающаяся система треугольников имеет ровно одну общую точку2). Рассмотрим всевозможные стягиваю- стягивающиеся системы указанных выше треугольников. Кривую L мы определим как множество {М} всевозможных точек, каждая из которых предста- представляет собой общую точку некоторой стягивающейся системы указанных \р р + 1] выше треугольников Г —, . Отметим, что множеству {М} (кривой L) принадлежат вершины всех треугольников Т ——, Чтобы убедиться в этом, заметим, что вер- вершина каждого такого треугольника принадлежит стягивающейся системе г г 2kp 2fep + l]i r r2fcp — 1 2кр ] 1 треугольников < Т п . . , п , , > и системе < Т п . , , п . . >. Чтобы убедиться, что построенное нами множество {-М} является простой кривой в смысле определения, данного в п. 1 § 1 этой главы, мы должны доказать, г) Диаметром треугольника называется длина его максимальной стороны. ) В гл. 3 (см. п. 2 § 3) мы доказали, что стягивающаяся система сег™ ментов имеет ровно одну общую точку. Проецируя стягивающуюся систему треугольников на оси Ох и Оу, мы получим стягивающиеся системы сег- сегментов на координатных осях. Пусть ж и у — соответственно общие точки указанных стягивающихся систем сегментов на осях Ох и Оу. Читатель легко убедится, что точка М с координатами х и у является единственной общей точкой рассматриваемой стягивающейся системы треугольников.
400 ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА ГЛ. 11 что все точки множества М определяются параметрическими уравнениями х = (p(t), у = tfj(t)j a ^ t ^ Ь, где <p(t) и ф{г) — непрерывные функции г). Рассмотрим сегмент [0,1] оси t. Каждому сегменту —¦, , где р и п — любые неотрицательные целые числа, р < 2п, поставим в соответствие треугольник Т7 т^7? 2). На рис. 11.20 изображены сегменты, которым [р р + li отвечают треугольники Т —, . Любая точка t сегмента [0,1] принад- 2 ? „ (fPk Pfe + lll лежит всем сегментам некоторой стягивающейся системы < , > сегментов ). Поставим в соответствие этой точке t общую точку М стяги- вающеися системы треугольников < 1 , >. 1аким ооразом, каж- каждому значению t из сегмента [0,1] ставится в соответствие два числа х ж у — координаты точки М. Сле- 0 1/8 1/4 3/8 1/2 5/8 3/4 7/8 1 t довательно, х и у являют- ~~^ ся функциями параметра t. Убедимся, что эти функции Рис. 11.20 х = (p(t) и у = %j)(t) непре- непрерывны на сегменте [0,1]. В самом деле, пусть е — любое данное положительное число, t — данная точ- точка сегмента [0,1] и М — точка кривой L, определяемая этим значением параметра t. Из стягивающейся системы < Т\ т^р, > треугольников, определяющих точку М", выберем треугольник, диаметр которого меньше ?, г рк Pfc + ll и рассмотрим сегмент , ------------- , который содержит точку г, определяю- определяющую М (а следовательно, жиг/). Все точки кривой L, определяемые значе- значениями t из этого сегмента, расположены в указанном выше треугольнике, и поэтому их координаты отличаются от координат точки М не более чем на е. Но это означает, что функции (p(t) и г/>(?) непрерывны в указанной точке. 2. Перейдем к построению неквадрируемой фигуры Q. Рассмотрим ква- квадрат Q, сторона которого равна 2. На каждой стороне этого квадрата по- построим равнобедренные прямоугольные треугольники Ti, T2, Т3, Т4, в ре- результате мы получим квадрат Q со стороной 2-^2 (рис. 11.21). Затем из каж- каждого такого треугольника произведем удаление полуоткрытых треугольни- треугольников так, как это описано выше, в п. 1. В результате мы получим фигуру Q, ограниченную замкнутой кривой, состоящей из четырех кривых, конгру- конгруэнтных4) кривой L (см. п. 1). Докажем, что полученная фигура Q неква- ) То, что различным t отвечают различные точки множества М, очевид- очевидно из построения кривой L. 2) Отметим, что каждому такому треугольнику отвечает только один сег- 1 р F+ 1] __ь' 2п _ 3) Пусть t — любая точка сегмента [0,1] и п — любое целое положи- положительное число. Тогда, очевидно, точка t принадлежит некоторому сегменту ——, ^—^— , причем каждый такой сегмент, отвечающий номеру п + 1, со- содержится в сегменте, который отвечает номеру п. 4) Множества А и В называются конгруэнтными^ если они могут быть совмещены движением.
ДОПОЛНЕНИЕ 401 дрируема. Рассмотрим две специальные последовательности многоуголь- многоугольников {Q } и {Qn}j первая из которых состоит из вписанных в фигуру Q многоугольников, а вторая из описанных вокруг Q многоугольников. Последователь- Последовательность {Q } получается посредством при- присоединения к квадрату Q полуоткрытых треугольников, удаляемых из треугольни- треугольников Ti, T2, Т3, Т± на каждом нечетном ша- шаге процесса, описанного в п. 1. Последо- Последовательность {Qn} получается посредством удаления из квадрата Q полуоткрытых треугольников, удаляемых из треугольни- треугольников Ti, T2, Т3, Т4 на каждом четном ша- шаге процесса, описанного в п. 1. Очевидно, что любой вписанный в фигуру Q много- многоугольник содержится в каком-нибудь мно- многоугольнике Q , а любой описанный вокруг фигуры Q многоугольник содержит какой- Рис. 11.21 нибудь многоугольник Qn. Поэтому предел последовательности {Яте} пло- площадей многоугольников Q равен нижней площади Р_ фигуры Q, а пре- предел последовательности {Sn} площадей многоугольников Qn равен верхней — п 1 _ площади Р фигуры Q. Легко убедиться, что S_ = 4 + J2 тттт? а 5П = 8 - 1-1 _ fe=J_4 - о Е ттгт Х)- Поэтому Р = lim 5те = 16/3, а Р = lim Sn = 22/3. Так как 2 jg==]_ 4 n-->oo n-—>oo F / Р, то фигура Q неквадрируема. Отметим, что разность Р—Р^ = 2. Таким образом, граница рассматриваемой фигуры Q имеет площадь, равную 2. 3. Докажем, что любая часть кривой L, ограниченная двумя различны- различными точками, неспрямляема. Докажем сначала, что такая часть Lf кривой L имеет отличную от нуля площадь, т. е. любой многоугольник, покрываю- покрывающий Ь;, имеет площадь, большую некоторого положительного числа. Заме- Заметим, что Lf содержит часть Ь/;, отвечающую точкам некоторого сегмента —, —— , и поэтому L!l содержится в треугольнике Т —, —-— и может быть получена посредством удаления из этого треугольника определенных полуоткрытых треугольников (см. п. 1 настоящего дополнения). Легко под- подсчитать, что сумма S площадей всех удаляемых полуоткрытых треугольни- [р р+11 —, . Следовательно, часть L имеет площадь, равную St — S > 0. В § 2 этой главы при доказательстве квадрируемости фигуры, ограниченной спрямляемой кривой, мы доказали, что площадь спрямляемой кривой равна нулю (спрямляемую кривую мож- можно покрыть многоугольником сколь угодно малой площади). Поэтому часть L" кривой L, а следовательно, и часть Ь;, содержащая Ь/;, неспрямляема. Замечание. Каждая из построенных функций <p(t) и ip{t) не имеет производной ни в одной точке сегмента [0,1]. ) Эти формулы легко получить, если учесть, что суммы площадей тре- треугольников, удаляемых на нечетных шагах процесса, образуют геометриче- геометрическую прогрессию 1,1/4,..., а суммы площадей треугольников, удаляемых на четных шагах процесса, — геометрическую прогрессию 1/2,1/8,...
ГЛАВА 12 ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛЕНИЯ КОРНЕЙ УРАВНЕНИЙ И ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ В этой главе рассматриваются приближенные методы нахож™ дения корней алгебраических и трансцендентных уравнений и вычисления определенных интегралов. § 1. Приближенные методы вычисления корней уравнений В этом параграфе мы займемся приближенным вычислением одного из корней уравнения f(x) = 0, где у = f(x) — некоторая непрерывная или дифференцируемая функция. Будем считать, что интересующий нас корень с этого уравнения изолирован на некотором сегменте [а, 6], т. е. будем считать, что этот корень яв™ ляется внутренней точкой сегмента [а, Ь], не содержащего других корней рассматриваемого уравнения. На практике обычно пу™ тем грубой прикидки определяют размеры указанного сегмента [а,Ъ]1). 1. Метод «вилки». Начнем с метода, который часто исполь- используется для приближенного вычисления корней на современных быстродействующих математических машинах. Пусть интересующий нас корень с уравнения /(ж) =0 изоли- изолирован на некотором сегменте [а, Ь]. Относительно функции f(x) мы предположим, что она непрерывна на сегменте [а, Ъ] и имеет на концах этого сегмента значения разных знаков. В дальней- дальнейшем для краткости мы будем называть «вилкой» всякий сег- сегмент, на концах которого f(x) имеет значения разных знаков. Перейдем к описанию метода отыскания корня уравнения f(x) = 0, называемого методом «вилки». ) При этом может быть использована вытекающая из физического со- содержания задачи дополнительная информация о расположении корня.
§ 1 ВЫЧИСЛЕНИЕ КОРНЕЙ УРАВНЕНИЙ 403 Ради определенности будем считать, что /(а)<0, /(Ь)>0. Разделим сегмент [а, Ь] пополам. При этом может представиться два случая: 1) значение функции в середине сегмента [а, Ь] равно нулю (в этом случае искомый корень найден); 2) указанное зна- чение не равно нулю. В этом случае одна из половин сегмента [а,Ь] является вилкой. Эту половину мы обозначим [ai,bi]. Оче- Очевидно, что /(ai) < 0, f(bi) > 0. С сегментом [ai,fti] поступим точно так же, как с сегментом [а, Ь], т. е. разделим сегмент [ai, Ь\\ пополам. Продолжая аналогичные рассуждения далее, мы бу- будем иметь две возможности: 1) либо описанный выше процесс оборвется вследствие того, что значение функции в середине некоторого из сегментов окажется равным нулю (в этом случае искомый корень найден); 2) либо описанный процесс можно про- продолжать неограниченно, и мы получим стягивающуюся систему сегментов-вилок [ai, bi], [«2^2]? • • • , [fln? bn]J ... , причем для лю- любого номера п f(an) < 0, f(bn) > 0. Указанная стягивающаяся система сегментов имеет одну общую точку с, к которой сходит- сходится каждая из последовательностей {ап} и {Ьп} (см. следствие из теоремы 3.15). Докажем, что с и является искомым корнем, т. е. /(с) = 0. Поскольку функция f(x) непрерывна в точке с, то каждая из последовательностей {f(an)} и {f(bn)} сходится к /(с). Но тогда из условий f(an) < 0, f(bn) > 0, в силу теоре- теоремы 3.13 и замечания к этой теореме, получим, что одновременно справедливы неравенства /(с) ^ 0 и /(с) ^ 0, т. е. /(с) = 0. Проведенные выше рассуждения дают алгоритм отыскания искомого корня с. За приближенное значение этого корня можно взять точку ^——-, т. е. середину сегмента [ап,Ьп]. Поскольку длина сегмента [аП1Ъп] равна , то число -^——- отличается от точного значения корня не более чем на 1 . Таким образом, описанный выше процесс последовательного деления сегментов- вилок пополам позволяет вычислить искомый корень с с любой наперед заданной степенью точности. Так как описанный про- процесс приводит к многократному повторению однотипных вы- вычислительных операций, он особенно удобен для проведения вы- вычислений на быстродействующих математических машинах. 2. Метод касательных 1). Метод касательных является од™ ним из самых эффективных приближенных методов вычисления корней уравнения f(x) = 0. Пусть искомый корень с уравнения f(x) = 0 изолирован на сегменте [а, Ь]. Перейдем к описанию метода касательных, не выясняя пока условий, при которых применим этот метод. 1) Этот метод называют также методом Ньютона.
404 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Обратимся к рассмотрению графика функции f(x) на сег- менте [а, Ь] (рис. 12.1). Возьмем за нулевое приближение иско- искомого корня некоторое значение х® из сегмента [а, Ь] и обозна- обозначим Во точку графика функции с абсциссой х®. Проведем через точку Во касательную к графику функции и возьмем за пер- первое приближение искомого корня абсциссу х\ точки пересечения этой касательной с осью Ох1). Далее проведем касательную к графику функции через точку В\ с абсциссой х\ и возьмем за второе приближение абсциссу Х2 точки пересечения этой каса- касательной с осью Ох. Продолжая этот процесс неограниченно, мы построим последовательность х®^ #i,... , хП1... приближенных значений искомого корня. В практических целях удобно получить рекуррентную фор- формулу, выражающую хп+\ через хп. Для этого возьмем уравне- уравнение Y — f(xn) = ff(xn)(x — хп) касательной к графику функции в точке Вп и вычислим абсцис- абсциссу хп+\ точки пересечения этой касательной с осью Ох. При этом получим х«-Шг A2Л) Формула A2.1) определяет ал- алгоритм метода касательных. Хаким образом, метод каса- касательных представляет собой Рис> 12л метод последовательных при- приближений (или, как говорят, метод итераций), которые строятся при помощи рекуррентной формулы A2.1). Нашей дальнейшей задачей является обоснова- обоснование метода касательных. В п. 5 мы выясним условия, при которых последовательность значений xnj определяемых формулой A2.1), сходится к иско- искомому корню с, и дадим оценку погрешности, т. е. отклонения приближенного значения хп от точного значения корня с. 3. Метод хорд. К числу широко распространенных прибли- приближенных методов решения уравнения f(x) = 0 относится метод хорд. Перейдем к описанию этого метода, не выясняя пока условий, при которых он применим. 1) Так как касательная в точке Во представляет собой график диффе- дифференциала функции у = /(ж) в точке xq, to указанный прием отыскания первого приближения х\ основан на замене функции ее дифференциалом в точке xq.
§ 1 ВЫЧИСЛЕНИЕ КОРНЕЙ УРАВНЕНИЙ 405 Предположим, что искомый корень с уравнения f(x) = 0 изо™ лирован на сегменте [а, Ь], и обратимся к рассмотрению графика функции f(x) на этом сегменте (рис. 12.2). Возьмем за нулевое приближение искомого корня некоторое число х® из сегмента [а, Ь] и обозначим А® и В точки графика функции с абсциссами х® и Ь. Проведем через точки А® и В графика функции хорду А®В и возьмем за первое приближение искомого корня абсцис- су х\ точки пересечения этой хорды с осью Ох (см. рис. 12.2). Далее проведем хорду через точки графика функции А\ с абсциссой Ж1 и В. За второе приближение возьмет абсцис™ су Х2 точки пересечения хор- хорды А\В с осью Ох. Продолжая этот процесс неограниченно, мы построим последователь- последовательность жо,жъ ... ,жп,... при™ ближенных значений искомого корня. В практических целях удоб™ но получить рекуррентную формулу, выражающую хп+\ Рис- 12-2 через хп. Для этого возьмем уравнение ,/1Ч \,п\ = хор- f{p)-j(xn) Ь-хп ды, проходящей через точки Ап(хп, f(xn)) и В(Ь, /(Ь)), и вычис- вычислим абсциссу xn^i точки пересечения этой хорды с осью Ох. При этом получим (b-xn)f(xn) (U2) Формула A2.2) определяет алгоритм метода хорд. Таким об- образом, метод хорд представляет собой метод итераций, кото- которые строятся при помощи рекуррентной формулы A2.2). Нашей дальнейшей задачей является обоснование метода хорд. В п. 6 мы выясним условия, при которых последовательность значений хп сходится к искомому корню с, и дадим оценку по- погрешности метода хорд. 4. Метод итераций (последовательных приближе- приближений). Из пп. 2 и 3 ясно, что методы касательных и хорд свя- связаны общей идеей построения последовательных приближений к искомому корню. Эта идея и лежит в основе излагаемого в настоящем пункте метода. Этот метод мы рассмотрим в применении к уравнению x = F(x). A2,3)
406 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Введем понятие итерационной последовательности. Последовательность #о, #ъ • • • ? жш • • • будем называть ите- итерационной, если для любого п ^ 1 элемент жте выражается через элемент хп^\ по рекуррентной формуле жте = F{xn-i), а в ка- качестве xq взято любое число из области задания функции F(x). Мы докажем, что при определенных условиях итерационная по- последовательность сходится к корню уравнения A2.3) и, стало быть, ее элементы могут быть взяты за приближенные значе™ ния этого корня. Справедливо следующее утверждение. Утверзюдение I. Пусть функция F(x) непрерывна на сег- сегменте [а,Ь], и пусть все элементы итерационной последова- последовательности жо, #ъ ... 5 хп-> • • • леэюат на этом сегменте. Тогда, если эта последовательность сходится к некоторому числу с, то указанное число с является корнем уравнения A2.3). Доказательство. Так как последовательность {хп} сходится к с и все ее элементы принадлежат сегменту [а, Ь], то и предел с принадлежит сегменту [а, Ь] (см. следствие 2 из тео- ремы 3.13). По условию функция F(x) непрерывна в точке с, и поэтому последовательность {F(xn^\)} сходится к F(c). Таким образом, равенство хп = F(xn-i) в пределе при п —> оо пере™ ходит в равенство с = F^), т. е. с является корнем уравнения A2.3). Доказанное утверждение будет существенно использова- использовано нами в пп. 5 и 6 для обоснования метода касательных и хорд. Докажем еще одно утверждение, часто используемое для приближенного вычисления корня уравнения A2.3) с помощью итерационной последовательности. Утверзюдение 2. Пусть с — корень уравнения A2.3), и пусть в некотором симметричном относительно точки с сег- сегменте [с — 6, с + е] производная функции F(x) удовлетворяет условию \Ff(x)\ ^ а < 1. Тогда итерационная последователь- последовательность жо, жъ ... j%m • • • 1 У которой в качестве х® взято любое число из сегмента [с —?, с + е], сходится к указанному корню с. Доказательство. Прежде всего докажем, что все элементы итерационной последовательности {хп} принадлежат указанному сегменту [с —в, с + в]. В самом деле, х® принадлежит этому сегменту по условию. Поэтому достаточно, предположив, что хп^\ принадлежит этому сегменту, доказать, что и хп ему принадлежит. Для этого применим формулу Лагранжа к разно- разности F(xn^i)^F(c) и учтем, что F(c) = с, хп = F{xn-\). Получим хп - с = Fixn-d - F[c) = F'{0(xn-i - с), A2.4) где ? — некоторая точка, лежащая между хп^\ и с и, стало быть, принадлежащая сегменту [с — е^с + е]. Так как \Ff(^)\ ^ а < 1,
ВЫЧИСЛЕНИЕ КОРНЕЙ УРАВНЕНИЙ 407 то из равенства A2.4) получим — с\ ^i - с A2.5) Из A2.5), поскольку 0 < а < 1, в свою очередь получим \хп — с\< \xn-i - с\. A2.6) Неравенство A2.6) устанавливает, что каждый последующий элемент хп расположен к с ближе, чем предыдущий элемент жп_1, и, стало быть, так как хп^\ принадлежит сегменту [с — — е, с + б] и так как этот сегмент симметричен относительно точ™ ки с, то и хп принадлежит этому сегменту. Остается доказать, что последовательность {хп} сходится к с. Поскольку неравен- неравенство A2.5) справедливо для всех номеров п, то с помощью этого неравенства получим \хп-с\ ^ап\х0-с\. A2.7) Из последнего неравенства очевидно, что хп —>> с, ибо ап —>• 0. Утверждение 2 доказано. Сделаем практические замечания относительно только что доказанно™ го утверждения. Предположим, что путем предварительной прикидки мы установили, что интересующий нас корень уравнении A2.3) изолирован на некотором сегменте [а, 6], на котором производная функция F(x) удовле- удовлетворяет условию \F (х)\ ^ а < 1. Так как сегмент [а,Ь], вообще говоря, не является симметричным от- относительно искомого корня, то, естественно, возникает вопрос о том, как выбрать нулевое приближение жо, с тем, чтобы можно было применить доказанное а о ^ р~а о Ь выше утверждение 2. Заметим, что где бы внутри сегмента [а, Ь] ни находился ис™ 2с-Ь с комый корень с, хотя бы один из двух а ° ° ° ° Ь симметричных относительно с сегментов [а, 2с — а] или [2с — b,b] (рис. 12.3) цели- Рис. 12.3 ком принадлежит сегменту [а, Ь]. Поэто- Поэтому хотя бы одна из точек а или Ь принадлежит симметричному относи™ тельно корня с сегменту, всюду на котором \F (ж)| ^ а < 1. Стало быть, по крайней мере одну из точек а или Ь можно, согласно доказанному выше утверждению 2, выбрать за хо. Конкретно за жо следует выбрать ту из двух точек а или Ь, для которой приближение х\ = F(xo) не выходит за пределы сегмента [а, Ь]. На практике чаще всего встречается случай, когда производ- производная Ff(x) имеет на сегменте [а, Ь] определенный знак. Если этот знак положителен, то из формулы A2.4) следует, что последо- последовательность {хп} монотонна. Этот случай приводит к так на- называемой ступенчатой диаграмме^ изображенной на рис. 12.4. Если же производная Ff(x) отрицательна на сегменте [а, Ь], то из той же формулы A2.4) видно, что любые два последовательных элемента хп^\ и хп лежат по разные стороны от корня с. Этот
408 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Рис. 12.4 Рис. 12.5 случай приводит к так называемой спиралеобразной диаграмме, изображенной на рис. 12.5. Замечание. Возникает вопрос об оценке погрешности ме- метода итераций, т. е. об оценке отклонения п-то приближения хп от точного значения корня с. Из формулы A2.7) непосредствен™ но вытекает следующая оценка: otn(b — а), где а — точная верхняя грань функции |i^'(a;)| на сегменте [а, Ь], на котором изолирован рассматриваемый корень. Если произ- производная F(x) отрицательна на сегменте [а1 Ь], то, как указано вы- выше, хп^\ и хп лежат по разные стороны от корня с, и поэтому справедлива следующая оценка: хп с\ \хп %п—1 Если же в рассматриваемом случае взять за приближенное зна- значение корня полусумму двух последовательных приближений то получим следующую оценку погрешности: 5. Обоснование метода касательных. 1°. Рассмотрим сначала случай, когда искомый корень с урав- уравнения f(x) = 0 изолирован на некотором сегменте [а, Ь], на кото- котором функция f(x) имеет не обращающуюся в нуль первую про- изводную и ограниченную вторую производную. Докажем, что в этом случае найдется такая достаточно малая окрестность кор™ ня с, что если нулевое приближение х® лежит в этой окрест™
§ 1 ВЫЧИСЛЕНИЕ КОРНЕЙ УРАВНЕНИЙ 409 ности, то последовательность {ж^}, определяемая рекуррентной формулой A2.1), сходится к корню с. Прежде всего, заметим, что уравнение x = F(x), где F(x)=x-j^ A2.8) имеет на сегменте [а, Ь] только один корень с, совпадающий с корнем уравнения f(x) = 0. Поэтому вместо уравнения f(x) =0 мы будем решать уравнение A2.8). Для этого, взяв некоторое xq, построим итерационную последовательность xn+l = F(xn) = xn- j&±. A2.9) Заметим, что рекуррентная формула (И точности совпада™ ет с рекуррентной формулой A2.1). Чтобы доказать сходимость итерациоииии последовательно™ сти {хп} к искомому корню с, достаточно доказать, что в неко- некоторой ^окрестности корня с производная Ff(x) удовлетворяет условию ^'(ж)! ^ а < 1, и взять х® в указанной е-окрестности (см. утверждение 2 из п. 4). В силу требований, наложенных на функцию /(ж), найдутся положительные числа т и N такие, что всюду на сегменте [а, Ь] выполняются неравенства |/'(ж)|^т>01), |/"W|a. A2.10) Поскольку Fi(r\ = 1 _ [f'(x)]2-f(x)f"(x) f(x)f"(x) { ' 1Г(х)}2 [f(x)? ' то из неравенств A2.10) вытекает следующая оценка: |^'(аО| < ^Ж. A2.11) Из непрерывности функции f(x) вытекает, что в некоторой е^окрестности корня с эта функция удовлетворяет неравенству 1/(*I < ^ A2-12) где а — фиксированное число из интервала 0 < а < 1. Сопо- Сопоставляя неравенства A2.11) и A2.12), мы получим, что всюду в указанной е-окрестности корня Ff(x)\ <a< 1. Тем самым сходимость последовательности A2.9) к корню с до- доказана. ) Эти неравенства вытекают из того, что производная ff(x) непрерывна и не обращается в нуль на рассматриваемом сегменте.
410 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Замечание 1. Мы доказали сходимость последователь™ ности {хп} к корню с лишь при условии, что нулевое приближе- приближение х® лежит в достаточно малой ^-окрестности корня с. Выбор нужного х® без труда осуществляется на современной быстро™ действующей электронно-вычислительной машине при помощи нескольких проб. Замечание 2. Оценим отклонение приближенного значе- значения корня хп^\ от точного значения с. С этой целью разложим функцию f(x) в окрестности хп по формуле Тейлора с остаточ- остаточным членом в форме Лагранжа: /(ж) = f(xn) + f'{xn){x — хп) + fr — хп) . Полагая в этой формуле х = с и учитывая, 2J что /(с) =0, будем иметь О — f(T \ _|_ ff(T \(r _ т \ 1 1 f11 (р\(е — т J Вычитая из последней формулы формулу f(xn) + ff(xn)(xn^i — — хп) = 0, которая вытекает из рекуррентного соотношения A2.9), получим Хп+г ^ с = 2 f'(xVn ~ С^2' Отсюда, используя принятые выше обозначения A2.10), придем к следующему неравенству: N 9 \ гр ^ /т> <^ ______ гр f» Последовательно применяя эту оценку для п = 0,1,2,..., полу- получим следующую оценку: ]V\n _ - 2°. Дадим обоснование метода касательных при несколько иных предположениях. Пусть искомый корень с уравнения f(x) = 0 изолирован на сегменте [а,Ь], на котором f(x) имеет монотонную первую про- изводную^ сохраняющую определенный знак. Эта производная обязательно непрерывна, ибо она не может иметь точек разрыва первого рода, а монотонная функция других точек разрыва не имеет. Ради определенности предположим, что производная не убы- убывает и положительна на сегменте [а, Ь]. Докажем, что итераци- итерационная последовательность {хп}^ у которой х® = 6, а хп+\ опреде- определяется через хп с помощью формулы A2.9), сходится к корню с. Если для некоторого номера п окажется, что хп = с, где с — искомый корень, то f(xn) = /(с) = 0 и из формулы A2.9) полу- получим, что и хп+\ = с. Продолжая аналогичные рассуждения, мы
ВЫЧИСЛЕНИЕ КОРНЕЙ УРАВНЕНИЙ 411 последовательно докажем, что и хп+2 = %п+з = ... = с, т. е. в этом случае итерационная последовательность {хп} сходится к искомому корню с. Теперь докажем по индукции, что если хп удовлетворяет соотношениям с < хп ^ Ь, то хп+\ удовлетворяет соотноше- соотношениям с ^ хп+\ ^ хп ^ Ь. Отсюда будет следовать, что все хп принадлежат сегменту [с,Ь] (ибо xq = Ь принадлежит этому сегменту), а также тот факт, что последовательность {хп} является невозрастающей и потому сходящейся. В силу утверждения 1 из п. 4 сходимость последовательности {хп} и принадлежность всех ее элементов сегменту [с, Ь] (а потому и сегменту [а, Ъ]) завершает доказатель- доказательство сходимости этой последовательности к искомому корню с. Итак, остается доказать, что если хп удовлетворяет соотно- шениям с < хп ^ 6, то хп+\ удовлетворяет соотношениям с ^ ^ xn+i < хп. Пусть с < хп ^ Ъ. Тогда из формулы A2.9), учитывая, что /(с) = 0, получим Хп Хп+1- f/{x) . Применяя к выражению, стоящему в числителе последней дро- дроби, формулу Лагранжа, получим т — где с < ^п < хп. В силу того, что производная функции f(x) не убывает и положительна, дробь v ; положительна и не пре- / \хп) восходит единицы, т. е. О ^ хп — хп+\ —хп — с или с ^ хп+\ ^ хп. Замечание 3. Мы рассмотрели случай, когда ff(x) не убывает и положительна на [а, Ь]. Возмож:ны еще три слу- случая: 1) f'{x) не возрастает и отрицательна на [а,Ъ\, 2) f'{x) не возрастает и пололсительна на [а, Ь]; 3) ff(x) не убывает и отри™ цательна на [а, Ь]. В калсдом из этих трех случаев обоснование метода касатель- касательных проводится в полной аналогии со случаем, рассмотренным выше. Отметим лишь, что в случае 1) за нулевое приближение следует взять значение xq = Ь, а в случаях 2) и 3) — значение х® = а. Это обеспечит принадлежность всех членов итерацион- итерационной последовательности {хп} сегменту [а, Ь] и сходимость этой последовательности к искомому корню с. Замечание 4. Укажем оценку отклонения n-го прибли- приближения хп от точного значения корня с (при сформулированных в этом пункте предположениях).
412 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Применяя к выражению f(xn) = f(xn) — /(с) формулу Ла- гранжа, будем иметь f(xn) = (хп — c)ff(^n). Отсюда получим следующую оценку: |Жи_с|^ШМ? A2.13) где т — минимальное значение |/;(ж)| на сегменте [а, Ь]. Форму- Формула A2.13) позволяет оценить отклонение хп от точного значения корня с через значение модуля заданной функции у = /(ж) в точке хп. 6. Обоснование метода хорд. Предположим, что искомый корень с уравнения f(x) = 0 изолирован на некотором сегмен- сегменте [а, Ь], на котором функция f(x) имеет монотонную первую производную^ сохраняющую постоянный знак. Ради определен- определенности будем считать, что эта производная не убывает и положи- положительна на сегменте [а, Ь]. Заметим, что уравнение х = F(x), где F(x) =x- j^0j^ l) A2-14) имеет на сегменте [а, Ъ] только один корень с, совпадающий с корнем уравнения f(x) =0. Поэтому вместо уравнения f(x) =0 мы будем решать уравнение A2.14). Для этого, взяв х® = а, построим итерационную последовательность хп+1 - t \хп) - хп /(fe) _ f{x^ . {иль) Заметим, что рекуррентная формула A2.15) в точности совпа- совпадает с рекуррентной формулой A2.2). Докажем, что последовательность {хп} сходится к искомому корню с. Если для некоторого номера п окажется, что хп = с, где с — искомый корень, то f(xn) = /(с) = 0 и из формулы A2.15) по- получим, что и хп^\ = с. Продолжая аналогичные рассуждения, мы последовательно докажем, что и хп+2 = хп+% = ... = с, т. е. итерационная последовательность {хп} сходится к искомо™ му корню с. Докажем теперь по индукции, что если хп удовлетворяет соотношениям а ^ хп < с, то хп+\ удовлетворяет соотноше- соотношениям а ^ хп ^ хп+\ ^ с. Отсюда и из того, что х® = а, будет следовать, что все хп при- принадлежат сегменту [а, с] (и тем более сегменту [а, Ь]) и что по- последовательность {хп} является неубывающей (а потому и схо- сходящейся) . 1) При этом считаем, что F(b) = Ь — , , . Тогда функция F(x) будет непрерывна на всем сегменте [а, 6].
§ 1 ВЫЧИСЛЕНИЕ КОРНЕЙ УРАВНЕНИЙ 413 В силу утверждения 1 из п. 4 это завершит доказательство сходимости итерационной последовательности {хп} к искомому корню с. Итак, остается доказать, что если хп удовлетворяет соотно™ шениям а ^ хп < с, то хп^\ удовлетворяет соотношениям хп ^ < Хп+1 < С. Пусть а ^ хп < с. Из соотношения A2.15), учитывая, что /(с) = 0, получим „. _ (Ъ-ХпШхп) _ (b-xn)[f(c)-f(xn)] х — №-f(xn) [f(b)-f(c)] + [f(c)-f(xn)Y Применяя к выражениям в квадратных скобках теорему Ла- гранжа, получим т м_г (fr ~ Xn)f feO . (г _ т \ A о 1 а) где жи < ^п < с, с < ^* < Ь, так что ?п < ?*. В силу неубывания и положительности производной ff(x) можно записать, что 0 < < /;(Cn) ^ ff(^n)- Отсюда следует, что дробь в правой части A2.16) положительна и, кроме того, не превосходит единицы 1 ТЙГПО ( О — С1 Т I г I -4- ( С — 1* \ t \ г I J> If) — Г1 I -4- I С — Т* \\ Т \ г I — = (Ь - ^)/;(^)). Стало быть, 0 ^ xn+i — хп ^ с - жп, т. е. Замечание 1. Мы рассмотрели случай, когда f'{x) не убывает н положительна на [а, Ь]. Возможны еще три слу™ чая: 1) f'{x) не возрастает и отрицательна на [а, Ь]; 2) ff(x) не возрастает и положительна на [а, Ь]; 3) f'{x) не убывает и отри- отрицательна на [а, Ь]. Эти три случая аналогичны рассмотренному выше. В случае 1) уравнение f(x) = 0, так же как и выше, заменяется уравне- уравнением A2.14) и в качестве нулевого приближения берется xq = a (при этом последовательность {хп} также оказывается неубы- неубывающей). В случаях 2) и 3) уравнение f(x) = 0 заменяется не уравнением A2.14), а уравнением где тр(т\ — т _ (Q — х)](х) { ' /(а) - f(x) и в качестве нулевого приближения берется точка х® = Ь (при этом последовательность {хп} оказывается невозрастающей). Замечание 2. Укажем, что для метода хорд справедлива та же самая оценка A2.13) отклонения хп от корня с, что и для метода касательных.
414 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Замечание 3. На практике часто используют комби™ нированный метод, заключающийся в поочередном применении метода хорд и метода каса- касательных. Ради определенно™ сти предположим, что ff(x) не убывает и положительна на сегменте [а, Ь] (рис. 12.6). Определим х\ по методу каса- касательных, взяв за нулевое при- приближение точку Ь. После это- этого определим Ж2, применяя ме- метод хорд, но не к сегменту [а, 6], а к сегменту [а, жх]. Да- Далее, определим жз по методу касательных, исходя из уже Рис. 12.6 найденного жх, а ж 4 по методу хорд, применяя его к сегменту [ж2,жз]. Указанный процесс иллюстрируется на рис. 12.6. Преимущества комбинированного метода состоят в следую- следующем: во-первых, он дает более быструю сходимость, чем метод хорд, и, во-вторых, поскольку последовательные приближения хп и хп+\ комбинированного метода с разных сторон прибли- приближаются к корню, то разность дает оценку погрешно- Хп+1 сти этого метода. Если за приближенное значение корня взять ж* = — 2+1^ То для погрешности получим оценку \х1 - с < § 2. Приближенные методы вычисления определенных интегралов 1. Вводные замечания. При решении ряда актуальных фи- физических и технических задач встречаются определенные инте- интегралы от функций, первообразные которых не выражаются че- через элементарные функции. Кроме того, в приложениях прихо- приходится иметь дело с определенными интегралами, сами подынте- гральные функции которых не являются элементарными. Это приводит к необходимости разработки приближенных методов вычисления определенных интегралов 1). В этом параграфе мы познакомимся с тремя наиболее упо™ требительными приближенными методами вычисления опреде- ) Заметим, что приближенными методами часто пользуются и для ин- интегралов, выражающихся через элементарные функции.
ВЫЧИСЛЕНИЕ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ 415 ленных интегралов: методом прямоугольников, методом тра- трапеций и методом парабол. Основная идея этих методов заключается в замене подын- тегральной функции f(x) функцией более простой природы — многочленом, совпадающим с f(x) в некоторых точках. Для уяс- h нения этой идеи рассмотрим при малых h интеграл J f(x)dx, представляющий собой площадь узкой криволинейной трапе™ ции, лежащей под графиком функции у = f(x) на сегменте [М] ( 7) Заменим функцию f(x) многочленом нулевого порядка, а h именно константой /@). При этом интеграл / f{x)dx прибли- -h женно заменится площадью прямоугольника^ заштрихованного на рис. 12.8. Ниже мы покажем, что при определенных требо™ ваниях на f(x) ошибка, совершаемая при такой замене, имеет У -h 0 h У -h 0 h х Рис. 12.7 Рис. 12.8 Рис. 12.9 порядок /г3. Заменим, далее, функцию f(x) многочленом перво- первого порядка, а именно линейной функцией у = кх + Ь, совпада™ h ющей с f(x) в точках —h и h. При этом интеграл J f(x)dx приближенно заменится площадью прямолинейной трапеции, заштрихованной на рис. 12.9. Ниже мы покажем, что при опре- определенных требованиях на f(x) ошибка, совершаемая при такой
416 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 У замене, также имеет порядок Л,3. Заменим, наконец, функцию f(x) многочленом второго порядка, т. е. параболой у = Ах2 + + Вх + G, совпадающей с f(x) в точках —/г, 0 и h. При этом h интеграл J f(x)dx приближенно заменится -h площадью фигуры^ лежащей под параболой и заштрихованной на рис. 12.10. Ниже мы покажем, что при определенных требованиях на функцию f(x) ошибка, совер- совершаемая при такой замене, имеет порядок h5. ь Если требуется вычислить интеграл J f{x)dx а по любому сегменту [а,Ь], то естественно этот сегмент разбить на достаточно большое число малых сегментов и к каждому из этих сегмен™ тов применить изложенные выше рассуждения. При этом мы и придем к методам прямоуголь- прямоугольников, трапеций и парабол в их общем виде. Детальное изложение каждого из этих трех методов дается ниже. Здесь же мы сделаем одно важное для дальнейшего замечание. Замечание. Пусть функция f(x) непрерывна на сег- сегменте [а, Ь], а х\ , X2 , • • • jXn — некоторые точки сегмента [а, Ь]. Тогда на этом сегменте найдется точка ? такая^ что среднее j* f(%l) + f (#2) + • • • + f(Xn) арифметическое ——-——— ——- равно -h 0 h Рис. 12.10 В самом деле, обозначим через тш М точные грани функции f(x) на сегменте [а, Ь]. Тогда для любого номера к справедливы неравенства т ^ f{%k) ^ М (к = 1,2,... ,п). Просуммировав эти неравенства по всем номерам к = 1,2,... , п и поделив ре- результат на п, получим т ^ Так как непрерывная функция принимает любое промежуточ™ ное значение, заключенное между т и М, то на сегменте [а, Ь] найдется точка ^ такая, что — . (lZ.l/J п 2. Метод прямоугольников. Пусть требуется вычислить интеграл ъ f(x) dx. A2.18)
ВЫЧИСЛЕНИЕ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ Разобьем сегмент [а, Ь] на п равных частей при помощи точек а = х® < Х2 < ... < Х2п = Ь. Обозначим через #2fc-i среднюю точку сегмента [х2к-2^2к] (рис. 12.11). Метод прямоугольников заключается в замене интеграла A2.18) суммой Ь — а площадей прямоугольников с высотами, соответственно равны- равными f(x2k-i)i и основаниями, равными Х2к ~ х2к-2 = ^^^ (эти прямоугольники заштрихованы на рис. 12.11). Таким образом, справедлива формула f(x) dx = b ~~ a r + f(x3) + ... + f(x2n-i)] + R, A2.19) где R — остаточный член. Формула A2.19) называется формулой прямоугольников. Докажем, что если функция f(x) имеет на сегменте [а, Ь] непрерывную вторую производную, то на этом сегменте най- найдется такая точка rj, что остаточный член R в формуле A2.19) равен 24n2 . A2.20) С этой целью оценим сна™ чала J f{x)dx) считая, что а, -h функция f(x) имеет на сег- сегменте l^hj +h] непрерыв- Рис- 12.11 ную вторую производную. Для этого подвергнем двукратному интегрированию по ча- частям каждый из следующих двух интегралов: h= , I2= -h 14 B.A. Ильин, Э.Г. Позняк, часть I
418 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Для первого из этих интегралов получим о о h = J f{2)(x)(x+hfdx = [(x+hJf\x)]\°_-2 j f\x){x+h)dx = 0 = f@)h2 - [2(x + h) • f(x)]\°_h+2 I f(x) dx = 0 = f@)h2 - 2f@)h + 2 Г f{x) dx. -h Для второго из интегралов совершенно аналогично получим h h = -/Ш2 - 2 • /@)Л + 2 J fix) dx. о Полусумма полученных для 1\ и I2 выраж:ений приводит к следующей формуле: h ^. A2.21) Оценим величину г 2, применяя к интегралам 1\ и 1^ фор™ мулу среднего значения и учитывая неотрицательность функ- функций (ж + КJ и (ж — КJ. Мы получим, что найдутся точка ?i на сегменте [—Л, 0] и точка ^2 на сегменте [0, h] такие, что -h 0 0 h = -|/B)(ei) f{x + hfdx + i/B)F) J(X - hfdx = -h 0 В силу замечания в конце п. 1 на сегменте [—Л, +К\ найдется точка г\ такая, что
§ 2 ВЫЧИСЛЕНИЕ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ 419 Поэтому для полусуммы мы получим следующее вы™ ражение: Вставляя это выражение в A2.21), получим, что h Г f(x) dx = 2f@)h + Д, A2.22) -h где yi2)f (-h^ri^h). A2.23) Так как величина 2/@) • h представляет собой площадь пря- моугольника, заштрихованного на рис. 12.8, то формулы A2.22) и A2.23) доказывают, что ошибка, совершаемая при замене h J f(x) dx указанной площадью, имеет порядок Л,3. h Таким образом, формула J f(x)dx ^ 2f@)h тем точнее^ Ъ чем меньше h. Поэтому для вычисления интеграла J f(x)dx а естественно представить этот интеграл в виде суммы достаточ- достаточно большого числа п интегралов Х2 Х4 Х2п Г Г Г / f(x) dx + / f(x) dx + ... + / f(x) dx XQ X2 X2n-2 и к калсдому из указанных интегралов применить формулу A2.22). Учитывая при этом, что длина сегмента [х2к-2чх2к] равна , мы получим формулу прямоугольников A2.19), в которой R = i?i+i?2~K • -^"Rfi= 24п2 п ~ 24п2 * ^'' (Здесь а ^ г] ^ Ъ. Мы воспользовались формулой A2.17) для функции 14*
420 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 3. Метод трапеций. Пусть, как и выше, требуется вычис™ лить интеграл ь I f(x)dx. A2.18) Разобьем сегмент [а, Ь] на п равных частей при помощи точек а = х® < х\ < Х2 < ... < хп = b (рис. 12.12). Метод трапеций заключается в замене интеграла A2.18) суммой площадей трапеций с основаниями, соответственно равными -i) и f(xk), и с высотами, равными х^ — xj^^i = (эти трапеции заштрихованы на рис. 12.12). Таким образом, справедлива формула n-1 X® X\ k=i Д, A2.24) Рис. 12Л2 где R — остаточный член. Фор- Формула A2.24) называется форму- лой трапеций. Докажем, что если функция f(x) имеет на сегменте [а, Ь] непрерывную вторую производную, то на этом сегменте най™ дется такая точка rj, что остаточный член R в формуле A2.24) имеет вид A2.25) +h Оценим сначала интеграл J f(x)dx, считая, что функция -h f(x) имеет на сегменте [—h,+h] непрерывную вторую произ- производную.
§ 2 ВЫЧИСЛЕНИЕ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ 421 Подвергая интеграл J f^(x)(x2 ^ h2) dx двукратному инте™ -h грированию по частям, получим +h +h f f^(x)(x2 - h2) dx = [f(x)(x2 - h2)] +k - 2 / f(x) dx = J -h J -h f(x)dx = -h -h +h -\-n = -2[f(-h) + f(+h)]h + 2 f f(x) dx. A2.26) -h В силу A2.26) приходим к формуле h f(x) dx = 1к^1±Ш.2Н + Д, A2.27) -h где (-h^rj^h). A2.28) 1ак как величина ^^—J x J In представляет собой площадь трапеции, заштрихованной на рис. 12.9, то формулы A2.27) и A2.28) доказывают, что ошибка, совершаемая при замене h J f(x) dx указанной площадью, имеет порядок /г3. Ъ Для вычисления интеграла J f(x) dx^ как и в методе прямо- а угольников, представим этот интеграл в виде суммы достаточно большого числа п интегралов Х\ Х2 Хп f(x)dx + J f(x)dx + ...+ J f(x)dx. Применяя к каждому из этих интегралов формулы A2.27) и A2.28), мы и придем к формуле трапеций A2.24) с выражением для остаточного члена A2.25).
422 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 4. Метод парабол. Для вычисления интеграла ь f(x)dx A2.18) снова разобьем сегмент Ь [а, Ь] на п равных частей при помощи точек а = х® < < Х2 < ... < Х2п = Ь и обо- обозначим через X2k-i середи™ Рис. 12ЛЗ ну сегмента [х2к-2^2к\- Ме- Метод парабол заключается в замене интеграла A2.18) суммой /ЫЖ/Ы- ... + [/(ж2п-2)+4/(ж2п-1) = ^{/(а) + /(Ь) + 2 { к=1 к=0 ) площадей фигур, заштрихованных на рис. 12.13 и представляю- представляющих собой криволинейные трапеции, лежащие под параболами, проходящими через три точки графика функция f(x) с абсцис- абсциссами X2k—2i X2k — l и Х2к /• Таким образом, справедлива формула ь Ь — а гс-1 гс-1 jf{x)dx = гс-1 ГС-1 Да) + /F) + 2]Р f(x2k) + 4 J] /(*2*+i) A;=l fc=0 A2.29) где R — остаточный член. Формула A2.29) называется формулой бол или формулой Симпсона. Докажем, что если функция f(x) имеет на сегменте [а, Ь] непрерывную четвертую производную, то на этом сегменте най- найдется такая точка г/, что остаточный член R в формуле A2.29) равен S/D)(^)- A2-30) 1) Из примера 2 п. 4 § 2 гл. 11 вытекает, что выражение с учетом того, что —, представляет собой площадь, лежащую под параболой, проходящей через три точки гра- графика фуНКЦИИ /(ж) С абсЦИССамИ Ж2&-2, Х2к-1 И Х2к-
ВЫЧИСЛЕНИЕ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ 423 С этой целью оценим сначала J f(x)dx1 считая, что функ- ция f(x) имеет на сегменте [—h,+h] непрерывную четвертую производную. Для этого подвергнем четырехкратному интегрированию по частям каждый из следующих двух интегралов: о h -h О Для первого из этих интегралов получим о -h - {/<2> (х) [З(х + /гJ (ж - J) + (х + hK] } + J f\ f I Т" I I /У I л! I I T* I 1 I T* I fl 1 i UJ \ / \ ' / I "o" I V / I. L \ о / -{б/(ж)Dж + | + f(x)dx = о = -/C)@)y +4/'@)/l2 -8h[f(-h) + 2/@)]+ 241/(x) Для I2 совершенно аналогично получим A2.31) . A2.32) о Посредством сложения соотношений A2.31) и A2.32) полу- получим следующее равенство: J f(x) dx = 2/г + A2.33) Для оценки х применим к интегралам 1\ и I2 формулу среднего значения, учитывая неположительноств функций (х + + /гK (х -- и (ж- /гK (ж + - ) на сегментах [—Л, 0] и [0, соответственно.
424 ПРИБЛИЖЕННЫЕ МЕТОДЫ ГЛ. 12 Мы получим, что найдутся точка ?i на сегменте [—/г, 0] и точ™ ка ^2 на сегменте [0, +h] такие, что h + h I 24 24 -h +h 90 2 0 Снова используя замечание в конце п. 1, мы получим, что на сегменте [—/i, +h] найдется точка г/ такая, что . Т 1 К A2.34) Из A2.33) и A2.34) окончательно получим h + R, A2.35) -h где пп [/(-/г) +4/@) + /(/г)] о, г- „ 1ак как величина ^^— ±^J-— v /J 2/г представляет собой 6 площадь фигуры, лежащей под параболой и заштрихованной на рис. 12.10, то формулы A2.35) и A2.36) доказывают, что ошибка, h совершаемая при замене J f(x) dx указанной площадью, имеет порядок /г5. ъ Для вычисления интеграл J f(x) dx, так же как и в методах а прямоугольников и трапеций, представим этот интеграл в виде суммы п интегралов Л\ 7 i I Г / \ 1 i i I P / \ 1 Т I /7 "Т -4- I г Т /7 "Т -4- -4- I f т /IТ* %0 X2 %2п-2 Применяя к каждому из этих интегралов формулы A2.35) и A2.36), мы и придем к формуле Симпсона A2.29) с выражением для остаточного члена A2.30). Сравнивая остаточный член A2.30) с остаточными членами A2.20) и A2.25), мы убеждаемся в том, что формула Симпсо™
§ 2 ВЫЧИСЛЕНИЕ ОПРЕДЕЛЕННЫХ ИНТЕГРАЛОВ 425 на дает большую точность, чем формулы прямоугольников и трапеций. В качестве иллюстрации применения формулы Симпсона %о 2 обратимся к вычислению интеграла I(xq) = / e^x dx1)^ огра™ о ничиваясь для простоты значениями xq из сегмента 0 ^ xq ^ 1. Полагая f(x) = е~х и вычисляя производную f^(x) = 4Dж4 — — 12ж2 + 3)е^ж , без труда убедимся в том, что для всех х из сегмента 0 ^ х ^ xq ^ 1 во всяком случае |/D)(ж)| < 20. Исходя из оценки A2.30), можем утверждать, что |Д| < . Стало быть, разбив сегмент [0, xq] всего на пять равных частей и заме- заменив рассматриваемый интеграл суммой, стоящей в правой части формулы Симпсона, мы вычислим этот интеграл с точностью до 1 _ 1 144 • 54 ~ 90 000 * 5. Заключительные замечания. Каждый из изложенных в этой главе методов вычисления корней уравнений и определен- определенных интегралов содержит четко сформулированный алгоритм для проведения вычислений. Другой особенностью изложенных методов является стереотипность тех вычислительных опера- операций, которые приходится проводить на каждом отдельном шаге. Эти две особенности обеспечивают широкое применение изло™ женных методов для проведения вычислений на современных быстродействующих вычислительных машинах. Выше для приближенного вычисления интеграла A2.18) от функции f(x) мы исходили из разбиения основного сегмента [а, Ь] на достаточно большое число п равных частичных сег™ ментов одинаковой длины h и из последующей замены функции f(x) на каждом частичном сегменте многочленом соответствен- соответственно нулевого, первого или второго порядка. Погрешность, возникающая при таком подходе, никак не учи- учитывает индивидуальных свойств функции f(x). Поэтому, есте- естественно, возникает идея о варьировании точек разбиения основ- основного сегмента [а, Ь] и выборе для каждой фиксированной функ- функции f(x) такого оптимального разбиения основного сегмента [а, Ь] на п, вообще говоря, не равных друг другу частичных сег™ ментов, которое обеспечивало бы минимальную величину по- погрешности данной приближенной формулы. В Дополнении к гл. 14 мы остановимся на реализации ука- указанной идеи, принадлежащей А.Н. Тихонову и С.С. Гайсаряну. ) Рассматриваемый интеграл не выражается через элементарные функ- функции. Этот интеграл широко применяется в статистической физике, теории теплопроводности и диффузии.
ГЛАВА 13 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ Еще в элементарном курсе приходилось сталкиваться с сум™ мами, содержащими бесконечное число слагаемых (например, с суммой бесконечного числа элементов геометрической про- прогрессии). Такого рода суммы, называемые рядами, и изучаются в настоящей главе. Мы установим, что при некоторых условиях ряды обладают свойствами, аналогичными свойствам конечных сумм. § 1. Понмтие числового рмда 1. Ряд и его частичные суммы. Сходмщиесм и расхо- расходящиеся рмды. Рассмотрим бесконечную числовую последова- последовательность щ, г^2, • • • , зд,... и формально образуем из элементов этой последовательности выражение вида ui + щ + ... + щ + ... = ^Р щ. A3.1) k=l Выражение A3.1) принято называть числовым рядом или про- просто рядом. Отдельные элементы щ, из которых образовано вы- выражение A3.1), принято называть членами данного ряда. Как правило, мы будем пользоваться для обозначения ряда симво- символом суммы ^2. Сумму первых п членов данного ряда будем называть п-й частичной суммой данного ряда и обозначать симво- лом Sn. Итак, Sn = ui+U2 + - • - + ип = J2 ик- Р^д A3.1) называ- к=г ется сходящимся^ если сходится последовательность {Sn} частичных сумм этого ряда. При этом предел S последо- последовательности частичных сумм {Sn} называется суммой данного ряда. Таким образом, для сходящегося ряда, имеющего
§ 1 ПОНЯТИЕ ЧИСЛОВОГО РЯДА 427 сумму Sj мы можем формально записать равенство В случае^ если lim Sn не существует^ ряд называется рас- ходящим с я. Подчеркнем, что понятие суммы определено лишь для сходя™ щегося ряда и, в отличие от понятия конечной суммы, вводится посредством предельного перехода 1). Заметим, что рассмотрение числовых рядов есть новая фор™ ма изучения числовых последовательностей, ибо: 1) каждому данному ряду однозначно соответствует последовательность его частичных сумм; 2) каждой данной последовательности {Sn} однозначно соответствует ряд, для которого эта последователь™ ность является последовательностью его частичных сумм (до- (достаточно положить члены ряда равными щ = S& — Sfc-i ПРИ к > 1 и щ = Si). Одной из главных задач теории числовых рядов является установление признаков, по которым можно решить вопрос о сходимости или расходимости данного ряда. Примеры числовых рядов. 1. Изучим вопрос о сходимости ряда -l)*. A3.2) k=i Поскольку последовательность его частичных сумм Si = 1, S2 = 0, ..., S2n-i = 15 S2n = 0, ... не имеет предела, ряд A3.2) расходится. 2. Рассмотрим ряд, составленный из элементов геометриче- геометрической прогрессии: 9*~\ A3.3) к=1 п-я частичная сумма Sn этого ряда при q ф 1 имеет вид *„ = ! + , + ... + ^ = 1^ = ^-^. A3.4) Очевидно, что при |д| < 1 последовательность частичных г) В современной математике, наряду с указанным выше понятием сум- суммы, вводится понятие суммы ряда в различных обобщенных смыслах. Это позволяет суммировать в обобщенных смыслах многие расходящиеся ряды (см. Дополнение 3 к этой главе).
428 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 сумм Sn сходится и имеет предел, равный . Таким обра™ зом, при \q\ < 1 рассматриваемый ряд сходится и имеет сумму, 1 равную . При \q\ > 1 из равенства A3.4) очевидно, что последователь™ ность Sn (а стало быть, и рассматриваемый ряд) расходится. При \q\ = 1 расходимость ряда A3.3) усматривается непосред- непосредственно. В самом деле, при q = +1 Sn = п, расходимость после™ довательности Sn очевидна, а при q = — 1 ряд A3.3) переходит в изученный выше ряд A3.2). 3. Пусть х — любое фиксированное число. Докажем, что ряд сходится и имеет сумму, равную ех. Вп. 2 §15 гл. 8 мы получили разложение по формуле Маклорена функции ех еж = 1 + ^ + ^ + ^ + (^ + Rn(x)^ A3*6) где Из формул A3.6) и A3.7) мы получим : Ч>'- A3-8) Обозначая через Sn п-ю частичную сумму ряда A3.5), мы мо™ леем переписать неравенство A3.8) в виде \Sn-ex\ ^ ^е^. A3.9) Поскольку при любом фиксированном х Щ\ = 0 2), то правая часть неравенства A3.9) представляет собой элемент бесконечно малой последовательности. Но это и означает, что последовательность {Sn} сходится к числу ех. Стало быть, и ряд A3.5) сходится и имеет сумму ех. 1) Символом 0! мы обозначили число 1. 2) См. пример 3 из п. 3 § 3 гл. 3.
§ 1 ПОНЯТИЕ ЧИСЛОВОГО РЯДА 429 4. Совершенно аналогично, используя формулу Маклорена для функций sin ж и cos ж, можно доказать, что ряды ж3 ж5 х7 2! 4! 6! ^ [2к-2)\ к=1 при любом фиксированном значении ж сходятся и имеют суммы соответственно равные sin ж и cos ж. (Предоставляем читателю самому убедиться в этом.) 2. Критерий Коши сходимости ряда. Так как вопрос о сходимости ряда, по определению, эквивалентен вопросу о схо™ димости последовательности его частичных сумм, то мы полу- получим необходимое и достаточное условие сходимости данного ря- ряда, сформулировав критерий сходимости Коши для последова- последовательности его частичных сумм. Ради удобства приведем фор™ мулировку критерия Коши для последовательности. Для того чтобы последовательность {Sn} была сходящейся, необходимо и достаточно, чтобы для любого положительного числа е на- нашелся номер N такой, что для всех номеров п, удовлетворяю- удовлетворяющих условию п ^ JV, и для всех натуральных р(р=1,2,3,...) В качестве следствия из этого утверждения мы получим сле- следующую основную теорему. Теорема 13.1 (критерий Коши для ряда). Для того оо чтобы ряд J2 ик сходился^ необходимо и достаточно, чтобы к=г для любого положительного числа е нашелся номер N такой, что для всех номеров п, удовлетворяющих условию п ^ N и для всех натуральных чисел р п+р k=n+l A3.10) Для доказательства этой теоремы достаточно заметить, что ве- величина, стоящая под знаком модуля в неравенстве A3.10), равна разности частичных сумм Бп+Р — Sn. Подчеркнем, что критерий сходимости Коши представляет в основном теоретический инте- интерес. Его использование для практических потребностей установ™ ления сходимости или расходимости тех или иных конкретных
430 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 рядов, как правило, сопряжено с трудностями. Поэтому пали™ чие критерия Коши не снимает вопроса об установлении других практически эффективных признаков сходимости и расходимо- расходимости рядов. Из теоремы 13.1 легко извлечь два элементарных, но важных следствия. Следствие 1. Если ряд ^ щ сходится, то последователь- k=l ность rn = Y2 и^ является бесконечно малой. Принято называть величину тп п-м остатком ряда оо Y^ ЗД. Чтобы доказать следствие 1, достаточно доказать, что k=i для любого ? > 0 найдется номер N такой, что \rn\ ^ e при п^ N. Последнее неравенство непосредственно вытекает из неравен- неравенства A3.10), справедливого для любого р = 1, 2, 3,... , и из тео- теоремы 3.13. Следствие 2 (необходимое условие сходимости ря- оо да). Для сходимости ряда ^ щ необходимо^ чтобы последова- k=i тельность щ, и^, Щ^ • • • членов этого ряда являлась бесконечно малой. Достаточно доказать, что для данного сходящегося ряда и для любого е > 0 найдется номер Nq такой, что при п ^ Nq \ип\ < е. Пусть дано любое е > 0. Согласно теореме 13.1 най- найдется номер N такой, что при п ^ N и для любого натураль- натурального р выполняется неравенство A3.10). В частности, при р = 1 это неравенство имеет вид \un+i\<e (при в > Ж). A3.11) Если теперь положить номер Nq равным Nq = N + 1, то при п ^ Nq в силу неравенства A3.11) получим \ип\ < 6, что и тре- требовалось доказать. По другому следствие 2 можно сформулировать так: для схо- оо димости ряда ^ и^ необходимо¦, чтобы lim и^ = 0. Таким об- и | к^сх) разом, при исследовании на сходимость данного ряда следует прежде всего посмотреть, стремится ли к нулю к-й член этого ряда при к —> оо. Если это не так, то ряд заведомо расходится. Так, например, ряд У^ к Ък2 + 3001с к=1
§ 1 ПОНЯТИЕ ЧИСЛОВОГО РЯДА 431 заведомо расходится, ибо к2 1 lim иь = Mm —— = - Ф 0. fc-юо fc-юо 5fc2 + 300А; 5 ^ oo Аналогично расходимость у же изученного выше ряда У^ (—1) к=1 вытекает из того, что lim (—1) не существует. к^ Подчеркнем, однако, что стремление к нулю к-то члена ряда при к —> оо является лишь необходимым^ но не достаточным условием сходимости ряда. В качестве примера рассмотрим ряд Ь1+И+- <13Л2> к=1 Этот ряд обычно называют гармоническим рядом. Очевидно, что для гармонического ряда выполнено необходимое условие сходимости, ибо lim - = 0. Докажем, однако, что этот ряд рас- k к ходится. Воспользуемся критерием Коши. Докажем, что для по- ложительного числа е = 1/2 не существует такого номера JV, что при п ^ N для любого натурального р п+р У - к=п+1 <е = \. A3.13) В самом деле, если взять р = п, то для сколь угодно большого п п+р 2п El v^ 1 . 1 1 k= 2^ k^2Hn = T k=n-\-l k=n-\-l (Мы учли, что в последней сумме п слагаемых и что наименьшее из этих слагаемых равно 1/2п.) Итак, неравенство A3.13) оказывается невыполненным, ка- каким бы большим мы ни взяли номер N. В силу критерия Коши ряд A3.12) расходится. 3. Два свойства, связанные со сходимостью рмда. 1°. Отбрасывание конечного числа членов ряда (или добавление к ряду конечного числа членов) не влияет на сходимость или рас- расходимость этого ряда. Чтобы убедиться в этом, достаточно заметить, что в резуль- результате указанного отбрасывания (или добавления) членов, все ча- частичные суммы этого ряда, начиная с некоторого номера, изме- изменятся на одну и ту же постоянную величину.
432 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 2°. Если с — отличная от нуля постоянная, ufk = сщ, то ряд ^2 и'к сходится тогда и только тогда, когда сходит- оо ся ряд Y1 ик - к=1 Если обозначить n-е частичные суммы рассматриваемых ря- рядов соответственно через S'n и Sn, то очевидно, что Sfn = cSn. Из последнего равенства вытекает, что lim SL существует тогда и тг^оо только тогда, когда существует lim Sn. п^оо § 2. Рмды с положительными членами 1. Необходимое и достаточное условие сходимости ря- да с положительными членами. В этом параграфе мы рас- рассмотрим ряды, все члены которых неотрицательны. Следуя установившейся традиции, мы будем называть такие ряды ряда- рядами с положительными членами (хотя правильнее было бы упо- употреблять термин «ряды с неотрицательными членами»). Что же касается рядов, все члены которых строго больше нуля, то такие ряды мы будем называть рядами со строго положительными членами. Ряды с положительными членами сами по себе часто встреча- встречаются в приложениях. Кроме того, их предварительное изучение облегчит изучение рядов с членами любого знака. В дальней- дальнейшем, чтобы подчеркнуть, что речь идет о ряде с положитель- ными членами, мы часто будем обозначать члены такого ряда символом рк вместо щ. Мы можем сразу же отметить основное характеристическое свойство ряда с положительными членами: последовательность частичных сумм такого ряда является неубывающей. Это позволяет нам доказать следующее утверждение. Теорема 13.2. Для того чтобы ряд с положительными членами сходился, необходимо и достаточно, чтобы последо- вательность частичных сумм этого ряда была ограничена. Необходимость следует из того, что всякая сходя- сходящаяся последовательность является ограниченной (в силу тео- теоремы 3.8). Достаточность вытекает из того, что последователь- последовательность частичных сумм не убывает и, стало быть, для сходимости этой последовательности достаточно, чтобы она была ограниче- ограничена (в силу теоремы 3.15). 2. Признаки сравнения. В этом пункте мы установим ряд признаков, позволяющих сделать заключение о сходимости (или расходимости) рассматриваемого ряда посредством сравнения
§ 2 РЯДЫ С ПОЛОЖИТЕЛЬНЫМИ ЧЛЕНАМИ 433 его с другим рядом, сходимость (или расходимость) которого известна. со со Теорема 13.3. Пусть ^ рк и J^ pfk — два ряда с положи- к=\ к=\ тельными членами. Пусть^ далее^ для всех номеров к справед- справедливо неравенство Рк ^Рк° A3.14) сю Тогда сходимость ряда Y1 Рк влечет за собой сходимость ряда к=1 со со Y1 Рк] расходимость ряда ^ рк влечет за собой расходимость к=1 к=1 со ряда ^2 р'к- к=1 Доказательство. Обозначим n-е частичные суммы ря- оо со дов ^2 Рк и ]С Рк соответственно через Sn и S'n. Из неравенства к=1 к=1 A3.14) заключаем, что Sn ^ S'n. Последнее неравенство озна- означает, что ограниченность последовательности частичных сумм {Sfn} влечет за собой ограниченность последовательности ча- частичных сумм {Sn} и, наоборот, неограниченность последова- последовательности частичных сумм {Sn} влечет за собой неограничен- неограниченность последовательности частичных сумм {Sfn}. В силу теоре- теоремы 13.2 теорема 13.3 доказана. Замечание 1. В условии теоремы 13.3 молено тре- требовать, чтобы неравенство A3.14) было выполнено не для всех номеров fc, а лишь начиная с некоторого номера к. В самом деле, в силу п. 3 § 1, отбрасывание конечного числа членов не влияет на сходимость ряда. Замечание 2. Теорема 13.3 останется справедливой, если в условии этой теоремы заменить неравенство A3.14) следующим неравенством: Рк < ср'к, A3.15) где с — любая положительная постоянная. В самом деле, в со силу п. 3 § 1, вопрос о сходимости ряда J2 Рк эквивалентен к=1 со вопросу о сходимости ряда J2(cPk)- При этом, конечно, мож- к=г но требовать, чтобы неравенство A3.15) было выполнено, лишь начиная с некоторого достаточно большого номера к.
434 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 оо Следствие из теоремы 13.3. Если ^2рк ~~ Р^д с положи™ к=1 оо тельными членами, Y1 Р'к ~ Ря(^ со стРого положительными к=1 членами и если существует конечный предел Mm Щ. + ? к^оо Рк ОО то сходимость ряда Y1 Рк влечет за собой сходимость ряда к=1 оо оо ^2 Рк] расходимость ряда ^ рк влечет за собой расходимость к=1 к=1 оо ряда Y1 Рк ¦ к=1 Доказательство. Так как lim Щ- = L, то, по k определению предела, для некоторого е > 0 найдется номер N такой, что при к ^ N Стало быть, при к ^ N справедливо неравенство рк < {Ь + е)р'к. Последнее неравенство совпадает с неравенством A3.15) при с = = L + е. В силу замечания 2 к теореме 13.3 следствие доказано. оо оо Теорема 13-4- Пусть Y1 Рк и Y1 Рк ~ ^ва Ря(^а со строго к=1 к=1 положительными членами. Пусть, далее, для всех номеров к справедливо неравенство A3.16) Рк р'к оо Тогда сходимость ряда ^ р'к влечет за собой сходимость ряда к=\ оо оо J2 Рк] расходимость ряда J2 Рк влечет за собой расходимость к=1 к=1 оо ряда Т.Р'к° к=1 Доказательство. Запишем неравенство A3.16) для fc = l,2,... ,п — 1, где п — любой номер. Будем иметь Р2 < Р2 РЗ < Рз Рп < Р'п Pi ^ Pi ' Р2 ^ Р'2 ' ••••••• рп^г ^ p/i_i •
§ 2 РЯДЫ С ПОЛОЖИТЕЛЬНЫМИ ЧЛЕНАМИ 435 Перемножая почленно все написанные неравенства, получим рп ^ Рп ^ Pi / — < t-y- ИЛИ рп < t-rVr,. Pi ^ Pi Fn ^ р'/п Поскольку в последнем неравенстве величина с = р\/р[ пред- представляет собой положительную постоянную, не зависящую от номера п, то, в силу замечания 2 к теореме 13.3, теорема 13.4 доказана. Замечание 3. В условии теоремы 13.4 можно тре- требовать, чтобы неравенство A3.16) было выполнено не для всех номеров fc, а лишь начиная с некоторого номера к (ибо отбрасы- отбрасывание конечного числа первых членов не влияет на сходимость ряда). Обе доказанные в настоящем пункте теоремы называют те- теоремами сравнения или признаками сравнения. Приведем примеры применения признаков сравнения. 1. Исследуем вопрос о сходимости ряда зТ^' где Если Ъ ^ 1, то fc-й член рассматриваемого ряда не стремится к нулю при к —> оо. Стало быть, нарушено необходимое условие сходимости ряда и ряд расходится. Если же Ь > 1, то, поскольку для любого номера к справедливо неравенство < 3 + Ьк Ьк ос t и поскольку ряд Y1 Тк СХОДИТСЯ5 теорема сравнения 13.3 позво- к=1 b ляет утверждать сходимость рассматриваемого ряда. 2. Исследуем вопрос о сходимости для любого а ^ 1 следую- следующего ряда: ^- = 1 + ^- + ... + ^- + ... A3.17) J^a 2а ка Х 7 k=l Этот ряд часто называют обобщенным гармоническим рядом. Поскольку при а ^ 1 для любого номера к справедливо нера- неравенство ка ' к и поскольку гармонический ряд ^ — расходится 1), то теорема к=\ к сравнения 13.3 позволяет утверждать расходимость ряда A3.17) для любого а ^ 1. 1) Расходимость гармонического ряда установлена в п. 2 § 1.
436 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 3. Признаки Даламбера и Коши. К признакам сравнения непосредственно примыкают два весьма употребительных при- признака сходимости рядов с положительными членами — Далам- Даламбера и Коши. Признаки Даламбера и Коши основаны на сравне™ нии рассматриваемого ряда с рядом, составленным из элементов геометрической прогрессии, а именно со сходящимся рядом с© J>* = g + 92 + g3 + ..., |9|<1, A3.18) к=1 или с расходящимся рядом 1 = 1 + 1 + 1 + ... A3.19) к=1 Теорема 18.5 (признак ДаламбераI). I. Если для всех номеров fc, или по крайней мере начиная с некоторого номера fc, справедливо неравенство ^ q ( Pk \ Pk оо то ряд J2 Pk сходится (расходится). k=l П. Если существует предел q < 1 2) (?*±! > l) , A3.20) \ Pk J Mm ЕИ±1 = ц A3.21) к^ Рк сю то ряд J2 Рк сходится при L < 1 и расходится при L > 1. к=г Теорему II обычно называют признаком Даламбера в пре- предельной форме. В этой форме он наиболее часто используется. Доказательство. Разберем отдельно теоремы I и П. 1) Для доказательства теоремы I положим pfk = q (p'k = 1). Тогда IP*±L = g5 где q < 1 I ^±1 = 1 J 5 и мы можем переписать Pk \ Pk J неравенство A3.20) в виде ( Л A3.22) ( ^ pfk I Pk pfk 1) Жак Лерон Даламбер — французский математик и философ A717— 1783). . °° j При этом, конечно, предполагается, что все члены ряда ^ рк (по край™ к=г ней мере начиная с некоторого номера) строго положительны.
§ 2 РЯДЫ С ПОЛОЖИТЕЛЬНЫМИ ЧЛЕНАМИ 437 оо Так как ряд J^ pfk, совпадающий с рядом A3.18) (A3.19)), схо™ к=1 дится (расходится), то неравенство A3.22) на основании теоре™ мы сравнения 13.4 гарантирует сходимость (расходимость) ряда оо ^2 Рк- Теорема I доказана. к=1 2) Докажем теперь теорему П. Если L < 1, то найдется по- положительное число б такое, что L = 1^2ежЬ + е = 1 — 6. По определению предела последовательности для указанного е найдется номер N такой, что при к ^ N Т г- ^ Рк + 1 ^ т | _ 1 _ /19 QQ\ Ь — 6 < ^— <1^ + б=1^б. [lo.Zo) Рк Число L + е = 1 — б играет роль q в теореме I. Ряд сходится. Если же L > 1, то найдется положительное число е такое, что L = 1 + ?и!-е= 1. В этом случае на основании левого из неравенств A3.23) получим ^^ > L — е = 1 (при к ^ N). Рк Ряд расходится на основании теоремы I. Теорема 13.5 полностью доказана. Замечания к теореме 13.5. 1) Обратим внимание на то, что в теореме 13.5 (I) неравенство ^ q < 1 (для всех fc, Рк начиная с некоторого) нельзя заменить на ^^ < 1. Рк В самом деле, как доказано выше, гармонический ряд A3.12) расходится, но для этого ряда = < 1 (для всех номе™ Рк к + 1 ров к). 2) Если в условиях теоремы 13.5 (II) L = 1, то нельзя сказать ничего определенного о сходимости ряда (т. е. при L = 1 признак Даламбера «не действует»). В самом деле, для гармонического ряда A3.12) L = 1, причем этот ряд, как мы знаем, расходится. Вместе с тем для ряда *—-\ 1 к=1 также L = 1, но этот ряд, как будет показано в следующем пункте, сходится. Теорема 13.6 (признак Коши), I. Если для всех номе- номеров к, или по крайней мере начиная с некоторого номера fc, справедливо неравенство К /гул -* <С /1 ^^" 1 I k /гул -* j> 1 | I 1 -\ /^ I ОО то ряд Y1 Рк сходится (расходится). к=1
438 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 П. Если существует предел lim Уп = Ь, A3.26) к^оо то ряд J2 Рк сходится при L < 1 и расходится при L > 1. к=1 Теорему II обычно называют признаком Коши в предельной форме. Доказательство. Разберем отдельно теоремы I и П. 1) Для доказательства теоремы I положим p'k = qk (pfk = 1). Тогда из неравенства A3.25) получим Рк^р'к (Рк>р'к)- A3-27) ОО Так как ряд Y1 Р/с' совпадающий с рядом A3.18) (A3.19)), схо™ к=г дится (расходится), то неравенство A3.27) на основании тео™ ремы сравнения 13.3 гарантирует сходимость (расходимость) оо ряда ]Р рк. к=1 Теорема 13.6 (I) доказана. 2) Для доказательства теоремы 13.6 (II) следует дословно по- повторить схему доказательства теоремы 13.5 (II), заменив во всех Р рассуждениях -—— на typk- Рк Теорема 13.6 полностью доказана. Замечания к теореме 13.6. 1) Как и в предыдущей теореме, в теореме 13.6 (I) неравенство ^/р^ ^ q < 1 нельзя заменить на ^fpk < 1. 2) При L = 1 признак Коши в предельной форме «не дей- действует». Можно сослаться на два примера, указанные в соответ™ ствующем замечании к признаку Даламбера. 3) Возникает вопрос о том, какой из двух признаков, Даламбера или Коши, является более сильным. Проанализируем этот вопрос в отношении признаков Даламбера и Коши, взятых в предельной форме. Можно дока™ зать, что из существования предела A3.21) вытекает существование пре- предела A3.26) и факт равенства этих пределов. (Доказательство приведено в дополнении I к этой главе.) Обратное неверно. В самом деле, легко убе- убедиться в том, что для ряда предел A3.26) существует и равен 1/2, в то время как предел A3.21) вообще не существует. Таким образом, признак Коши является более сильным, чем признак Даламбера, ибо всякий раз, когда действует признак Даламбера, действует и признак Коши и вместе с тем существуют ряды (например, ряд
§ 2 РЯДЫ С ПОЛОЖИТЕЛЬНЫМИ ЧЛЕНАМИ 439 A3.28)), для которых действует признак Коши и не действует признак Да™ ламбера. Несмотря на это, признак Даламбера на практике употребляется чаще, чем признак Коши. Примеры. 1) Исследуем вопрос о сходимости ряда A3.29) k=l Применим признак Даламбера в предельной форме. Имеем (л/к) Рк+1 (л/к +1) к\ 1 Л . 1 Рк = у, ? ^^ = /У » Л, , ^хк = /^—г- I 1 + 7 л! Pfe (/c + lj! (у/к) у/к + 1 V »у A3.30) На основании A3.30) l\fc/2_ — J-J.J.1.J. , - i 1 ~Т~ Т" I — Pfe к^гоо л/к + 1 \ &/ ххххх t lim A + i 1 = 0 • xfe = 0 < 1, jfc^oo ч/А; + 1 к^оо \ к/ т. е. ряд A3.29) сходится. 2) Изучим вопрос о сходимости ряда к=1 Применим признак Коши в предельной форме. Имеем W~k = ^- A3-32) На основании A3.32) lim ^/р^ = - lim л/к = - < 1 г). Таким к—>оо ^ к—>оо ^ образом, признак Коши устанавливает сходимость ряда A3.31). 4. Интегральный признак Коши—Маклорена. Призна- Признаки Даламбера и Коши оказываются непригодными для выяс- выяснения вопроса о сходимости некоторых часто встречающихся рядов с положительными членами. Так, например, с помощью этих признаков нельзя выяснить вопрос о сходимости обобщен- обобщенного гармонического ряда к=1 (а — любое вещественное число). ) Для вычисления lim х 'х следует прологарифмировать выражение хг^х и применить правило Лопиталя.
440 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Правда, в конце п. 2 мы установили, что при а ^ 1 ряд A3.33) расходится, но остается открытым вопрос о сходимости этого ряда при а > 1. В этом пункте мы установим еще один об- общий признак сходимости ряда с положительными членами, из которого, в частности, будет вытекать сходимость ряда A3.33) при а > 1. Теорема 13.7 (теорема Коши-Маклорена). Пусть функция f(x) неотрицательна и не возрастает всюду на по- лупрямой х ^ га, где т — любой фиксированный номер. Тогда числовой оо Y, /(*) = f(m) + f(m + 1) + /(m + 2) + ... A3.34) k=m сходится в том и только в том случае, когда существует пре- предел при п —>> оо последовательности п ап т п = t f(x)dx. A3.35) Доказательство. Пусть к — любой номер, удовле- удовлетворяющий условию &^га + 1,аж — любое значение аргумента из сегмента к — 1 ^ х ^ к. Так как по условию функция f(x) не возрастает на указанном сегменте, то для всех х из указанного сегмента справедливы неравенства /(А0</(жК/(*-1). A3.36) Функция /(ж), будучи ограниченной и монотонной, интегриру- интегрируема на сегменте к — 1 ^ х ^ к (см. п. 5 § 4 гл. 10). Более того, из неравенств A3.36) и из свойства 3° (см. п. 1 § 6 гл. 10) вытекает, что J f(k) dx^ J f(x) dx^ J f(k ^ 1) dx k-1 fc-1 fc-1 или к J f(x)dx^f(k-l). A3.37) k-i Неравенства A3.37) установлены нами для любого к ^ т + 1. Запишем эти неравенства для значений А; = га + 1,га + 2,... ,п,
§ 2 РЯДЫ С ПОЛОЖИТЕЛЬНЫМИ ЧЛЕНАМИ 441 где п — любой номер, превосходящий т: га+1 т m+2 га+1 п /(пК У f(x)dx^f(n-l). га-1 Складывая почленно записанные неравенства, получим П р П — 1 f(h) < I f(r-)fJ-r < \^ f(h) A4 ЧЯ) J \гь I -^; I J \^ I Vu**-> <5: / J \гъ I • 1 1О.ОО I к=т Договоримся обозначать символом Sn n-ю сумму ряда A3.34), равную к=т Приняв это обозначение и учитывая обозначение A3.35), мы мо™ леем следующим образом переписать неравенства A3.38): Sn - f(m) < ап ^ Sn-L A3.39) Неравенства A3.39) позволяют без труда доказать теорему. В самом деле, из формулы A3.35) очевидно, что последователь- последовательность {ап} является неубывающей. Стало быть, для сходимости этой последовательности необходима и достаточна ее ограничен- ограниченность. Для сходимости ряда A3.34) в силу теоремы 13.2 необхо- необходима и достаточна ограниченность последовательности {S^}. Из неравенств A3.39) вытекает, что последовательность {Sn} огра™ ничена тогда и только тогда, когда ограничена последователь- последовательность {а^}, т. е. тогда и только тогда, когда последовательность {ап} сходится. Теорема доказана. Примеры. 1) Прежде всего применим интегральный признак Коши-Маклорена для выяснения сходимости обобщен- обобщенного гармонического ряда A3.33). Поскольку ряд A3.33) можно рассматривать как ряд вида A3.34) при т = 1, f(x) = — и функция f(x) убывает и положительна на полупрямой х ^ 1,
442 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 вопрос о сходимости ряда A3.33) эквивалентен вопросу о сходи™ мости последовательности {ап}, где п ап = / — ' 1-OL Inх при а ф 1, при а = Из вида элементов ап вытекает, что последовательность {ап} расходится при а ^ 1 и сходится при а > 1, причем в последнем случае lim ап = -. Таким образом, ряд A3.33) расходится п^оо а — 1 при а ^ 1 (это мы уже установили выше другим способом) и сходится при а > 1. В частности, при а = 2 ряд A3.33) не- реходит в ряд A3.24), сходимость которого мы теперь можем утверждать. 2) Исследуем вопрос о сходимости ряда к=2 где /3 — фиксированное положительное вещественное число. Ряд A3.40) можно рассматривать как ряд вида A3.34) при m = 2 и f(x) = я • Поскольку функция f(x) неотрицательна и не воз™ X 111 X растает на полупрямой х ^ 2, вопрос о сходимости ряда A3.40) эквивалентен вопросу о сходимости последовательности {ап}, где ¦ dx = I - - Р — „ при х=2 1~Р In In ж | _2 = In Inn — In In 2 при /3 = 1. Из вида элементов ап вытекает, что последовательность {ап} сходится при /3 > 1 и расходится при /3^1. Таким образом, ряд A3.40) сходится при /3 > 1 и расходится при /3^1. 5. Признак Раабе. Признаки Даламбера и Коши были основаны на сравнении рассматриваемого ряда с рядом, представляющим собой сумму геометрической прогрессии. Естественно, возникает идея о получении бо- более тонких признаков, основанных на сравнении рассматриваемого ряда с другими стандартными рядами, сходящимися или расходящимися «медлен- «медленнее», чем ряд для геометрической прогрессии. В этом пункте мы установим признак, основанный на сравнении рассма- рассматриваемого ряда с изученным в предыдущем пункте стандартным рядом
§ 2 РЯДЫ С ПОЛОЖИТЕЛЬНЫМИ ЧЛЕНАМИ 443 Теорежа 13.8 (признак Раабе) 1). I. Если для всех номеров к, или по крайней мере начиная с некоторого номера к, справедливо неравенство2) A3.42) Рк ) I V Pk то ряд Y1 Рк сходится (расходится). k=i П. Если существует предел l _ 2Z±L) = L, A3.43) Рк J oo то ряд J2 Рк сходится при L > 1 и расходится при L < 1. Теорему II fc=i обычно называют признаком Раабе в предельной форме. Доказательство. Разберем отдельно теоремы I и П. 1) Для доказательства теоремы I перепишем неравенство A3.42) в виде A3.44) Рк к I рк к Так как q > 1, то найдется некоторое число а, удовлетворяющее нера- неравенствам q > а > 1. Разложив функцию A + х)а по формуле Маклорена с остаточным членом в форме Пеано (см. п. 2 § 15 гл. 8), будем иметь Полагая в последней формуле х = —1/к, получим Поскольку последовательность —— является бесконечно малой, то на™ 1/к чиная с некоторого номера ко, справедливо неравенство Сопоставляя A3.45) и A3.46), получим неравенство 1 , , ^ 1 - f (ПРИ к > **)• A3.47) к J к Сравнение неравенств A3.44) и A3.47) дает / 1 \ а ( л Л Рк + 1 ^ I 1 1 \ I Рк + 1 ^ 1 1 I / ? \ I \ Pfe V к/ I Рк к) 1) Иозеф Людвиг Раабе — швейцарский математик A801-1859). ) Конечно, при этом предполагается, что ряд 2_j Pk, по крайней мере к=1 начиная с некоторого номера, имеет строго положительные члены.
444 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Последние неравенства можно переписать в виде 1 ( 1 рк - , .„.-,. (приЛ^Ло). A3.48) Поскольку ряд A3.41) сходится при а > 1 и расходится при а = 1, то неравенства A3.48) и теорема сравнения 13.4 позволяют утверждать, что сю ряд ^2 Рк сходится (расходится). Теорема I доказана. k=i 2) Точно так же, как и в признаках Даламбера и Коши, мы сведем теоре- теорему II к теореме I. Пусть сначала L > 1. Положим е = , q = \-\-e = L — е. По определению предела A3.43) для этого е можно указать номер ко, на™ чиная с которого -L < е, и, стало быть, справедливо левое Рк J неравенство A3.42). Если же L < 1, то мы положим е = 1 — L и, используя определение предела A3.43), получим, что, начиная с некоторого номера &о, справедливо правое неравенство A3.42). Теорема 13.8 полностью доказана. Замечание. Отметим, что в теореме 13.8 (I) в левом неравенстве A3.42) нельзя взять q = 1 (при этом сходимость ряда может не иметь ме- места). При L = 1 теорема 13.8 (II) «не действует» (возможна и сходимость, и расходимость ряда). Пример. Исследовать вопрос о сходимости ряда сю /11 1 Л, ^^ -1+- + -+...+-"--- 2^Рк, где рк = а V й * Ч (а = const > 0). Легко проверить, что признаки Даламбера и Коши в применении к этому ряду «не действуют». Применим признак Раабе. Легко проверить, что Pk J (I к Нетрудно сообразить, что последняя дробь при к —>¦ оо стремится к произ- водной функции ах в точке х = 0, т. е. стремится к In а. В силу признака Раабе рассматриваемый ряд сходится при In а > 1, т. е. при а > е, и рас- расходится при In а < 1, т. е. при а < е. При а = е вопрос о сходимости ряда требует дополнительного исследования, так как признак Раабе «не действует». Другим примером ряда, в применении к которому «не действу- действует» признак Раабе, может служить ряд A3.40). 6. Отсутствие универсального рмда сравненим. Мы уже отмеча- отмечали, что признаки Даламбера и Коши основаны на сравнениях рассматрива- рассматриваемого ряда с рядом для геометрической прогрессии, а признак Раабе — на сравнении с более медленно сходящимся (или расходящимся) рядом A3.41). Естественно, возникает вопрос о том, не существует ли такой универ- универсальный (предельно медленно!) сходящийся (или расходящийся) ряд7 срав- сравнение с которым позволило бы сделать заключение о сходимости (или расходимости) любого наперед взятого ряда с положительными членами.
§ 3 АБСОЛЮТНО И УСЛОВНО СХОДЯЩИЕСЯ РЯДЫ 445 Докажем, что такого универсального ряда не существует. Пусть даны оо оо два сходящихся ряда ^]р^и Y1 Рк 5 обозначим символами гп и г'п соответ- k=l к=1 оо ственно их п-е остатки. Будем говорить, что ряд ^ р'к сходится медлен- к = 1 оо j, нее, чем ряд ^ рк, если lim -^ = 0. Докажем, что для каждого сходя- k = l n^° Гп щегося ряда существует ряд, сходящийся медленнее этого ряда. В самом оо деле, пусть J2 Рк — любой сходящийся ряд; гп — его n-й остаток. Докажем, к=1 оо оо что ряд ^2 рк, где г) Рк = у/Тк-i ~~ у/^kj сходится медленнее, чем ряд ^ рк. к=1 к=1 оо В самом деле, если г'п — п-й остаток ряда Y1 Ркч т0 к = 1 lim — = lim —-— = 0. п^оо г' п^оо x/f\l Доказсем теперь отсутствие универсального сходящегося ряда, сравнение с которым позволило бы сделать заключение о сходимости любого наперед взятого сходящегося ряда. В самом деле, если бы такой универсальный схо™ со дящийся ряд Y1 Рк существовал, то, взяв для него построенный выше ряд к = 1 оо J2 p'ki MbI получили бы, что к = 1 т Рк т Гк^г ~ Гк v ( I . 1—\ с\ lim — = lim — = lim (yfr'k~i + \/тк) = 0. fc^oo рк к^оо ^JVk~\ ~~ у/Г к к^оо оо Таким образом, из сравнения с рядом ^ рк нельзя сделать заключения о k=i со сходимости ряда Yl Pk- Аналогично доказывается отсутствие универсаль- к = 1 ного расходящегося ряда, сравнение с которым позволило бы сделать за™ ключение о расходимости любого наперед взятого расходящегося ряда. § 3. Абсолютно и условно сходмщмесм рмды 1. Понятия абсолютно и условно сходящегося ряда. Теперь мы перейдем к изучению рядов, члены которых являют- являются вещественными числами любого знака. Определение 1. Будем называть ряд оо * A3.49) к=1 г) За го принимаем всю сумму Y1 Рк- к = 1
446 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 абсолютно сходящимся, если сходится ряд к=1 Заметим, что в этом определении ничего не сказано о том, пред- предполагается ли при этом сходимость самого ряда A3.49). Оказы- Оказывается, такое предположение оказалось бы излишним, ибо спра- справедлива следующая теорема. Теорема 18.9. Из сходимости ряда A3.50) вытекает схо- сходимость ряда A3.49). Доказательство. Воспользуемся критерием Ко- ши для ряда (т. е. теоремой 13.1). Требуется доказать, что для любого е > 0 найдется номер N такой, что для всех номеров в, удовлетворяющих условию п ^ Ж, и для любого натурального р п+р Т.' к=п+1 < е. A3.51) Фиксируем любое е > 0. Так как ряд A3.50) сходится, то, в силу теоремы 13.1, найдется номер N такой, что для всех номеров в, удовлетворяющих условию п ^ Ж, и для любого натурального р A3.52) Имея в виду, что модуль суммы нескольких слагаемых не пре- превосходит суммы их модулей, можем записать п+р Y1 п+р < Е к=п+1 A3.53) Сопоставляя неравенства A3.52) и A3.53), получим неравенство A3.51). Теорема доказана. Определение 2. Ряд A3.49) называется условно с х о- д я щ и м с л, если этот ряд сходится^ в то время как соот- соответствующий ряд из модулей A3.50) расходится. Примером абсолютно сходящегося ряда может служить ряд Е- fc=i к<* Этот ряд сходится абсолютно, ибо при а > 1 сходится ряд A3.33). Приведем пример условно сходящегося ряда. Докажем
3 АБСОЛЮТНО И УСЛОВНО СХОДЯЩИЕСЯ РЯДЫ 447 условную сходимость ряда к 2 к=1 A3.54) Так как соответствующий ряд из модулей (гармонический ряд), как мы уже знаем, расходится^ то для доказательства условной сходимости ряда A3.54) достаточно доказать, что этот ряд схо- сходится. Докажем, что ряд A3.54) сходится к числу In 2. В п. 2 § 15 гл. 8 мы получили разложение по формуле Маклорена функции () ^ ^^ ;). A3.55) z о 4 п Там же для всех х из сегмента 0 ^ х ^ 1 получена следующая оценка остаточного члена: \Rn+i(x)\ < -1Т. Полагая в формулах A3.55) и A3.56) х = 1, будем иметь где ИЛИ п+ 1 2 ' 3 4 п Обозначая через Sn п-ю частичную сумму ряда A3.54), мы мо- можем переписать последнее неравенство в виде Таким образом, разность Sn — In 2 представляет собой бесконеч- бесконечно малую последовательность. Это и доказывает сходимость ря- ряда A3.54) к числу In 2. 2. О перестановке членов условно сходмщегосм рмда. Одним из важнейших свойств суммы конечного числа веще- вещественных слагаемых является переместительное свойство. Это свойство утверждает, что от перестановки слагаемых сумма не меняется. Естественно, возникает вопрос, остается ли справед- справедливым это свойство для суммы сходящегося ряда, т. е. может ли измениться сумма сходящегося ряда от перестановки чле~ нов этого ряда! В этом пункте мы выясним этот вопрос в отно- отношении условно сходящегося ряда. Мы начнем наше рассмотре™ ние с изучения некоторой конкретной перестановки членов ряда
448 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 A3.54). Для удобства запишем ряд A3.54) в виде В конце предыдущего пункта мы доказали, что ряд A3.54) схо- сходится условно и имеет сумму S = In 2. Переставим теперь члены ряда A3.54) так, чтобы после одного положительного члена сто™ яли два отрицательных члена. В результате такой перестановки членов получим ряд 1 1,1 1 1 , Докажем, что полученный в результате указанной перестановки членов ряда A3.54) ряд A3.57) сходится и имеет сумму, вдвое меньшую, чем ряд A3.54). Будем обозначать га-е частичные суммы рядов A3.54) и A3.57) символами Sm и S'm соответствен- соответственно. Можем записать: т D3m — Z^ k=l k=l k=l Итак, 53m = 2S2m' A3.58) Далее, очевидно, что S'zm-i = \s2m + ^, A3.59) Поскольку lim 52ТО = 5, в пределе при ш -> оо из формул т^оо A3.58), A3.59) и A3.60) получим lim Sf3m = ^S, lim 5зш_! = -5, lim 5зш^2 = -S. Тем самым окончательно доказано, что ряд A3.57) сходится и имеет сумму, равную -S. Поскольку S = In2 ф 0, ясно, что -S Ф S. Стало быть, в результате указанной выше переста- перестановки членов сумма условно сходящегося ряда A3.54) измени- изменилась. Рассмотренный нами конкретный пример показывает, что
§ 3 АБСОЛЮТНО И УСЛОВНО СХОДЯЩИЕСЯ РЯДЫ 449 условно сходящийся ряд не обладает переместителъным свой- свойством. Полную ясность в вопрос о влиянии перестановок членов на сумму условно сходящегося ряда вносит следующее замеча- замечательное утверждение, принадлежащее Риману. Теорема 13.10 (теорема Римана). Если ряд сходится условно^ то, каково бы ни было наперед взятое число L, мож~ но так переставить члены этого ряда, чтобы преобразованный ряд сходился к числу L. Доказательство. Пусть — произвольный условно сходящийся ряд. Обозначим через Pi,P2iP3t • • положительные члены ряда A3.61), выписанные в таком порядке, в каком они стоят в этом ряде, а через 4ii42i4%i • • • модули отрицательных членов ряда A3.61), выпи™ санные в таком же порядке, в каком они стоят в этом ряде. Ряд A3.61) содержит бесконечное число как положительных, так и отрицательных членов^ ибо если бы членов одного знака было конечное число, то, отбросив не влияющее на сходимость ко- конечное число первых членов, мы бы получили ряд, состоящий из членов одного знака, для которого сходимость означала бы абсолютную сходимость. Итак, с рядом A3.61) связаны два бес- конечных ряда с положительными членами ]Р р^ и J^ q^. Б у™ дем обозначать первый из этих рядов символом Р, а второй — символом Q. Докажем, что оба ряда Р и Q являются расходя- расходящимися. Обозначим символом Sn п~ю частичную сумму ряда A3.61), символом Рп — сумму всех положительных членов, вхо- входящих в Sn, символом Qn — сумму модулей всех отрицательных членов, входящих в Sn. Тогда, очевидно, Sn = Рп ~~ Qn, и так как по условию ряд A3.61) сходится к некоторому числу 5, то lim (Pn ^ Qn) = S. A3.62) п—>оо С другой стороны, так как ряд A3.61) не сходится абсолютно, то lim (Рп + Qn) = оо. A3.63) гг>оо Сопоставляя A3.62) и A3.63), получим lim Рп = оо, lim Qn = п—>-оо п-ч>оо = оо, т. е. доказано, что оба ряда Р и Q расходятся. Из расходи- расходимости рядов Р и Q вытекает, что даже после удаления любого конечного числа первых членов этих рядов, мы можем взять из оставшихся членов как ряда Р, так и ряда Q столь большое 15 В.А. Ильин, Э.Г. Позняк, часть I
450 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 число членов, что их сумма превзойдет любое наперед взятое число. Опираясь на этот факт, докажем, что можно так переста- переставить члены исходного ряда A3.61), что в результате получится ряд, сходящийся к наперед взятому числу L. В самом деле, мы получим требуемый ряд следующим образом. Сначала выберем из исходного ряда A3.61) ровно столько положительных членов РъР2,Рз, • • • ,Pkn чтобы их сумма pi+p2 + - "+Ркг превзошла L. Затем добавим к выбранным членам ровно столько отрицатель- отрицательных членов — (/]_, — </25 • • • 5 ~Як2^ чт°бы общая сумма р\ +Р2 + • • • • • • +Pfci —Qi ^4.2 — • • • — Qk2 оказалась меньше L. Затем снова доба- добавим ровно столько положительных членов р&1+1,р&1+2,... ,р&3> чтобы общая сумма р\ + р2 + • • • + Ркг — 4i ~ 42 — • • • — Чк2 + + Pfci+i + • • • +Pifc3 оказалась больше L. Продолжая аналогичные рассуждения далее, мы получим бесконечный ряд, в состав ко- которого войдут все члены исходного ряда A3.61), ибо каждый раз нам придется добавлять хотя бы один положительный или отрицательный член исходного ряда. Остается доказать, что по- полученный ряд сходится к L. Заметим, что в полученном ряде последовательно чередуются группы положительных и группы отрицательных членов. Если частичная сумма полученного ря- ряда заканчивается полностью завершенной группой, то отклоне- отклонение этой частичной суммы от числа L не превосходит модуля последнего его члена1). Если же частичная сумма заканчива- заканчивается не полностью завершенной группой, то отклонение этой частичной суммы от числа L не превосходит модуля последне- последнего члена предпоследней из групп. Для установления сходимости ряда к L достаточно убедиться в том, что модули последних членов групп образуют бесконечно малую последовательность, а это непосредственно вытекает из необходимого условия сходи- сходимости исходного ряда A3.61). Теорема Римана доказана. 3. О перестановке членов абсолютно сходящегося ря- ряда. В предыдущем пункте мы доказали, что условно сходящийся ряд не обладает переместительным свойством. В этом пунк- пункте мы докажем, что для всякого абсолютно сходящегося ряда справедливо переместительное свойство. Теорема 13,11 (теорема Коши). Если данный ряд схо- сходится абсолютно, то любой ряд, полученный из данного ряда посредством некоторой перестановки членов, также сходится абсолютно и имеет ту же сумму, что и данный ряд. Доказательство. Пусть ряд k=l г) Ибо мы добавляем в данную группу члены ровно до тех пор, пока общая сумма «не перейдет» через число L.
АБСОЛЮТНО И УСЛОВНО СХОДЯЩИЕСЯ РЯДЫ 451 сходится абсолютно и сумма этого ряда равна S. Пусть, далее, — ряд, полученный из ряда A3.64) посредством некоторой пере- перестановки членов. Требуется доказать: 1) что ряд A3.65) сходится и имеет сумму, равную S; 2) что ряд A3.65) сходится абсолют™ но. Докажем сначала 1). Достаточно доказать, что для любого е > 0 найдется номер N такой, что при п ^ N k=i < е. A3.66) Фиксируем произвольное е > 0. Так как ряд A3.64) сходится абсолютно и имеет сумму, равную 5, то для выбранного е > 0 можно указать номер Nq такой, что будут справедливы неравен™ ства Е - (р — любое натуральное число) к=1 A3.67) A3.68) Выберем теперь номер N столь большим, чтобы любая ча- частичная сумма Sfn ряда A3.65) с номером п, превосходящим JV, содержала все первые Nq членов ряда A3.65) 2). Оценим разность, стоящую в левой части A3.66), и дока™ жем, что при п ^ N для этой разности справедливо неравен™ ство A3.66). В самом деле, указанную разность можно представить в виде п к=1 (п Nq k=l k=l Nq Щ- S A3.69) 1) Номер No в неравенствах A3.67) и A3.68) можно взять один и тот же. В самом деле, предварительно записав указанные два неравенства с разными номерами JVo, мы затем можем взять наибольший из двух номе™ ров No. ) Такой номер N выбрать можно, ибо ряд A3.65) получается из ряда A3.64) посредством некоторой перестановки членов. 15*
452 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Так как модуль суммы двух величин не превосходит суммы их модулей, то из A3.69) получим A3.70) п Е < -s п J2uk k=l No -E k = l k=l Из неравенств A3.68) и A3.70) очевидно, что для доказательства неравенства A3.66) достаточно доказать, что при п ^ N No к=1 k=l A3.71) Для доказательства неравенства A3.71) заметим, что при п^ N первая из сумм, стоящих в левой части A3.71), содержит все Nq первых членов ряда A3.64). Вследствие этого разность No A3.72) k=l к=1 представляет собой сумму (п — Nq) членов ряда A3.64) с номе- номерами, каждый из которых превосходит N®. Если выбрать натуральное р столь большим, чтобы номер Щ + Р превосходил номера всех (п — Nq) членов только что указанной суммы, то для разности A3.72), во всяком случае справедливо неравенство k=i k=i No+p E A3.73) Из неравенств A3.73) и A3.67) вытекает неравенство A3.71). Тем самым доказано неравенство A3.66), т. е. доказано, что ряд A3.65) сходится и имеет сумму, равную S. Остается доказать утверждение 2) о том, что ряд A3.65) сходится абсолютно. До- Доказательство этого утверждения следует из утверждения 1), ес- если его применить к рядам E i-'i E k = l и'к A3.74) При этом мы докажем сходимость второго из рядов A3.74), т. е. докажем абсолютную сходимость ряда A3.65). Теорема 13.11 полностью доказана.
§ 4 ОПЕРАЦИИ НАД СХОДЯЩИМИСЯ РЯДАМИ 453 § 4. Арифметические операции над сходмщимисм рмдами В этом параграфе мы рассмотрим вопрос о возможности по- почленного сложения и перемножения сходящихся рядов. Теорема 13.12, Если два ряда J2 ик и J2 vk сходятся к=1 к=1 и имеют суммы, соответственно равные U и У, то и ряд оо Y2 (ик =Ь vk) сходится и имеет сумму, равную U ± V. к=г Доказательство. Обозначим n-е частичные сум- суммы рядов J2uki Ylvk и Yl(uk =t vk) соответственно через Un, Vn и Sn. Тогда, очевидно, Sn = Un ±Vn. Так как lira Un = f/, n>oo lim Fn = F, то, согласно теоремам 3.9 и 3.10, существует предел lim Sn = U ±V. Теорема доказана. Таким образом любые сходящиеся ряды можно почленно складывать и вычитать. Переходя к вопросу о возможности почленного перемноже™ ния рядов, докажем следующее утверждение. оо оо Теорема 18.13. Если два ряда J2 uk u J2 vl сходятся аб- к=\ 1=1 солютно и имеют суммы, соответственно равные U и V, то ряд^ составленный из всех произведений вида ukvi (k = 1,2,... ; 1 = 1,2,...), занумерованных в каком угодно порядке, также сходится аб- абсолютно и его сумма равна UV. Доказательство. Обозначим через w\, 102,103? • • • произведения вида u^vi (k = 1, 2,... ; I = 1, 2,...), занумерован- ные в каком угодно порядке. Докажем, что ряд ]Р \wi\ сходится. Пусть Sn — п-я частичная сумма этого ряда. Сумма Sn состоит из членов вида |здг^|. Среди индексов к и I таких членов, вхо- входящих в сумму Sn, найдется наибольший индекс, который мы обозначим через т. Тогда во всяком случае Sn ^ (Ы + Н + ... + Ы)(Ы + Н + ... + |г;ш|). A3.75) В правой части неравенства A3.75) стоит произведение т~х ча- частичных сумм рядов J2 \ик\ и J2 \vl\- В силу сходимости указан- указанных рядов с положительными членами все их частичные суммы (а стало быть, и их произведение) ограничены. Поэтому ограни-
454 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 йена и последовательность частичных сумм {Sn}, а это и до™ казывает сходимость ряда ]Р |^|, т. е. абсолютную сходимость ряда J2wi> Остается доказать, что последний ряд имеет сумму 5, рав- равную UV. Так как этот ряд сходится абсолютно, то в силу тео- теоремы 13.11 его сумма S не зависит от порядка^ в котором мы его суммируем. Какую бы мы ни взяли последовательность (а стало быть, и подпоследовательность1)) частичных сумм этого ряда, она сходится к числу S. Но в таком случае сумма S ряда оо Y^ Wi заведомо равна UV, ибо именно к этому числу сходится подпоследовательность Wm частичных сумм этого ряда вида Wm = (т + и2 + ... + um)(vi + v2 + ... + vm). Теорема 13.13 доказана. Замечание. Произведение рядов k=l k=l для многих целей удобно записывать в виде +оо \ /+оо ( \k=i У \k=i У = UiVi + (U1V2 + U2Vi) + . . . + (uiVk-l + • • • + Uk-lVi) + . . . Отметим без доказательства, что ряд, полученный почленным перемножением двух рядов указанным специальным образом, сходится и в случае, когда только один из двух перемножае- перемножаемых рядов сходится абсолютно (а другой ряд может при этом сходиться только условно). В случае, когда оба ряда сходятся условно, почленное перемножение их далее по этому правилу приводит, вообще говоря, к расходящемуся ряду. § 5. Признаки сходимости произвольных рядов В § 2 мы установили ряд признаков сходимости для рядов с положительными членами. В этом параграфе мы изучим во™ прос о признаках сходимости для рядов с членами любого знака. Итак, пусть со 5>* A3.76) г) В силу п. 1 § 4 гл. 3.
§ 5 ПРИЗНАКИ СХОДИМОСТИ ПРОИЗВОЛЬНЫХ РЯДОВ 455 — ряд, члены которого имеют какие угодно знаки. Прежде всего, заметим, что для установления абсолютной сходимости этого ряда, т. е. для установления сходимости ряда с положительными членами ^ к=1 можно применять любой из признаков § 2 (признак Даламбе™ ра, Коши, Раабе или интегральный признак). Однако ни один из указанных признаков не дает возможности выяснить более тонкий вопрос об условной сходимости ряда A3.76) г). Ниже мы и займемся отысканием более тонких признаков, позволяющих устанавливать сходимость ряда A3.76) ив тех слу- случаях, когда этот ряд не является абсолютно сходящимся. 1. Признак Лейбница. Признак Лейбница относится к весьма распространенному частному виду ряда A3.76), к так называемому знакочередующемуся ряду. Ряд называется зна- кочередующимся, если члены этого ряда поочередно имеют то положительный, то отрицательный знаки. Знакочередующийся ряд удобно записывать так, чтобы были выявлены знаки всех его членов, т. е. в виде Р1-Р2+РЗ---- + (-I)*" V + ¦ ¦ ¦ , A3.77) где все р^ ^ 0. Теорема 13.14 (признак Лейбница). Если члены знако- чередующегося ряда, будучи взяты по модулю^ образуют невоз- растающую бесконечно малую последовательность^ то этот ряд сходится. Замечание 1. Ряд, удовлетворяющий условиям теоремы 13.14, часто называют рядом Лейбница. ) Заметим, впрочем, что признаки Даламбера и Коши можно приме™ пять для установления расходимости ряда с членами любого знака A3.76). В самом деле, всякий раз, когда признак Даламбера или Коши констати- оо рует расходимость ряда из модулей Yl \uk\, к~й член ряда A3.76) Uk не k=i стремится к нулю при к —> оо, т. е. ряд A3.76) расходится. В качестве 00 к примера установим, что ряд YJ к\ ( — 1 расходится для любого фиксиро- k=i ванного значения ж, удовлетворяющего неравенству х > е. Подчеркнем, что непосредственная проверка того, что к-й член рассматриваемого ряда не стремится к нулю при к -^ оо, является затруднительной. Применим к рассматриваемому ряду признак Даламбера. Обозначая к-й член этого ря™ || \\ \\ \\ «/ «и ^ \Х\ да через aki будем иметь 1™^^11 = |W| откуда lim |VT/t^,11 = — > 1. |«fc| (l + -) k^°° lttfel e r> \ k/ Расходимость ряда доказана.
456 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Доказательство теоремы 13.14. Пусть дан ряд A3.77) и известно, что последовательность {pj,} является невозрастающей и бесконечно малой. Частичную сумму этого ряда четного порядка $2П можно записать в виде $2п = (Pi - Ы + (рз - Ра) + • • • + (P2n^i - Р2п)- A3.78) Так как каждая круглая скобка в A3.78) неотрицательна1), то ясно, что при возрастании п последовательность {$2п} пе убы- убывает. С другой стороны, S2n можно переписать в виде #2га =Р1- (Р2 - Рз) - (Р4 - Рб) - • • • - (Р2те~2 ~ P2ra-l) ~ Р2в, откуда очевидно, что для любого номера п будет 5^ ^ Pi- Та- Таким образом, последовательность четных частичных сумм S^ не убывает и ограничена сверху. В силу теоремы 3.15 эта после™ довательность сходится к некоторому числу 5, т. е. lim S^ = S. п^оо Из очевидного равенства $2n-i = S^ + Р2тг и из того, что lim p2n = 0, вытекает, что и последовательность нечетных ПХУЭ частичных сумм {$2n-i} сходится к тому же числу Я, т. е. lim S271-1 — S. Таким образом, вся последовательность {Sn\ п^оо сходится к S. Замечание 2. При доказательстве теоремы 13.14 мы обнаружили, что последовательность четных частичных сумм {$2п} сходится к пределу S не убывая. Аналогично из равенства S2n-1 = Pi — (Р2 — Рз) — (Р4 — Ръ) — • • • — (Р2п-2 ~ P2n-l) вытекает, что последовательность нечетных частичных сумм {$2n-i} сходится к пределу S не возрастая. Таким образом, для любого номера п Q <-" Q <-" Q ho 70\ kJ2n ^5 ^ ^ ^2п 1* i-LO. I V) Поскольку S271-1 — S2n = P2n из неравенств A3.79) вытекает, что S — S2n ^ Р2п и 52п-1 — $' ^ Р2п ^ P2n-i- Тем самым мы получаем, что для любого номера п справедливо неравенство \Sn-S\ ^Pn« A3.80) Неравенство A3.80) широко используется для приближенных вычислений с помощью рядов. В качестве примера рассмотрим уже неоднократно фигури- фигурировавший выше ряд оо / ^ 1 — ~Ч"™~ — ~~ ~~Ь ... ~Ь "т" • • • A3.81) г -^ к 2 3 4 к к=1 г) Вследствие того, что {рк} не возрастает, т. е.
§ 5 ПРИЗНАКИ СХОДИМОСТИ ПРОИЗВОЛЬНЫХ РЯДОВ 457 Заметим, что ряд A3.81) является рядом Лейбница, а поэто™ му сходимость его вытекает из теоремы 13.14. Пусть, например, нужно вычислить сумму ряда A3.81), т. е. число In2, с точно- точностью до —-. В силу оценки A3.80) эта сумма с требуемой точ- о ^ 1.1 1 . 1 ностью совпадает с own = 1 — - + - — - + ... — ^—. 2 о 4 10"' 2. Признак Дирихле—Лбе лм. Для установления еще одно- одного тонкого признака сходимости рядов выведем одно интересное тождество, представляющее собой аналог формулы интегриро- интегрирования по частям. Пусть щ^ щ^ Щ^ • • • , ^ъ v2-> ^з7 • • • — совершенно произвольные числа, Sn = щ + и^ + • • • + иП1 п и р — любые но- номера. Тогда справедливо следующее тождество: п+р п+р—1 Еж О / \ i О О /1 О ОО\ акик — / °к\ик ик+1) " °п+рип+р °п—1ип- \±o.ozjJ к=п к=п Тождество A3.82) обычно называют тождеством Абеля1). Вывод тождества Абеля. Учтем, что щ = = Sk — Sk-Хч и подставим это значение Uk в левую часть A3.82). Получим п+р п+р п+р к=п к=п к=п В последней сумме уменьшим на единицу индекс суммирова- суммирования к. Получим п+р п+р п+р—1 Е к=п к=п к=п—1 п+р—1 п+р—1 к=п к=п п+р—1 = ^2 ^k(vk^vk+^) к=п 1) Если равенство A3.82) переписать в виде п+р п+р 2^Vk{Sk — Sk-l) = Sn+pVn+p ^ Sn-lVn ~~ ^J i ) k=n k=n то становится очевидным, что преобразование Абеля является по существу формулой суммирования по частям, представляющей собою разностный аналог формулы интегрирования по частям.
458 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Мы получили выражение, совпадающее с правой частью A3.82). Тем самым тождество Абеля доказано. Теорема 13,15 (признак Дирихле-Абеля). Пусть дан ряд ukvk. A3.83) оо Е к=1 Этот ряд сходится, если выполнены следующие два условия: 1) последовательность {vt} является невозрастающей и бесконечно малой] оо 2) ряд J2 ик имеет ограниченную последовательность ча- к=1 стичных сумм. Доказательство. Обозначим Sn в~ю частичную оо сумму ряда Y1 ик- По условию существует такое число М > к=1 > О, что \Sn\ ^ М для всех номеров п. В силу критерия Копти достаточно доказать, что для любого е > 0 найдется номер N такой, что при п ^ N и для любого натурального р п+р к=п < е. A3.84) Пусть дано любое е > 0. Так как последовательность {vk} явля- является бесконечно малой и не возрастает, то для положительного числа —— найдется номер N такой, что 0 <С Vfl < _?_ (при п > N). A3.85) Применим теперь для оценки величины, стоящей в левой части A3.84), тождество Абеля A3.82). Учитывая, что модуль суммы нескольких величин не превосходит суммы их модулей, модуль произведения равен произведению модулей и что vk \ лучим -i\vn- A3.86) п+р к=п п+р-1 < V к=п В правой части A3.86) воспользуемся неравенством \Sn справедливым для всех номеров п. Получим п+р к=п V (vk - vn+p Mvn Ж, A3.87) к=п
§ 5 ПРИЗНАКИ СХОДИМОСТИ ПРОИЗВОЛЬНЫХ РЯДОВ 459 Далее, заметим, что сумма, стоящая в фигурных скобках, точно равна vn. В таком случае неравенство A3.87) принимает вид п+р к=п 2Mvn. A3.88) Теперь, если в правой части A3.88) воспользоваться неравен™ ством A3.85), получим, что при п ^ N и для любого натураль™ ного р справедливо неравенство A3.84). Теорема доказана. Замечание. Теорема 13.14 (признак Лейбница) является частным случаем теоремы 13.15 при1) ик = (—1)к~1. Примеры. 1. Исследовать на сходимость следующий ряд: 12112 1 1 2 2~345~6 3?г-2 Зга - 1 ~ Зга " Указанный ряд можно рассматривать как ряд вида A3.83) при Щ = k1 Щ = 1? Щ = 1? ^3 = ^2' Щ = 1, ^5 = 1, Ш = -2, • • • оо Очевидно, что: 1) ряд Y1 ик обладает ограниченной последова™ k=i тельностью частичных сумм: S\ = 1, S2 = 2, S3 = О, S^ = 1, S5 = 2, 5б = 0, ... ; 2) последовательность {v^} не возрастает и является бесконечно малой. По теореме 13.15 рассматриваемый ряд сходится. оо z. Выясним вопрос о сходимости ряда > , где ж — неко- ^ ^ tZ торое фиксированное вещественное число. Пользуясь обозначе- обозначениями теоремы 13.15, положим и^ = cosfca;, v^ = 1/k. Оценим оо последовательность частичных сумм Sn ряда ^ щ. Поскольку к=1 для любого номера к sin ( А; + - 1 ж — sin I А; — - 1 х = 2 sin - cos кх^ \ Z / \ Z у Z то, суммируя это соотношение по к от 1 до п, получим п • / . 1\ -1 о • ж V^ 1 00 • ж sin I n + - 1 ж — sin -ж = 2 sin - > cos кх = 25^ sin -. \ А / Zi Z **¦ ¦** zl г) Очевидно, что ряд J2 uk = Y1 (^г)к Х = 1 — fc=i fc=i ограниченную последовательность частичных сумм.
460 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Отсюда sm(n+-jx-sm- —¦ ^ _ 2 sin - Таким образом, для любого ж, не кратного 2тг, последователь- последовательность частичных сумм Sn ограничена: По теореме 13.15 рассматриваемый ряд сходится для любого значения х, не кратного 2тг. Если же х кратно 2тг5 то рассма- рассматриваемый ряд превращается в гармонический и, как доказано выше, расходится. § 6. Бесконечные произведения 1. Основные понмтим. К понятию числового ряда близко примыкает понятие бесконечного числового произведения. Пусть дана бесконечная числовая последовательность vi, г?2, • • • , vk, • • • Записанное формально выражение вида \[k A3.89) принято называть бесконечным произведением. Отдельные эле- элементы Vk принято называть членами данного бесконечного про- произведения. Произведение первых п членов данного бесконечного произведения принято называть п~м частичным произведением и обозначать символом Рп: ¦ п- Рп = ViV2...Vn = Д Vk. k=l Бесконечное произведение A3.89) называют сходящимся^ если последовательность частичных произведений Рп имеет конеч™ ный предел Р, отличный от нуля1). В случае сходимости бес- бесконечного произведения A3.89) указанный предел Р называют значением этого бесконечного произведения^ т. е. пишут vk. A3.90) к=1 1) Тот факт, что при Р = 0 бесконечное произведение принято считать расходящимся, хотя и носит условный характер, но, как мы увидим ниже, позволяет провести четкую аналогию между сходимостью рядов и беско- бесконечных произведений.
§ 6 БЕСКОНЕЧНЫЕ ПРОИЗВЕДЕНИЯ 461 Подчеркнем, что равенство A3.90) имеет смысл лишь для сходящегося бесконечного произведения. Ясно, что рассмо™ трение бесконечных произведений по существу представляет собой новую форму изучения числовых последовательностей, ибо каждому данному бесконечному произведению однозначно соответствует последовательность его частичных произведений и каждой числовой последовательности {-Р&}, все элементы ко™ торой отличны от нуля, однозначно соответствует бесконечное произведение, для которого эта последовательность является последовательностью частичных произведений (достаточно положить члены бесконечного произведения равными v^ = k Рк-1 при к > 1 и v\ = Pi). Теорема 13.16. Необходимый условием сходимости беско- бесконечного произведения A3.89) является стремление к единице его k-го члена при к —>> оо. Доказательство. Пусть бесконечное произведение A3.89) сходится и имеет значение Р, отличное от нуля. Тогда lim Pk-i = Hm P^ = P ф 0. Поскольку v^ = k , то lim vj- k^oo k^oo *k — i k^oo существует и равен единице. Заметим, что на сходимость бесконечного произведения не влияет удаление любого конечного числа членов этого произ™ ведения (если, конечно, среди этих членов нет равных нулю). Поскольку бесконечное произведение, у которого хотя бы один член равен нулю, согласно принятому выше определению, счи™ тается расходящимся, то мы в дальнейшем вообще исключим из рассмотрения бесконечные произведения^ у которых хотя бы один член равен нулю. Примеры бесконечных произведений. II Г X X X X /iini\ I} cos — = cos - cos - ... cos — ... A3.91) k=l (x — любое фиксированное число). Докажем, что бесконечное произведение A3.91) сходится и sin ж у-г имеет значение . Подсчитаем в~е частичное произведение Рп = cos | cos ^ ... cos ^. A3.92) Умножая обе части A3.92) на sin— и последовательно исполь- зуя формулу для синуса двойного угла sin2y = 2 sin у cos у, по- получим D . х 1 . Fn sin — = — sin ж. n 2n 2n
462 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Из последней формулы 1) sin ж х \ —— 2те/ Поскольку выражение в фигурных скобках стремится к единице при п —>> оо (в силу первого замечательного предела), то lim Рте п—)-оо существует и равен . Тем самым доказано, что бесконечное /1 о ni\ i произведение Aо.91) сходится и имеет значение h - 2 sin ж ОО ТТ h IIL k=2 1 4 2 5 (ife-1) (ik + 2) 2*3*3*4*** fc * (ife + 1) A3.93) Докажем, что бесконечное произведение A3.93) сходится и име- имеет значение -. Подсчитаем частичное произведение Рп: о р _ 1 2 3 п - 1 4 5 6 w + 2l w + 2 п ~ 2 * 3 * 4 *** 2 3 4 *** п 3 4 5 *** п + 1 п 3 * После этого очевидно, что lim Рте = lim существует и 1 п—>оо п—>оо Зтг равен -. о 2. Свмзь между сходимостью бесконечных произведе- произведений и рмдов. Если бесконечное произведение A3.89) сходится, то в силу теоремы 13.16 все члены его ^, начиная с некоторого номера fc, положительны 2). Поскольку конечное число первых членов вообще не влияет на сходимость бесконечного произве™ дения, то при изучении вопроса о сходимости бесконечных про- произведений мы, не ограничивая общности, можем рассматривать лишь такие бесконечные произведения, у которых все члены по- положительны. Теорема 13.17. Для того чтобы бесконечное произведение A3.89) с положительными членами сходилось^ необходимо и достаточно, чтобы сходился ряд k=l 1) Мы считаем, что ж / 0. Если ж = 0, то все члеивх A3.91) и его значение равны единице. 2) Ибо lim vfe = 1.
§ 6 БЕСКОНЕЧНЫЕ ПРОИЗВЕДЕНИЯ 463 В случае сходимости сумма S ряда A3.94) и значение Р про- произведения A3.89) связаны формулой P = es. A3.95) Доказательство. Обозначив через Рп п-е частичное произведение бесконечного произведения A3.89), а через Sn п-ю частичную сумму ряда A3.94), можем записать В силу непрерывности показательной функции для всех зна- значений аргумента и непрерывности логарифмической функции для всех положительных значений аргумента, последователь- последовательность Рп сходится тогда и только тогда, когда сходится Sni при- причем если lira Sn = 5, то Mm Pn = es. Теорема доказана. При исследовании на сходимость бесконечного произведения оказывается очень удобным представить это бесконечное произ- произведение в виде оо JJA + ик) = A + Щ)A + щ)... A + ик)... A3.96) При этом, конечно, в соответствии с принятым выше предполо- предположением, мы считаем, что все щ > — 1. Теорема 13.17 утверждает, что вопрос о сходимости произве- произведения A3.96) эквивалентен вопросу о сходимости ряда A3.97) k=i Теперь мы можем доказать еще одно утверждение. Теорема 13.18. Если все и^ (по крайней мере начиная с некоторого номера к) сохраняют один и тот же знак, то для сходимости бесконечного произведения A3.96) необходимо и до- статочно, чтобы сходился ряд *- A3.98) Доказательство. Поскольку условие lim щ = 0 яв- ляется необходимым и для сходимости ряда A3.98), и для схо- сходимости произведения A3.96), мы можем считать это условие выполненным как при доказательстве необходимости, так и при доказательстве достаточности. Но из указанного условия и из
464 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 асимптотической формулы 1) 1пA + у) = У + О{у) вытекает, что lim 1п (! + "*) = 1 A3.99) к ик lim —--—г = 1. A3.100) Поскольку по условию теоремы все члены рядов A3.97) и A3.98), начиная с некоторого номера fc, сохраняют один и тот же знак, условия A3.99) и A3.100), в силу следствия из теоремы сравнения 13.3, позволяют утверждать, что ряд A3.98) сходит- сходится тогда и только тогда, когда сходится ряд A3.97). Теорема доказана. Примеры. 1) Из расходимости гармонического ряда и из теоремы 13.18 вытекает расходимость следующих бесконечных произведений: к=1 к=1 Легко понять, что первое из указанных произведений расходит- расходится к +оо, а второе к нулю. 2) Из той же теоремы 13.18 и из сходимости ряда A3.33) при а > 1 вытекает сходимость при а > 1 следующих бесконечных произведений: k=l оо k=l Так же как и для рядов, для бесконечных произведений вво- вводится понятие абсолютной и условной сходимости. Бесконечное произведение A3.96) называется абсолютно сходящимся в том и только том случае, когда сходится абсолютно ряд A3.97). Те- Теоремы Копти 13.11 и Римана 13.10 позволяют заключить, что г) См. § 7 гл. 4.
§ 6 БЕСКОНЕЧНЫЕ ПРОИЗВЕДЕНИЯ 465 абсолютно сходящееся произведение обладает переместитель- ним свойством, в то время как условно сходящееся произведение заведомо им не обладает. Справедливо следующее утверждение. Теорема 13.19, Бесконечное произведение A3.96) сходится абсолютно тогда и только тогда^ когда сходится абсолютно ряд A3.98). Для доказательства этой теоремы достаточно до™ оо казать, что ряд Yl \uk\ сходится тогда и только тогда, когда к=1 оо сходится ряд Y2 11пA + щ)\. Это последнее легко вытекает из к=1 существования пределов A3.99) и A3.100). Детали рассуждений предоставляем читателю. В заключение рассмотрим еще несколько примеров. 1°. Рассмотрим бесконечное произведение со I I V L.2 2 / — V ""° / \ 92 2 / \ Q2 2 ) ' ' ' \^-O.l\Jl) k = l ОО Так как ряд \^ т^ сходится, то, в силу теорем 13.18 и 13.19, бес™ к=1 конечное произведение A3.101) сходится абсолютно для любого фиксированного значения ж, отличного от 1ж (где 1 = 0,=Ы,...). В дополнении 2 к этой главе мы докажем, что это произведение сходится к значению sin ж. Тем самым будет обосновано разло™ жение функции sin ж в бесконечное произведение A3.102) к=1 2°. Из разложения A3.102) путем использования соотноше™ ния cos ж = , элементарно получается следующее разложе- разложение: 28ШЖ 1 — 2 . (lJ.luJj к=1 Абсолютная сходимость произведения, стоящего в правой ча™ сти A3.103), для любого ж, отличного от ^ B1 — 1) (I = 0, ±1, ... ), вытекает из теорем 13.18 и 13.19 и из сходимости ряда сю Bк-\ к=1
466 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 3°. Полагая в разложении A3.102) х = тг/2, получим со со со 2 = ТТ Л J_\ TT 4fe2^l = TT Bfc тг II V 4к2) II 4Р II B1сJ k=l k=l k=l Отсюда получается так называемая формула Валлиса1) оо BfeJ _ 2 2 4 4 2fc 2fc A Я 1 041 3 3 5***2lc-l 2fc + l***1 ^ Путем несложных преобразований формулу Валлиса можно привести к виду Первоначально формулу Валлиса использовали для приближен™ ного вычисления числа тг. В настоящее время для вычисления числа ж существуют более эффективные методы. Формула Вал- Валлиса A3.104) представляет интерес для ряда теоретических ис- исследований 2). ДОПОЛНЕНИЕ 1 ВСПОМОГАТЕЛЬНАЯ ТЕОРЕМА ДЛЯ п. 3 § 2 Teopema 13.20. Пусть рк — какие угодно полотсительные числа. То- гда, если существует предел lim ^±i = L, A3.105) fe^oo pk то существует и предел lim VpT, причем справедлива формула к-ч-оо lim У^= lim ?*±1=L. A3Л06) > fe> p Доказательство. Преж:де всего докаж:ем следующее вспомога- вспомогательное утверждение3): если последовательность положительных чисел ai,a2,... , afc,... сходится к некоторому числу L, wo тс этому шее чис- числу L сходится и последовательность средних геометрических этих чи- чисел bk = y/cLiQ>2 • • • ttfe. Для доказательства вспомогательного утверж:дения заметим, что в силу непрерывности логарифмической функции для L > 0 lim In afc = In L. (Последнее равенство формально справедливо и при L = 0, ) Дж:он Валлис — английский математик A616—1703). ) В частности, она может быть использована для установления так назы- называемой формулы Стирлинга (см. часть 2 настоящего курса). Джемс Стир™ линг — английский математик A692-1770). 3) Подчеркнем, что это утверждение имеет и самостоятельный интерес.
ДОПОЛНЕНИЕ 2 467 когда inL = — со.) Но тогда по теореме о пределе среднего арифметического (см. дополнение к гл. 3, пример 1) существует предел In ai + In tt2 + • • • + In а к hm In \/aia2 ... a& = hm = = In L. (Последнее равенство справедливо и при L = О, когда InL = — оо.) Из последнего равенства, в силу непрерывности показательной функции, по- получим lim \/а\п2 . • • (ik = Hm exp (In \/а\п2 ... а&) = e n = L. к—»oo fe—->oo (Эти рассуждения справедливы и при L = 0.) Вспомогательное утверждение доказано. Применяя это утверждение к Р2 РЗ Ffe числам ai = pi, а,2 = —, «з = —, • • •, о>к = 5 • • • ? мы установим суще- Р\ Р'2 Рк-1 ствование предела lim ^fpk и равенство A3.106). Теорема A3.20) доказана. ДОПОЛНЕНИЕ 2 РАЗЛОЖЕНИЕ ФУНКЦИИ sin ж В БЕСКОНЕЧНОЕ ПРОИЗВЕДЕНИЕ Ради удобства разобьем вывод формулы A3.102) на отдельные пункты. 1°. Пусть т — любое положительное нечетное число: т = 2п + 1. Прежде всего докажем, что для любого отличного от кж (к = 0, =Ы,...) значения 9 1) справедлива следующая формула: Л sln2^ \ тп-1 sin 771 - A3.107) Для установления формулы A3.107) будем исходить из формулы Муавра (см. § 1 гл. 7) cos m9 + г sin m0 = (cos 9 + г sin 9)m. Расписывая правую часть этой формулы с помощью бинома Ньютона и сравнивая мнимые части, получим п т^1л • п т(т-1)(т-2) т^3 п . з Л , sm m0 = тп cos 0 sm 0 — ^^^™^^^^~^^ cos 0 sm 0 + ... 1-2-3 Учитывая, что m = 2n + 1, будем иметь — = cos2n 0 cos2n 0 sin2 6» + ... A3.108) 7тг sm 61 1-2-3 В правой части A3.108) все показатели при косинусах и синусах четные, так что если заменить cos2 9 на 1 ^sin2 0, то в правой части A3.108) получится многочлен степени п относительно sin2 0. Положив г = sin2 0, обозначим этот многочлен символом F(z), а его корни символами ai,a2, • • • ,«п- Так ) Нас в дальнейшем будут интересовать значения в лишь из интервала 0 < 101 <тг.
468 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 как z = sin2 в —»• 0 при в —»¦ 0 и поскольку левая часть A3.108) стремится к единице при 0 —»¦ 0, многочлен F(z) можно представить в виде msin.0 \ ai Остается определить корни ai, 0*2-, • • • , сап. Замечая, что эти корни соответ- соответствуют нулям функции sin тв, получим • 2 ТГ -2 2?Г . 2 П7Г а± = sin —, а2 = sin —, ... , ап = sin —. mm m Тем самым формула A3.107) установлена. 2°. Положив в формуле A3.107) 9 = х/т и считая, что 0 < |ж| < тгт, придадим этой формуле вид sin — Фиксируем любое (отличное от нуля) значение х и возьмем два произ- произвольных натуральных числа р и п, удовлетворяющих неравенствам 2-—— < 7Г < р < п = —-—. Тогда формулу A3.109) можно записать в виде A3.110) где п RP(x) = }} fc=p+i V sinz — I \ ml tj* pfn 1 Прежде всего оценим Rp(x). Поскольку 2— < p < n = , то аргу™ 7Г 2 менты всех синусов, стоящих в формуле A3.111), принадлежат интервалу (—тг/2, тг/2). Кроме того, ясно, что для всех к, участвующих в этой формуле, х < ктг/2 и, стало быть, • 2Х -2 "^ sin — sin ^— 2 2 . о ктт . 9 ктт . ^ ктт 2 sin — sin — 4 cos2 m m 2m ( ктт TV ктт Ti 2 ктт 1 \ ибо — < —, т. e. -— < —, и поэтому cos -— > — . 1ак как для любого m 2 2m 4 2m 2/ /3 из интервала 0 < /3 < 1/2 справедливы неравенства 1 > 1 — /3>е™2/31), 1) Правое из этих неравенств элементарно вытекает из формулы Макло- рена: e^w = 1 - 2/3 + ^^ - ... < 1 - 2f3 + 2^2 < 1 - /3, так как 2^2 < р.
ДОПОЛНЕНИЕ 2 469 то для всех номеров к, превосходящих р, . о X sin — 1 > 1 - ,m > ехр I -2 ?ш I . A3.112) кж ' ^ I v 7 sin — m Почленно перемножая неравенства A3.112), записанные для значений к = = р + 1, р + 2, ..., п, получим следующую оценку для Rp(x): 1 > Др(ж) >ехр I -2sin2— V Х? I. A3.113) \ Имея в виду, что аргумент кж/т лежит в первой четверти и что для любо™ а « 1 \ sin/^ \ 2 П го р из первой четверти 1 ^ —— ^ — J, получим р тг 1 1 Таким образом, ехр ^2sin2^ V fc=p+l sin — I т . 2 х ^^ г 1 111 / т" . 2 ж > ехр --—sin — > - - = ехр -—- sin — I 2 т ^^ Ik — 1 fcJ I V 2р т ,[^i4l) Последнее неравенство позволяет следующим образом усилить оценку A3.113): / т2 т \ 1 > Rp{x) > ехр —— sin2 — . A3.114) \ 2р ту 3°. Устремим теперь в формуле A3.110) число т к бесконечности, остав™ х ляя фиксированными значение х и номер р. Поскольку lim msin — = ж, т-юо ТВ lim m sin — = к ж , то существует предел левой части A3.110), рав™ m-4-oo 771 • 2 ^ sin — I HL ^ равный sin — т 1\ гл Sil1/^ j с!ти неравенства вытекают из того, что отношение при изменении /3 от 0 до тг/2 убывает от 1 до 2/тг. Факт убывания функции sm/3//3 в свою /sin^x' cos^//3 . очередь вытекает из того, что (—— 1 = (р — tgp) < 0 всюду на интервале 0 < /3 < тг/2.
470 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 ||A — То—о J • Далее мы будем считать, что последний предел отличен от А А V K27TZ У k=l нуля, ибо когда он равен нулю, sin ж = 0 и разложение A3.102) установ- установлено. Но тогда существует и предел llm Rp(x). Обозначим этот предел т-->оо через Rp(x). Из неравенств A3.114), справедливых для любого номера т, и из теоремы 3.13 вытекает, что A3.115) Формула A3.110) в пределе при т —>¦ оо дает 4°. Остается, сохраняя фиксированным ж, устремить в формуле A3.116) номер р к бесконечности. Поскольку левая часть A3.116) от р не зависит, а предел llm Rp(x), в силу неравенств A3.115) и теоремы 3.14, существует и равен единице, то существует и предел lim p—>oo ¦ Тем самым разложение для sin ж A3.102) установлено. Замечание. В полной аналогии с разложениями A3.102) для sin ж и A3.103) для cos ж можно получить "разложения в бесконечные произведения гиперболических функций sh ж = ж ТТ I 1 + ¦——; I и ch ж = ТТ 1 + \ kzirz J L 4ж2 Заметим, что из разложений для sin ж, cos ж, впж, спж немедленно получа- получаются разложения в бесконечные произведения функций tgx, ctgж и tha;, cthaj. ДОПОЛНЕНИЕ 3 ОБОБЩЕННЫЕ МЕТОДЫ СУММИРОВАНИЯ РАСХОДЯЩИХСЯ РЯДОВ Во всей гл. 13 мы называли суммой ряда оо ]Р ик = иг + и2 + из + • • • + ик + • • • A3.117) k=l предел S последовательности {Sn} частичных сумм этого ряда (при усло- условии, что этот предел существует). В ряде задач математического анализа, представляющих как теорети- теоретический, так и практический интерес, приходится оперировать с рядами, у которых последовательность частичных сумм не сходится и суммы в ука- указанном в гл. 13 обычном смысле не существует. Естественно, возникает вопрос об обобщении понятия суммы ряда и о суммировании расходяще- расходящегося в обычном смысле ряда A3.117) с помощью каких-либо обобщенных
ДОПОЛНЕНИЕ 3 471 методов. В настоящем дополнении мы и остановимся на некоторых обоб- обобщенных методах суммирования расходящихся рядов. Прежде всего дадим общую характеристику тех методов суммирова- суммирования, с которыми мы будем иметь дело. Разумно требовать, чтобы обоб- обобщенное понятие суммы включало в себя обычное понятие суммы. Точнее, ряд, сходящийся в обычном смысле и имеющий обычную сумму S, должен иметь обобщенную сумму, и притом также равную S. Метод суммирова- суммирования, обладающий указанным свойством, называется регулярным. Далее, естественно подчинить понятие обобщенной суммы следующему оо оо условию: если ряд Yl ик имеет обобщенную сумму U, а ряд Yl vk имеет k=i fc=i оо обобщенную сумму V, то ряд ^ (^ик + Bvk), zde А и В — любые посто- постоянные, имеет обобщенную сумму (AU + BV). Метод суммирования, удо- удовлетворяющий указанному условию, называют линейным. В анализе и в его приложениях, как правило, имеют дело лишь с регулярными линейны- линейными методами суммирования. Остановимся на двух методах обобщенного суммирования, представляющих особый интерес для приложений. 1. Метод "Чезаро г) (или метод средних арифметических). Гово- Говорят, что ряд A3.117) суммируем методом Чезаро, если существует предел средних арифметических частичных сумм этого ряда lim Sl + ^ + ''' + Sn . A3.118) п—>оо П При этом предел A3.118) называется обобщенной в смысле Чезаро суммой ряда A3.117). Линейность метода суммирования Чезаро очевидна. Регулярность ме- метода Чезаро вытекает из примера 1, рассмотренного в Дополнении 1 к гл. 3. В самом деле, из указанного примера вытекает, что если последователь- последовательность {Sn} частичных сумм ряда A3.117) сходится к числу S, то предел A3.118) существует и также равен S. Приведем примеры рядов, не сходящихся в обычном смысле, но сумми- суммируемых методом Чезаро. 1) Рассмотрим заведомо расходящийся ряд оо ^(-l)* = 1-1 + 1-1 + ... fe=l Поскольку все четные частичные суммы S2n этого ряда равны нулю, а все нечетные частичные суммы S2n—i равны единице, то предел A3.118) существует и равен 1/2. Таким образом, рассматриваемый ряд суммируем методом Чезаро и его сумма в смысле Чезаро равна 1/2. 2) Считая, что х — любое фиксированное вещественное число из интер- интервала 0 < х < 2тг, рассмотрим заведомо расходящийся 2) ряд оо Yj cos kx = cos x + cos 2ж + cos Зж + ... A3.119) fc=i г) Эрнесто Чезаро — итальянский математик A859-1906). 2) Расходимость ряда A3.119) без труда усматривается из приведенного ниже выражения для его частичной суммы.
472 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Частичная сумма этого ряда Sn уже подсчитана нами в примере 2 в конце §5 . / 1\ . х sin( п -\— )х — sin — V 2/ 2 Si + 52 + ¦ ¦ ¦ + Sn 4wsm2™ Lm=i~ Отсюда очевидно, что 2 sin X 2 гческое частичных Yj sin I m cosm + + \ -I - 1 х 1 2 сумм: cos ж — cos 4nsin 2 ^ 2 Таким образом, ряд A3.119) суммируем методом Чезаро и его сумма в смыс- смысле Чезаро равна (—1/2). 2. Метод суммирования Пуассона *)—Абеля. Этот метод суммиро- суммирования состоит в следующем. По данному ряду A3.117) составляется сте- степенной ряд оо Л =Ш+ ч2х + и3х2 + ... + икхк^г + ... A3.120) Если указанный степенной ряд сходится для всех х из интервала 0 < < х < 1 и если сумма S(x) этого ряда имеет левое предельное значение lim S(x) в точке х = 1, то говорят, что ряд A3.117) суммируем мето- методом Пуассона-Абеля. При этом указанное предельное значение называется суммой ряда A3.117) в смысле Пуассона-Абеля. Линейность метода суммирования Пуассона—Абеля не вызывает сомне- сомнений. Докажем регулярность этого метода. Пусть ряд A3.117) сходится в обычном смысле и имеет сумму, равную S. Требуется доказать: 1) что ряд A3.120) сходится для любого х из интервала 0 < х < 1; 2) что сумма S(x) ряда A3.120) имеет в точке х = 1 левое предельное значение, равное S. Докажем сначала утверждение 1). Так как ряд A3.117) сходится, то последовательность его членов является бесконечно малой и, стало быть, ограниченной, т. е. найдется такое число М, что для всех номеров к \ик\^М. A3.121) Используя неравенство A3.121), оценим модуль к-ro члена ряда A3.120), считая, что х — любое число из интервала 0 < х < 1. Получим :м\х\к-\ г) Симон Дени Пуассон — французский математик A781-1840).
ДОПОЛНЕНИЕ 3 473 Так как |ж| < 1, то ряд k=i сходится. Стало быть, в силу замечания 2 к теореме сравнения 13.3, сходится и ряд A3.120). Докажем теперь утверждение 2). Пусть Sn — n-я частичная сумма ряда A3.117), a S — его обычная сумма. С помощью преобразования Абеля1) легко убедиться в том, что для любого ж из интервала 0 < ж < 1 справед- справедливо тождество оо оо \ А „., гГк~~1 — (л ,г\ \ ^ С. гГк~~1 A4 1 99^ 7 Cl//g«ly — ^-L JL> J / kJk^ • \ * / fc=l fc=l Вычтем тож:дество A3.122) из следующего очевидного тож:дества: При этом, обозначая г к к~й остаток ряда A3.117), будем иметь S-S(x) = A- к-1 A3.123) к=1 Наша цель доказать, что для любого е > 0 найдется ё > 0 такое, что левая часть A3.123) меньше е для всех ж, удовлетворяющих неравенствам 1 — § < < х < 1. Так как остаток г к ряда A3.117) стремится к нулю при к —»¦ оо, то для положительного числа е/2 найдется номер ко такой, что г к < ?"/2 при к ^ ко. Таким образом, fc-1 <2 A -т) V т^1 к=к0 -X) ^1 к=к0 Остается доказать, что для ж, достаточно близких к единице, fco-i A — Ж) 2_^ гкХ fc = l но это очевидно, ибо сумма, стоящая в последнем неравенстве, ограничена. Регулярность метода Пуассона-Абеля доказана. В качестве примера снова рассмотрим расходящийся ряд -1 = 1-1 + 1-1 + ... A3.124) fc=i Для этого ряда составим степенной ряд вида A3.120) / J fc=l / 1 \ fc — 1 fc — 1 1 i 2 3 (—1) х =1 — ж + ж —ж г) Преобразование Абеля A3.82) установлено нами в п. 2 § 5. В рассма™ триваемом случае следует положить в A3.82) п = 1, Sn—i = 0 и затем устремить р к бесконечности.
474 ТЕОРИЯ ЧИСЛОВЫХ РЯДОВ ГЛ. 13 Очевидно, что последний ряд сходится для всех х из интервала 0 < х < 1 и имеет сумму, равную S{x) = . Так как lim Six) = lim = —, то ряд A3.124) суммируем методом Пуассона™Абеля и его сумма в смысле Пуассона-Абеля равна 1/2. Обратим внимание на то, что сумма ряда A3.124) в смысле Пуассона™ Абеля совпадает с его суммой в смысле Чезаро. Этот факт не является слу- случайным: можно доказать, что если ряд суммируем методом Чезаро, то он суммируем и методом Пуассона—Абеля, причем сумма этого ряда в смысле Чезаро совпадает с его суммой в смысле Пуассона-Абеля. Более того, суще- существуют ряды, суммируемые методом Пуассона-Абеля, но не суммируемые методом Чезаро ). Детальное изучение всевозможных методов обобщенно- обобщенного суммирования расходящихся рядов проводится в монографии Г. Харди «Расходящиеся ряды» — М.: ИЛ, 1951 г. ) Таким образом, можно сказать, что метод Пуассона—Абеля является более «сильным» методом суммирования, чем метод Чезаро.
ГЛАВА 14 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ § 1. Понятие функции нескольких переменных 1. О функциональных зависимостях между несколь- несколькими переменными величинами. При изучении многих во- вопросов естествознания встречаются такие зависимости между несколькими переменными величинами, когда значения одной из этих переменных величин полностью определяются значе- значениями остальных переменных. Так, при рассмотрении каких- либо физических характеристик тела (например, его плотно- плотности р или температуры Т) нам приходится учитывать изменение этих характеристик при переходе от одной точки тела к другой. Поскольку каждая точка тела определяется тремя декартовы- декартовыми координатами ж, у и z, то рассматриваемые характеристи- характеристики (плотность р или температура Т) определяются значениями трех переменных ж, у и z. При рассмотрении физических процессов, меняющихся во времени, значения физических характеристик определяются значениями четырех переменных: трех координат точки ж, у, z и времени t. Например, при изучении звуковых колебаний газа плотность р этого газа и давление р определяются значения- значениями четырех переменных ж, у, z и t. Для изучения такого рода зависимостей в этой главе вводится понятие функции несколь- нескольких переменных и развивается аппарат для исследования таких функций. В теории функций нескольких переменных удобно пользо- пользоваться геометрической терминологией. Непосредственно ясно, что областью задания функции двух (или трех) переменных является некоторое множество точек плоскости (или простран- пространства). Для геометризации наших представлений о функции т переменных удобно ввести понятие m-мерного простран- пространства, обобщающее хорошо известные понятия двумерной плос- плоскости и трехмерного пространства. Наше последующее изложе-
476 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 ние мы начнем с выяснения необходимых нам геометрических понятий. 2. Понятия евклидовой плоскости и евклидова про- пространства. Известные из аналитической геометрии понятия ко- координат точек на плоскости и в пространстве и формула для определения расстояния между двумя точками могут быть ис- использованы для аналитического введения понятий плоскости и пространства. Множество всевозможных упорядоченных пар (ж, у) вещественных чисел х и у называется координат- координатной плоскостью. При этом каждую пару (ж, у) мы будем называть точкой этой плоскости и обозначать одной буквой М. Числа х и у называ- ются координатами точки М. Запись М(х^у) означает, что точ- точка М имеет координаты х и у. Координатная плоскость называется евклидовой плоскость ю, если между любыми двумя точками M'(xf,yf) и Mff(xff1yff) координатной плоскости определено рас- расстояние р{М\М") по формуле p(Mf,Mff) = y/(x/f -x'f + iy11 -у1 2 Совершенно аналогично вводится понятие координатного и ев- евклидова пространств. Множество всевозможных упорядочен- ных троек (ж, у, z) чисел ж, у и z называется координа т- н ы м пространством. При этом каждую тройку (ж, у, z) мы будем называть точкой этого пространства и обозна- обозначать одной буквой М. Числа ж, у и z называются координатами точки М. Запись M{x,y,z) означает, что точка М имеет коор- координаты ж, у и z. Координатное пространство называется евклидовым пространство м, если между любыми двумя точка- точками Mf(xl\yl\z!) и M"{x!l\уп\z") координатного пространства определено расстояние по формуле p(Mf,Mff) = у/{х" - x'f + (у" - у1J + (zff - z1J. Введенные нами понятия координатной плоскости и коорди- координатного пространства представляют собой аналоги числовой прямой, а евклидова плоскость и евклидово пространство пред- представляют собой аналоги евклидовой прямой^ которую молено определить как числовую прямую, между любыми двумя точка- точками х1 и х" которой определено расстояние р{х'^х") по формуле р{х', х") = ^{х'1 - xfJ = \х" - х'\. Рассмотрим некоторые множества {М} точек евклидовой плоскости и евклидова пространства. 1°. Множество {М} точек евклидовой плоскости, координаты ж и у которых удовлетворяют неравенству (ж — aJjr{y — Ь J ^ I?2,
§ 1 ПОНЯТИЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 477 как известно, называется кругом радиуса R с центром в точке Мо(а, Ь). Если координаты х шу удовлетворяют строгому нера- венству (х — аJ + (у — бJ < i?2, то множество {М} называется открытым кругом. В евклидовом пространстве множество {М} точек, координаты ж, у и z которых удовлетворяют неравенству (х — аJ + (у — Ъ J + (z — сJ ^ I?2, как известно, называется ша- шаром радиуса R с центром в точке М$(а, Ь, с). Если координаты ж, у ж z удовлетворяют соответствующему строгому неравенству, то множество {М} называется открытым шаром1). 2°. Множество {М} точек евклидовой плоскости (евклидова пространства), координаты х и у (ж, у и z) которых удовлетво- удовлетворяют неравенствам |ж — а| ^ d\ и \у ~~ b\ ^ cfo (\х — а\ ^ cfi, |у — b | ^ с?2 и \z — с\ ^ из), называется координатным пря- прямоугольником (координатным параллелепипедом) с центром в точке Мо(а, Ь) (в точке Мо(а, Ь, с)). 3. Понмтие функции двух и трех переменных. Исполь- Используя геометрическую терминологию, можно следующим образом сформулировать уже известное нам понятие функции одной пе- переменной. Если каждой точке М из некоторого множества {М} то- чек евклидовой прямой ставится в соответствие по известно- известному закону некоторое число и, то говорят^ что на множестве {М} задана функция и = и(М) или и = /(М). Введем теперь понятие функции двух переменных. Если каждой точке М из некоторого множества {М} то- точек евклидовой плоскости ставится в соответствие по из- известному закону некоторое число и, то говорят^ что на мно- множестве {М} задана функция и = и(М) или и = /(М). Заметим, что понятие функции двух переменных отличает- отличается от сформулированного выше понятия функции одной пере™ менной лишь тем, что вместо слов «евклидова прямая» исполь- используется термин «евклидова плоскость». Совершенно аналогично вводится понятие функции трех переменных. Для этого вместо множества {М} точек евклидовой плоскости нужно взять мно™ жество {М} точек евклидова пространства. Так как точка М евклидовой плоскости определяется двумя координатами х и у, а точка М евклидова пространства — тремя координатами ж, у и z, то для функций двух и трех переменных мы будем употреблять соответственно обозначение и = /(ж, у) и и = f(x,y,z). Если функция и = f(M) задана на множестве {М}, то это множество называется областью задания функции и = /(М). Число и, соответствующее данной точке М из мно- ) Очевидно, круг и шар представляют собой множества {М} точек плос- плоскости и пространства, для которых р(М, Mo) ^ R.
478 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 ^, 2А;тг- - ^ ж +У жества {М}, будем называть частным значением функции в точке М. Совокупность {и} всех частных значений функции и = f(M) называется множеством значений этой функции. Для функции двух переменных молено ввести понятие гра- графика, именно: графиком функции и = /(ж, у) называется по- верхность, точки которой имеют координаты (ж, у, /(ж, у)). Рассмотрим примеры функций двух и трех переменных. 1°. и = у^4 — ж2 — у2. Областью задания этой функции явля- является круг радиуса 2 с центром в начале координат, а множество значений представляет собой сегмент 0 ^ и ^ 2. 2°. и = ( Областью задания этой функции явля™ ется множество точек, лежащих вне круга радиуса 2 с центром в начале координат, а множество значений представляет собой открытую полупрямую и > 0. 3°. и = д/соз(ж2 + у2). Областью задания этой функции явля- является множество {М} точек, координаты которых удовлетворя- удовлетворяют неравенству cos (ж2 + у2) ^ 0. Это неравенство эквивалентно неравенствам 0 ^ ж + у к = 1,2,... Таким об- образом, {М} состоит из круга радиуса \/тг/2 с центром в точке 0@,0) и кольцеобразных обла- областей (рис. 14.1). 4°. и = \nxyz. Обла- Областью задания этой функ™ ции является множество {М} точек, координаты которых удовлетворяют неравенству xyz > 0, а множеством значений — вся числовая прямая ^оо < и < +оо. 5°. и = ж2 + у2 + z2. Областью задания этой функции является все ев- евклидово пространство, а рис. 14.1 множеством значений — полупрямая и ^ 0. 4. Понятим m-мерного координатного пространства и m-мерного евклидова пространства. Множество всевоз- всевозможных упорядоченных совокупностей (жх, Ж2,... , хт) т чисел
§ 1 ПОНЯТИЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 479 х\1Х21 • • • , %т называется т-м е р н ы м координатным пространством Ат. При этом каждую упорядоченную совокупность (жх, Ж2, ... ... , хт) мы будем называть точкой этого пространства и обозначать одной буквой М. Числа #i,#2,... 5жш называют- называются координатами точки М. Запись M(xi,X2, • • • ,%) означает, что точка М имеет координаты #i,#2, • • • ?жт- Введем понятие т~мерного евклидова пространства. Координатное простран- пространство Ат называется т-м е р н ы м евклидовым пространством Ет1 если между любыми двумя точка- точками М\х\,х*2-> • • • , х'т) и М"{х'{, #2? • • • •> хт) координатного про- пространства Ат определено расстояние1) p(M\Mff) no формуле Р(М', М") = у/{х'{ - Х[Г + D " 4J +...+«" Х'тJ- A4Л) Введенные нами понятия т™мерного координатного простран™ ства Ат и m-мерного евклидова пространства Ет представля- ) Евклидово т^мерное пространство представляет собой так пазы™ ваемое метрическое пространство. Произвольное множество {М}, эле- элементы которого именуются точками, называется метрическим простран- пространством, если существует правило, с помощью которого любым двум точкам М и М множества {-М"} ставится в соответствие некоторое число р(М , М ), называемое расстоянием между этими точками. При этом ука- указанное правило должно быть таким, чтобы выполнялись следующие ак- аксиомы (аксиомы метрического пространства): 1) для любых М' и М" p(Mf,Mff) = p(Mff,Mf) (симметрия расстояния); 2) для любых М' и М" р(М\М1) ^ 0, причем, если p(Mf,Mff) = 0, то точки М1 и МП совпа- совпадают; 3) для любых трех точек М\ М" и М'" выполняется неравенство р(М;, М!") ^ р(М\ М'!) + p(Mff, М"!) (неравенство треугольника). Убедимся, что введенное нами евклидово m-мерное пространство дей- действительно является метрическим пространством. В самом деле, справед- справедливость первых двух аксиом метрического пространства очевидна (см. фор- формулу A4.1)). Убедимся в справедливости третьей аксиомы. Пусть ж-, х", х'11 - координаты точек М;, М\ М1"'. Имеем р2(М'', МП1) = ' - х") + W - х'г)]2 = EW; - О2 + 2 Ё«; - х'Ш - х\) + т + Yl (xi ~ х'гJ• Полагая х'1' — х" = а% и х'1 — х\ = Ь% и используя неравенство г = 1 Буняковского (см. неравенство A0.30) в Дополнении 1 к гл. 10), найдем, т I m 1т что Y,{xT-хЧКхТ-х\) ^ jEW-<JjE«-*iJ- Отсюда следует, 1 У 1 У 1 чтоР2(М',М'") < I WE«' "О2 + ^Е« "^J ) , т. е. 2
480 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 ют собой обобщения указанных выше понятий координатного пространства и евклидова пространства. 5. Множества точек m-мерного евклидова простран- пространства Е171. Символом {М} мы будем обозначать некоторое мно- множество точек m-мерного евклидова пространства Ет. Рассмо- Рассмотрим несколько примеров множеств в m-мерном евклидовом пространстве Ет. 1°. Множество {М} всевозможных точек, координаты жх,Ж2, • • • , жт которых удовлетворяют неравенству (х\ — ж?J + + (ж2^^2J + .. . + {хт — х®тJ ^ i?2, называется га-мерным шаром радиуса R с центром в точке Mq(x(A х%, • • • , х%). Таким образом, га-мерный шар определяется как множество {М} всевозможных точек М, расстояние р от каждой из которых до некоторой точ- точки Mq (центр шара) удовлетворяет неравенству р{М1М®) ^ R. Если расстояние р(М, Mq) от каждой точки множества {М} до точки Mq удовлетворяет строгому неравенству p(M^Mq) < I?, то множество {М} называется открытым т~мерным шаром. 2°. Множество {М} точек, расстояние от каждой из ко™ торых до некоторой точки Mq удовлетворяет соотношению р(М, М®) = R, называется т-мерной сферой радиуса R с цен- центром в точке Mq. 3°. Множество {М} точек, координаты х\,Х2т-- ,хт кото- которых удовлетворяют неравенствам \х\ — ж^| ^ di, \х2 — х%\ ^ <^25 • • • ... , \хт — ж^| ^ dmj называется т-мерным координатным па- параллелепипедом. При этом точка Mq(x\, х^,... , ж^) называет- называется центром этого m-мерного параллелепипеда. Если координа- координаты Ж]_, Х2ч • • • , %т точек множества {М} удовлетворяют строгим неравенствам |жх—ж?| < di, |ж2~^| < d2, ..., |жш^ж^| < dm, то множество {М} называется открытым т-мерным координат- координатным параллелепипедом. Введем понятия е-окрестности точки Mq евклидова m-мерного пространства и прямоугольной окрестности этой точки Mq. Будем называть е-о крестностью т о ч- к и Mo(#i5#25 • • • 7жш) ^-мерного евклидова пространства Ет открытый т-мерный шар радиуса е с центром в точке Mq. Прямоугольной окрестностью точки Mq(x\1x^... ,ж^) т-мерного евклидова пространства называ- называется любой открытый т~мерный координатный параллелепи- параллелепипед с центром в точке Mq. Справедливо следующее очевидное утверждение. Любая е~окрестность точки Mq евклидова т~мерного про- странства Ет содержит некоторую прямоугольную окрест- окрестность этой точки. Любая прямоугольная окрестность точ- точки Mq содержит некоторую е-окрестность точки Mq.
§ 1 ПОНЯТИЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 481 Пусть {М} — некоторое множество точек евклидова т~мерного пространства Ет. Введем следующие понятия. Точка М множества {М} называется в н у т р е н- ней точкой этого множества, если существует некото- некоторая е-окрестность точки Ж, все точки которой принадлежат множеству {М}. Точка Ж1) называется граничной точкой множе- множества {М}, если любая е-окрестность этой точки содержит как точки, принадлежащие множеству {М}, так и не при- принадлежащие ему. Множество {М} пространства Ет называется откры- открытым множеством или область ю, если любая точка этого множества внутренняя. Если каждая граничная точка множества {М} является точкой этого множества, то множество {М} называется замкнутым. Если множество {М} представляет собой область, то множе™ ство {М}, полученное присоединением к {М} всех граничных точек этого множества, называется замкнутой областью. Отметим, что если все точки области {М} находятся внутри некоторого шара, то эта область называется ограничен- ограниченной. В дальнейшем нам понадобится понятие связного множе- множества. Предварительно мы введем понятие непрерывной кривой в многомерном пространстве Ет. Непрерывной кривой L в пространстве Ет мы будем назы- называть множество {М} точек этого пространства, координаты х\,Х2-> - - - , %т которых представляют собой непрерывные функ- функции параметра t: xi = ipi(t), x2 = (p2(t),... ,xm = <pm(t), a^t^f3. A4.2) Мы будем говорить, что точки М'^х'^х^, • • • jXfm) и Mff(xf{,xf2j... , #^J пространства Ет можно соединить непре- непрерывной кривой L, если существует такая непрерывная кривая L, определяемая параметрическими уравнениями A4.2), что ), ..., x'm = ipm{a), Сформулируем понятие связного множества. Множество {} пространства Ет называется связным, если две любые ) Отметим, что при этом точка М может не принадлежать множе- множеству {М}. 16 В.А. Ильин, Э.Г. Позняк, часть I
482 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 его точки можно соединить непрерывной Kpueouj все точки которой принадлежат этому множеству. Замечание. Отметим, что иногда областью называют открытое и связное, а не просто открытое множество. Рассмотрим следующий пример. Множество {М} точек ?Jm, определяемое уравнением 2 2 2 *^1 i *^2 [ | ^т 1 /1/1 О\ называется т~мерным эллипсоидом. Точки т~мерного эллипсо- эллипсоида являются граничными точками множества {М} точек М, координаты которых удовлетворяют неравенству х\ х\ х2т 2 ' 2 ' • • • ' 2 Это множество является множеством внутренних точек т- мерного эллипсоида. Читатель легко убедится сам, что множество внутренних то- точек т™мерного эллипсоида является открытым и связным мно™ жеством. Отметим, что m-мерный эллипсоид, определяемый со- соотношением A4.3), представляет собой замкнутое множество. Область задания функции и = у cos (ж2 + у2) представляет собой несвязное множество (см. пример 3° п. 3 и рис. 14.1). В заключение договоримся называть окрестностью точки М любое открытое связное множество, содержащее М. 6. Понятие функции иг-переменных. Введем понятие функции т переменных. Если каждой точке М из множества {М} точек т- мерного евклидова пространства Ет ставится в соответ- соответствие по известному закону некоторое число и, то гово- говорят, что на множестве {М} задана функция и = и(М) или и = f(M). При этом, множество {М} называется областью за- задания функции и = f(M). Число и, соответствующее данной точке М из множества {М}, будем называть частным значением функции в точке М. Совокупность {и} всех частных значений функции и = f(M) называется множеством значений этой функции. Так как точ- точка М определяется координатами х\,Х2т-- 5жте, то для функ- функции и = f(M) m переменных используется также обозначение и = /(ж1,ж2,... ,жш). Рассмотрим примеры функций т переменных. 1°. Пусть и = \J\ — х\— х^ — ... — х^. Областью задания этой функции служит, очевидно, т~мерный шар радиуса 1 с
§ 2 ПРЕДЕЛЬНОЕ ЗНАЧЕНИЕ ФУНКЦИИ 483 центром в точке 0@,0,... ,0). Множеством значений рассма™ триваемой функции является сегмент [0,1]. 2°. Пусть и = — . Областью задания 2 2 2 1 _ HLL _ ^JL _ _ Хт а1 а2 ат функции является множество {М} внутренних точек т-мерного эллипсоида. Множеством значений этой функции является по- полупрямая и ^ 1. § 2. Предельное значение функции нескольких переменных 1. Сходмщиесм последовательности точек в т-мерном евклидовом пространстве Ет. Критерий Коши сходимо- сходимости последовательности. Рассмотрим в m-мерном евклидо™ вом пространстве Ет последовательность точек {М}1). Сфор- Сформулируем следующее определение. Последовательность {М} точек евклидова пространст- пространства Ет называется сходящейся^ если существует такая точка А, что для любого положительного числа е можно ука- указать номер N2) такой^ что при п ^ N выполняется неравен- неравенство p(MnjA) < e. При этом точка А называется преде- лом последовательности {Мп}. Для обозначения предела А последовательности {Мп} используется следующая символика: lim Мп = Д или Мп —)> А при п —> оо. Докажем следующую лемму. Лемма 1. Пусть последовательность {Мп} точек евкли- евклидова пространства Ет сходится к точке А. Тогда последова- Г {п)\ Г {п)\ Г (пI л ъ/г тельности < х\ J > , < х\ \ , ... , \ Хт \ координат точек Мп сходятся к соответствующим координатам aj_, 02,... , ат точки А, и наоборот^ если последовательности I х^1 > , ) Понятие последовательности точек в евклидовом пространстве Ет определяется следующим образом. Пусть каждому числу п натурально- натурального ряда чисел 1,2,... , п,... ставится в соответствие точка Мп евклидова пространства Ет. Возникающий при этом ряд точек Mi, M2,... , Мп,..., рассматриваемый в указанном порядке, называется последовательностью точек евклидова пространства Ет. Мы будем кратко обозначать эту после- последовательность символом {Мп~}. ) Так как номер N зависит, вообще говоря, от ?, то иногда пишут N = N(e). 16*
484 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 < Жг» >, • • • , I Хт ( координат точек Мп сходятся соответ- соответственно к числам ai, а2,... , аш, шо последовательность {Мп} сходится к точке А с координатами ai, а2,... , аш. Доказательство. Докажем первую часть леммы. Ес- Если последовательность {Мп} сходится к точке А, то для любого е > 0 можно указать номер N такой, что при п ^ N выполняется ^ , х^1 неравенство р(Мп^ А) < е. Пусть f х^ , х^1 ,... , ж^ 1 — коорди- координаты точки МП1 а (ai, a2,... , аш) — координаты точки А. Тогда неравенство p(MnjA) < e можно записать следующим образом: № » 0,2 (п) хт ат < е. A4.4) Отсюда следует, что при п ^ N выполняются неравенства ж; — жл — < е. Иными словами, последовательности aj; , ^ ,..., Xm \ координат точек Мп сходятся соответственно к числам ai,a2,... , am. Докажем теперь обратное утверждение. Предпо™ ломким, что указанные последовательности координат точек Мп сходятся соответственно к числам ai, a2,... , ат- Тогда для лю- любого е > 0 можно указать номера N\, N2,... , Л^т такие, что при п ^ iVi, п ^ iV, ... , n ^ Жш соответственно выполняются нера- неравенства (п) — О>2 (п) _ ? л/т' Отсюда следует, что при п ^ N = max{7Vi, Ж2,... , Nm} выпол- выполняется неравенство A4.4). Иными словами, при п ^ N выпол- выполняется неравенство p(MnjA) < б, где А — точка Ет с коорди- координатами ai, с&2,... , «та- Таким образом, последовательность {Мп} сходится к точке А. Лемма доказана. Сформулируем определение фундаментальной последова- последовательности точек в m-мерном евклидовом пространстве. Последо- Последовательность {Мп} точек т-мерного евклидова пространства называется фундаментальной или последова- последовательностью Коши^ если для любого положительного числа е можно указать такой номер Ж, что при п ^ N и для любо- любого натурального р выполняется неравенство p{Mn+piMn) < e. Справедлив следующий критерий сходимости последовательно™ сти (критерий Коши).
§ 2 ПРЕДЕЛЬНОЕ ЗНАЧЕНИЕ ФУНКЦИИ 485 Для того чтобы последовательность {Мп} точек т-мерного евклидова пространства была сходящейся, необходимо и доста- достаточно, чтобы она была фундаментальной. Чтобы убедиться в справедливости сформулированного критерия, достаточно за™ метить, что из условия фундаментальности последовательно™ сти {Мп} следует, что последовательности |ж|^ >, \х2 k ... ... , < Хт \ координат точек Мп также фундаментальны, и на- наоборот, если указанные последовательности координат фунда™ ментальны, то фундаментальной будет и последовательность {Мп}, и затем применить критерий Коши для числовых после™ довательностей к последовательностям координат точек {Мп} и лемму 1 этого пункта. 2. Некоторые свойства ограниченных последователь- последовательностей точек в m-мерном евклидовом пространстве. Введем понятие ограниченной последовательности точек в га- мерном евклидовом пространстве. Последовательность {Мп} точек т-мерного евклидова пространства называется огра- ограниченной, если существует такое число а > 0, что для всех п выполняется неравенство р(О^Мп) ^ а, где О - точка, все координаты которой равны нулю. Иными словами, последо- последовательность {Мп} является ограниченной, если все точки {Мп} этой последовательности находятся внутри или на границе неко- некоторого шара с центром в начале координат. Справедлива следующая основная теорема. Теорема 1^.1 (теорема Болъцано-Вейерштрасса). Из любой ограниченной последовательности {Мп} точек т~ мерного евклидова пространства можно выделить сходящуюся подпоследовательность. Доказательство. Убедимся, во-первых, ( (п)\ Г 0I Г (п)\ что последовательности < х\ J >, < хх2 f, • • • , 1 хкт; > коорди- координат точек Мп являются ограниченными. Действительно, так как последовательность {Мп} ограничена, то для всех п вы- выполняется неравенство р@^Мп) ^ а. Поскольку р@^Мп) = / ОJ . ОJ . '. {nf = Vх\ ~^~ Х2 +•••+ Хт 1 то отсюда следует, что для всех п выполняются неравенства О) 1 а, ГО) €2 » а. Иными словами, последовательности < х\ ' >, < ху2 у >,..., < Хт \ координат точек Мп ограничены. В силу теоремы Больцано^ Вейерштрасса для числовых последовательностей (см. п. 4 § 4 оч Г (п)\ гл. 6) из последовательности < х\ > можно выделить последова-
486 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 тельность < хг г >, сходящуюся к некоторому числу а\. Рассмо- трим соответствующую подпоследовательность ч ж2 f после- последовательности вторых координат точек {Мп}. В силу той же теоремы из подпоследовательности < х2 1 > можно выделить подпоследовательность lx2 f, сходящуюся к некоторому чис- лу «2- Заметим, что подпоследовательность i%\ г последо- вательности < х1 г > сходится к числу а\. Итак, подпоследова- Г (пк2)\ Г К2)\ тельности < ж1 ? и < ж2 f сходятся к числам ai и О2 со- соответственно. Очевидно, что если мы из подпоследовательности < х3 z > последовательности третьих координат точек Мп выде- выделим сходящуюся к некоторому числу аз подпоследовательность < ж3 Ь то подпоследовательности < ж1 d h ix2 h \хз ( сходятся соответственно к числам ai, a2, аз- Продолж:ая эти рас- су ведения, мы, наконец, получим сходящуюся к некоторому чис- числу ат подпоследовательность < Хтт \ последовательности т-х координат точек Mnj причем подпоследовательности < х^171 >, < Х2кт к • • •, 1 хткт > сходятся к числам ai, a2,... , am соот- соответственно. Но тогда, в силу леммы 1, подпоследовательность {МПк } последовательности точек {Мп} сходится к точке А с координатами ai, с&2,... , сьт. Теорема доказана. Замечание. Предел А последовательности {Мп} точек, принадлежащих замкнутому множеству {М}, такж:е принадле- жит этому множеству. Чтобы убедиться в этом, достаточно за- заметить, что в любой б-окрестности точки А имеются точки Мп, т. е. точки множества {М}, и поэтому точка А является либо внутренней, либо граничной точкой {М}, а следовательно, при- принадлежит {М}. 3. Понмтие предельного значения функцми несколь- нескольких переменных. Рассмотрим функцию и = /(М), опреде- определенную на множестве {М} гл-мерного евклидова пространства, и точку А этого множества, быть может, и не принадлежащую множеству {Д/f}, но обладающую тем свойством, что в любой е-окрестности этой точки содержится хотя бы одна точка мно- множества {М}, отличная от А. Определение 1. Число Ъ называется предель- предельным значением функции и = f(M) в
§ 2 ПРЕДЕЛЬНОЕ ЗНАЧЕНИЕ ФУНКЦИИ 487 точке А (или пределом функции при М —> А), если для любой сходящейся к А последовательности Mi, M2,... , Mn,... точек множества {М}, элементы Мп ко- которой отличны от А1) (Мп ф А), соответствующая после- последовательность /(Mi), /(M2)? • • • 5 f(^n)j • • • значений функции сходится к Ъ. Приведенное определение называется определением предель- предельного значения функции с помощью последовательностей. Сфор- Сформулируем другое определение предельного значения функции, используя «б-E»™терминологию. Определение 2. Число b называется предельным значением функции и = /(М) в точке А, если для любого положитель- положительного числа е можно указать такое положительное число 8, что для всех точек М из области задания функции, удовле- удовлетворяющих условию 0 < р(М, А) < E, выполняется неравен- неравенство \f(M) —b\ < е. Замечание. Определения 1 и 2 предельного значения функции эквивалентны. Справедливость этого утверждения мо- жет быть доказана точно так же, как и эквивалентность двух определений предельного значения функции одной переменной. Для обозначения предельного значения Ь функции и = /(М) в точке А используется следующая символика: lim /(М) = Ь, или lim /(#i, #2, • • • •> хт) = ^ где ai, с&2,... , ат — координаты точки А. Сформулируем определение предельного значения функции при стремлении точки М к бесконечности. Определение 3. Число Ь называется предельным значением функции и = f(M) при М —>> оо (или пределом функции при М —>> оо), если для любого по- положительного числа е можно указать такое положительное число а, что для всех М из области задания функции, удовле- удовлетворяющих условию р(О, М) > а, выполняется неравенство \f(M)-b\<e. Арифметические операции над функциями т переменных, имеющими предельное значение в точке А, приводят к функ- функциям, также имеющим предельное значение в точке А. Именно, справедливо следующее утверждение. Пусть функции f(M) и g(M) имеют в точке А предельные значения Ьис. Тогда функции f(M) + g(M), f(M) —g(M), f(M)- ) Это требование объясняется, в частности, тем, что функция и = f(M) может быть не определена в точке А.
488 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 •g(M) и ,м\ имеют в точке А предельные значения (частное при условии с ф 0), равные соответственно Ъ + с, Ъ — с, Ъ • с, -. Доказательство этого утверждения совершенно аналогично доказательству теоремы 4.1. 4. Бесконечно малые функции. Функция и = f(M) на- называется бесконечно малой в точке А (при М —>• А), если lim ДМ) = 0. Легко убедиться, что функция f(M) = (х\ — a\)ni + ... ... + (хт ~~ ат)Пт, где ni,... , пт — положительные числа, яв- является бесконечно малой в точке A(ai, 02,... , ат) 1). Если функция и = f(M) имеет равное b предельное значение в точке А^ то функция а(М) = f(M) — Ъ является бесконечно малой в точке А. Действительно, lim а(М) = lim (f(M) — м^А м^А — b)= lim f(M)— lim 5 = 0. Используя этот результат, мы по™ М^А М^А лучим специальное представление для функции, имеющей рав- равное Ь предельное значение в точке А: f(M) = Ъ + а(М), где lim а(М) = 0. М^А Сравнение бесконечно малых функций нескольких переменных производится точно так же, как это указано в п. 3 § 2 гл. 4 для бесконечно малых функций одной переменной. Отметим, что, как и в случае одной переменной, под символом о(/3) мы будем понимать любую бесконечно малую в данной точке А функцию более высокого порядка малости, чем бесконечно малая в данной точке А функция /3(М). 5. Необходимое и достаточное условие существования предельного значения функции (критерий Коши). Будем говорить, что функция f(M) удовлетворяет в точке М = А условию Коши, если для любого положительного числа е пай™ дется положительное число 6 такое, что, каковы бы ни были две точки М1 и М11 из области задания функции /(Ж), удовлетво- удовлетворяющие неравенствам 0 < р(М'^А) < E, 0 < р(МА) < E, для соответствующих значений функций справедливо неравенство Справедлива следующая основная теорема Теорема 14-2 (критерий Коши). Для того чтобы функ- функция f(M) имела конечное предельное значение в точке М = А, ) Достаточно учесть, что каждая из функций одной переменной f{xk) = = (xk — ®к)Пк является бесконечно малой в точке Хк = а&.
§ 2 ПРЕДЕЛЬНОЕ ЗНАЧЕНИЕ ФУНКЦИИ 489 необходимо и достаточно, чтобы функция f(M) удовлетворя- удовлетворяла в этой точке условию Коши. Доказательство этой теоремы совершенно аналогично доказательству теоремы 8.2 и получает- получается из него путем замены букв ж и а на буквы М и А и замены выражений типа \х ~~ а\ на символ р(М^А). 6. Повторные предельные значения. Для функции и = = /(жх, Ж2,... , хт) нескольких переменных можно определить понятие пре- предельного значения по одной из переменных Хк при фиксированных значе- значениях остальных переменных. В связи с этим возникает понятие повторного предельного значения. Уясним это понятие на примере функции и = f(x,y) двух переменных ж и у. Пусть функция и = f(x,y) задана в некоторой пря- прямоугольной окрестности |ж — жо| < di, \у — уо\ < с?2 точки Мо(жо,|/о), за исключением, быть может, самой точки Mq. Пусть для каждого фиксиро- фиксированного г/, удовлетворяющего условию 0 < \у — уо\ < с?25 существует пре- предельное значение функции и = f(x,y) одной переменной х в точке х = xq: lim f(x,y) и пусть, кроме того, существует предельное значение b функции <р(у) в точке у = у о: lim (р(у) = Ь. У^УО В этом случае говорят, что существует повторное предельное значение Ь для функции и = /(ж, 2/) в точке Мо, которое обозначается следующим образом: lim lim /(ж, у) = Ь. у-^УО x-^xq Аналогично определяется повторное предельное значение lim lim f(x,y). х^х0 y^yo Установим достаточные условия равенства двух введенных повторных предельных значений. Теорежа Ц.З. Пусть функция и = f(x,y) определена в некоторой прямоугольной окрестности |ж — жо| < di, \у — уо\ < с?2 точки Мо(жо,|/о) и имеет в этой точке предельное значение Ь. Пусть, кроме того, для лю- любого фиксированного ж, 0 < |ж — жо| < di, существует предельное значение ф{х) = lim f(x,y) и для любого фиксированного у, 0 < \у — уо\ < cfe, суще- у-^уо ствует предельное значение <р(у) = lim /(ж, г/). Тогда повторные предель- ж->ж0 ные значения lim lim f{x,y) и lim lim f{x,y) существуют и равны Ь. ж->ж0 У~~>УО У~~>УО х->х0 Доказательство. Так как функция и = /(ж, у) имеет в Мо(жо, г/о) предельное значение 6, то для любого е > 0 можно указать такое S > 0, что при |ж — жо| < ё ш \у — уо\ < S выполняется неравенство \f(x,y) — b\<s. Та- Таким образом, в прямоугольной окрестности \х — хо < S ж \у — уо <<5> точки Mq значения функции f(x,y) отличаются от Ь не больше чем на е. Но тогда предельные значения ф(х) и (р(х), указанные в формулировке теоремы при ж и |/, удовлетворяющих неравенствам |ж — жо| < S к \у — уо\ < Sj также отличаются от Ь не больше чем на е. Следовательно, и предельные значе- значения этих функций в точках жо и г/о соответственно существуют и равны Ь. Теорема доказана.
490 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Можно определить понятие повторного предела для так называемых двойных последовательностей {атп}, элементы атп которых определяют- определяются двумя индексами т и п. Именно, символ lim lim amn означает, что п—>оо т—>оо сначала определяется последовательность {Ьп}, Ьп = lim amn, а затем на- т^оо ходится предел этой последовательности {Ьп}. Рассмотрим, например, двойную последовательность {amn}, где атп = = cosm 2тгп\х, х- фиксированное число. Докажем, что т .1, если х — рациональное число, lim lim cos 2тгп\х = п—>оо гп— 0, если х — иррациональное число. В самом деле, если х = p/q, где р и q — целые числа, то при п ^ q имеем cos 2тгп\х = 1, и поэтому lim cosm 2тгп\х = 1. Иными словами, если х — m-->OG рациональное число, то lim lim cosm 2ттп\х = 1. Если же х — иррацио™ ¦>оо т-->оо нальное число, то при любом п справедливо неравенство | cos27rn!x| < 1, и поэтому lim cosm 2mi\x = 0, т. е. lim lim cosm 2mi\x = 0. n—->схэ m—>oo Замечание. Используя полученный результат, мы можем аналити- аналитическим способом задать функцию Дирихле (см. п. 1 § 1 гл. 4) как повторный предел lim lim cosm 2тг?г!ж. >оо гп—Хуэ § 3. Непрерывные функции нескольких переменных 1. Определение непрерывности функции несколь- нескольких переменных. Пусть точка А принадлежит области за- задания функции и = f(M) нескольких переменных и любая е- окрестность точки А содержит отличные от А точки области задания этой функции. Определение 1. Функция и = f(M) называется непре- непрерывной в точке А, если предельное значение этой функции в точке А существует и равно частному значению f(A). Отметим, что так как А = Mm M, то условие непрерыв™ ности функции можно записать в следующей форме: lim /(M) = /( lim м). Точки, в которых функция не обладает свойством непрерывно™ сти, называются точками разрыва этой функции. Сформулируем определение непрерывности функции, ис- используя определение предельного значения функции с помощью е и 5. Определение 2. Функция и = f(M) называется непрерыв- непрерывной в точке А^ если для любого положительного числа е моэю- но указать такое положительное число 5^ что для всех то-
§ 3 НЕПРЕРЫВНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 491 чек М из области задания функции, удовлетворяющих условию p(MJA) < Sj выполняется неравенство |/(М) — f(A)\ < e. Определение 3. Функция и = f(M) называется непре- непрерывной на множестве {М}, если она непрерывна в каждой точке этого множества. Назовем приращением или полным приращением функции и = f(M) в точке А функцию Аи, определяемую формулой Аи = f(M) - /(A), A4.5) где М — любая точка из области задания функции. Пусть точ- точки А и М имеют соответственно координаты ai,a2,... , flm и Ж1,Ж2,... чхт- Обозначим Х\—а\ = Ах\, Х2^О>2 — Ах2ч ... ..., хт — ат = Ахт. Используя эти обозначения, получим для приращения функции Аи, соответствующего приращениям ар- аргументов Ах\,... , Ажш, следующее выражение: Аи = f(ai + Ахъ а2 + Ах2,... , ат + Ажт) - /(ai, a2,... , аш). A4.6) Очевидно, <9лл непрерывности функции и = f(M) в точке А необходимо и достаточно^ чтобы ее приращение Аи предста- представляло собой бесконечно малую в точке А функцию, т. е. необхо- необходимо и достаточно, чтобы Mm Au= Mm (ДМ) -/(А)) =0или Mm Au = O. A4.7) Условие A4.7) мы будем называть разностной формой условия непрерывности функции и = f(M) в точке А. Для функции и = /(жх,Ж2,... ,жт) нескольких перемен™ ных мож:но определить понятие непрерывности по одной из пе- переменных при фиксированных значениях остальных перемен- переменных. Для определения этого понятия рассмотрим так называ™ емые частные приращения функции и = /(жх,Ж2,... ,жш) в точке М(х\, #2, • • • 5жшM принадлежащей области определения функции. Зафиксируем все аргументы, кроме первого, а пер- первому аргументу придадим произвольное приращение Ах\ та- такое, чтобы точка с координатами х\ + Джх,Ж2,... ,хт находи- находилась в области задания функции. Соответствующее приращение
492 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 функции называется частным приращением1) функции в точке М{х\,Х2-> • • • ? xm)i соответствующим приращению Ах\ аргумен- аргумента х\ и обозначается АХ1и. Таким образом, АХ1и = f(xi + Ахъх2,... ,хт) - f(xux2,... ,хт). A4.8) Аналогично определяются частные приращения функции, соот™ ветствующие приращениям других аргументов: АХ2и = f(xbx2 + Аж2, ж3,... , хт) ~~ f(xi,x2,... , жш), ________ ........... A4.9) Введем теперь понятие непрерывности функции и = /(#i, ж2, • • • ... , жт) по одной из переменных. Функция и = /(жх,ж2,... ,жш) называется непрерывной в точке М(#i, ж2,... ,жш) по переменной ж^, еслк частное при- приращение АХки этой функции в точке М представляет собой бесконечно малую функцию от Аж^, т. е. если lim AXku = 0. A4.10) При фиксированных значениях всех переменных, кроме пере- переменной Хк, функция и = /(ж1,ж2,... ,жш) представляет собой функцию одной этой переменной. Отметим, что непрерывность функции по переменной х^ означает непрерывность указанной функции одной переменной. Очевидно, из условия непрерывно- непрерывности функции и = /(жх,ж2,... ,жт) в данной точке М вытека™ ет непрерывность этой функции в точке М по каждой из пе- переменных жх,ж2,... ,жт. Однако из непрерывности функции в точке М по ка^кдой из переменных Ж1,ж2,... ,жто не вытекает, вообще говоря, непрерывность функции в этой точке. Чтобы убедиться в этом, рассмотрим следующие примеры: 1°. Мы будем говорить, что функция и = f(M) = /(ж, у) непрерывна в точке М на некоторой прямой, проходящей через эту точку, если для любой последовательности точек {Мп} этой прямой, сходящейся к точке М, соответствующая последова- последовательность {f(Mn)} значений функции имеет пределом частное значение f(M) функции в точке М. Так как на прямой функ™ ция и = /(ж, у) представляет собой функцию одной перемен- переменной, то понятие непрерывности функции на прямой совпадает, очевидно, с понятием непрерывности указанной функции одной 1) Термин «частное приращение» употребляется для того, чтобы от- отличить это приращение от полного приращения A4.6), соответствую- соответствующего произвольным приращениям Аж1,Аж2,... , Ажт всех аргументов
§ 3 НЕПРЕРЫВНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 493 переменной. В частности, непрерывность функции в точке М по отдельным переменным х и у представляет собой непрерыв- ность ее на прямых, проходящих через точку М и параллельных координатным осям. Докажем, что функция ' ху 2 I 2 / а а тттлтд" /тг* —J— II —/- 1 I и= < х ^ [ 0 при х2 + у2 = О непрерывна в точке О@, 0) по каждой из переменных ж и у, т. е. непрерывна на каждой из координатных осей, но не является непрерывной на всех остальных прямых, проходящих через эту точку, и поэтому не является непрерывной в точке О. Каждая прямая, отличная от координатных осей и проходящая через точку 0@,0), может быть представлена уравнением у = кх, где к Ф 0. Очевидно, на такой прямой все значения функции посто- постоянны и равны . Поэтому, если последовательность {Мп} 1 тл отличных от О точек такой прямой сходится к точке О, то соот- ветствующая последовательность значений функции имеет пре- к дел —. Так как при к Ф 0 этот предел отличен от нуля и не I Н~ л совпадает с частным значением функции в точке О, то функция разрывна в этой точке на рассматриваемой прямой. Непрерыв- Непрерывность функции на координатных осях вытекает из того, что ее значения на этих осях равны нулю. Может сложиться впечатление, что если функция двух пере™ менных непрерывна на любой прямой, проходящей через дан- данную точку, то эта функция непрерывна в указанной точке. Сле- Следующий пример показывает, что это, вообще говоря, не так. 2°. Рассмотрим функцию 2 Х У при ж4 + у2 ф О, 2 u = f(M)=( ж4+ 2/ [ 0 при ж4 + у2 = 0. Докажем, что, хотя указанная функция непрерывна на любой прямой, про- проходящей через точку О@, 0), она не является непрерывной в этой точке. В кх самом деле, значения функции на прямой у = кх равны — —, и поэтому Ж "т" ft при ж —>- 0 и —>- 0. Непрерывность этой функции на оси Оу вытекает из того, что ее значения на этой оси равны нулю. С другой стороны, значения функции на параболе у = рх2 постоянны и равны -, и поэтому пре- предельное значение функции при стремлении точки М к точке О по указанной параболе также равно -. Так как при р ф 0 этот предел отличен от 1 +р2 нуля и не совпадает с частным значением функции в точке О, то функция разрывна в этой точке.
494 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 2. Основные свойства непрерывных функций нес- нескольких переменных. В этом пункте мы перечислим основ- основные свойства непрерывных функций нескольких переменных. Поскольку доказательства этих свойств в основном аналогия™ ны доказательствам соответствующих свойств функций одной переменной, то, как правило, мы будем давать лишь краткие пояснения, предоставляя детали доказательств читателю. 1°. Арифметические операции над не- непрерывными функциями. Справедливо следующее утверждение. Пусть функции f(M) и g(M) непрерывны в точке А. Тогда функции f(M)+g(M), /(M)-g(M), f(M)-g(M) и Днепре- рывны в точке А (частное при условии g(A) ф 0). Доказатель- Доказательство этого утверждения совершенно аналогично доказательству теоремы 4.2. 2°. Непрерывность сложной функции. Вве- Введем понятие сложной функции нескольких переменных. Пусть функции Х2 = заданы на множестве {N} евклидова пространства Е (^1,^2,... ,tk — координаты точек в этом пространстве). Тогда каждой точке N(ti,t2, • • • , ?fc) из множества {N} ставится в со- соответствие с помощью формул A4.11) точка М(жх,Ж2,... ,жш) евклидова пространства Ет. Обозначим через {М} множе- множество всех таких точек. Пусть и = /(жх,Ж2,... ,жт) — функ™ ция w-переменных, заданная на указанном множестве {М}. В этом случае мы будем говорить, что на множестве {N} ев- евклидова пространства Е определена сложная функция и = = /(жх, Х2ч • • • , хт), где жх, Х2ч • • • , %т являются функциями пе- переменных ti, ?2, • • • itk, причем эти функции определяются соот- соотношениями A4.11). Справедливо следующее утверждение. Пусть xi = <рх(*ъ*2,... ,*&), ^2 = <Ы*ъ*2,... ,*fc)> ••• ••• , %т = Vmituh,--- jtk) непрерывны в точке А(аъа2,.. .,а^), а функция и = f(x\,X2, • • • , жш) непрерывна в точке В{Ъ\, b2l... ...,ЬШ), гс?е Ь^ = ^(аьа2,... ,а/ь), г = 1, 2, ..., т. Тог- ^а сложная функция и = /(жх5#25--- 5жтM г(^е жх,Ж2,... ,жт представляют собой определенные выше функции аргумен- аргументов ?х,#2,... '^' непРеРывна в точке А(ах,а2,... ,«/с). Наме™
§ 3 НЕПРЕРЫВНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 495 тим основные этапы доказательства этого утверждения. Пусть {Nn}, Nn ф А, — произвольная сходящаяся к А последователь- последовательность точек из области {N} задания функций ^(^15^25--- ??fc)> а {Мп} — соответствующая последовательность точек, коорди- (п) /Лп) Лп) Лп)\ "о наты х\ которых равны (pi(t\ ^ц ^ - - ^Ц ;). В силу непрерыв™ ности функций ifi в точке А, последовательность {Мп} сходится к точке B(bi, &25 • • • ^ Ьт) (не исключена возможность совпадения точек Мп с точкой В). В силу непрерывности в точке В функ- функции и = /(жь #2, • • • •> xm)j последовательность {f(Mn)} сходится к f(B). Но эта последовательность представляет собой после™ довательность значений сложной функции, отвечающую сходя- сходящейся к А последовательности {Nn} точек области ее задания. Так как мы убедились, что последовательность {f(Mn)} схо- дится к частному значению /(-В), то тем самым непрерывность сложной функции доказана. Замечание. Приведенное здесь доказательство представ™ ляет собой обобщение на случай нескольких переменных доказа- доказательства теоремы 4.5 о непрерывности сложной функции одной переменной. 3°. Теорема об устойчивости знака непрерывной функции. Теорема 14-4- Если функция и = f(M) непрерывна в точ- ке А евклидова пространства Ет и если f(A) ф 0, wo суще- существует такая 8-окрестность точки А^ в пределах которой во всех точках области своего задания f(M) не обращается в нуль и имеет знак^ совпадающий со знаком f(M). Справедливость этой теоремы непосредственно вытекает из определения непре™ рывности функции в терминах «е — 6». 4°. Теорема о прохождении непрерывной функции через любое промежуточное значение. Теорема 14-5. Пусть функция и = f(M) непрерывна во всех точках связного множества {М} евклидова простран- пространства Ет, причем f(A) и f(B) — значения этой функции в точ- точках А и В этого множества. Пусть, далее, С — любое число, заключенное между f(A) и f(B). Тогда на любой непрерывной кривой L, соединяющей точки А и В и целиком располагающей- ся в {М}, найдется точка N такая, что f(N) = С. Доказательство. Пусть — уравнения непрерывной кривой L, соединяющей точки А и В множества {М} и целиком располагающейся в {М} (см. п. 5 § 1). На сегменте [а, /3] определена сложная функция и = f{x\, Х2, • • • ••• iXm), где xi = (pi(t), i = 1,2,... ,m, a ^ t ^ /3. Очевидно,
496 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 значения этой функции на сегменте [а, /3] совпадают со значе™ ниями функции и = /(М) на кривой L. Указанная сложная функция одной переменной i, в силу утверждения раздела 2° этого пункта, непрерывна на сегменте [а, /3] и, согласно теореме 8.6, в некоторой точке ? сегмента [а,/3] принимает значение С. Поэтому в точке N кривой L с координатами </?i(?), 9^2(С)? ••• ... , (fm(O справедливо равенство f(N) = С. Теорема доказана. 5°. Ограниченность функции, непрерывной на замкнутом ограниченном множестве. Теорема 14-6 (первая теорема Вейерштрасса). Ес- Если функция и = f(M) непрерывна на замкнутом ограничен- ограниченном множестве {М}, то она ограничена на этом множестве. Остановимся на доказательстве ограниченности и = f(M) свер- сверху. Предположим, что u = f(M) не ограничена сверху на {М}. Выделим (как и в доказательстве аналогичной теоремы 8.7) последовательность {Мп} точек множества {М}^ для которых f(Mn) > п. В силу теоремы Больцано^Вейерштрасса (см. п. 2 § 2) из {Мп} можно выделить сходящуюся подпоследователь™ ность {М"^п}, предел М которой, в силу замечания к теореме Больцано^Вейерштрасса, принадлежит множеству {М}. Оче- Очевидно, последовательность {/(М&п)} бесконечно большая. С другой стороны, в силу непрерывности функции в точке Ж, эта последовательность {/(М/Сп)} должна сходиться к f(M). Полу™ ченное противоречие доказывает теорему. 6°. Достижение функцией, непрерывной на замкнутом ограниченном множестве, своих точных граней. Теорема 14-7 (вторая теорема Вейерштрасса). Если функция и = f(M) непрерывна на замкнутом ограниченном множестве {М}, то она достигает на этом множестве своих точных верхней и нижней граней. Доказательство этой теоре- теоремы совершенно аналогично доказательству теоремы 8.8 (вторая теорема Вейерштрасса для функции одной переменной). 7°. Понятие равномерной непрерывности функции нескольких переменных. Функция и = f(M) называется равномерно непрерыв- непрерывной на множестве {М} 1) евклидова пространства Ет, ес- если для любого положительного числа е можно указать такое положительное 5^ зависящее только от е, что для любых двух точек М1 и М" множества {М}^ удовлетворяющих условию p(Mf,Mff) < <5, выполняется неравенство \f(Mff) — f(Mf)\ < e. Имеет место следующая теорема. ) При этом предполагается, что множество {-М"} плотно в себе, т. е. в любой е-окрестыости каждой точки М этого множества имеются отличные от М точки множества {М}.
§ 4 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 497 Теорема 1^-8 (теорема о равномерной непрерывно- непрерывности). Непрерывная на замкнутом ограниченном множестве {М} функция равномерно непрерывна на этом множестве. До- Доказательство этой теоремы совершенно аналогично доказатель™ ству теоремы 10.2 и получается из него путем замены термина «сегмент [а, Ь]» термином «множество {М}», замены буквы х на букву М и замены выражений типа х" — х' на символ ( Замечание. Назовем диаметром ограниченного множества {М} точную верхнюю грань чисел р(М\Мп)^ где М1 и М" — всевозможные точки множества {М}. Исполь- Используя понятие диаметра множества, отметим следующее свойство непрерывных на замкнутых ограниченных множествах функ- функций. Пусть функция и = f(M) непрерывна на замкнутом огра- ограниченном множестве {М}. Тогда для любого положительного числа е можно указать такое 5 > 0, что на каждом принадле- принадлежащем множеству {М} замкнутом подмножестве {М}^ диа- диаметр которого меньше 81 колебание ио1) функции f(M) мень- меньше е. Доказательство этого свойства совершенно аналогично доказательству следствия из теоремы 10.2. § 4. Производные и дифференциалы функции нескольких переменных 1. Частные производные функции нескольких пере- переменных. Пусть точка M(xi,X2,... , жш) является внутренней точкой области задания функции и = /(жь #2, • • • ? хт)- Рассмо- Рассмотрим в данной фиксированной точке M(x\,X2i • • • чхт) отноше- отношение частного приращения АХки (см. п. 1 § 35 формулы A4.8) и A4.9)) к соответствующему приращению Ах^ аргумента х^: Axk A4.12) Отношение A4.12) представляет собой функцию от Аж^, опреде- определенную для всех, отличных от нуля значений Аж^, для которых точка М(х\, #2, • • • ^ xk-ii хк + Аж^, ж&+1,... , хт) принадлежит области задания функции и. Определение, Если существует предел отношения A4.12) частного приращения АХки функции в точке М{х\)Х2-) • • • ,жш) ) Колебанием ш функции f(M) на множестве {-М} называется разность между точной верхней и точной нижней гранями функции f(M) на этом множестве.
498 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 к соответствующему приращению Ах^ аргумента х^ при Axk —>> 0, то этот предел называется частной про- изводной функции и = f{x\1X21... ,хт) в точке М по аргументу х^ и обозначается одним из следующих символов: ди_ df_ , ., Таким образом, p * A4.13) Отметим, что частная производная функции и = /(#i,#2,... • • • ^ хт) п0 аргументу х^ представляет собой обыкновенную про- производную функции одной переменной х^ при фиксированных значениях остальных переменных. Поэтому вычисление част- частных производных производится по обычным правилам вычис- вычисления производных функций одной переменной. Примеры. х ди у ди —х = = Я = 2 , 2- 2 3°. — *} § "У f*C\^l <+ f Of* ^ — QI <y \J20> /л. / ИГ* — Q i У PflQ л. /ИГ* — Q i У 11 /С LUu \J db 11 As Zj \J Лу У/6 LUO \f *Aj 11 /0 Замечание 1. Из существования у функции в данной точке всех частных производных, вообще говоря, не вытекает непрерывность функции в этой точке. Мы уже убедились, что функция [ 0 при х2 + у2 = О не является непрерывной в точке 0@,0) (см. пример 1° п. 1 § 3). Однако в этой точке указанная функция имеет частные производные по х ж у. Это следует из того, что /(ж,0) =0 и /(О, у) = 0, и поэтому д? дх = 0 и Tr- Trio,о) ду @,0) = 0. Замечание 2. Мы определили понятие частных производных для внутренних точек области задания функции.
ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 499 У1 I/O М0(ж0, г/о) Для граничных точек области задания данное нами определение частных производных является, вообще говоря, непригодным. В частности, это связано с тем, что в граничных точках области задания функции не всегда можно вычислить частные приращения этой функции (так, например, обстоит дело с гранич- граничной точкой М® области, изображенной на рис. 14.2). Поэтому обычно част™ ные производные в граничных точках области задания функции определя- определяются как предельные значения этих производных. 2. Понятие дифференцируемо- сти функции нескольких пере- переменных. Напомним, что приращени- приращением (или полным приращением) функции и = f{x\1x2l... ,хт) в точке М(жх,Ж2,... ,жт), соответствующим приращениям Ах\1 О Рис. 14.2 Ах2, Аи = Ахт аргументов, называется выражение Ахъ х2 + Ax2l... , х Ахт) - x2l , х Определение, Функция и = f{x\^x2^... ->xm) называется дифференцируемой в данной точке M{x\1x2l... , жт), еслн ее полное приращение в этой точке может быть пред- представлено в виде Аи = + А2Ах2 + АтАхт •OLr. A4.14) где Ах, ^2,... , Ат — некоторые не зависящие от Ах\^ Ax2l... ... , Ажто числа^ a ai, а2, ... , ат — бесконечно малые при Ах\ —> О, А^2 —>" 0, ... , Ажш —>• 0 функции, равные нулю при Ах\ = Ах2 = ... = Ажто = 0. Соотношение A4.14) назы- называется условием дифференцируемости функции в данной точ- точке М. Условие A4.14) дифференцируемости функции мож:но за- записать так^ке в иной форме. Для этого рассмотрим бесконечно малую при Axi —>> 0, Аж2 —> 0, ..., Ахт —>> 0 функцию р = = \/Ах\ + Аж| + ... + Ах^ 1) и отметим, что эта функция обра- обращается в нуль лишь при Ах\ = Аж2 = ... = Ахт = 0. Убедимся теперь, что входящая в правую часть соотношения A4.14) сум- сумма «1 Ах\ + а2Ах2 + ... + атАхт представляет собой бесконеч- бесконечно малую более высокого порядка функцию по сравнению с р. ) Геометрически эта функция представляет собой расстояние между точ- точками М(Ж1, Ж2, • • • , Хт) И М'\х\ + АЖ1, Ж2 + Аж2, . . . , Хт + Ахт).
500 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Иными словами, убедимся, что эта сумма представляет собой выражение о(р). В самом деле, при р ф 0 справедливо ' Жг' ^ 1, и поэтому \ol\Ax\ + а2Ах2 + ... + атАхт\ < Таким образом, условие A4.14) дифференцируемости функции может быть записано в следующей форме: Аи = AiAxi + А2Ах2 + ... + АтАхт + о(р). A4.15) При этом величину о(р) мы считаем равной нулю при р = 0. Чтобы доказать, что условие A4.15) эквивалентно условию A4.14), нужно убедиться, что из представления A4.15) в свою очередь вытекает представление A4.14). Для этой цели, считая, что не все Джх, Ax2j ... , Ахт равны нулю х), представим о(р) в виде о(р) = ^М^ = °(р) Аж1 + Аж' + • • • + Дд4 = р р р р Полагая —^-—- = а* и учитывая, что а7- является бесконечно Р Р малой при р —>> 0 (а стало быть, и при Ах\ —>> 0, Аж2 -^ 0, ... ... , Ажш —>• 0) функцией, мы придем к представлению A4.14). Итак, условие дифференцируемости функции молено запи- записать как в виде A4.14), так и в виде A4.15). Если хотя бы одно из чисел А\, A2i ... , Ат отлично от ну- нуля, то сумма А\Ах\ + А2Ах2 + ... + АтАхт представляет со™ бой главную^ линейную относительно приращений аргументов часть приращения дифференцируемой функции. Отметим, что при определении понятия дифференцируемости функции мы не исключали возможности обращения всех чисел А\, A2j ... , Ат в нуль, и поэтому, если приращение Аи функции может быть представлено в виде A4.14) или A4.15) при А\ = А2 = ... ... = Ат = 0, то функция дифференцируема в данной точке. Справедлива следующая теорема. ) Если все Аж^ равны нулю, то все члены в правой части формул A4.14) и A4.15) равны нулю.
§ 4 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 501 Теорема Ц.9. Если функция и = f(xi,X2,-.. ,%) диффе- дифференцируема в точке M(xi,X2t - - ,жш), то в этой точке су- существуют частные производные по всем аргументам, причем —— = Ai, где А{ определяются из условия A4.14) или A4.15) OX i дифференцируемости функции. Доказательство. Из условия A4.14) дифферен- дифференцируемости функции в точке М(жх? Ж2, • • • , хт) вытекает, что ее частное приращение AXiu в этой точке равно AXiu = AiAxi + + ttiAxi. Отсюда вытекает, что Xi = А{-\-щ, и поэтому, так Ах{ как otj —>• и при /\xj —> и, пш Л г = -тг— = А*. Следствие 1. Условие A4.15) дифференцируемости функ- функции в данной точке М можно записать в следующей форме: Аи = р^Ахг + р^Ах2 + ... + ^Ахт + о(р) х). A4.16) ОХ\ 0X2 ОХт Следствие 2. Если функция и = f(xi,X2,- - - ^хт) диф- дифференцируема в точке М(жх,Ж2,... ,жш), то представление ее приращения Аи в форме A4.14) или A4.15) единственно. В са- самом деле, коэффициенты А{ этих представлений равны частным производным —— в данной точке М и поэтому определяются (Ух % единственным образом. Убедимся в справедливости следующего важного свойства дифференцируемых функций. Если функция и =f(xi,X2, • • • jXm) дифференцируема в точ- точке М{х\,Х2-> • • • , жт), то она и непрерывна в этой точке. В са- самом деле, из условия A4.14) дифференцируемости функции в точке вытекает, что lim Аи = 0, а это и означает, что функ- А0 т ция непрерывна в точке М (см. п. 1 § 3, формула A4.7)). В случае функции и = /(ж, у) двух переменных условие диф- дифференцируемости может быть иллюстрировано геометрически. Введем понятие касательной плоскости к поверхности в точ- точке No. Плоскость тг, проходящая через точку Nq поверхности, называется касательной плоскостью в этой точ- ке, если угол между этой плоскостью и секущей^ проходящей через точку Nq и любую точку N\ поверхности^ стремится к нулю, когда точка N\ стремится к Nq (рис. 14.3). ) Здесь все частные производные —— берутся в данной точке М. OX
502 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Если в точке Nq существует касательная плоскость, то очевид™ но, что касательная в точке Nq к любой кривой, расположенной на поверхности и про- проходящей через Nq, ле™ жит в указанной плос- плоскости. Убедимся, что из условия дифференци- руемости функции и = = /(ж, у) в данной точ- точке Mq (xq , уо) вытека™ ет существование ка™ сательной плоскости к графику S этой функ- функции в точке Щ(хо,уо, zq). Положим Ах = = х - х0, Ау = у - - у0, Аи = и - щ, где щ = /(жо,уо), и = = /(ж, у). Очевидно, Рис. 14.3 условие A4.14) дифференцируемости в рассматриваемом случае можно записать следующим образом: и — uq = А(х — xq) + В(у — уо) + (%Ах + f3Ay = = А(х - Xq) + В(у - уо) + о(р), л о ди ди где Аид — постоянные, равные частным производным -^ и тг дх ду в точке Mq, а а и /3 — бесконечно малые при Ах ™>0 и Ду —>• 0 функции, р = \JАх1 + Ду2. Рассмотрим следующее уравнение: U -Щ = А(х - Xq) + В(у - уо). Из аналитической геометрии известно, что это уравнение определяет в декартовой системе координат (ж, у, U) некоторую плоскость тг, проходящую через точку Жо(жо,уо5^о) и имеющую нормальный вектор п = {А11?, — 1} 1). Докалсем, что эта плоскость тг является касательной плоско- плоскостью в точке Nq поверхности S. Для этого достаточно убедить- убедиться, что: 1) плоскость ж проходит через точку Nq поверхности S и 2) угол if между нормалью п к этой плоскости и любой се- секущей NqN\ стремится к тг/2, когда точка N\ поверхности S стремится к точке Nq. Утверждение 1) очевидно. Перейдем к ) Нормальным вектором плоскости называется любой ненулевой вектор п, перпендикулярный к этой плоскости.
§ 4 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 503 доказательству утверждения 2). Вычислим косинус угла </?, вое™ пользовавшись известной формулой для косинуса угла между двумя векторами. Так как координаты вектора п равны А, I?, — 1, а координаты вектора NqN\ секущей равны ж — жд, у — уо, и — щ (см. рис. 14.3), то cog _ А(х ~ жо) + В(У ~ Уо) ~{ц- Цр) л/А2 + В2 + 1у/(х - ж0J + (у - 2/оJ + (и- и0J ' Из условия дифференцируемости функции и = /(ж, у) выте- вытекает, что А (ж - ж0) + Б(у - |/о) - (г* - и0) = о(р). Поэтому |cos<p| о(р)\ _ \о(р)\ Из этой формулы вытекает, что lim собш = 0, т. е. lim ю = тт/2. >0 ^О Утверждение 2) доказано. Таким образом, дифференцируемость функция и = /(ж, у) в точке Мо(ж0,уо) с геометрической точки зрения означает на- наличие касательной плоскости к графику функции и = /(ж, у) в точке ^о(жо,уо,зд)- Так как коэффициенты А и В равны соответственно частным производным, вычисленным в точке Mq(xq, уо), то уравнение ка™ сательной плоскости может быть записано в виде и-щ = ^(х-хо) + g(y - у0). A4.17) тт „ Г ди ди -, 1 Нормальный вектор п = < -^—, -^-, — 1 > касательной плоскости I дх ду J принято называть нормалью к поверхности к = /(ж, у) в точке Жо(жо,уо,зд). Выясним достаточные условия дифференцируемости функ- функции нескольких переменных. Теорема 1^.10. Если функция и = /(жх,Ж2,... ,жт) имеет частные производные по всем аргументам в некоторой окрест- ¦А /Г /° ° ° \ ности точки Мо(ж!,ж2,... ,жт), причем все эти частные про- производные непрерывны в самой точке Мо, то указанная функция дифференцируема в точке Mq. Доказательство. Для сокращения записи проведем до™ казательство для функции двух переменных и = /(ж,у). Итак, пусть обе частные производные fx и f'y существуют в окрестно™ сти точки Мо(ж0,уо) и непрерывны в этой точке. Дадим аргу™ ментам ж и у столь малые приращения Аж и Ау, чтобы точка
504 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 М(х® + Дж, у® + Ау) не выходила за пределы указанной окрест™ ности точки М®. Полное приращение Аи = f(x® + Дж, у® + Ау) — — f{x®,y®) можно записать в виде Аи = [f[x® + Ах, у® + Ау) - /(ж0, I/O + Ау)] + + [/(^о, Уо + Ay) - f(x®, у®)]. Выражение [f(x® + Дж, уо + Ау) — f(x®, Уо + Ау)] можно рассма- рассматривать как приращение функции f(x,y® + Ау) одной перемен™ ной ж на сегменте [жо,жо + Ах]. Поскольку функция и = /(ж,у) имеет частные производные, указанная функция f(x,y® + Ау) дифференцируема и ее производная по ж представляет собой частную производную fx. Применяя к указанному приращению формулу Лагранжа, найдем такое в\ из интервала 0 < в\ < 1, что Рассуждая совершенно аналогично, получим, что для неко- некоторого 6>2 из интервала 0 < 02 < 1, 5Уо + Ау) - /(ж0,уо)] = 1у(х®^Уо + в2Ау)Ау. Так как производные /^ и /' непрерывны в точке Mq, to ffx(x® + <9i Аж, уо + Ау) = /я(жо, Уо) + «, /^(ж0, уо + ^2 Ay) = fyix®, уо) + )9, где а и /3 — бесконечные малые при Аж ->0и Ау —>• 0 функции. Отсюда, учитывая приведенные выражения для [/(ж0 + Аж, уо + Ау) - f[x®, у® + Ау)] и [/(ж0, уо + Ау) - /(ж0, уо] и выражение для Аи, найдем Аи = f'x{x®,y®)Ax + f'y{x®, у®) Ay + аАх + /ЗДу. Следовательно, функция и = /(ж, у) дифференцируема в точ- точке Mq. В случае функции т переменных и = /(жх,Ж2,... ,жш) рассуждения проводятся аналогично, только полное прираще- приращение Аи этой функции следует представить в виде суммы Аи = /(жх +Ажь ... , хт +Джто) - /(жь ... , жте) = хк, хк+1 +Ахк+Ъ ... , хт +Ахт) - т - /(жь ... ,хк_ъхк,хк+1 +Дж^+Ь ... ,хт +Ажш)]. Теорема доказана.
§ 4 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 505 3. Понмтие дифференциала функции нескольких пе- переменных. Определение. Дифференциалом du дифференциру- дифференцируемой в точке М{х\, x2j • • • , хт) функции и = /(жх? Ж2, • • • , хт) называется главная линейная относительно приращений аргу- аргументов часть приращения этой функции в точке М. Если все коэффициенты А% в представлении A4.14) приращения диффе- дифференцируемой функции равны нулю^ то дифференциал du функ- функции в точке М считается равным нулю. Таким образом, дифференциалом du дифференцируемой в точке М функции и = /(жх, Ж2, • • • ? хт) называется выражение du = А\Ах\ + А2Ах2 + ... + АтАхт. A4.18) Используя теорему 14.9, мы можем, очевидно, переписать выра- выражение A4.18) для дифференциала du следующим образом: du = ^АХ1 + ^Ах2 + ... + ^Ахт. A4.19) дх\ дх2 дхш х ; Введем понятие дифференциала d%{ независимой переменной Х{. Под дифференциалом dxi независимой переменной Х{ можно по- понимать любое (не зависящее от х\1Х21... ,хт) число. Догово™ римся в дальнейшем брать это число равным приращению Axi независимой переменной х\. Эта договоренность позволяет нам переписать формулу A4.19) в виде du = р- dxx + р- dx2 + ... + #^ dxm. A4.20) dxi дх2 дхт Подчеркнем, что формула A4.20) установлена нами лишь для случая, когда аргументы x\1x2l--- ,xm являются независимы™ ми переменными. Однако ниже, в п. 5 этого параграфа, мы до™ кажем, что формула A4.20) остается справедливой и для слу- случая, когда аргументы жх, x2l... , хт не являются независимыми переменными, а сами представляют собой дифференцируемые функции некоторых новых переменных. 4. Дифференцирование сложной функции. В этом пункте мы рассмотрим вопрос о дифференцировании сложной функции вида и = }(хъх2,... ,жш), где A4.21) Мы докажем, что при определенных условиях эта сложная функция является дифференцируемой функцией своих аргу™
506 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 ментов ti,t2,... ,?&. При этом частные производные указанной сложной функции по аргументам ix^2?--- ,?fc выражаются че- через частные производные функции и = /(жх, #2? • • • ? жт) и через частные производные функций A4.21) по следующим форму™ лам: ди _ ди дх\ ди дх2 , , ди дхт I Т\ 7\~, I • • • dt\ дх\ dt\ дх2 dii ' ' ' дхт dt± ' ди ди дх\ ди дх2 , . ди дхт dti дх\ dt2 дх2 dti ''' дхт dti ' A4.22) ди ди дх\ ди дх2 , , ди I ~<Л 'гГ. I • • • dtk dxi dtk дх2 dtk ' ' ' дхт dtk Докалсем следующую основную теорему. Теорема Ц.11. Пусть функции A4.21) дифференциру- о о о емы в некоторой точке M(ti, t2, • • • , tk)i Q> функция и = = /(#1, Ж2,... , хт) дифференцируема в соответствующей точ~ о о о о о о о ке N(xi,x2,... ,жт), где хг= <Рг(*1?*2? • • • ?*/ьM i = 1,2,... ,т. Тогда сложная функция и = /(жг, Ж2, • • • , жт), гс?е жх, Ж2, • • • , хт определяются соотношениями A4.21), дифференцируема в точке М. При этом частные производные этой сложной функ- функции в точке М определяются формулами A4.22), в которых л ди ди ди г- -at все частные произвооные -т—, -^—, • • • , -^— берутся в точке iv, а все частные производные -^ функции A4.21) по аргументам oti tx, ?2, • • • ^ ^ берутся в точке М. Доказательство. Придадим аргументам о о о #1, ^2, • • • , tk в точке iW(ti, i2j • • • jtk) произвольные прираще™ ния Ati,At2,... , А^, не равные одновременно нулю. Этим приращениям соответствуют приращения Ажх, А^2,... , Ажш функций A4.21) в точке М. Приращениям Ажх,Аж2,... , Ажто в свою очередь соответствует приращение Аи функции и = f(xi,X2, • • • чхт) в точке N. Поскольку функция и = = /(жх,Ж2,... ,жт) предполагается дифференцируемой в точ- точке Ж, указанное приращение Аи этой функции может быть за- записано в виде ди а , ди а . . ди а , ^Ажх + ^Аж2 + ... + ъ—Ахт + ОХ\ ОХ2 ОХт ... + «тоДжте, A4.23) ди ди ди г ш где частные производные т^, т^, • • • , тг^ берутся в точке /V, дх\ дх2 дхт а «х, «2,... , ат — бесконечно малые при Ажх —> 05 А^2 —^ 0 ...,
§ 4 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 507 ... , Ахт —>> 0 функции, равные нулю при Ах\ = Ах2 = ... ... = Ахт = 0. Подчеркнем, что в соотношении A4.23) A#i, Аж2, ..., Ахт представляют собой приращения функций A4.21), отвечающие выбранным приращениям Aii, At2j... , Atfc аргументов этих функций. В силу дифференцируемости функ- о о о ций A4.21) в точке M(ti, t2l • • • , ?fc) указанные приращения можно записать в следующей форме: A424) г = 1,2,... ,т, где частные производные ^, ^,... , -^ берутся в точке М, а C/ti СГС 2 Crefc Мы должны убедиться в том, что после подстановки в правую часть A4.23) выражений A4.24) приращение Аи может быть приведено к виду Аи = AiAti + A2At2 + ... + AkAtk + о(р), A4.25) где Тем самым доказательство теоремы будет завершено, ибо фор- формула A4.25) устанавливает факт дифференцируемости сложной функции, а выражение A4.26) представляет собой частную про™ изводную указанной сложной функции (см. теорему 14.9). При подстановке в правую часть A4.23) выражений A4.24), кроме группы слагаемых A\At\ + А2 А#2 + • • • + A^Ath, мы полу- получим и другие группы слагаемых. Нам нужно убедиться в том, что все другие группы слагаемых представляют собой величи™ ну о(р). Это вытекает из следующих соображений: 1°. Все частные производные — в формуле A4.23) берут- ох% ся в точке Ж, т. е. представляют собой постоянные числа^ которые при умножении на о(р) дают снова величину о(р). 2°. Все Axi (г = 1,2,... ,га) удовлетворяют неравенству \Axi\ ^ constp. Это непосредственно вытекает из формул A4.24). 3°. Все OLi в формуле A4.23) представляют собой бесконечно малые при р —>> 0 функции. В самом деле, все о^ являются бес- бесконечно малыми при Ах\ —>> 0, Аж2 —^ 0, ..., Ахт —>> 0. Но все функции A4.21) дифференцируемы, а стало быть, и непрерыв- непрерывны в точке Ж, и поэтому Ажх, Ax2j • • • , Ахт стремятся к нулю при р —)> 0.
508 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 4°. Каждое произведение о^Дж^ представляет собой величи- величину о(р). Это непосредственно вытекает из пп. 2° и 3°. Теорема доказана. Замечание. Рассмотрим важный частный случай, когда функции A4.21) зависят от одного аргумента t. Тогда мы имеем сложную функцию одной переменной t: и = /( где Xi = (fi(t). Производная — этой сложной функции опреде- определяется следующей формулой: du ди dx\ . ди dx2 , , ди dxm /«* ™\ Применим формулу A4.27) для доказательства теоремы Эйлера об однородных функциях. Функция и = /(#i, Х2ч • • • , хт), заданная на множестве {М}^ называется однородной функцией степени р на этом множестве, если для каждой точки М{х\, Х2-, - - • , хт) множества {М} и для ка^кдого числа t, для которого точка N(tx\, tx2, • • • ,txm) при- принадлежит множеству {М} выполняется равенство f(txi,tx2,... ,txm) = tpf{xux2l... ,хт). A4.28) Теорема ЦЛ2 (теорема Эйлера об однородных функ- функциях). Если и = /(ж]_,Ж2, • • • ixm) является в некоторой обла- области {М} дифференцируемой однородной функцией степени р, то в каждой точке М(х\,Х2-> • • • ,хт) области {М} справедли- справедливо равенство ди ди ди /1Л ОА\ т^Ж1 + ^х2 + ... + ъ—хт = ри. A4.29) дхг дх2 дхт Доказательство. Пусть Мо(ж!,ж2,... , жт) — произвольная точка области {М}. Рассмотрим сложную функ™ цию и = /(жьж2,... ,жт), где Xi = t хг {% = 1,2,... ,т), т. е. функцию и = f(tx\, tX2i... ,txm). Так как при t = 1 функции ж^ = t Xi дифференцируемы и функция и = /(жх,Ж2,... ,жш) дифференцируема в соответствующей точке Mq, to, согласно те- теореме 14.11 и замечанию к этой теореме, мы можем вычислить du „ „ 1 #1 производную — указанной слолснои функции в точке t = 1 по формуле A4.27). Так как -т1 =ЖЬ т0 du ~dt _ ди о ди о ди о (-1ЛШ Ой г Ъ/ГГЧ где производные —— оерутся в точке Mq. Ь другой стороны, в силу A4.28) рассматриваемая сложная функция может быть
§ 4 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 509 представлена следующим образом: и = f{txutx2,... ,txm) = tpf(xux2,... ,жш). A4.31) Из A4.31) вытекает, что — = ptp f(xi1x2l... ,жто), т. е. at = Р/(ЖЪ X2, • • • , хт) = PU- A4.32) Сравнивая A4.30) и A4.32), мы получим соотношение A4.29) для точки М®. Так как точка М® — произвольная точка области {М} то теорема доказана. 5. Инвариантность формы первого дифференциала. В и 3. мы ввели понятие первого дифференциала du функ- функции нескольких переменных и установили, что когда аргументы #1, Х2, • • • , хт являются независимыми переменными, то диффе- дифференциал du молено представить в виде I ди j . ди j . . ди j /1 л ОАч аи = —— ах\ + —— ах2 + ... + -— ахт. A4.20) дх\ дх2 дхт В этом пункте мы докажем, что формула A4.20) является уни- универсальной и справедлива так лее и в том случае, когда аргумен™ ты #1, Х2-> • • • , хт сами являются дифференцируемыми функци- функциями новых переменных ?i, #2,... ч^к- Указанное свойство первого дифференциала обычно называют свойством инвариантности его формы. Пусть аргументы x\1x2l--- jXm функции и = f(x\^x2^... ... ^хт) представляют собой дифференцируемые в точке о о о A{ii,i2,... ,tk) функции Xi = <pi(ti,t2,... ,tfc), а сама функ- о о ция и = /(#i, X2-, • • • , хт) дифференцируема в точке В{х\1Х21... о о о о о ... , жш), где х^= (pi(ti, #2э • • • ? tk)- В таком случае мы можем рас- рассматривать и как сложную функцию аргументов ii,^--- j^fc? которая, в силу теоремы 14.11, является дифференцируемой в точке А. Поэтому дифференциал du этой сложной функции можно представить в виде fjqi —— d~tл ~\~ dfo -\~ ~4~ dfi С14 'ill где — определяются из соотношений A4.22). Подставляя — из A4.22) в A4.33) и собирая коэффициенты при ^—, получим / т , иХт 1, . . ОХ дх
510 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Остается заметить, что в последнем соотношении коэффициент при -— равен дифференциалу dxi функции Xi = ^(^ъ^ • • • ОХ % ... , ?&). Мы получим для дифференциала du сложной функ- функции формулу A4.20), в которой дифференциалы dxi будут диф- ференциалами функций Xi = <^(ii,i2,... ??&)• Инвариантность формы первого дифференциала установлена. Свойство инвариантности формы первого дифференциала позволяет установить следующие правила дифференцирования. Пусть и и v — дифференцируемые функции каких-либо пере- переменных. Тогда d(cu) = cdu (с = const), d(u ±v) = du ± dv, d(uv) = udv + vdu, d(-)= 2U v. \V/ V (В последней из написанных формул v не обращается в нуль). Докажем, например, справедливость третьей из указанных формул. Рассмотрим функцию w = uv двух переменных и и v. Дифференциал этой функции dw равен , dw 7 . dw 7 aw = ^^ аи + ^^ av. ди ov Так как ^^ = v и ^^ = и, то dti; = г/ б?г? + vdu. В силу инва- OU OV риантности формы первого дифференциала выражение и dv + + v du будет дифференциалом функции uv и в случае, когда и и v сами являются дифференцируемыми функциями каких-либо переменных. 6. Производная по направлению. Градиент. Пусть функция и = f(x,y,z) трех переменных ж, у и z задана в неко™ торой окрестности точки Мо(ж0,|/0, zq). Рассмотрим некоторое направление, определяемое единичным вектором а с координа- координатами cos a, cos/3, COS71)- Проведем через точку М® ось 1, на- направление которой совпадает с направлением вектора а, возь- возьмем на этой оси произвольную точку M{x1y1z) и обозначим че- через I величину направленного отрезка М®М указанной оси2). Из аналитической геометрии известно, что координаты ж, у, z точки М определяются равенствами х = х® + I cos а, у = у® + I cos /3, z = z® + I cos 7. A4.34) ) Из аналитической геометрии известно, что если единичный вектор а составляет с осями координат углы а, /3, 7? т0 координаты этого вектора равны cos a, cos/3, COS7- 2) Величиной I направленного отрезка MqM оси 1 называется число, рав- равное его длине, взятой со знаком плюс, если направление этого отрезка сов- совпадает с направлением оси 1, и со знаком минус, если направление этого отрезка противоположно направлению оси 1.
§ 4 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ 511 На указанной оси 1 функция и = /(ж,у, z), очевидно, являет™ ея сложной функцией одной переменной величины I. Если эта функция имеет в точке I = 0 производную по переменной Z, то эта производная называется производной по на- направлению 1 от функции и = f(x, у, z) в точке Mq и обо- ди значается символом —. Согласно замечанию к теореме 14.11, ot в случае дифференцируемости функции и = /(ж, у, z) в точке М® производная — может быть вычислена по формуле A4.27), в которой аргумент t нужно заменить на I. Таким образом, ди ди dx ди dy ди dz Ж ~ ~dxll ~дуШ ~dzH' m dx dy o dz 1ак как -— = cos a, -^ = cosp, -— = cos 7, то из последней al dl dl формулы находим ди ди ди Q ди /1 Л осгч — = ^- cos а + — cos р + -^- cos 7. A4.35) dl dx dy dz x 7 Введем понятие градиента дифференцируемой в точке Mq(xq, уо,^о) функции и = f(x,y,z). Градиентом функции и = f(x,y,z) в точке Mq называется вектор^ обозначаемый символом grad и и имеющий координаты^ соответственно равные производным —, —, —, взятым в точке Mq. Таким образом, ди ди ди 1 (Л А ^Р\ W A436) Используя понятие градиента функции и учитывая, что век- вектор а, определяющий направление оси 1, имеет координаты cos a, cos/3, cos7, представим выражение A4.35) для производ- производной — по направлению 1 в виде скалярного произведения век- 01 торов gradii и а: ^ = agradti1). A4.37) Покажем, что градиент функции и = f(x,y,z) в точке Mq характеризует направление и величину максимального роста этой функции в точке Mq. Именно, убедимся, что производная г) Напомним, что скалярное произведение двух векторов, определяемое как произведение модулей (длин) векторов на косинус угла между ними, в случае, когда векторы заданы координатами, равно сумме произведений одноименных координат этих векторов.
512 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 функции и в точке Mq по направлению, определяемому гради™ ентом этой функции в указанной точке, имеет максимальное значение по сравнению с производной по любому другому на- направлению в точке Mq , а значение указанной производной равно | grad 111, т. е. длине вектора gradti. Перепишем формулу A4.37) в виде ди где (р — угол между векторами а и grad гл. Так как ди а = 1, то — = | grad u\ cos (p. 01 Из последней формулы вытекает, что максимальное значение производной по направлению будет при cosc^ = 1, т. е. max когда направление вектора а совпадает с направлением grad ti, при этом (-«7 ) =| grad u\. \ 01 У шах Для выяснения геометрического смысла вектора grad и введем понятие поверхности уровня функции и = f(x,y,z). Назовем поверхностью уровня функции и = f(xjy,z) каждую поверх™ ность, на которой функция и = f(x,y,z) сохраняет постоянное значение, /(ж, у, z) = с = const. Нетрудно убедиться в том, что вектор grad и в данной точке Mq(xoj |/о, zq) ортогонален к той поверхности уровня функции и = f(xJy,z)J которая проходит через данную точку Mq. Замечание. В случае функции и = /(ж, у) двух пере™ менных х шу единичный вектор а, определяющий направление в точке Мо, имеет координаты cos а и sin а. Поэтому в указанном случае формула A4.35) принимает вид ди ди . ди . — = — cos а + — sin a. dl дх ду Отметим, что в случае функции двух переменных градиент диф- дифференцируемой функции и(х^у) определяется как вектор, имею™ щий координаты —— и —. Формула A4.37), очевидно, справед- справедлива и в случае двух переменных. Для функции и = /(#]., #2, • • • ... , хт) т переменных жх, Ж2,... , хт производная по направле- направлению и градиент определяются аналогично. Именно, производ- производная — в точке Mo(#x,#2,... jXfn^ п0 напРавлению 1? которое задается единичным вектором а = {cos ax, cos «2? • • • 5 cos am} 1M ) В аналитической геометрии m-мерного евклидова пространства еди- единичный вектор а определяется как вектор с координатами cos ai, cos о% • • • ... , cosam, где cos2 ai + cos2 «2 + • • • + cos2 am = 1.
§ 5 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 513 определяется как производная по I сложной функции и = о о Где Х\=Х\ + icOSQfi, X2 =%2 + ^COSQf2, • • • хт = хт + I cos ат. В случае, если и = /(#i, Ж2, • • • , ф ф ( ) дифференцируемая функция, для производной по направлению имеет место формула ди ди . ди . . ди ^т = я" COS а1 + я" COS «2 + • • • + ^— COS аш. Градиентом функции в данной точке Мо(ж17Ж2,... ,#ш) назы- называется вектор, обозначаемый символом gradii и имеющий коор- ди ди ди г динаты -—, -—, ... , -—, причем указанные производные Ье- дх\ дх2 дхт рутся в точке Mq . Для производной по направлению дифферен- дифференцируемой функции и = /(жх,Ж2,... ,хт) справедлива формула A4.37). § 5. Частные производные и дифференциалы высших пормдков 1. Частные производные высших порядков. Пусть ди 1 частная производная —— по аргументу Х{ функции и = (Ух % = /(^i, Ж2,... , жш), определенной в области {М}^ существу™ ет в каждой точке области {М}. В этом случае указанная частная производная представляет собой функцию переменных жх,Ж2? • • • jxmj также определенную в области {М}. ЪЛожет слу™ 1 ди читься, что эта функция —— имеет частную производную по OXi аргументу х^ в некоторой точке М области {М}. Тогда указан- указанную частную производную по аргументу х^ называют второй частной производной или частной производной второго порядка функции и = f{x\,X2i • • • чхт) в точке М сначала по аргумен™ ту жг, а затем по аргументу х^ и обозначают одним из следую™ щих символов: ^ fB) B) дд' ]ХХк" ХХк' тт • / j д2и При этом, если г Ф к, то частная производная ——-— называ™ OXkOXi ется смешанной частной производной второго порядка. После того как введено понятие второй частной производной, мож- можно последовательно ввести понятие третьей частной производи ной, затем четвертой и т. д. Если предположить, что нами уже введено понятие (п — 1)-й частной производной функции и = /(жх,Ж2,... jXm) по аргументам ж^,ж^2,... ,ж^Г1_1 (отдель™ ные или даже все номера которых могут совпадать) и что 17 В.А. Ильин, Э.Г. Позняк, часть I
514 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 эта (п — 1)-я частная производная имеет в точке М частную производную по аргументу Х{п, то указанную частную произ- производную называют n-й частной производной (или частной про- производной п-то порядка) функции и = f(xi,X2, • • • ,жто) в точ™ ке М по аргументам ж^,ж^2,... i%in_n%in- Таким образом, мы вводим понятие n-й частной производной индуктивно^ перехо™ дя от первой частной производной к последующим. Соотноше- Соотношение, определяющее п~ю частную производную по аргументам xh,Xi21... ,xin_x,xin, имеет вид дпи д Если не все индексы ii,^?--- ^n совпадают между собой, дпи то частная производная — —-— называется смешанной OXin . . . OXi2OXi1 частной производной п-го порядка. Так как частная производ- производная функции по аргументу Xi определяется как обыкновенная производная функции одной переменной Х{ при фиксирован™ ных значениях остальных переменных, то методика вычисления частных производных высших порядков предполагает умение вычислять только обыкновенные производные первого поряд- порядка. В качестве примера вычислим частные производные второго порядка функции и = arctg -. Имеем ди дх д2и д2и дудх У 2ху 2 2 . х -у ди _ ду д2и _ дхду д2и ду2 X Ж2 +|/2' х2 -у2 2ху (Ж2 +2/2J* В рассмотренном примере смешанные частные производные , , и о _ равны друг другу. Вообще говоря, значения сме™ дудх дхду шанных производных зависят от порядка, в котором произво- производятся последовательные дифференцирования. Убедимся, напри- д2и д2и 1 мер, что смешанные частные производные -—— и -——- функции ду дх дх ду и = О при х2 + у2 = О в точке @, 0) существуют, но не равны друг другу. Действитель- Действительно, / / 4 4 , л 2 2\ I 2/(ж — у + 4ж |/ ) 2 2 / л ^ | J при ж2 + у2 = 0.
ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 515 Поэтому ди д2и дудх = lim ди дх = -1. --- д2и Проводя аналогичные вычисления, получим дхду = 1. х=0,у=0 Таким образом, в точке @,0) . . Ф . _ . Выясним до™ х ; дхду дудх статочные условия независимости значений смешанных про- производных от порядка, в котором производятся последователь™ ные дифференцирования. Предварительно введем понятие п раз дифференцируемой функции нескольких переменных. Функция и = /(жх,Ж2,... ,хт) называется п раз д и ф ф е- ренцируемои в точке Mq{xi^X21 ... ,жш], ес- если все частные производные (п — 1)-го порядка этой функ- функции являются дифференцируемыми функциями в точке Mq. Отметим следующее утверждение. Для того чтобы функция и = /(xi, Ж2, • • • j%m) была п раз дифференцируемой в точке Mo(#i,#2,... ixm)i достаточно^ чтобы все ее частные произ- производные п-го порядка были непрерывными в точке М®. Справед- Справедливость этого утверждения вытекает из определения дифферен™ цируемости функции и теоремы 14.10 о достаточных условиях дифференцируемости. Теорема 1^.13. Пусть функция и = /(ж, у) дважды диф~ ференцируема в точке Мо(жо,уо)- Тогда в этой точке частные производные fxy и fyj равны. Доказательство. Так как функция и = /(ж, у) дважды дифференцируема в точке Мо(жо,уоM то частные про- производные f'x и fy определены в некоторой окрестности точки М® и представляют собой дифференцируемые функции в этой точке. Рассмотрим выражение Ф = f(x® + h,y® + h) - f(x® + h, у®) - f(x®, yo + h) + f(x®, y®), A4.38) где h — любое столь малое число, что точка М(х® + Л, у® + h) на™ ходится в указанной окрестности точки М®. Выражение Ф мож- можно рассматривать как приращение Aip = (р(х® + h) — (f(x®) диф- дифференцируемой на сегменте [x®^x® + h] функции (р(х) = /(ж,уо + + К) — f {х, у®) одной переменной х. Поэтому по формуле Лагран- жа, обозначая через в некоторое число из интервала 0 < в < 1, 17*
516 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 можем записать = [f'x(xo+eh,yo+h)-f'x(xo+eh,yo)}h = - fx(xo,yo)}-[f'x(xo + 9h,yo)- fx(xo,yo)]}h. A4.39) Так как частная производная f'x является дифференцируемой в точке Mq функцией, то fj${xo,yo)h + ai9h + /Зф, [f'x(x0 + Oh, yo) - &(x0, yo)} = fW{x0, yO)Oh + a26h, где ai, /3i и «2 — бесконечно малые при h —>> 0 функции. Подста- Подставляя найденные выражения для [fx(xo + 6h, yo + h) — fx(xo^ Уо)] и [fx(xo + Oh,yo) - )х(хо^Уо)] в формулу A4.39), получим Ф = [/^(хо,уо)+а}к21 A440) где а = а\в + /3\ — «2^ — бесконечно малая при h —)> 0 функция. С другой стороны, выражение Ф, определяемое A4.38), можно рассматривать как приращение Аф = ^(уо + ^) ~ ^(Уо) ДИФ™ ференцируемой на сегменте [уо^у® + Л] функции ф(у) = /(жо + + /i, y) — f(xo,y). Применяя формулу Лагранжа и учитывая диф- ференцируемость частной производной f в точке Mq, мы полу- получим совершенно аналогично предыдущему следующее выраже™ ние для Ф: Ф = 1ф(хо,уо)+№2, A4-41) где /3 — бесконечно малая при h —>• 0 функция. Приравнивая правые части соотношений A4.40) и A4.41) и сокращая обе ча- части полученного равенства на /г2, найдем, что fxy (хо,уо) + а = = fyx (хо, Уо) + /5. Так как а и /5 — бесконечно малые при h —> 0 функции, то из последнего равенства следует, что fxy (хо^Уо) = — fyx {хо,уо). Теорема доказана. Замечание. Теорема 14.13 утверждает, что в данной точке Мо(ж(ьУо) имеет место равенство fxy = fyXj если в этой точке дифференцируемы f'x и fy. Из дифференцируемости /^ и fy в точке Мо вытекает существование в этой точке всех част™ гх ^B) /.B) ных производных второго порядка. Однако равенство jxy = /^ж имеет место и при условии существования лишь производных fxy и fyx-> но ПРИ дополнительном требовании непрерывности
§ 5 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 517 этих производных в рассматриваемой точке. Именно, справед™ ливо следующее утверждение. Пусть в некоторой окрестности точки Мо(жо5Уо) функция и = /(ж, у) имеет частные производные f'x, f'y, /^ , /^ж . Пусть^ кроме того, производные fxy и fyj непрерывны в точке Mq. Тогда в этой точке fxy = fyj • Для доказательства воспользуемся выражением Ф, определенным соот- соотношением A4.38). Из A4.39) вытекает, что Ф представляет собой умножен- умноженную на h разность значений функции fx(x^y) в точках (жо + Oh^yo + h) и (жо + 9h,yo). Применяя к этой разности формулу Лагранжа конечных приращений по переменной у на сегменте [г/о, Уо + h], получим В силу непрерывности fxy в точке Мо(жо,2/о), из последнего равенства по- лучаем Ф = где а(К) —>¦ 0 при h —»¦ 0. С другой стороны, эта же величина Ф представляет собой умножен™ ную на h разность значений функции fy(x^y) в точках (жо + h1 уо + ^2^) и (жо, у о -\-O2h). Применяя к этой разности формулу Лагранжа конечных при- приращений по переменной ж на сегменте [жо, xo + h] и учитывая непрерывность fyj в точке Мо(жо, г/о), получим Ф = где /3(h) -^ 0 при Л, —»¦ 0. Приравнивая последние два выразсения для Ф и рассуж:дая так же, как и в конце доказательства теоремы 14.13, мы убедимся в справедливости нужного нам равенства Докажем теперь теорему о независимости значения любой смешанной частной производной п-го порядка от порядка, в котором производятся по- последовательные дифференцирования. Теорелла 14-1-4- Пусть функция и = /(жх,Ж2,... ,хт) п раз дифферен- дифференцируема в точке Мо(ж1,Ж2,... ,хт). Тогда в этой точке значение любой смешанной частной производной п-го порядка не зависит от порядка^ в котором производятся последовательные дифференцирования. Доказательство. Очевидно, достаточно доказать независи- независимость значения любой п~й смешанной производной от порядка проведения двух последовательных дифференцирований. Иными словами, достаточно доказать равенство
518 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 дк~1и Рассмотрим функцию тг — . Эта функция представляет собой два- ^к 1 * * * **^*1 жды дифференцируемую функцию переменных xik и Xik+1. Поэтому, в силу теоремв! 14.13, дк+1и дк+1и Отсюда и вытекает справедливость равенства A4.42). Теорема доказана. Отметим, что в случае п раз дифференцируемой в точке Mq функции и = /(ж]_,Ж2, • • • чхт) любую ее частную производную n-го порядка можно записать в виде дпи дх^дх^2 ...дх%г' где ai,a2,... , «m — целые числа, удовлетворяющие условиям О ^ (Xi ^ В, (Х\ + «2 + • • • + OLm = ^- 2. Дифференциалы высших порядков. Выше мы использовали для обозначения дифференциалов аргументов функции и = /(жх,Ж2,... j%m) и Для обозначения дифферен™ циала самой этой функции символы dxi^dx2^ • • • ^dxm и du со- соответственно. Теперь нам придется использовать для обозначения диф™ ференциалов аргументов указанной функции и дифференциа- дифференциала самой этой функции и другие символы. В частности, мы будем обозначать дифференциалы аргументов функции и = = /(#1, Х2, • • • , хт) и дифференциал самой этой функции симво- символами 8х\, Sx2j... , feTO и (Jii соответственно. В этих обозначениях инвариантное по форме выражение для первого дифференциала этой функции A4.20) (см. п. 5 § 4) будет иметь вид с ди с . ди с , , ди с ОП = -—0Х\ + ъ—0X2 + • • • + « ОЖТО. Возвращаясь к прежним обозначениям, рассмотрим выраже™ ние A4.20) для первого дифференциала дифференцируемой в данной точке М(х\1Х21... , жш) функции и = /(жх,Ж2,... ,жто): | | р m. A4.20) | dx2 + ... + р dxm. OX2 OXm Предположим, что величина, стоящая в правой части A4.20), представляет собой функцию аргументов жх, #2, • • • ? жш5 диффе- дифференцируемую в данной точке М{х\^Х2ч • • • ixm)- Для этого до- достаточно потребовать, чтобы функция и = f(xi,X2, • • • ^хт) бы- была два раза дифференцируема в данной точке М(#х, #2, • • • ? ж^M а аргументы жх,#2,... ^ж™ являлись либо независимыми пере- переменными, либо два раза дифференцируемыми функциями нею> торых независимых переменных.
ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 519 При этих предположениях мы можем рассмотреть диффе™ ренциал 8(du) = 8 lk=l от величины A4.20). Определение 1. Значение S(du) дифференциала от первого дифференциала A4.20), взятое при 8х\ = dx\, 6x2 = dx2j ... ... , 8хт = dxmi называется вторым дифферен- дифференциалом функции и = /(жх,Ж2,... jXm) (в данной точке {х\1Х21 • • • ,хт)) и обозначается символом d2u. Итак, по определению1) d и = S(du) = 16 6x2= 1к=1 ди Ъх~к dxi ёх\= Sxm=dxr} Дифференциал dnu любого порядка п введем по индук- индукции. Предположим, что уже введен дифференциал dn^lu поряд- порядка п — 1 и что функция и = /(ж]_,Ж2,... ,жт) п раз диффе™ ренцируема в данной точке M(xi,X2,- - - ,%), а ее аргументы Ж1,Ж2,... ,хт являются либо независимыми переменными, ли- либо п раз дифференцируемыми функциями некоторых независи- независимых переменных ti, ?2, • • • , tk- Определение 2. Значение 8{dn~lu) дифференциала от (п — — 1)-го дифференциала dn^lu1 взятое при 8х\ = dx\, 8x2 = = dx2j ... , 8хт = dxmi называется п~м дифферен- ц и а л о м функции и = f{x\1X21... jXm) (в данной точке С2, • • • -)Хт)) и обозначается символом dnu. Итак, по определению Sxm=dxm При вычислении второго и последующих дифференциалов приходится существенно различать два случая: 1) случай, ко- когда аргументы #i,#2, • • • чхт являются независимыми перемен™ ными; 2) случай, когда аргументы #i, #2, • • • 1 хт являются соот™ 1) Символ < > Vl = dxi, обозначает, что в выраж:ении, заключенном в ёхт = dxm фигурные скобки, следует положить 5х\ = dxi, Sx2 = dx2, • • •, Sxm = dxm.
520 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 ветствующее число раз дифференцируемыми функциями неко- торых независимых переменных ti, ?2, • • • , tk. Рассмотрим сначала первый случай. Если х\1Х2-)--- ,хт яв- являются независимыми переменными, то мы имеем право считать, что dx\, dx2^ • • • , dxm не зависят от х\, #2? • • • ? жт- Каждый дифференциал dx^ мы можем взять равным одному и тому же приращению Ахк для всех точек М{х\1Х21 • • • ,хт). При этом мы получим, что OXi Последнее соотношение и правила дифференцирования, уста- установленные в конце п. 5 § 4, позволяют нам записать для два раза дифференцируемой в данной точке М функции и = = /(#1, Х2, • • • , хт) следующую цепочку равенств: d2u = 6(du) Sxm=dxm A4.43) (Мы воспользовались еще и тем, что для два раза дифферен- дифференцируемой функции смешанные производные второго порядка не зависят от того, в какой последовательности производится диф™ ференцирование.) Итак, мы получаем, что в случае, когда аргументы #1, Х2, • • • , %т являются независимыми переменными, для второ- второго дифференциала два раза дифференцируемой в данной точке функции и = /(#i, Х2-> • • • ->хт) справедливо представление: i=l к=1
ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 521 Замечание 1. Функция т переменных ?]_, #2, • • • jtm вида т т Ф = ^ ]С aiktitkj где а^ — постоянные вещественные числа, г1&1 называется квадратичной формой от переменных ti, ?2, • • • 5^5 а числа а^ — ее коэффициентами. Квадратичная форма называется симметричной, если ее ко™ эффициенты удовлетворяют условию щ^ = аы (для всех г = = 1,2,... ,га; А; = 1,2,... ,т). Полученное нами выражение A4.44) позволяет утверждать, что для случая, когда аргументы #i,#2,...,#m являются независимыми переменными, второй дифференциал два ра™ за дифференцируемой в данной точке М функции и = = /(#i,#2,... 7жш) представляет собой симметричную1), ква- квадратичную форму от переменных dx\, dx2j... , <icm, коэффици™ енты которой равны соответствующим частным производным второго порядка функции и = f{x\^X21 • • • ,жш), взятым в дан- данной точке М. Отметим, что полученное нами выражение для дифференци- дифференциала второго порядка A4.44) можно переписать и в другом виде, используя формальный символ d = dxl7^ + dx2^ + ... + dxmj^, A4.45) OXi OX2 ОХт С помощью этого символа выражение A4.44) может быть не- реписано в виде J- + ... + dxm^-) и. A4.46) дх2 дхт/ х ; По индукции легко убедиться в том, что в случае, когда ар™ гументы #1, #2, • • • , хт п раз дифференцируемой в данной точке M(xi,X2,... jXm) функции и = f(x\JX2J... , хт) являются неза- независимыми переменными, для п™го дифференциала этой функ- функции справедливо представление dnu = W... V п dx*, dxjo ... dxj . дхг1дхг2 ...dxin l 2 n «1 = 1*2 = 1 гп = 1 Это представление с помощью формального символа A4.45) может быть переписано в виде dnu = [dxx-2- + dx2^ + ... + dxm^Xu. A4.47) V OXi OX2 OXJ г) Симметричность этой квадратичной формы вытекает из равенства
522 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Совершенно другой вид имеют представления для второ™ го и последующих дифференциалов в случае, когда аргументы #1, #2, • • • 1 хт ФУНКЦИИ U = /(#1, #2? • • • 5 хт) ЯВЛЯЮТСЯ СООТВет- ствующее число раз дифференцируемыми функциями некото™ рых независимых переменных ti, ?2, • • • ? ?&• Обращаясь к этому случаю, установим выражение для вто- второго дифференциала два раза дифференцируемой в данной точ- точке М(х\, Х2, • • • , хт) функции и = /(#1, #2,... ? жшM аргументы #1, #2, • • • ^ жт которой являются два раза дифференцируемыми функциями некоторых независимых переменных ti,t2,... , ?&. Повторяя рассуждения из цепочки A4.43), мы на этот раз получим Заметим, что в силу определения второго дифференциала функции и = х^ (где к — любой из номеров 1,2,... , га) [S(dxk)] , = dxu =d2xk- 6xm=dxn Учитывая это соотношение, мы приходим к следующему представлению для второго дифференциала: <-\2 (j U k=l i=l г к k=l или (с использованием символа A4.45)) ди ,2 -х—а дхк 2 u= OX\ д OX2 u du A4.48) Сравнивая полученное нами представление A4.48) с пред- представлением A4.46), мы убедимся в том, что (в отличие от пер- первого дифференциала) второй дифференциал уже не обладает свойством инвариантности формы. Тем более не обладают свойством инвариантности формы все последующие дифференциалы.
§ 5 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 523 Замечание 2. Укажем важный частный случай, когда второй и последующие дифференциалы функции т от перемен™ ных и = f{x\1X21... ,хт) все же обладают инвариантностью формы и определяются той самой формулой A4.47), что и для случая независимых переменных х\, #2? • • • ? хт. Будем говорить, что переменные х\,Х2т-- ,хт являются линейными функциями независимых перемен™ ных ti,t2,... ,iki если они определяются равенствами %i = Що + cbnh + Щ2Ь + ... + aiktk (г = 1, 2,... , га), в которых через щ®^ ац,... , а^ обозначены некоторые постоян- постоянные. Заметим, что если функция и = /(жх,Ж2,... ,жт) являет- является п раз дифференцируемой в данной точке М(жх,Ж2,... ,жт), а ее аргументы жх,Ж2,... ,жт являются линейными функция- ми независимых переменных ?х,#2, * * * '^' шо п™^ дифференци- дифференциал функции и = /(жх,Ж2,... ,жто) определяется той эюе самой формулой A4.47), ^шо и для случая независимых переменных ]_,2, , ш Чтобы убедиться в этом, заметим, что поскольку ?х, #2,... ' ^ являются независимыми переменными, то n-й диффе™ ренциал Xi как функций аргументов ?х,#2,... ' ^ определяется равенством типа A4.47), а точнее равенством Но любая частная производная выше первого порядка от ли™ нейной функции Xi равна нулю. Стало быть, d2Xi = 0, Sxi = 0, ..., dnXi = 0. Равенство d2xi = 0 (при всех г = 1,2,... , т) и представ™ ление A4.48) дают право заключить, что d2u определяется ра- равенством A4.46). Совершенно аналогично, используя соотноше™ ния d^Xi = 0, ..., dnXi = 0, мы по индукции докажем, что d3u^ d4u^... , dnu определяются равенством A4.47). Замечание 3. При проведении вычислений иногда требуется расшифровать равенство A4.47) и, учитывая, что в этом равенстве имеют- имеются совпадающие члены, выписать все различные члены этого равенства со стоящими перед ними коэффициентами. Для этой цели может быть использована формула полинома Ньютона, имеющая вид («1+а2 + ...+ат) = у :—: j—-ахга^ ... атто f-^x ai!a2'...am! A4.49)
524 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 (суммирование в правой части этой формулы идет по всем целочисленным индексам ai, аг-, • • • , ат, каждый из которых удовлетворяет неравенствам О ^ oti ^ n при условии, что сумма всех этих индексов оц + «2 + • • • + «т равна п). Формулу A4.49) нетрудно установить по индукции. В самом деле, при т = 2и при любом натуральном п эта формула заведомо справедлива, ибо она переходит в известную формулу бинома Ньютона. Предположим, что эта формула справедлива для некоторого номера тJи любого натурального в, и проверим, что в таком случае она спра- справедлива и для номера т + 1и любого натурального п. Представив (а\ + a 2 + ... + ат + am+i)n в виде (ai + п2 + ... + ат+г)п = [(а± + п2 + ... + am) + am+i]n, подсчитаем с помощью бинома Ньютона коэффициент при а^а^2 • • • ammam7+i1* ^ силу равенства ai + «2 + • • • + «m+i = n, форму- формулы бинома Ньютона и предположения о справедливости формулы A4.49) для номера т и любого натурального п, этот коэффициент равен г) pam + 1 (ai + «2 + • • • + «m)! (ai + «2 + ¦ • • + «m + am+i)! (ai +a2 + ... (aro+i)!(ai + a2 + ... + am)! _ (ai + «2 + • ¦ • + Qm + am Полученное выражение для коэффициента при a • а^2 ... а^ • ап^[1 в точности совпадает с тем выражением, которое получится из формулы A4.49), если в этой формуле заменить номер тнат+1. Индукция завершена, и формула A4.49) доказана. Формула A4.49) дает нам право переписать выражение A4.47) для п-го дифференциала в следующем виде: <Ги{М)= ? dxaldxT2U gxa 3. Формула Тейлора длм функции шпеременных с остаточным членом в форме Лагранжа. Мы будем обозна- обозначать дифференциал к-го порядка функции и = /(жх, Ж2,... , хт) в точке М символом <1ки\м- Докажем следующую теорему г) Мы учитываем, что Сп = ттт—* ч,, и потому А;!(п — к)\
§ 5 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 525 Теорема Ц.15. Пусть функция и = f(M) = /(жх,Ж2, • • • ...,жте) задана в некоторой е-окрестности1) точки Mo(#i, х2-> • • • 5 хт) и п + 1 раз дифференцируема в указанной е-окрест- ности. Тогда полное приращение Аи = f(M) — /(Mo) этой функции в точке М® для любой точки М из указанной е-ок- рестности моэюет быть представлено в следующей форме: Аи = du Мо 2! A4.50) р этом N — некоторая точка указанной s-окрестности, за- зависящая^ вообще говоря^ от М(х\1Х21... , жш), а дифференциа- дифференциалы dxi переменных х\, входящие в выражения dku\uQ и dn+1u\N, равны Ахг = Xi^ X{. Формула A4.50) называется формулой Тей™ лора для функции и = f(M) с центром разложения в точке Mq. Доказательство. Для сокращения записи проведем рассуждения для функции и = /(ж, у) двух переменных х и у. Предварительно запишем в специальной форме формулу Тей- Тейлора для п+1 раз дифференцируемой в некоторой окрестно™ сти точки to функции и = F(t) одной переменной t. Напомним, что формула Тейлора с центром разложения в to для функции и = F(t) одной переменной имеет следующий вид (остаточный член взят в форме Лагранжа): F(t) = F(t0) + F'(to)(t - t0) + ^B)(*о)(< - toJ + ¦¦¦ ¦¦¦ + V(n)(*o)(* - to)n + r^W ^+1)^ + W - *°))(* - *°)n+1' 0<в < 1. A4.51) Так как аргумент t является независимой переменной, то при- приращение At = t — to представляет собой дифференциал dt неза- независимой переменной t. Поэтому - to)k = F^(to)dtk = dkF(t0) = dku\t t0 F(»+D(io + Q(t - to))(t - to)n+l = dn+1u\to+e{t_to). A4.52) Если мы обозначим разность F(t) —F(to) через Аи, то, согласно A4.52), формулу Тейлора A4.51) можно записать в следующей 1) Вместо е-окрестыости точки Мо можно взять так называемую звезд- звездную окрестность этой точки, которая определяется как такая окрестность точки М"о, которая вместе с каждой своей точкой М целиком содержит отрезок MqM.
526 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 специальной форме: Аи = du +-^d2 to 2. + ... + ± t0+(n JU to+e(t-to) A453) Рассмотрим теперь в ^окрестности точки Мо(жо,уо) пРОИЗВОЛЬт ную точку М(жо+Дж, уо+Ау) и соединим точки Mq и М прямой линией. Очевидно, координаты х и у точек указанной прямой представляют собой следующие линейные функции новой пере- переменной t: х = xo + tAx, y = yo + tAy; A4.54) при этом координаты точек отрезка М®М соответствуют зна- значениям переменной t из сегмента [0,1]. Отметим, что значению t = 0 отвечает точка Mq, а значению t = 1 — точка М. Так как по условию функция и = /(ж, у) двух переменных х и у в рассматриваемой окрестности точки М® п + 1 раз дифферен- дифференцируема, то из формул A4.54) вытекает, что на прямой MqM эта функция является сложной функцией переменной t, (n + 1) раз дифференцируемой по крайней мере для всех значений t из сегмента [0,1]. Обозначим эту сложную функцию через F(t) и запишем для нее формулу Тейлора с центром разложения в точке to = 0 в специальной форме A4.53) при Аи = F(l) - F@) = ДМ) - /(Мо). Фигурирующие в формуле A4.53) дифференциалы различных порядков представляют собой дифференциалы сложной функ™ ции и = /(ж,у), где х и у являются линейными функция- функциями A4.54). Согласно замечанию предыдущего пункта при этих условиях дифференциалы любого порядка функции и = /(ж, у) могут быть записаны в форме A4.47). Поэтому dku to=0 = ( — ax + — ax ox ay и = dku dn+lu = I ^- dx + — dx) x A4.55) xu N(xo+0Ax,yo+0Ay) причем в формулах A4.55) dx и dy находятся из соотношений A4.54) при dt = At = 1 — 0 = 1. Таким образом, в формулах D) A4.54) A4.55) dx = dt Ax = Ах и dy = dt Ay = Ay. A4.56) t0 и dn+1u\to+0^to^ из A4.55) в формулу A4.53) и учитывая соотношения A4.56), мы получим формулу Тейлора A4.50). Теорема доказана. Подставляя d u
§ 5 ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 527 Приведем развернутое выражение формулы Тейлора A4.50) для функции и = /() X2j . . . , — (хл- хЛ + —- (x2- x2) + ...+ 0(xi-xi), x2 + 9(x2-x2),... , жш + 0(xm-xm)]. A4.57) 4. Формула Тейлора с остаточным членом в форме Пеано. Теорема 14-15*. Пусть п ^ 1 — целое число, функция и = = f(M) = f(x\,X2-> • • • -)Xm) задана и (п — 1) раз дифференциру- о о о е«ма в е-окрестности точки Mq{xi1x2i ... ,хт) и п раз диффе- дифференцируема в самой точке М® г). Тогда для любой точки М из указанной е-окрестности Mq справедлива следующая формула: f(M) = /(Mo) +1 du +ld2u + ... + 1 dnu +o{pnI 1! Mo n! Mo 2! A4.58) в которой через р обозначено расстояние р(Мо,М), а символ o(pw) обозначает бесконечно малую при р^О (или при М —>• Мо) функцию более высокого порядка малости^ чем рп. Формула A4.58) называется формулой Тейлора (с центром в точке Mq) с остаточным членом в форме Пеано. Замечание. В более подробной записи формула Тейлора A4.58) имеет вид: , . . . , Хт) = !{ХЪХ2, . . . , Х 2,... ,жт) + о(рп). A4.59) Заметим, что в правой части A4.59) стоит сумма многочлена степени п от т переменных x\1x2l • • • ,хт и остаточного члена о(рп). 1) При п = 1 следует требовать, чтобы функция и = f(xi,x>2,--- ,жт) была только задана в е-окрестыости точки Mq и дифференцируема в самой точке Mq.
528 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Обозначим Rn+i(M) разность между /(М) и указанным мно™ гочленом, т. е. положим к=1 т Теорема 14.15* будет доказана, если мы установим, что при выполнении условий этой теоремы i?n+i(M) = о(рп). Доказательству теоремы 14.15* предпошлем две леммы. Лемма 1. Если функция /(М) = /(#i,#2?--- ,хт) п раз дифференцируема в точке Mo(#i,#2?... , жт), то как шл«о функция i?n+i(M), определяемая равенством A4.60), тсж к все ее частные производные по любым переменным х\1Х21... ,хт до порядка п включительно обращаются в нуль в точке М®. Доказательство. При п = 1 функция A4.60) принимает вид = /(М) - /(Мо) - (Ж1- ^i)^-(Mo) -... и равенства i?2(Mo) = 0, -^—^-(Мо) = 0 (при всех i = 1,2,... , ттг) проверяются элементарно. Для проведения индукции предположим, что лемма справед- справедлива для некоторого номера п ^ 1, и докажем, что в таком слу- случае она справедлива и для номера п + 1. Пусть функция f(M) (n + 1) раз дифференцируема в точке Мо и тг+1 k=l m Равенство i?n_|_2(-^o) = 0 проверяется элементарно (достаточ- о но учесть, что каждая круглая скобка (ж^ xi) в A4.61) обра- обращается в нуль в точке Мо). Нам остается доказать, что для любого г = 1, 2,... ,т сама р% ту функция п+2 (М) и все частные производные этой функции (УХ{ до порядка п включительно обращаются в нуль в точке Мо, а для этого в силу сделанного нами предположения о справедли™ вости леммы для номера п достаточно доказать, что функция
ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ 529 о ту п +2 венством определяется равенством типа A4.60), а точнее ра™ к=1 <14-62» Так как все переменные х\ {% = 1,2,... ,т) равноправны и входят в выражение для i?n_|_2GW) симметрично, то достаточно доказать равенство A4.62) для г = 1, т. е. доказать равенство -Еh. к=1 Из A4.61) очевидно, что для доказательства A4.63) доста- достаточно убедиться, что для каждого номера fc = l,2,...,n + l при фиксированных #2? жз? • • • ? хт -к A4.64) Так как при дифференцировании по х\ переменные , жз,... , жш фиксированы, то величину D = (ж2- ж2)^- {хт- х при дифференцировании по х\ молено рассматривать как посто™ янную. К этому следует добавить, что поскольку символы д дх2 д дх используются для образования частных произвол- 2 т пых функции /в фиксированной точке Mq, to при дифференцировании по х\ указанные символы также нуж- нужно рассматривать как постоянные величины. В силу сказанного для доказательства равенства A4.64) до- достаточно убедиться в справедливости равенства <14-65»
530 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Г ° д 1к Дифференцируя функцию (#х~ х\)^— + D\ no x\ как сложную и учитывая отмеченную выше независимость от х\ символов D и ^—, мы получим равенство A4.65). Индукция за™ вершена. Лемма 1 доказана. Лемма 2. Пусть R(M) = R{x\1 Х2, • • • , хт) — произвольная функция, удовлетворяющая двум требованиям: о о о 1) R(M) п раз дифференцируема в точке Мо(#х?ж2?... , жт); 2) сама функция R(M) и все ее частные производные по лю- любым из переменных xi,X2,--- ,xm до порядка п включительно обращаются в нуль в указанной точке Mq. Тогда для функции R(M) справедлива оценка ЩМ) = о(рп), A466) где буквой р обозначено расстояние р(Мо,М) между точками Мо и М. Доказательство. При п = 1 утверждение леммы вытекает из условия дифференцируемости 1) функции R(M) в точке Мо, которое имеет вид: R(M) - R(M0) = J2 Jf k=i Учитывая, что R(Mq) = 0, -—(Mo) = 0 для всех к = 1, 2,... , га, мы и получим, что R(M) = о(р). Для проведения индукции предположим, что лемма 2 спра- справедлива для некоторого номера п ^ 1, и докажем, что в таком случае она справедлива и для номера п + 1. Пусть функция R(M) удовлетворяет двум требованиям лем- леммы 2 для номера п + 1. Тогда, очевидно, любая част™ вн ная производная этой функции первого порядка --—(М) (к = oxk = 1,2,... ,га) будет удовлетворять двум требованиям леммы 2 для номера п, а потому (в силу сделанного нами предпо™ ложения о справедливости леммы 2 для номера п) будет спра- справедлива оценка |? О(Л. A4-66*) Заметим теперь, что поскольку п^ 1, то n + 1 ^ 2и функция Д(М), удовлетворяющая двум требованиям леммы 2 для номера п + 1, во всяком случае один раз дифференцируема в окрестно™ г) См. соотношение A4.16) из п. 2 § 4 этой главы.
§ 6 ЛОКАЛЬНЫЙ ЭКСТРЕМУМ 531 сти точки Mq. Поэтому для этой функции выполнены условия теоремы 14.15 для номера п = 0. Согласно указанной теореме для любой точки М из достаточно малой ^-окрестности точки Mq на отрезке М®М найдется точка N такая, что справедлива формула т R(M) = R(M0) + I J>fc- xk)^;(N). A4.67) * k=l Заметим теперь, что поскольку точка N лежит между точ- точками Mq и М, а р — расстояние между точками Mq и М, то p(N,Mq) ^ р, и потому из A4.66*) вытекает, что u Подставляя последнюю оценку в A4.67) и учитывая, что R(Mq) = 0, получим, что R(M)=o(pn) k=i 1ак как \Xk— х^ ^ \ Z^\xi^ х%) — Р, т0 окончательно полу- чим, что R(M) = о(рп) Индукция завершена. Лемма 2 доказана. Доказательство теоремы 14.15* легко проводится с помощью лемм 1 и 2. В самом деле, выше уже отмечалось, что для доказатель™ ства теоремы 14.15* достаточно установить, что при выполнении условий этой теоремы для функции A4.60) справедлива оценка В силу леммы 1 сама функция A4.60) и все ее частные произ- производные по любым переменным жх, #2, • • • ? хт Д° порядка п вклю™ чительно обращаются в нуль в точке Mq. Но тогда в силу лем- леммы 2 для функции A4.60) справедлива оценка Rn+\{M) = о{рп). Теорема 14.15* доказана. § 6. Локальный экстремум функции т переменных 1. Понятие экстремума функции т переменных. Необходимые условим локального экстремума. Пусть функция т переменных и = /(М) = /(жх? х2-> • • • 5 хт) определе- 71 /Г / \ на в некоторой окрестности точки Mq{xi^X2^ ... ,хт) простран™ ства Ет.
532 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Определение 1. Будем говорить, что функция и = f(M) имеет в точке М® локальный максимум (локаль- (локальный м и н и м у ем), если найдется такая S-окрестность точ- точки Мо^ в пределах которой значение /(Mq) является наиболь- наибольшим (наименьшим) среди всех значений /(М) этой функции. Определение 2. Будем говорить^ что функция и = /(М) имеет в точке Mq локальный экстрему м, если она имеет в этой точке либо локальный максимум, либо локальный минимум. Установим необходимые условия локального экстремума функции и = /(Ж), обладающей в данной точке Mq частны- частными производными первого порядка по всем переменным. Докажем следующее утверждение: если функция и = f(M) = /(xi,Ж2,... jXm) обладает в точке Mq(x\^ x<i, ... ... ,жт) частными производными первого порядка по всем пе- переменным х\,Х2, • • • ,хт и имеет в этой точке локальный экс- тремум, то все частные производные первого порядка обраща- обращаются в точке Mq в нуль^ т. е. справедливы равенства: ? ??=0. A4.68) Доказательство. Установим справедливость первого равенства A4.68). Фиксируем у функции и = f(xi,X2,- - - ,#m) аргументы Х2, х%,... , хт, поло^кив их равными соответствую™ 1 /Г О О щим координатам точки Mq, т. е. положив 2:2 = ^2, жз = ^з, ... о о о ... , хт = хт. При этом мы получим функцию и = /(#]., ^2,... ... jXm) одной переменной х\. Производная этой функции од™ о ной переменной в точке х\=х\ совпадает с частной производной Так как функция т переменных и = f(M) имеет локальный экстремум в точке Mq, to указанная функция одной перемен™ ной и = f(x\jX2j... j%m) имеет локальной экстремум в точке о Х1 =жъ и поэтому (в силу результатов п. 2 § 7 гл. 8) производная о этой функции одной переменной в точке х\ = х\, совпадающая « ди й с частной производной --—(Мо), равна нулю. Первое равенство A4.68) доказано. Остальные равенства A4.68) доказываются аналогично. Подчеркнем, что равенства A4.68) (т. е. обращение в нуль в данной точке Mq всех частных производных первого порядка) являются лишь необходимыми и не являются достаточными уело™ виями локального экстремума функции u = f(M) в точке Mq.
§ 6 ЛОКАЛЬНЫЙ ЭКСТРЕМУМ 533 Например, у функции двух переменных и = ху обе частные производные — и — обращаются в нуль в точке Мо(О, 0), но ох ^У никакого экстремума в этой точке Mq@,0) указанная функция не имеет, ибо эта функция и = ху равна нулю в самой точке ^о(О,О), а в как угодно малой ^-окрестности этой точки прини- принимает как положительные, так и отрицательные значения. Точки, в которых обращаются в нуль все частные производ- производные первого порядка функции и = /(М), называются точка- точками возможного экстремума этой функции. В каждой точке возможного экстремума у функции и = f(M) может быть локальный экстремум, однако наличие этого экс- экстремума можно установить лишь с помощью достаточных усло- условий локального экстремума, выяснению которых будет посвя- посвящен следующий пункт. Из доказанного выше утверждения вытекает и другая форма необходимых условий локального экстремума: если функция u = f(M) дифференцируема в точке М® и имеет в этой точке локальный экстремум, то дифферен- дифференциал с1и\м0 этой функции в точке М® равен нулю тожде- тождественно относительно дифференциалов независимых перемен- переменных dx\^ d,X2j... , dxm. В самом деле, поскольку du\M() = ^-(Мо) dx\ + ^-(Мо) dx2 + • • • + ^-(Мо) dxm, то из равенств A4.68) вытекает, что при любых dx\1dx2-)... , dxm справедливо равенство du\M0 = 0. 2. Достаточные условим локального экстремума. При формулировке достаточных условий локального экстремума функции т переменных и = f(M) важную роль будет играть второй дифференциал этой функции в обследуемой точке Mq. В п. 2 § 5 этой главы мы убедились в том, что для случая, ко™ гда аргументы х\, Х2, • • • , хт два раза дифференцируемой функ- функции и = /(ж]_,Ж2, • • • 5жш) являются либо независимыми пере- переменными, либо линейными функциями некоторых независимых переменных, второй дифференциал этой функции в данной точ- точке Mq представляет собой квадратичную форму относитель- относительно дифференциалов аргументов dxi,dx2i- - - jdxm следующего вида: т т d2u\MQ = ^ ]Р Щк dxi dxk, A4.69) г=1 к=1 где
534 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Для формулировки достаточных условий локального экстре™ мума нам понадобятся некоторые сведения из теории квадра- квадратичных форм, которые мы для удобства читателя приводим ниже 1). Квадратичная форма относительно переменных h\, h<i, ... .... П>т, Ф(Л,1, /&2? • • • ? hm) = у j У j aikhihk A4.71) г=1 к=1 называется положительно определенной (отрицательно определенной), если для любых значений h\, /i25 ••• , hmj одновременно не равных ну™ лю, эта форма принимает строго положительные (строго отри- отрицательные) значения. Квадратичная форма A4.71) называется знакоопреде- ленной, если она является либо положительно определенной, либо отрицательно определенной. Квадратичная форма A4.71) называется знакопере- знакопеременной, если она принимает как строго положительные, так и строго отрицательные значения. Квадратичная форма A4.71) называется квазизнак о™ определенной, если она принимает либо только неотрица- неотрицательные, либо только неположительные значения, но при этом обращается в нуль для значений h\, hi, • • • , hmj одновременно не равных нулю. Сформулируем так называемый критерий Сильвестра зна™ коопределейности квадратичной формы2). Назовем матрицей квадратичной формы A4.71) следующую матрицу: аи а\2 ... а\т д _ а21 «22 • • • «2га «ml «ш2 • • • ®тт ) A4.72) Если все элементы матрицы А удовлетворяют условию aik = аы (^ = 1,2,... , га; к = 1, 2,... , га), то указанная матрица называется симметричной. ) Все приводимые здесь определения и утверждения можно найти, на- например, в книге: Ильин В.А., Позняк Э.Г. Линейная алгебра. — М.: Наука, 1978. 2) Дж. Сильвестр — английский математик A814-1897).
ЛОКАЛЬНЫЙ ЭКСТРЕМУМ 535 Назовем главными минорами симметричной матрицы A4.72) следующие определители: А\ = аи, А2 = аи аи «21 «22 А-т — ац аи «13 «21 «22 «23 «31 «32 «33 «11 «12 • «21 «22 • «2 «ml «m2 • • • «тгл Критерии Сильвестра формулируется в виде следующих двух утверждений: 1°. Для того чтобы квадратичная форма A4.71) с сим- симметричной матрицей A4.72) являлась положительно опреде- определенной, необходимо и достаточно, чтобы все главные миноры матрицы A4.72) были положительны, т. е. чтобы были спра- справедливы неравенства Ai >0, А2 > О, ... , Ат > 0. 2°. Для того чтобы квадратичная форма A4.71) с симмет- симметричной матрицей A4.72) являлась отрицательно определен- определенной, необходимо и достаточно, чтобы знаки главных миноров матрицы A4.72) чередовались, причем знак А\ был отрицате- отрицателен, т. е. чтобы были справедливы неравенства Аг < 0, А2 > 0, А3 < 0, А4 > 0,... Теперь мы подготовлены к тому, чтобы сформулировать и доказать теорему, устанавливающую достаточные условия ло- локального экстремума. Теорема 14--16. Пусть функция т переменных и = f(M) = = /(ж1,Ж2,... ,жт) один раз дифференцируема в некоторой окрестности точки Mq{xi1x2i ... , жт) и два раза дифференци- дифференцируема в самой точке М®. Пусть, кроме того, точка Mq являет- является точкой возможного экстремума функции и = /(М), т. е. Ли\мо = 0. Тогда, если второй дифференциал A4.69), A4.70) представляет собой положительно определенную (отрица- (отрицательно определенную) квадратичную форму от переменных dxi, dx2l ... , dxmi то функция и = f(M) имеет в точке Mq локальный минимум (локальный максимум). Если же второй дифференциал A4.69), A4.70) представляет собой знакопере- знакопеременную квадратичную форму, то функция и = f(M) не имеет локального экстремума в точке Mq.
536 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Доказательство. Докажем сначала первую часть тео™ ремы, предполагая, ради определенности, что второй дифферен™ циал A4.69), A4.70) представляет собой положительно опреде- определенную квадратичную форму от переменных dx\, dx2^... , dxm. Докажем, что в этом случае функция и = f(M) имеет в точке Мо локальный минимум. Разложим функцию и = f(M) в окрестности точки М® по формуле Тейлора с остаточным членом в форме Пеано, беря в этой формуле п = 21). Мы получим при этом, что ДМ) - /(Мо) = <*« | +± сРи\ + о(р2), A4.73) причем в равенстве A4.73) дифференциалы dxk переменных ж&, входящие в выражения для du\M0 и сРи\м0] равны соответствую- соответствующим приращениям (х^ — х^) этих переменных, а величина р равна р = y/(dXlJ + (dx2J i^ хгJ + (х2- х2J + ... + (хт- хтJ. A4.74) По условию теоремы точка Мо является точкой возможно- возможного экстремума. Поэтому на основании результатов предыдущего пункта du\M0 — 0. Учитывая это равенство и полагая в выраже- о ниях A4.69), A4.70) для второго дифференциала dx^ = х^ ж^, мы придадим формуле Тейлора A4.73) следующий вид: f(M) ^ /(Мо) = f XM>**te- х{)(хк- °хк)+о(р2). A4.75) г=1 к=1 Достаточно доказать, что для всех достаточно малых р пра- правая часть A4.75) положительна. (Это и будет означать, что в до- достаточно малой окрестности точки Mq разность f(M) — /(Мо) положительна, т. е. функция и = f(M) имеет в точке М® ло- локальный минимум.) Положим hi = — -, где г = 1,2,..., т. Тогда из выражения A4.74) для р вытекают следующие соотношения: N ^ 1, hl + hl + ... + hll = l. A4.76) ) Для функции и = f(M) выполнены при п = 2 все условия теоремы 14.15* (см. п. 4 § 5 этой главы).
§ 6 ЛОКАЛЬНЫЙ ЭКСТРЕМУМ 537 С помощью ьведенных обозначений равенство A4.75) может быть переписано в виде ДМ) - ДМо) = ^ Yl J2 a^hk + о(А A475*) г=1 к=1 Отношение *% ' представляет собой бесконечно малую при Р р —>• 0 (или при Ж —>• Mq) функцию, которую мы обозначим а(р). Введение этой функции позволяет нам записать равенство о(р2) = р2-о(р), с помощью которого мы придадим соотношению A4.75*) вид: 2 ^^~ikhihk + a{p) i=l k=l A4,75 **> Теперь уже нетрудно доказать, что правая часть A4.75**) является положительной для всех достаточно малых р. Квадра™ т т тичная форма Ф = Yl J2 aikhihk представляет собой функцию, г=1к=1 определенную и непрерывную на поверхности единичной сфе- сферы A4.76), представляющей собой замкнутое и ограниченное множество. По второй теореме Вейерштрасса (см. теорему 14.7 из п. 2 § 3 гл. 14) эта функция достигает на указанном мно- множестве своей точной нижней грани /i, причем из положитель- положительной определенности квадратичной формы A4.71) и из того, что /ii,/i2,-.. jhmi удовлетворяющие соотношению A4.76), не рав- равны одновременно нулю, вытекает, что указанная точная нижняя грань /л строго положительна. Так как бесконечно малая при р —>• 0 функция а{р) при всех достаточно малых р удовлетворяет неравенству |«(р)| < /i, то вся правая часть A4.75) является положительной при всех до- достаточно малых р, т. е. при всех Ж, достаточно близких к Mq. Это и означает, что функция и = f(M) имеет в точке Mq локальный минимум. Совершенно аналогично доказывается, что в случае, ко™ гда второй дифференциал A4.69), A4.70) представляет собой отрицательно определенную квадратичную форму, функция u = f(M) имеет в точке Mq локальный максимум. Докажем теперь вторую часть теоремы, т. е. докажем, что в случае, когда второй дифференциал A4.69), A4.70) пред- представляет собой знакопеременную квадратичную форму, функ- функция и = f(M) не имеет локального экстремума в точке Mq. Прежде всего установим следующее вспомогательное свой- свойство знакопеременной квадратичной формы A4.71).
538 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Если квадратичная форма Ф(/&1, Л>25 • • • -,hm) знакоперемен- не, то найдутся две совокупности переменных (/&]_, /i2, ... , hfm) и (h!{, Щ,... , /iJ™) такие^ что (КJ + (^J +... + (О2 = 1, ДоJ + {titf + ... + (СJ = 1, A4.77) причем Ф(Н[,Н'2, ...,h'm)> 0, Ф(к'{, hi... , С) < 0. A4.78) В самом деле, в силу определения знакопеременной ква™ дратичной формы найдутся две совокупности аргументов (t'l51;2,... , t^) и (t;/, ?2, • • • 7 ^ш)? состоящие из чисел, одновремен- одновременно не равных нулю, и такие, что 0. A4.79) Положив A480) и учитывая, что из определения A4.71) квадратичной формы сразу же вытекает, что мы получим (в силу A4.79)) неравенства A4.78), причем из со- соотношений A4.80) сразу же вытекают равенства A4.77). Вспомогательное свойство знакопеременной квадратичной формы доказано. Возвратимся теперь к доказательству второй части теоремы. Зафиксируем две совокупности переменных (/г^,/г2,... ,hrm) и (h!{, /i2, ..., /&^J, удовлетворяющие соотношениям A4.77) и A4.78), и дока^кем, что для любого р > 0 найдутся две точки Mf(x[, х'2,... , хгт) и М//(ж/1/, ж2,... , ж^) пространства ??w такие, что ^(М^Мо) = р(М;/,М0) = р, причем ^ < = 1? 2j... , т. A4.81) В самом деле, положив для любого р > 0 и для каждого номера г (г = 1, 2,... , га) ж^ = ^ + ph'^ x'l =Xi + ph",
ЛОКАЛЬНЫЙ ЭКСТРЕМУМ 539 мы удовлетворим соотношениям A4.81), причем в силу равенств A4.77) будут справедливы равенства: р(М',М0) = р(М/;,М0) = - xi? + D- Х2? + ¦¦¦ + «- хту = = р IJ (hffJ = Р- Теперь уже нетрудно убедиться в том, что для случая, когда второй дифференциал A4.69), A4.70) представляет собой знако- знакопеременную квадратичную форму, функция и = f(M) не имеет экстремума в точке Mq. Записывая для функции и = f(M) разложение в окрестности точки Mq по формуле Тейлора с остаточным членом в форме Пеано и беря это разложение в указанных выше точках М1 и М11', мы получим вместо A4.75) следующие два разложения: f(Mf) - /(Mo) = f г=1 к=1 ), A4.82) f(M") - /(Мо) = \ Y, Е а*№~ xi)W~ xk) + о(Р2), A4.83) г=1 к=1 справедливые для всех достаточно малых р > 0. Подставляя в эти разложения значения {х\— х\) и (х"— Xj) из равенств A4.81) и учитывая, что о(р2) = р2 -а(р), где сх(р) —>• 0 при р^О, мы придадим разлолсениям A4.82) и A4.83) следую™ щий вид: г=1 к=1 т т г=1 /с=1 Последние два соотношения можно также переписать в виде: f(M')-f(Mo)=p2[±$(ti1,ti2,...,tim) + f(M") - /(Мо) = р2 [|Ф(Л?, Л'2', ¦ ¦ ¦ , С) + A4.82*; A4-83*;
540 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Учитывая соотношения A4.78) и тот факт, что величины Ф(/ь'15 h!2, • • • , h'm) > 0 и Ф (/&'/, Ы2,... , h'm) < 0 не зависят от р и вспоминая, что р = p(M;,Mq) = p(M/f1MoI мы получим из со- соотношений A4.82*) и A4.83*), что для как угодно малого р > 0 справедливы неравенства f(Mf) > /(Mo) и f(M") < /(Mo), ко- которые и доказывают отсутствие экстремума в точке Mq. Теорема 14.16 полностью доказана. Замечание 1. Если второй дифференциал два раза дифференцируемой в данной точке возможного экстремума Mq функции и = /(М) представляет собой в этой точке квазизнако- определенную квадратичную форму, то нельзя сказать ничего определенного о наличии или отсутствии в этой точке локаль- локального экстремума. Так, например, у каждой из двух функций щ = ж3 + у3 и U2 = ж4 + у4 второй дифференциал в точке возможного экс- экстремума Мо(О, 0) тождественно равен нулю (т. е. представляет собой квазизнакоопределенную квадратичную форму), но толь™ ко одна вторая из указанных двух функций имеет в этой точке локальный экстремум. Для решения вопроса о локальном экстремуме для случая, когда второй дифференциал представляет собой квазизнако- квазизнакоопределенную квадратичную форму, следует привлечь диффе- дифференциалы более высоких порядков, но это выходит за рамки дан- данного курса. Замечание 2. Требование сРи\м0 ^ 0 (соответственно с12и\м0 ^ 0) является необходимым условием локального ми~ нимума (максимума) в точке Mq дважды дифференцируемой в этой точке функции и = /(М). В самом деле, пусть, ради определенности, u = f(M) имеет в точке Mq локальный минимум, но условие сРи\м0 ^ 0 не вы- выполнено. Тогда найдутся /ii, /^2? - - - •> hm такие, что i=l k=l о о о Рассмотрим функцию F(t) = f(%\ +thi^x2 +t/i2,... , #m +thm), заведомо определенную при всех t, достаточно малых по моду- модулю. Функция F(t) обязана иметь локальный минимум в точке t = 0, чему противоречит условие F"@) = d2u\Mo < 0. 3. Случай функции двух переменных. На практике ча™ сто встречается задача об экстремуме функции двух перемен™
§ 6 ЛОКАЛЬНЫЙ ЭКСТРЕМУМ 541 ных и = /(ж,у). В этом пункте мы приведем результаты, отыо еящиеся к этому случаю. Обозначим частные производные -—г, о _ , -—г в некоторой дх2 дхду ду2 о о точке Мо(х,у) символами ац, a\2i «22 соответственно. Справед- Справедливо следующее утверждение. Пусть функция двух переменных и = /(ж, у) одгш раз сЬдб- о о ференцируема в окрестности точки М®(х1у) и два раза диф- дифференцируема в самой точке М® и пусть М® является точкой возможного экстремума. Тогда^ если в точке М® выполнено условие аца22 — ai2 ^ 0? то функция u = f(x,y) имеет в этой точке локальный экстремум (максимум при ац < 0 и минимум при ац > 0). Если же в точке М® аи«22 ~~ tti2 < 0, то функция u = f(x,y) не имеет в этой точке локального экстремума1). Доказательство. Справедливость первой части сформулированного утверждения непосредственно вытекает из теоремы 14.16 и критерия Сильвестра знакоопределенности ква- квадратичной формы, ибо Аг = ац, А2 = «21 «22 Докажем вторую часть утверждения. Итак, пусть в точке М® справедливо неравенство аца22 — «12 < 0- Докажем, что в этом случае второй дифференциал d2u в точке М® представляет собой знакопеременную форму. Рассмотрим сначала случай «11 ф 0. Используя введенные выше обозначения р= получим следующее выражение для второго дифференциала: 2 2 d2u\Mo = Р2 ^2 ^2 aikhihk = Р2{ацк\ + 2auh1h2 1 [( ) O «11 «12 Легко проверить, что при hi = 1, h2 = 0 и при h\ = 1 + ai 2 h2 = Qn =2) дифференциал A2и\м0 имеет разные знаки, 1) Случай ацО22 — «12 = 0 требует дополнительного исследования. ) При этом р может быть как угодно малой величиной. Условие h\-\-h2 = = 1 выполнено.
542 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 т. е. является знакопеременной формой, и поэтому, согласно те™ ореме 14.16, функция не имеет в точке Mq локального экстре- экстремума. Рассмотрим теперь случай ац = 0. Тогда из условия аца22 — — а\2 < 0 вытекает, что а\2 ф 0. Следовательно, из написанного выше выражения для сРи\м0 получится d2u\Mo = p2h2{2al2hl + a22h2). A4.84) Пусть h\ ф 0 и величина h2 столь мала (из условия h\ + /г| = 1 следует, что такой выбор h\ и h2 возможен), что выражение {2a\2h\ + a22h2) сохраняет знак величины 2ai2h\. Тогда из фор- формулы A4.84) вытекает, что сРи\м0 имеет разные знаки при h2>0 и h2 < 0, т. е. функция и = /(ж, у) не имеет локального экстре™ мума в точке Mq. Утверждение полностью доказано. 4. Примеры исследования функции на экстремум. 1) Найти точки локального экстремума функции т переменных и = Хх\ + х\ + ... + х2т + 2х2 + ... + 2хт, A4.85) где А — отличное от нуля вещественное число. Для отыскания точек возможного экстремума получаем сле- следующие уравнения: A4.86) Из уравнений A4.86) заключаем, что единственной точкой возможного экстремума является точка Mq@, — 1,... , — 1). Чтобы исследовать функцию A4.85) в этой точке Mq с помо- помощью достаточных условий экстремума, вычислим второй диф- дифференциал d2u\Mo = 2\{dxlf + 2{dx2f + ... + 2{dxmf* A4.87) Очевидно, что при А > 0 все значения второго дифференци- дифференциала A4.87) при dxi, dx2i ... , dxmi одновременно не равных ну- нулю, являются строго положительными, т. е. при А > 0 второй дифференциал A4.87) представляет собой положительно опре- определенную квадратичную форму. Поэтому при А > 0 функция A4.85) имеет в точке Mq@, —15... 5 —1) локальный минимум. При А < 0 второй дифференциал A4.87) положителен при dx\ = 0, ... , dxm—\ = 0, dxm = 1 и отрицателен при dx\ = 1, dx2 = 0, ..., dxm = 0. Это означает, что при А < 0 второй диф™ ференциал A4.87) представляет собой знакопеременную квадра- квадратичную форму. Поэтому при А < 0 функция A4.85) не имеет в точке Мо(О, —1,... , —1) локального экстремума.
ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 543 2) На плоскости даны п точек Мк(ак^ЬкI к = 1,2,... , п, в которых сосредоточены массы т^ > 0. Требуется найти на этой плоскости точку Мо(жо,уо) такую, относительно которой момент инерции указанной системы материальных точек явля™ ется минимальным. Так как момент инерции указанной системы материальных точек относительно точки М{х1у) равен к=1 то задача сводится к отысканию точки Мо(#(ьУо)? в которой функция A4.88) достигает своего минимального значения. Для отыскания точек возможного экстремума функции A4.88) получаем следующие уравнения: п п fx = 2 J2 тк(х - ак) = 0, f = 2 J^ тк(у - Ьк) = 0. A4.89) к=\ к=\ Из уравнений A4.89) заключаем, что единственной точ- точкой возможного экстремума функции A4.88) является точка Мо(ж(ьУо)? к00РДинать1 которой равны _ гц + 22 + ... + тпап _ т\Ь\ + Ш2&2 + • • • + тпЪп mi+m2+ +m ' m A4.90) Так как аи = — = 2^тк > 0, а12 = ^ = 0, а22 = — = п к=1 = 2\^тк > 0, то ац«22 ~ tti2 > 0, и согласно утверждению, к=1 доказанному в п. 3, функция A4.88) имеет локальный минимум в точке Мо(ж(),уо) с к00РДинатами A4.90). Легко убедиться, что значение /(ж, у) в этой точке является минимальным. Заметим в заключение, что формулы A4.90) определяют координаты цен- центра тяжести рассматриваемой системы материальных точек. § 7. Градиентный метод поиска экстремума сильно выпуклой функции В этом параграфе излагается теория широко применяемого на практике градиентного метода поиска экстремума сильно вы- выпуклой функции. Идея этого метода чрезвычайно проста. Для приближенно- приближенного отыскания точки минимума функции т переменных исполь- используется тот факт, что градиент этой функции имеет направ™ ление, совпадающее с направлением наибольшего возрастания
544 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 этой функции. Стало быть, вектор — grad/(#o) в каждой точке о о о xq = {х\1Х21... ,жто) направлен в сторону наибольшего убыва- убывания функции /(ж) = /(жх,Ж2, • • • ,хт). Это дает основание ожи- ожидать, что если, отправляясь от некоторого нулевого приближе™ ния xq = (Ж!,ж2,... , жш), мы построим к-е приближение х^ = = (ж1, ж2,... , жт) по рекуррентной формуле #fc+i =хк- agradf(xk), то при достаточно малом положительном а последовательность точек {х^} сойдется к точке минимума функции f(x). Строгой реализации этой простой идеи и посвящен настоя- настоящий параграф. 1. Выпуклые множества и выпуклые функции. Пусть 11 1 2 2 2 xi = (жьж2,... ,жт) и х2 = (жьж2,... ,жт) — две точки га- мерного евклидова пространства Ет, которые мы можем рас- рассматривать как векторы в ??w с соответствующими координата- координатами. Назовем отрезком, соединяющим точки х\ и ж2, множе™ ство точек пространства 1?ш вида жх + t(x2 — жх), где t — любое число из сегмента 0 ^ t ^ 1. Будем обозначать отрезок, соединяющий точки х\ и ж2, сим- символом Х\Х2- Определение 1. Множество Q точек пространства Ет называется в ы п у к л ы м, если оно обладает следующим свойством: каковы бы ни были две точки х\ и ж2, принадле- принадлежащие множеству Q, отрезок жхж2, их соединяющий^ также принадлежит этому множеству. Примером выпуклого множества в пространстве Ет может служить т™мерный шар (безразлично, открытый или замкну™ тый) или полупространство хт ^0 (т. е. мнолсество всех точек (#1, #2,... ^ хт) пространства Ет, гтг-я координата которых удо- удовлетворяет условию хт ^ 0). Примером мнолсества Q, не являющегося выпуклым, может служить дополнение га-мерного шара или га-мерный шар, из которого удалена хотя бы одна точка. Пусть Q — некоторое множество точек пространства Ет1 а х — любая фиксированная точка этого пространства. Назовем расстоянием от точки х до множества Q точную нижнюю грань расстояний от точки х до всевозможных точек этого множества. Будем обозначать расстояние от точки х до множества Q символом p{x^Q).
ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 545 Итак, по определению p{x,Q) = inf р(х,у). Для любого множества Q пространства Ет и любой точки х этого пространства существует расстояние p(x,Q) 1). В частно- частности, если точка х принадлежит множеству Q, то р(ж, Q) = 0. Однако у множества Q не всегда существует точка у такая, что р(х,у) = p(x,Q). Так, например, если множество Q представляет откры- открытый т^мерный шар, а х — точка Ет1 лежащая вне этого шара, то у такого множества Q не существует точки у такой, что р(ж, у) = р(ж, Q) (ибо для всех точек у открытого шара Q справедливо неравенство р(х^у) > p(x,Q)). Если все же у множества Q существует точка у такая, что р(х,у) = р(ж, Q), то эта точка у называется проекцией точки х на множество Q. Проекцию точки х на множество Q будем обозначать симво- символом Pq(x). Подчеркнем, что если точка х принадлежит множеству Q, то Pq(x) = ж. Итак, проекция Pq(x) точки х на множество Q определяется соотношением p(x,PQ(x)) = p(x,Q) = Inf p(x,y). Полезно отметить, что молсет существовать несколько проек- проекций точки х на множество Q. Так, например, если Q — т^мерная сфера с центром в точке ж, то любая точка Q является проек- проекцией точки х на множество Q. Справедлива, однако, следующая лемма. Лемма 1. Если множество Q пространства Ет является выпуклым и замкнутым^ а х — любая точка Ет^ то суще- существует и притом единственная проекция точки х на множе- множество Q. Доказательство. Сначала докажем существова- существование хотя бы одной проекции точки х на множество Q. Обозначим р(ж, Q) расстояние от точки х до множества Q. По определению р(ж, Q) как точной нижней грани inf р(ж, у) най- дется последовательность {уп} точек множества Q такая, что р(х,уп) -+ p(x,Q). По определению предела числовой последовательности для любого е > 0 все элементы ynj начиная с некоторого номера, ) Ибо множество р(х,у) для всевозможных г/, принадлежащих Q, всегда ограничено снизу (например, числом нуль). 18 В.А. Ильин, Э.Г. Позняк, часть I
546 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 удовлетворяют соотношению р(х, Q) - е < р(х, уп) < р(х, Q) + е. Отсюда следует, что последовательность {уп} точек простран- пространства Ет во всяком случае является ограниченной и потому в си- силу теоремы Больцано-Вейерштрасса (см. п. 2 § 2 гл. 14) из этой последовательности можно выделить сходящуюся подпоследо- подпоследовательность {укп}-) гДе п = 1,2,... Обозначим через у предел подпоследовательности {укп}. В силу замкнутости множества Q точка у принадлежит этому множеству. Остается доказать, что р(х,у) = p(x,Q) = lim р{х,укп). Заметим, что в силу неравенств треугольника р(х^укп) ^ ^ р(х,у) + р{у,Укп) и р(х,у) ^ р(х,укп) + р(укп,у) справедливо соотношение \р(х,укп) — р(х,у)\ ^ р(у^укп). Из этого соотноше- соотношения и из сходимости подпоследовательности {укп } к у вытекает, что lim (ж, укп) = р{х, у), т. е. р(х, Q) = р(х, у). тг>оо Тем самым доказательство существования хотя бы одной про- проекции точки х на множество Q завершено. Докажем теперь, что существует только одна про- проекция точки х на множество Q. Предположим, что существуют две различные проекции у\ и у 2 точки х на множество Q. Так как множество Q является выпуклым, то весь отрезок у\У2-> соединяющий точки у\ и|/25 принадлежит множеству Q. В част- частности, множеству Q принадле^кит середина ——— указанного отрезка. Убедимся в том, что расстояние plx, ——— ) от точ- точки х до указанной середины отрезка у\У2 строго меньше рас- расстояния р(х,у\) = р(х,У2). Исключим из рассмотрения тривиальный случай, когда и = х. Б этом случае р\ ж, 1 = 0, в то время как p(x,yi) = р(х,у2) > 0, ибо иначе (т. е. в случае равенства р{х^у\) = р{х,у2) = 0) обе точки у\ и у2 совпадали бы с ж и не могли быть различными. Итак, в тривиальном случае yi у>2 = х неравенство р(х, ^у^) < Р& У1) = <°(ж> У2) A4-91) очевидно. Докажем теперь неравенство A4.91) в случае, когда ф фх.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 547 Используя свойства скалярного произведения двух векторов пространства Ет х), мы получим соотношение п2 ( Ш±Ш\ _ fyi +У2 _ У1 +|/2 _ \ _ р V ' ~2~) " V^^ ' ^^ У " -X У2-Х У1 -X -[(yi - ж, |/1 - ж) + 2(i/i - ж, |/2 - х) + (у2 ~х,у2- х)]. A4.92) Убедимся теперь в справедливости строгого неравенства -ж,2/2 -х). A4.93) Для этого воспользуемся тем, что для любых векторов аи b пространства Ет, не коллинеарных друг другу (т. е. таких, что а ф ЛЬ ни для одного вещественного Л), справедливо строгое неравенство Коши^Буняковского 2) Это означает, что для доказательства неравенства A4.93) нам достаточно убедиться в том, что векторы у\ ^х и У2^% не колли™ неарны, т. е. убедиться в том, что ни для одного вещественного Л не может быть справедливо равенство У1-х = Х(у2-х). A4.94) Если бы равенство A4.94) было справедливо для такого Л, для которого |Л| ф 1, то было бы невозможно равенство р(уъх) = р(у2,х). Справедливость равенства A4.94) для Л = +1 противоречила бы тому, что точки yi и г/2 являются различными. Наконец, справедливость равенства A4.94) для А = — 1 озна- чала бы, что = ж, а этот случаи мы исключили. Итак, равенство A4.94) не справедливо ни для одного веще- вещественного Л, а потому доказательство неравенства A4.93) завер- завершено. 1) См., например, § 1 гл. 4 книги В.А. Ильина и Э.Г. Позняка «Линейная алгебра», Изд-во «Наука», 1978. 2) В самом деле, при а ф ЛЬ вектор (а — ЛЬ) не является нулевым. По- Поэтому квадратный трехчлен (а — ЛЬ, а — ЛЬ) = (а, а) — 2Л(а, Ь) + Л (b, b) строго положителен и его дискриминант 4[(а, Ь) — (а, а) • (b, b)] строго от- отрицателен. 18*
548 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Сопоставляя равенство A4.92) с неравенством A4.93), полу™ чим, что -[(yi - ж, |/1 - ж) + (У2 - Ж, У2 - ^)] = - [ V (У1 - Ж, |/1 - Ж = -[p(a;,yi) + р( Тем самым доказательство неравенства A4.91) завершено. Но это неравенство означает, что у множества Q нашлась точка ———, более близкая к ж, чем точки у\ и у21 а это противоречит тому, что каждая из точек у\ и у2 является проекцией точки ж на множество Q, т. е. является точной нижней гранью расстояния р(х,у) для всевозможных у, принадлежащих Q. Полученное противоречие показывает, что предположение о том, что существуют две различные проекции у\ и у2 точки х на множество Q, является ошибочным. Доказательство леммы 1 полностью завершено. Перейдем теперь к определению выпуклой функции. Определение 2. Функция /(ж), заданная на выпуклом мно- эюестве Q пространства Ет, называется выпуклой вниз или просто выпуклой на этом множестве^ если для лю- любых двух точек х\ и Х2 множества Q и для любого веществен- вещественного числа t из сегмента 0 ^ t ^ 1 справедливо неравенство f[x2 + t(x2 - Xl)] < f(Xl) + t[f(x2) - /(Ж1)]. A4.95) Определение З. Функция /(ж), заданная на выпуклом мно- эюестве Q пространства Ет1 называется строго вы- выпуклой на этом множестве^ если для любых двух точек х\ и Х2 множества Q и для любого вещественного числа t из интервала 0 < t < 1 справедливо строгое неравенство f[x2 + t(x2 - Xl)] < /On) + t[f(x2) - f(Xl)]. A4.96) Ясно, что всякая строго выпуклая на множестве Q функция /(ж) является выпуклой на этом множестве. Легко установить достаточное условие выпуклости (соответ- (соответственно строгой выпуклости) дважды дифференцируемой на выпуклом множестве Q функции /(ж). Всюду в дальнейшем мы будем предполагать, что множе™ ство Q имеет хотя бы одну внутреннюю точку.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 549 Лемма 2. Пусть функция f(x) задана и два раза диффе- дифференцируема на выпуклом множестве Q. Тогда для того^ что- чтобы эта функция являлась выпуклой (строго выпуклой) на мно- множестве Q, достаточно, чтобы второй дифференциал d f этой функции во всех точках Q являлся квазиположительно опре- определенной (строго положительно определенной) квадратичной формой. Доказательство. Пусть х\ и Х2 — любые две фиксированные точки множества Q. Рассмотрим на сегменте О ^ t ^ 1 следующую функцию одной независимой переменной t: F(t) = f[Xl + t(x2 - хг)] - f(Xl) - t[f(x2) - f(Xl)l A497) Напомним, что второй дифференциал d2f функции f(x) = = /(#i, #2, • • • i хт) т независимых переменных х\, x2l... , хт в данной точке х = (#i, #2? • • • 5 хт) равен 1) ^ki A498) г=1 к=1 Дифференцируя функцию A4.97) два раза по t по правилу дифференцирования сложной функции, получим mm = Е Е оЫ^[Х1+t{X2"Xl)] (Xi ~Xi) (Хк ~ К A4.99) 11 1 2 2 2 где (#i, #2, • • • 5 жш) и (Ж15 Ж25 • • • ^ жш) — координаты точек х\ и ^2 соответственно. Сопоставляя соотношения A4.98) и A4.99), мы убедимся в справедливости равенства F"(t) = d2f[Xl + t(x2 - хг)Ъ A4.100) где в выралсении для d2 / приращения Аж^ взяты равными 2 1 Ж, - Хг. Дальнейшие рассуждения, ради определенности, проведем для случая, когда второй дифференциал d2f во всех точках Q является квазиположительно определенной квадратичной фор™ мой. В этом случае для всех t из сегмента 0 ^ t ^ 1 правая (а, стало быть, и левая) часть A4.100) неотрицательна, т. е. для всех t из сегмента 0 ^ t ^ 1 Fff(t) > 0. A4.101) г) См. п. 2 § 5 гл. 14.
550 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 В силу определения 2 и соотношения A4.97) нам достаточно доказать, что для ьсех t из сегмента 0 ^ t ^ 1 справедливо неравенство F(t) < 0. A4.102) Для доказательства неравенства A4.102) используем соотно- соотношение A4.101) и легко проверяемые равенства F@) = 0, F(l) = 0. A4.103) Предположим, что внутри сегмента 0 ^ t ^ 1 существует хотя бы одна точка t, в которой F(t) > 0. Тогда функция F(t) до- достигает своего максимального на сегменте 0 ^ t ^ 1 значения в некоторой внутренней точке to этого сегмента, причем F(to) > 0. В этой точке to функция F(t) имеет локальный максимум, а по- потому Ff(to) = 0. Но из неравенства A4.101) вытекает, что про- производная Ff(t) не убывает на всем сегменте 0 ^ t ^ 1, а потому и на сегменте to ^ t ^ 1. Отсюда и из условия i?/(to) = O сле- следует, что производная F'{t) неотрицательна всюду на сегменте to ^ t ^ 1, а поэтому функция F(t) не убывает на этом сегменте. Это приводит нас к неравенству F(l) > F(to) > 0, противоречащему второму соотношению A4.103). Полученное противоречие доказывает, что предположение о том, что на сегменте 0 ^ t ^ 1 существует хотя бы одна точка t, в которой F(t) > 0, является ошибочным, т. е. доказывает спра- справедливость всюду на сегменте 0 ^ t ^ 1 неравенства A4.102). Тем самым первая часть леммы (о выпуклости f(x) при уело™ вии, что сР / является квазиположительно определенной квадра- квадратичной формой) доказана. Вторая часть леммы (о строгой выпуклости f(x) при усло- условии, что d2 f является строго положительно определенной ква- квадратичной формой) доказывается аналогично. Исходя из нера- неравенства A4.101), справедливого на этот раз со знаком >, и из равенств A4.103) и предположив, что внутри сегмента 0 ^ t ^ 1 существует хотя бы одна точка t, в которой F(t) ^ 0, мы придем к выводу, что F(t) имеет внутри сегмента 0 ^ t ^ 1 точку ло- локального максимума to, причем F(to) ^ 0. Но тогда, поскольку Ff(t®) = 0, из A4.101) получим, что F'{t) > 0 всюду на полуин- полуинтервале to < t ^ 1, а это означает, что F(l) > F(to) ^ 0. Мы снова получаем противоречие со вторым соотношением A4.103), которое доказывает, что F(t) < 0 всюду на интервале 0 < t < 1, т. е. доказывает строгую выпуклость f(x) на множе™ стве Q.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 551 Лемма 2 полностью доказана. Доказанная лемма естественно наводит на мысль о рассмо- рассмотрении следующего еще более узкого класса выпуклых на вы™ пуклом множестве Q и два раза дифференцируемых на этом множестве функций. Определение ^. Два раза дифференцируемая на выпуклом множестве Q функция }'{х) называется сильно выпук- выпуклой на этом множестве^ если существуют такие две по- положительные постоянные к\ и &2, что второй дифференциал d2f этой функции^ определяемый соотношением A4.98), во всех точках х множества Q удовлетворяет неравенствам fci • (АхJ ^ d2f ^ k2 • (АхJ. A4.104) (В этих неравенствах через Ах обозначен вектор с координата- координатами (Аж1, Аж2,... , Ажш), а символ (АхJ обозначает скалярный квадрат этого вектора.) Из левого неравенства A4.104) сразу же вытекает, что вто- второй дифференциал сильно выпуклой функции представляет со- собой строго положительно определенную во всех точках множе- множества Q функцию, а потому (в силу леммы 2) сильно выпуклая на множестве Q функция заведомо является строго выпуклой на этом множестве. Вместе с тем класс сильно выпуклых функций достаточно широк и важен в прикладных задачах, и мы ограничимся этим классом при изложении теории градиентного метода поиска ми™ нимума. Начнем с выяснения вопроса о существовании и о единствен™ ности минимума. 2. Существование минимума у сильно выпуклой функции и единственность минимума у строго выпук- выпуклой функции. Пусть функция f(x) определена на выпуклом множестве Q. Будем говорить, что эта функция имеет в точке х® множества Q локальный минимум, если существует такая ^-окрестность этой точки жо, чт0 значение f(x®) является наименьшим среди значений f(x) этой функции во всех точках пересечения ^-окрестности х® и множества Q. При таком определении понятие локального минимума вклю- чает в себя и точки краевого минимума функции f(x) на гра- границе множества Q. Таким образом, при данном нами определении можно под™ разделить точки минимума на точки внутреннего локального минимума (для случая, когда эти точки являются внутренними точками Q) и точки краевого локального минимума (для случая, когда эти точки являются граничными точками Q).
552 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Для изучения вопроса о существовании и единственности точки локального минимума нам понадобится следующая вспо- вспомогательная теорема. Лемма 3. Пусть на выпуклом множестве Q задана диф- дифференцируемая выпуклая функция f(x). Для того чтобы эта функция имела локальный минимум в точке х® множества Q, необходимо и достаточно, чтобы для любого вектора Дж, для которого точка х® + Ах принадлежит множеству Q, было справедливо неравенство1) (grad/(xo),Ax)>a A4.105) Доказательство. 1) Необходимость. В силу утверждения, доказанного в п. 6 § 4 гл. 14, левая часть A4.105) равна произведению производной функции f(x) в точке х® по направлению вектора Ах на длину \Ах\ этого вектора: (grad/Ы, Дя) = ^(хо)\Ах\, A4.106) где е = —— — единичный вектор в направлении Ах. Ах Так как х® является точкой локального минимума функции /(ж), то производная -^-(xq) по любому направлению е = —^т неотрицательна (точнее, равна нулю в случае, если х® — точка внутреннего локального экстремума, и неотрицательна в случае, если х® — точка краевого локального экстремума). Итак, правая часть A4.106) (а потому и левая часть A4.105)) неотрицательна. Необходимость доказана. 2) Достаточность. Пусть для любого вектора Дж, для которого точка жо + Аж принадлежит QJ справедливо неравен- неравенство A4.105). Докажем, что точка х® является точкой локаль- локального минимума функции /(ж). Так как функция /(ж) по условию является выпуклой на мно- множестве Q, то для любых двух точек х\ и Ж2 этого множества и любого числа t из сегмента 0 ^ t ^ 1 справедливо неравенство A4.95). Полагая в этом неравенстве х\ = жо, Ж2 = жо + Аж, мож- можно переписать это неравенство в виде f(x0 + Ах) - /Ы > /(*° + *А*)-/(*°). A4.107) Считая жо и Аж фиксированными, перейдем в неравенстве A4.107) к пределу при t —^ 0 + 0. По определению производ- производной по направлению (см. п. 6 § 4 гл. 14) предел при t —^ 0 + 0 г) В неравенстве A4.105) берется скалярное произведение векторов grad/(a;o) и Аж. Определение grad/(a;o) см. в п. 6 § 4 гл. 14.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 553 правой части A4.107) в точности равен произведению, стоящему в правой части A4.106). Поэтому в силу соотношений A4.105) и A4.106) этот предел неотрицателен. Учитывая, что левая часть A4.107) не зависит от t, мы получим в пределе при t —> 0 + 0 из неравенства A4.107), что Последнее неравенство, справедливое для любого вектора Аж, для которого точка х® + Ах принадлежит Q, доказывает, что функция f(x) имеет в точке х® локальный минимум. Достаточ™ ность доказана. Лемма 3 полностью доказана. Замечание 1. Из приведенного нами доказательства очевидно, что для случая, когда точка х® является внутрен- внутренней точкой множества Q, т. е. когда речь идет о внутреннем локальном минимуме, в формулировке леммы 3 знак ^ в нера™ венстве A4.105) можно заменить на знак =. Замечание 2. При доказательстве необходимости леммы 3 мы не использовали требования выпуклости функции f(x). Поэтому доказательство необходимости проходит без тре- требования выпуклости функции f(x). Иными словами, справедли™ во следующее утверждение: если функция f(x) диф- дифференцируема на выпуклом множестве Q и имеет локальный минимум во внутренней (в граничной) точке х® этого множе- ства^ то для любого вектора Дж, для которого точка х® + Ах принадлежит Q, справедливо неравенство (gmdf(x®),Ax) = 0 l(gmdf(x®),Ax) > 0]. Перейдем к вопросу о единственности и о существовании точ- точки локального минимума. Теорема (о единственности локального минимума у строго выпуклой функции). Если функция f(x) дифферен- дифференцируема и строго выпукла на выпуклом множестве Q, то она может иметь локальный минимум только в одной точке это- этого множества. Доказательство. Предположим, что функция f(x) имеет локальный минимум в двух различных точках х\ и Х2 множества Q. Тогда условие выпуклости A4.95) для точек х\ и Х2 молено записать в виде /Ы - /On) > Л*1+*(**-*0]-/(*1) A4.108) (здесь t — любое число из сегмента 0 ^ t ^ 1). Меняя в соотношении A4.108) точки х\ и Х2 ролями, мы по- получим неравенство /(*i) - /0*2) > /N + ^-*2)]-/D A4.109)
554 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 В пределе при t —^ 0 + 0 правая часть A4.108) (соответствен™ но правая часть A4.109)) дает производную функции f(x) по направлению вектора ж 2 — х\ (соответственно вектора х\ — х^), взятую в точке х\ (соответственно в точке x<i), умноженную на \Х2 ~ х\\- Так как обе точки х\ и Х2 являются точками локаль- локального минимума, то обе указанные производные по направлению неотрицательны, т. е. пределы правых частей A4.108) и A4.109) при t —^ 0 + 0 оба неотрицательны. Таким образом, из неравенств A4.108) и A4.109) в пределе при t —)> 0 + 0 мы получим Сопоставление последних неравенств приводит нас к заключе- заключению о том, что f(xi) = f(x2). Используя равенство f(x\) = /(#2), мы получим из условия строгой выпуклости A4.96), что f[x1+t{x2-x1)]<f{x1) A4.110) для всех t из интервала 0 < t < 1. Неравенство A4.110) противоречит тому, что функция f(x) имеет локальный минимум в точке х\ (в точке х\ + t(x2 — #i), как угодно близкой при малом t к точке жх, функция f(x) имеет значение, меньшее значения f(xi)). Полученное противоречие доказывает, что наше предположе- предположение о том, что функция f(x) имеет локальный минимум в двух различных точках множества Q, является ошибочным. Теорема доказана. Существование локального минимума докажем при более сильных ограничениях, чем единственность. Теорема (о существовании локального минимума у сильно выпуклой функции). Если функция f(x) сильно вы- выпукла на замкнутом выпуклом множестве Q, то у этой функции существует на множестве Q точка х® локального минимума1). Доказательство. Сначала отметим, что теорема заве- заведомо справедлива для случая, когда выпуклое замкнутое мно- множество Q является, кроме того, ограниченным. Тогда по второй теореме Вейерштрасса (см. теорему 14.7) функция /(ж), будучи во всяком случае непрерывной на множестве Q, достига- достигает в некоторой точке х® этого множества своего минимального на Q значения. Указанная точка х® и является точкой локаль- локального минимума. ) Так как сильно выпуклая на выпуклом множестве Q функция f(x) является строго выпуклой на этом множестве, то по предыдущей теореме точка жо будет единственной точкой локального минимума.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 555 Остается доказать теорему в случае, когда выпуклое замкну™ тое множество Q не является ограниченным. Фиксируем некоторую внутреннюю точку х\ множества Q и раз- разложим функцию f(x) по формуле Тейлора с центром в точке х\, взяв остаточный член В,2(х) в форме Лагранжа1) (см. п. 3 § 5 гл. 14). Указанное разложение будет иметь вид f{x) = /On) + df(Xl) + \d2f[Xl + 9{x - xi)], A4.111) где в — число из интервала 0 < в < 1, так что точка xi+6(x — xi) принадлежит отрезку, соединяющему точки х\ и х 2). Если обозначить Ах вектор х — х\, то для df(x\) будет спра™ ведливо равенство: df(xi) = (grad/(xi), Ах). Из этого равенства вытекает, что |grad/(a:i)| ¦ |Aar|. A4.112) Далее, используя левое неравенство в определении сильной выпуклости A4.104), мы придем к неравенству d2f[xi + в(х - xi)] > кг - (АхJ. A4.113) Из соотношений A4.111)—A4.113) заключаем, что f(x) - f(Xl) > -\df(Xl)\ + id2/[^i + в(х - Xl)} > так что f(x)-f(Xl)^\Ax\- [|-|ДЖ|-^гаа/(Ж1)|]. A4.114) Учитывая, что точка х\ фиксирована и величина | grad /(жх) | представляет собой некоторое фиксированное число, мы заведо™ мо можем выбрать положительное число R настолько большим, чтобы при | Ах\ > R выражение в квадратных скобках в A4.114) было положительным. ) Мы учитываем, что сильно выпуклая на множестве Q функция /(ж) два раза дифференцируема на этом множестве. 2) Какова бы ни была точка х множества Q, отрезок, соединяющий точки х\ иж2, принадлежит множеству Q в силу выпуклости этого множества. В сноске к теореме Тейлора 14.15 отмечалось, что в качестве окрестности цен- центра разложения можно брать любую звездную окрестность этого центра, т. е. можно брать все множество Q.
556 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Это означает, что при |Дж| > R справедливо неравенство f(x) > /(жх), т. е. всюду вне замкнутого шара Cr радиуса R с центром в точке х\ значения f(x) превосходят значение }'(х\) (в центре указанного шара). Обозначим Qr пересечение множества Q с указанным ша- шаром Cr. Так как оба множества Q и Cr являются выпуклыми и замкнутыми, то и их пересечение Qr также является выпук- выпуклым и замкнутым. Так как, кроме того, множество Qr является ограниченным, то по доказанному выше функция /(ж) имеет на множестве Qr единственную точку xq локального минимума. Поскольку мы доказали, что во всех точках Q^ лежащих за пределами Qr, значения /(ж) превосходят /(жх), то эти значе™ ния тем более превосходят /(жо), т. е. точка xq является точкой локального минимума f(x) и на всем множестве Q. Теорема пол- полностью доказана. 3. Поиск минимума сильно выпуклой функции. Мы доказали, что сильно выпуклая функция /(ж), заданная на за™ мкнутом выпуклом множестве Q, имеет на этом множестве единственную точку х® локального минимума. Обратимся к построению и обоснованию алгоритма, с помо- помощью которого отыскивается эта точка жо- Фиксируем произвольную точку жх множества Q и произ- произвольное число о, удовлетворяющее неравенствам О < а < 2/fc2, A4.115) где &2 — постоянная из неравенства A4.104), определяющего сильную выпуклость функции f(x). Отправляясь от жх как от первого приближения, составим итерационную последовательность {х^} с помощью рекуррент- рекуррентного соотношения xk+1 = PQ{xk-ag[adf(xk)), к = 1,2,... A4.116) В настоящем пункте мы докажем следующее утверждение. Основная теорема. Пусть функция f(x) является сильно выпуклой на замкнутом выпуклом множестве Q и пусть х\ — произвольная точка множества Q. Тогда итерационная после- последовательность {ж^}, определяемая рекуррентным соотноше- соотношением A4.116) при любом о, удовлетворяющем неравенствам A4.115), сходится к точке xq локального минимума функции /и. Подчеркнем, что эта теорема дает алгоритм отыскания любо- любого (внутреннего или краевого) локального минимума функции /(ж), являющейся сильно выпуклой на произвольном (не обяза™ тельно ограниченном) замкнутом выпуклом множестве Q.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 557 Доказательству основной теоремы предпошлем четыре лем™ мы. Лемма 4' Если Q — выпуклое замкнутое множество то- точек Ет, х — произвольная фиксированная точка Ет^ а у — произвольная точка Q, то (х - PQ{x), у - Pq{x)) ^ 0. A4.117) Доказательство. Предположим, что неравенство A4.117) несправедливо. Тогда существует точка у множества Q такая, что (x-PQ(x),y-PQ(x))>0. A4.118) Из A4.118) сразу же вытекает, что точка у не совпадает с Pq(x). В силу выпуклости множества Q любая точка z = Pq(x) + + t(y — Pq(x)) отрезка, соединяющего точки Pq(x) и у, принад- принадлежит множеству Q. Вычислим расстояние между любой такой точкой z и точкой х P2(z,x) = (x- PQ(x) - t(y - PQ{x)),x- Pq(x) - t(y - Pq(x))) = = P2(x,PQ(x)) -2t(x - PQ(x),y - PQ(x)) + t2p2(y,PQ(x)). A4.119) Так как ж и у фиксированы, at — любое число из сегмента 0 ^ t ^ 1, то в силу неравенства A4.118) можно взять t удовле- удовлетворяющим неравенству r)<f< Цх - PQ(x), у - PQ(x)) ЧРП) При таком выборе t ),у - PQ[x)) + t2p2(y,PQ(x)) < 0, и мы получим из A4.119), что p2(z1x) < р2(х^Рд(х)). Послед- Последнее неравенство противоречит тому, что точка Pq(x) является проекцией точки х на множество Q: у множества Q нашлась точка z, удаленная от х меньше, чем Pq(x) от х. Полученное противоречие завершает доказательство леммы. Лемма 5. Пусть f(x) дифференцируема и выпукла на замкнутом выпуклом множестве Q. Если при некотором положительном а проекция Pq(x® — а • grad/(xo)) точки xq — — а • grad/(xo) на множество Q совпадает с точкой xq это- этого множества^ то функция f(x) имеет в точке х® локальный минимум. Доказательство. Используя лемму 4, запишем неравенство A4.117) для точек х = х® — а • grad f(x®) и у = х® +
558 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 + Дж, где Ах — любой вектор, для которого точка у = х® + Ах принадлежит Q. В результате получим (хо-а- grad/Oo) - Pq(x0 - а • grad/(z0)), х0 + Ах - Pq(x0 - а • grad/(x0))) ^ 0. Учитывая, что Pq(xq — а • grad/(xo)) = жо, получим из послед- последнего неравенства следующее соотношение: Это соотношение, справедливое для любого вектора Аж, для ко™ торого точка х® + Ах принадлежит Q, в силу леммы 3 устанав- устанавливает, что функция f(x) имеет в точке х® локальный минимум. Лемма 5 доказана. Предположим, что функция f(x) является сильно выпуклой на ограниченном замкнутом выпуклом множестве Q. Обозна- Обозначим т минимальное значение f(x) на множестве Q, a /i — число, строго большее га, так что а > т = min fix). xeQ x J Фиксируем число z/, строго большее /i, и обозначим Q под- множество тех точек х множества Q, для которых /i ^ f{x) ^ I/. A4.120) Мнолсество Q как подмножество ограниченного мнолсества Q само является ограниченным. Убедимся в том, что множество Q является замкну- т ы м. Пусть {xk} — произвольная сходящаяся последователь- последовательность точек множества Q. Требуется доказать, что предел xq1) этой последовательности также принадлежит множеству Q. Так как калсдая точка х^ принадле^кит мнолсеству Q, то для каждо- каждого номера к fi С f{xk) < и. A4.121) Строго выпуклая функция f(x) во всяком случае непрерывна на Qj а поэтому из сходимости последовательности {х^} к xq в силу определения непрерывности функции вытекает сходимость последовательности {/(#&)} к числу /(жо). Так как все элемен- элементы сходящейся числовой последовательности {/(ж^)} удовлетво™ ряют неравенствам A4.121), то и предел /(жо) эт°й последова- последовательности удовлетворяет неравенствам /i ^ /(#о) ^ ^ (см- гл- 3, ) Так как исходное множество Q является замкну tbim, to предел ж о во всяком случае принадлежит Q.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 559 следствие 2 из теоремы 3.13), а это и означает, что точка х® принадлежит множеству Q. Доказательство замкнутости мно- множества Q завершено. Итак, множество Q всех точек х из множества Q, для кото- которых справедливы неравенства A4.120), является замкнутым и ограниченным. Докажем теперь следующую лемму. Лемма 6. Пусть функция f(x) сильно выпукла на выпук- выпуклом замкнутом множестве Q, х — любая точка Q, а — любое положительное число, символ Ах обозначает разность Ах = PQ(x - а • grad/(x)) - х. A4.122) Тогда справедливо неравенство: (gradf(x),Ax)^-\Ax\. A4.123) Oi Если же, кроме того^ множество Q ограничено и точка х принадлежит подмножеству Q тех точек Q, для которых справедливы неравенства A4.120) при /i > гшп/(ж), то най- xeQ дется строго положительное число j такое^ что справедливо неравенство \Ах\ > 7- A4.124) Доказательство. Докажем сначала неравен™ ство A4.123). Фиксируем произвольную точку х множества Q и, привлекая лемму 4, запишем неравенство A4.117), взяв в нем вместо х точку х — а • grad/(#), а вместо у точку х. При этом получим неравенство (x—a-gradf(x)—PQ(x—a-gradf(x)),x—PQ(x—a-gradf(x))) ^ 0, которое с учетом обозначения Ах = Pq(x — а • grad/(x)) — х перепишется в виде (-а • grad/(x) - Ах, -Ах) ^ 0. Из последнего неравенства и из свойств скалярного произве- произведения вытекает, что a(grad/(x), Ах) + |Аж|2 ^ 0, а это и приводит к неравенству A4.123). Остается доказать, что при дополнительном предположении о том, что Q ограничено и что х принадлежит подмножеству Q, существует 7 > 0 такое, что справедливо неравенство A4.124).
560 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Рассмотрим неотрицательную функцию точки х вида |Дж| = \Pq(x - a • gmdf(x)) - х\. A4.125) Убедимся в том, что эта функция является непрерывной на множестве Q функцией точки х. Докажем сначала, что векторная функция Pq(x) является непрерывной функцией точки х. Для этого достаточно доказать неравенство \PQ(x + Ах) - Р(х)\ ^ \Ах\, A4.126) справедливое для любых векторов х и Ах. В силу леммы 4 справедливы неравенства (х - Pq{xIPq{x + Ах) ~~ Pq(x)) ^ 0, (х + Ах - PQ(x + Ax),PQ{x) - Pq(x + Ах)) ^ 0. Используя эти неравенства и неравенство Коши^Буняко- вского, получим цепочку соотношений \PQ(x + Ах) - PQ(x)\2 = = (PQ(x + Ах) - PQ(x),PQ(x + Ах) - PQ(x)) = = {Pq(x + Ax) -x,Pq(x + Ax) -Pq(x)) + + (x- Pq(x),Pq(x + Ax) - Pq(x)) ^ = (Pq(x + Ax) -x- Ax,Pq(x + Ax) -Pq(x)) + + (Ax,PQ(x + Ax) - Pq(x)) < (Ax,PQ{x + Ax) - Pq(x)) < ^ \Ax\ • \PQ(x + Ax) - PQ(x)\, из которой и вытекает неравенство A4.126). Итак, доказано, что Pq(x) является непрерывной векторной функцией точки х. Из сильной выпуклости f(x) на Q вытекает, что функция a-grad/(rc) также является непрерывной на Q век™ торной функцией точки х. Но тогда из теоремы о непрерывно™ сти сложной функции и непрерывности разности непрерывных функций вытекает, что и функция PQ(x-a- gmdf(x)) - х является непрерывной на множестве Q векторной функцией точки х.
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 561 Модуль указанной векторной функции, т. е. скалярная функ™ ция A4.125), тем более является непрерывной на множестве Q5 а потому и на его подмножестве Q. Итак, функция A4.125) непрерывна и неотрицательна всюду на замкнутом ограниченном множестве Q. В таком случае по второй теореме Вейерштрасса (см. теорему 14.7) эта функция достигает на множестве Q своего неотрицательного минималь- минимального значения j. Указанное минимальное значение j заведомо строго положительно, ибо если бы j равнялось нулю, то на мно- множестве Q нашлась бы точка х® такая, что PQ(xo — a-gr3,df(xo)) — ~~ х® = 0, а это означало бы в силу леммы 5, что в этой точке х® множества Q функция f(x) имеет единственный на множестве Q локальный минимум (в то время как этот минимум по опреде™ лению Q лежит вне Q). Итак, j > 0, и неравенство A4.124) доказано. Лемма 6 полностью доказана. Лемма 7. Пусть функция f(x) сильно выпукла на выпук- выпуклом замкнутом множестве Q, х — любая точка Q, а — любое число^ удовлетворяющее неравенствам A4.115), Ах ^разность вида A4.122). Тогда при переходе из точки х в точку ж* = = Pq(x — а - grad/(a;)) значение функции f(x) не возрастает^ причем1) /(Ж)-/(Ж*)^A-|)|ДЖ|2. A4.127) Если эюе^ кроме того^ множество Q ограничено и точка х принадлежит подмножеству Q тех точек Q, для которых справедливо неравенство A4.120) при /i > min/fx), то нера- венство A4.127) переходит в неравенство 2, A4.128) где 7 > 0 — постоянная из леммы 6. Доказательство. Достаточно для любой точки х множества Q установить неравенство A4.127), ибо из этого нера- неравенства и из неравенства A4.124) сразу вытекает и неравенство A4.128) (для точек ж, принадлежащих Q, при условии, что Q ограничено). Сначала докажем неравенство A4.127) для случая, когда точ™ ка х является внутренней точкой множества Q. Имея в виду, что точка ж* = Pq(x — а • grad/(x)) принадлежит мно™ A h \ ] > 0. а 2 /
562 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 жеству Q, на котором функция /(ж) сильно выпукла, выразим значение /(ж*) по формуле Тейлора с центром в точке ж, взяв остаточный член 1?2(ж*) B форме Лагранжа. При этом получим fix*) = f(x) + (grad fix), Ax) + \d2fix + в Ax), A4.129) где Ax = ж* - x = Р^(ж - a • grad/(ж)) - ж, 0 < б < 1. Используя неравенство A4.123) и правое неравенство A4.104), мы получим из формулы Тейлора A4.129) 2 ' так что для случая внутренней точки ж неравенство A4.127) доказано. Пусть теперь ж является граничной точкой множе- множества Q. По определению граничной точки найдется последова- последовательность {хп} внутренних точек множества Q, сходящаяся к ж. Для каждой точки хп по формуле Тейлора с центром в этой точке мы получим ~t I ПГ* ' 1 ~t I ПГ* 1 I I СУТ*5^ #" "f" I Of* 1 /Т* * — Of* I I _ /# т O^* ~~J-— fhf I 'T3 — /T* 1 «/ \ / «/ \ IЬ / ' \C3 zf \ ! l> / У I v / * c% */ L * *^ i v \ I b / J 7 A4.130) где 0 < 0n < 1. Учитывая, что правое неравенство A4.104) справедливо для d2/ в любой точке множества Q и что grad/^) является непре- непрерывной векторной функцией точки ж на множестве Q, мы полу- получим, что в пределе при п —> оо из соотношения A4.130) вытека- вытекает справедливость неравенства A4.127) для граничной точки ж множества Q. Лемма 7 доказана. Перейдем теперь непосредственно к доказательству основной теоремы. Сначала докажем основную теорему при дополнительном предположении о том, что замкнутое выпуклое множество Q является также ограниченным. Возьмем произвольную точку х\ множества Q и составим итерационную последовательность {хп} точек, определяемых рекуррентным соотношением A4.116), при условии, что число а удовлетворяет неравенствам A4.115). Из леммы 7, а точнее из неравенства A4.127), сразу же вы- вытекает, что /Ы - f(xk+i) > (I - у) • \хк - хк+1\2 > 0. Таким образом, последовательность {/(ж^)} является невозра- стающей. Так как, кроме того, эта последовательность ограниче-
§ 7 ГРАДИЕНТНЫЙ МЕТОД ПОИСКА ЭКСТРЕМУМА 563 на снизу (минимальным значением т функции f(x) на множе™ стве Q), то она является сходящейся (см. теорему 3.15 из гл. 3). Обозначим предел последовательности {f(xn)} через /i. Ясно, что /i ^ га, где т — минимальное значение f(x) на множестве Q. Кроме того, поскольку все члены невозрастающей сходящейся последовательности не меньше ее предела (см. замечание 3 к теореме 3.15, гл. 3), то для всех номеров к справедливо неравенство /х. A4.131) Докажем, что для предела /л справедливо равенство /i = га = = mm fix). xeQ x ; Предположим, что это равенство несправедливо, т. е. пред™ положим, что /i > га. Тогда, если обозначить через v макси- максимальное значение f(x) на множестве Q, a Q — подмножество тех точек Q, для которых справедливы неравенства A4.120), то в силу леммы 7 найдется строго положительная постоянная j такая, что справедливо неравенство A4.128), которое приводит к следующему неравенству: f(xk) - f(xk+l) ^ (I - |) 72 > 0, A4.132) справедливому для любого номера к. Суммируя неравенства A4.132), записанные для номеров fc, равных 1, 2, 3,... , (п — 1), мы получим, что для любого номера п или, что то же самое, /Ы ^ /(si) - (п - 1) (i - ^) 72. A4.132') Неравенства A4.132;), справедливые для любого номера п, про- противоречат неравенству A4.131), ибо величина, стоящая в правой части A4.132;), при достаточно большом номере п становится меньше числа /i. Полученное противоречие доказывает ошибочность предпо- предположения /i > m, т. е. доказывает, что /i = т. Итак, доказано, что последовательность {/(#&)} сходится к минимальному зна- значению т функции f(x) на множестве Q. Остается доказать, что сама итерационная последователь- последовательность {х^} сходится к той точке жо, в которой это минимальное значение достигается х). ) Нами уже доказано, что минимальное значение функции /(ж) на мно- множестве Q достигается в единственной точке этого множества.
564 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 Фиксируем произвольное положительное число е и обозна™ чим через С? открытый га~мерный шар радиуса е с центром в точке xq. Далее обозначим через Q? ту часть множества Q, ко- которая не содержит точек шара С?. Ясно, что Q? — замкнутое ограниченное множество, так что функция f(x) достигает (в си- силу второй теоремы Вейерштрасса) своего минимального на этом множестве значения, которое мы обозначим через т?. Можно утверждать, что т? > га, ибо в противном случае нарушалось бы условие существования у функции f(x) на мно- множестве Q единственной точки локального минимума. Далее можно утверждать, что на множестве Q? имеется лишь конечное число точек последовательности {хк} (ибо по- последовательность {/(#&)}, У которой имеется бесконечное число элементов, удовлетворяющих неравенству f(xk) ^ т? > га, не может сходиться к числу га). Стало быть, мы доказали, что для любого е > 0 найдется номер N, начиная с которого все элементы последовательности {хк} лежат в шаре С? радиуса е с центром в точке х®. Это и означает, что последовательность {хк} сходится к точке х®. Тем самым, для случая ограниченного замкнутого выпуклого множества Q основная теорема доказана. Пусть теперь Q — неограниченное замкнутое выпуклое множество. Снова фиксируем произвольную точку х\ этого множества и составим итерационную последовательность A4.116) при условии, что число а удовлетворяет неравенствам A4.115). При доказательстве теоремы о существовании локального минимума у сильно выпуклой функции (см. п. 2) мы установили, что точка х® локального минимума сильно выпуклой функции f(x) на неограниченном замкнутом выпуклом множестве Q ле- лежит в той части Qr множества Q, которая содержится в шаре С и с центром в точке жх, радиус R которого выбран из условия Там же установлено, что подмножество Qr множества Q яв- является ограниченным выпуклым замкнутым множеством и что всюду вне Qr значения f(x) превосходят f{x\). Так как в силу леммы 7 (а точнее в силу неравенства A4.127)) последовательность {/(ж^)} является невозрастающей, а за пре- пределами Qr все значения f(x) превосходят f{x\I то все точки итерационной последовательности {х^} леэюат в Qr^ а потому для любого номера к PQ(xk -a-gra,df(xk)) = PqR(xk - а
ДОПОЛНЕНИЕ 565 Стало быть, итерационную последовательность A4.116) мож- можно заменить на после чего все дальнейшие рассуждения сведутся к ограни- ограниченному замкнутому выпуклому множеству Qr, т. е. к уже рассмотренному выше случаю. Основная теорема полностью доказана. Замечание 1. Особенно просто выглядит последова- последовательность A4.116) для случая, когда множество Q совпадает со всем пространством Ет. В этом случае для любой точки х спра- справедливо равенство Pq(x) = ж, и потому рекуррентная формула A4.116) принимает вид Замечание 2. Изложенный нами метод позволяет при выполнении соответствующих условии искать решение ж о = (#i, #2, • • • , хт) системы т функциональных уравнений: fi(x) = fi(xi,x2j... jXm) = О, /2 (ж) = /2(Ж1,Ж2, • • • ,Хт) = О, fm(x) = /т(ж1,Ж2,. • • ,Жт) = 0. Достаточно заметить, что решение указанной системы совпадает с точ- точкой локального минимума функции Замечание 3. Изложенная нами теория отыскания локального минимума сильно выпуклой (вниз) функции без каких-либо осложнений переносится на отыскание локального максимума сильно выпуклой (вверх) функции. ДОПОЛНЕНИЕ О ВЫБОРЕ ОПТИМАЛЬНОГО РАЗБИЕНИЯ СЕГМЕНТА ДЛЯ ПРИБЛИЖЕННОГО ВЫЧИСЛЕНИЯ ИНТЕГРАЛА В гл. 12 для приближенного вычисления интеграла ь f{x)dx A4.133) мы разбивали сегмент [а, Ь] на достаточно большое число п равных ча- частичных сегментов и на каждом из этих сегментов заменяли функцию /(ж) многочленом нулевого, первого или второго порядка. Возникшая при этом погрешность никак не учитывала индивидуальных свойств /(ж). Поэтому,
566 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ ГЛ. 14 естественно, встает вопрос о варьировании точек разбиения основного сег- сегмента [а, 6] и выборе для каждой фиксированной функции /(ж) такого оп- оптимального разбиения основного сегмента на п, вообще говоря, не равных друг другу частичных сегментов, которое обеспечивало бы минимальную величину погрешности данной приближенной формулы. В настоящем дополнении мы остановимся на решении указанного во- вопроса, принадлежащем А.Н. Тихонову и С.С. Гайсаряну ). Для приближенного вычисления интеграла A4.133) разобьем сегмент [а,Ь] на п частичных сегментов при помощи точек а = жо < х\ < Ж2 < ... < хп = Ь. Длину к-то частичного сегмента [ж&_1,ж&] (к = 1,2,... , п) обозначим символом hk, так что hk = Xk — Xk — i- Представив интеграл A4.133) в виде суммы интегралов f f(x)dx = ^T Г f(x)dx, A4.134) а xk — l приблизим каждый из интегралов в правой части A4.134) с помощью одной из трех приближенных формул (прямоугольников, трапеций или парабол). Любую из указанных трех формул можно записать в виде ¦tihk) + R3,mAf), A4.135) где узлы U и веса qi (г = 0,1,... , m — 1) выбираются так, чтобы остаточный член Rs,m,k(f) имел порядок h% при некотором s > 1 2). Вставляя A4.135) в A4.134), мы получим, что Ь 1 п га-— I (ж) dx = Y, hk Yl *КХк + Uhk^ + R*>™U)i A4.136) a k=1 г=0 где n Rs,m(f) = ^Rs,m,k(f)- A4.137) / Поставим вопрос о выборе такого разбиения {хк} сегмента [а, 6], при котором квадрат погрешности A4.137) достигал бы минимума при фикси- фиксированном числе точек разбиения п, фиксированной функции /(ж) и фикси™ рованной приближенной формуле A4.135). При такой постановке вопроса квадрат погрешности R^m(f) зависит только от выбора промежуточных то- точек разбиения, т. е. является функцией (п— 1) переменных xi, Ж2,... , xn-i, определенной в тетраэдре а < х\ < Х2 < ... < xn-i < Ь. Поскольку указан™ ный тетраэдр является открытой областью, то минимум функции RSym(f) B г) См. работу А.Н. Тихонова и С.С. Гайсаряна «О выборе оптимальных сеток при приближенном вычислении квадратур» (Журнал вычислитель™ ной математики и математической физики, т. 9, № 5, 1969). ) В частности, для формулы трапеций в A4.135) следует положить тп = = 2, з = 2, to = 0, ti = 1, go = gi = 1/2.
ДОПОЛНЕНИЕ 567 этом тетраэдре может, вообще говоря, и не достигаться (т. е. оптимального разбиения сегмента [а, 6] может, вообще говоря, и не существовать). Можно, однако, доказать, что если производная f (х) сохраняет знак на сегменте [а, 6], то минимум квадра- квадрата погрешности Rs,m(f) достигается на таком раз- разбиении сегмента [а, 6], узлы Хк которого удовлетворяют (п -— 1) уравнениям dR2s,m(f) = 0(fc = 1,2,... О Рис. 14.4 ... ,n-l) A4.138) и дополнительным услови- условиям xq = а, хп = Ь ). Остановимся более подробно на случае формулы трапеций. В этом случае в формуле A4.136) следует положить s = 2, т = 2, to = О, t\ = 1, go = qi = 1/2, в результате чего формула A4.136) принимает вид о / f{x) dx = J2 у Д2>2(/). A4.139) Уравнения A4.138), в силу A4.139) и A4.134), приводятся для этого случая к виду f(xk+i)-f(xk-1) = f'(xk)(xk+1-xk-1) (* = l,2,...,n-l). A4.140) Существование решения системы уравнений A4.140) обеспечивается со™ хранением знака второй производной f"{x) на сегменте [а, 6], т. е. сохра- сохранением направления выпуклости кривой у = f{x) при а ^ х ^ Ь. Узлы {хк} оптимального разбиения сегмента [а, 6], определяемого уравнениями A4.140), обладают следующим геометрическим свойством: секущая, про- проведенная через точки графика функции у = /(ж) с абсциссами ж^+i и Xk-i, параллельна касательной к указанному графику, проведенной через его точку с абсциссой Хк- Это свойство является прямым следствием равенств A4.140) и иллю- иллюстрируется на рис. 14.4 (рассуждения те же самые, что и в § 7 гл. 8). Можно доказать, что узлы «приближенного разбиения» {хк} (к = = 0,1,... , n)j определяемые рекуррентными равенствами хо = а, хк+г = хк + A|/zfc)r1/3 (к = 0,1,... , п - 1), A4.141) при А = (Ь — а)/п удовлетворяют уравнениям A4.140) с ошибкой (или, как говорят, с невязкой) порядка А . Это означает, что при больших п разбие- разбиение {хк} близко к оптимальному разбиению {хк}- Таким образом, при боль- больших п вычисление интеграла A4.133) по формуле трапеций с разбиением {хк}, узлы которого последовательно определяются рекуррентными соот- соотношениями A4.141), обеспечивает погрешность, близкую к минимальной. х) Доказательство этого утверждения можно найти в работе А.Н. Тихо- Тихонова и С.С. Гайсаряна, отмеченной в сноске г) на с. 566.
ГЛАВА 15 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ § 1. Понятие немвной функции В математике и в ее приложениях приходится сталкиваться с такими задачами, когда переменная и, являющаяся по смы- смыслу задачи функцией аргументов ж, у,... , задается посредством функционального уравнения F(u,x,y,...) = 0. A5.1) В этом случае говорят, что и как функция аргументов ж,у,... задана неявно. Так, например, функция и = — у 1 — ж2 — у2, рас™ сматриваемая в круге ж2 + у2 ^ 1, может быть неявно задана посредством функционального уравнения F{u, ж, у) = и2 + ж2 + у2 - 1 = 0. A5.2) Естественно, возникает вопрос, при каких условиях функцио™ нальное уравнение A5.1) однозначно разрешимо относительно ii, т. е. однозначно определяет явную функцию и = <р(х,у,...), и более тонкий вопрос, при каких условиях эта явная функция яв~ ляется непрерывной и дифференцируемой. Эти вопросы не явля- являются простыми. Так функциональное уравнение A5.2), вообще говоря, определяет в круге х2 + у2 ^ 1, кроме указанной вы- выше явной функции и = — у 1 — х2 — у2, бесконечно много дру- других функций. Таковыми являются функция и = +у 1 — х2 — у2, а также любая функция к, равная +y/l — х2 — у2 для некото™ рых точек (ж, у) из круга ж2 + у2 ^ 1 и равная —y/l — ж2 — у2 для остальных точек этого круга. Для выяснения вопроса об условиях, обеспечивающих однозначную разрешимость уравне- уравнения A5.2) относительно и, обратимся к геометрической илльо страции. Уравнение A5.2) определяет в пространстве (и^х^у)
§ 2 ТЕОРЕМА О СУЩЕСТВОВАНИИ И ДИФФЕРЕНЦИРУЕМОСТИ 569 сферу S радиуса 1 с центром в начале координат (рис. 15.1). Возьмем на сфере S точку Mq(ii, ж, у), не лежащую в плоскости Ожу, т. е. такую, для которой и Ф 0. Очевидно, часть сферы Я, лежащая в достаточно малой окрестности точки Mq, однознач- однозначно проецируется на плоскость Оху. Аналитически это означает, что если рассматривать функцию Р(и^х^у) = и2 + х2 + у2 — 1 только в ука™ м0. занной окрестности точки Mq, to уравне- уравнение A5.2) однозначно разрешимо относи™ тельно и и определяет единственную явную функцию и = + у 1 — х2 — у2 при и > 0 и ti = — д/l — ж2 — у2 при ti < 0. Если же на сфере 5 взять точку Mi@,ж,у), лежащую в плоскости Ожу (рис. 15.1), то очевидно, что часть сферы S, ле- Рис- 15.1 жащая в любой окрестности М\, неоднозначно проецируется на плоскость Оху. Аналитически это означает, что если рассматри- рассматривать функцию F(u, ж, у) = и2 + х2 + у2 — 1 в любой окрестности точки Mi, то уравнение A5.2) не является однозначно разре- разрешимым относительно и. Обратим внимание на то, что частная производная — = 2и функции F(u,x,y) = и2 + ж2 + у2 — 1 не обращается в нуль в точке М® и обращается в нуль в точке М\. Ниже мы установим, что для однозначной разрешимости в окрестности точки Mq общего функционального уравнения A5.1) относительно и принципиальную роль играет необраще- необращение в нуль в точке Mq частной производной ——. Попутно мы аи установим условия, при которых явная функция, представля- представляющая собой единственное решение уравнения A5.1), является непрерывной и дифференцируемой. В дальнейшем мы будем обозначать пространство переменных (и, ж, у,...) символом 1?, а пространство переменных (ж, у,...) символом Rf. Ради сокращения записи и для удобства геометри- геометрической иллюстрации будем рассматривать две переменные ж, у. § 2. Теорема о существовании и дифференцируемости немвной функции и некоторые ее применения 1. Теорема о существовании и дифференцируемости немвной функции. Теорема 15.1. Пусть функция Р(и^х^у) дифференцируема в некоторой окрестности точки Мо(гд,ж,у) пространства 1?,
570 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 BF причем частная производная -^— непрерывна в точке Mq . Тогда, если в точке Mq функция F обращается в нуль, а частная про- изводная -— не обращается в нуль, то для любого достаточно малого положительного числа е найдется такая окрестность точки М^(х^у) пространства В!\ что в пределах этой окрест- окрестности существует единственная функция и = (р(х,у), которая удовлетворяет условию \и — и\ < е и является решением урав- уравнения F(u,x,y) =0, A5.3) причем эта функция и = ср(х,у) непрерывна и дифференцируе- дифференцируема в указанной окрестности точки Mq. Замечание 1. В условиях теоремы 15.1 можно опустить BW требование непрерывности частной производной ~— в точке Mq, но тогда придется дополнительно потребовать, чтобы эта производная не обращалась в нуль не только в самой точке Mq, но и в некоторой окрестности этой точки и сохраняла определенный знак в этой окрестно- окрестности. Доказательство теоремы 15.1. 1. Прежде всего докажем, что для достаточно малого е > 0 в окрест- окрестности точки Mq(x,ij) существует единственная функция и = (р(х^у)^ удовлетворяющая условию \и — и\ < < е и являющаяся решением урав- уравнения A5.3). Чтобы сделать дока- доказательство более наглядным, будем сопровождать его геометрической иллюстрацией. Из аналитической геометрии известно, что уравнение A5.3) определяет в пространстве R некоторую поверхность S (рис. 15.2), причем, в силу условия F(Mq) = 0, точка Mq лежит на этой поверхности. С геометриче- геометрической точки зрения однозначная разрешимость уравнения A5.3) относительно и означает, что часть поверхности S, лежащая в непосредственной близости к точке Mq, может быть однозначно спроецирована на координатную плоскость Оху. Рис. 15.2
§ 2 ТЕОРЕМА О СУЩЕСТВОВАНИИ И ДИФФЕРЕНЦИРУЕМОСТИ 571 Ради определенности будем считать, что частная производи OF ная — положительна в точке М®. Тогда из непрерывности ука- указанной производной в Mq и из теоремы об устойчивости знака непрерывной функции вытекает, что найдется такая окрест- BF ность точки Mq, всюду в пределах которой ¦— положительна. Эту окрестность мы можем взять в виде шара О достаточ™ но малого радиуса с центром в точке Mq. Фиксируем далее по- ложительное число е настолько малым, чтобы каждая из то- чек М\{и — е, ж, у) и М2\и + б, ж, у) лежала внутри шара У (для этого достаточно взять е меньшим радиуса шара Q.) Подчерк- Подчеркнем, что при этом снизу е ограничено лишь нулем, и мы мо- можем брать его как угодно малым — это будет использовано нами ниже. Рассмотрим функцию F{u^x^y) одной переменной на сег™ о о менте и — е ^ и ^ и + е. С геометрической точки зрения это означает, что мы рассматриваем функцию трех переменных F(u^x^y) вдоль отрезка М\М2 (см. рис. 15.2). Так как произ™ 8F / О О О О водная -^—{u,x,y) положительна на сегменте и — е ^ и ^ и + + 6, то функция F(u,x,y) возрастает на этом сегменте. Но то- тогда, поскольку эта функция равна нулю в середине указанного сегмента (т. е. при и = и), то F^u^x^y) имеет отрицательное значение на левом конце и положительное значение на правом конце указанного сегмента^ т. е. F(Mi) < О, F(M2) > 0. Далее рассмотрим функции F(u — ?,ж,у) и F(u + 6, ж, у) двух переменных х и у, т. е., выражаясь геометрическим языком, рас™ смотрим функцию F(u,x,y) на двух плоскостях, параллельных координатной плоскости Оху^ первая из которых проходит через точку М\, а вторая — через точку М2. Поскольку F(M\) < 0, F(M2) > 0 и функция Р(и^х^у) непрерывна всюду в шаре Л, то по теореме об устойчивости знака непрерывной функции на указанных плоскостях найдутся такие окрестности точек М\ и М~2, в пределах которых функция F сохраняет те же знаки, что и в точках М\ и М2. Эти окрестности мы можем взять в виде открытых квадратов с центрами в точках М\ и М2 и с достаточно малой стороной 28 (на рис. 15.2 указанные квадра- квадраты заштрихованы). Тот факт, что функция F{u^x^y) сохраняет постоянный знак на указанных квадратах, аналитически выра™
572 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 жается неравенствами F(u-e,x,y)<0,\ °i/xi °\ ^ я акА\ о , _ } при \х-х\ < д, \у-у\ < о. A5.4) F(u + e,x,y) > О J Выбор стороны указанных квадратов мы подчиним и еще од- одному условию: возьмем 8 столь малым^ чтобы оба указанных квадрата лежали внутри шара О (это заведомо можно сделать, ибо центры квадратов М\ и М~2 являются внутренними точками шара п). При таком выборе 8 любая точка пространства (гд, ж, у), координаты которой удовлетворяют неравенствам |ж — ж| < J, |f/ — у\ < E, |гд — и\ < 6, A5.5) будет лежать внутри шара О. С геометрической точки зрения неравенства A5.5) определяют открытый прямоугольный па- параллелепипед с центром в точке Mq и со сторонами, парал- параллельными осям координат и, ж, у и соответственно равными 2е, 2E и 26. Этот параллелепипед мы будем обозначать симво- символом П. Так как параллелепипед П лежит внутри шара О, то всюду в параллелепипеде П1) производная j~~~ положительна. Кроме того, в силу неравенств A5.4), функция F{u^x^y) отри- отрицательна на нижнем основании и положительна на верхнем основании П. Докажем теперь, что уравнение A5.3) однозначно разреши- разрешимо относительно и, если функцию Р(и^х^у) рассматривать лишь для значений к, ж, у, лежащих внутри параллелепипеда П. Уяс- Уясним, что требуется доказать. Пусть М1г(ж, у) — любая точка про- пространства i?;, координаты которой удовлетворяют неравенствам \х-х\< 6, \у-у\ < S. A5.6) Иначе говоря, пусть М'{х^у) — любая точка плоскости Ожу, ле- лежащая внутри квадрата с центром в точке Мд(ж, у) и со сторона- сторонами, равными 2E. Требуется доказать, что для координат ж, у точ- точки М1 найдется, и притом единственное^ число и из интервала и — е < и < и+е такое, что F(u, ж, у) = 0. (С геометрической точ- точки зрения это означает, что любая прямая, параллельная оси и и пересекающая параллелепипед П, пересекает поверхность S внутри параллелепипеда П в одной и только в одной точке.) Зафиксировав значения ж и у, удовлетворяющие неравен- неравенствам A5.6), рассмотрим функцию F(u, ж, у) аргумента и на сег™ г) Включая открытые квадраты, лежащие в его основаниях.
§ 2 ТЕОРЕМА О СУЩЕСТВОВАНИИ И ДИФФЕРЕНЦИРУЕМОСТИ 573 о о менте и — е ^ и ^ и + 6, т. е. рассмотрим функцию F(u, х1 у) на отрезке М[М^ где М[ и ikf^ — точки пересечения прямой, про- проходящей через точку М'{х^у) и параллельной оси Ои, с основа- основаниями параллелепипеда П (см. рис. 15.2). Так как производная — (и^х^у) положительна на сегменте и — е^и^и + е^ то функ- функция F(u, ж, у) возрастает на этом сегменте (или, что то же самое, возрастает на отрезке ikf-fM"^). Но тогда из условий F(M[) < О, F^M1^) > 0 вытекает, что внутри сегмента и^е^и^и + е найдется одно единственное значение и такое, что F(u^x^y) = О (или, выражаясь геометрически, внутри отрезка М[М^ найдется единственная точка М, лежащая на поверхности S.) Пусть теперь функция и = (р(х,у) символизирует то прави- правило, посредством которого каждой точке Мг(х^у) из окрестности A5.6) ставится в соответствие единственное число и из интерва- интервала и — е<и<и + 6, для которого F(u, ж, у) = 0. Мы доказали, что в окрестности A5.6) существует единственная функция и = / \ i ° i = (р{х,у), удовлетворяющая условию \и — и\ < е и являющаяся решением уравнения A5.3). 2. Докажем теперь, что функция и = (р(х^у) непрерывна в любой точке М'(ж,у) окрестности A5.6). Так как для любой точки М'{х^у) из окрестности A5.6) выполнены те эюе усло- условия1) , что и для точки Мд(ж,у), то достаточно доказать непре™ рывность функции и = (р(х, у) лишь в точке Mq(x, у). Требуется доказать, что для любого достаточно малого положительного е существует положительное число 6 такое, что для любых ж и у, удовлетворяющих неравенствам |ж —ж| < J, |у — у| < S, справед- о /\° /оо\ ливо неравенство и — и < е, где и = (/?(ж,у), и = (р(х^у). Если взять в качестве е то число, которое выбрано выше при рассмо- рассмотрении п. 1, то существование 6 обеспечивается неравенствами A5.5). Остается заметить, что в рассуждениях п. 1 положитель™ ное число е может быть взято как угодно малым (это отмечалось в п. 1). Тем самым непрерывность функции и = (р(х,у) установлена. Запишем условие непрерывности функции и = (р(х,у) в точке Мо(ж,у) в разностной форме. Обозначая через Аи полное при- ) Именно, любой точке М1 {х,у) из окрестности A5.6) соответствует точ- точка М(и,х,у) пространства R такая, что функция F(u,x,y) обращается в нуль в точке М, дифференцируема в некоторой окрестности точки М и OF имеет в этой окрестности отличную от нуля частную производную ^г—. ди
574 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 ращение функции и = ip(xJy) в точке Мд(ж, у), соответствующее приращениям аргументов Ах и Ау, мы получим, что Аи —>• О ( при < 1 Ау -»¦ 0. 3. Остается доказать дифференцируемость функции и = = (р(х,у) в любой точке М;(ж,у) окрестности A5.6). В силу замечания, сделанного в п. 2, достаточно доказать дифферен- дифференцируемость функции и = (р{х^у) в самой точке М"д(ж,у). Что- Чтобы это сделать, вычислим полное приращение Аи функции и = = (р(х,у) в точке Мд(ж,у), соответствующее приращениям аргу- аргументов Дж и Ау. Поскольку F(u,ж, у) = 0 и F(ia + Дгд,ж + Аж,у + + Ау) = 0, то полное приращение AF функции F(u,x,y) в точ™ ке Мо(гл, ж,у), соответствующее приращениям аргументов Zlti, Аж и Ау, равно нулю. Но в силу условия дифференцируемости функции F(u^x^y) в точке Мо(гл, ж,у) это полное приращение имеет вид Q . OF OF OF ? Здесь все частные производные -^-, ^^ и ^^ берутся в точ- ди дх ду ке Мо(гл, ж,у); а, /? и 7 -> 0 при < Ау —)> 0, [ Дг/ -^ 0. Итак, мы получаем Согласно разностной форме условия непрерывности функции и = (р(х^ у) в точке Mq(x, у) Аи —>• 0 при < ' Таким об™ [ Ау ->> 0. Г Аж -^ 0, разом, мо^кно утвер^кдать, что из условия < следует, [ Ау^О что a, /J и 7 -> 0.
§ 2 ТЕОРЕМА О СУЩЕСТВОВАНИИ И ДИФФЕРЕНЦИРУЕМОСТИ 575 По условию теоремв! частная производная -^— отлична от нуля в точке М®. Поскольку 7^0 при < ' то при { Ау -+ 0, достаточно малых Ах и Ау выражение ~^~ + 7 не обращается (BF1 + 7) 5 в результате чего мы получим / OF \ 1 — +Р\ Ау. A5.8) По теореме о предельном значении частного двух функций мо- можем утверждать, что dF dF OF o 9F _ ОХ __ _ ОХ _|_ и _ OU __ _ °У _|_ у Qg g\ h 7 Ь 7 cm on, on ди f Ах -+ 0, где /i и I/ —)> и при < [ Ау -> 0. Сопоставляя формулы A5.8) и A5.9), окончательно получим «?\ / ^\ Аи= I —fer Формула A5.10) доказывает дифференцируемость функции и = = (р(х^у) в точке М^(х^у). Тем самым теорема 15.1 полностью доказана. Замечание 2. Приведенное доказательство без вся™ ких затруднений переносится на случай неявной функции, за- зависящей не от двух, а от любого конечного числа аргументов Ж1,Ж2, • • • ixm 1)- Случай двух аргументов х и у имеет лишь то преимущество, что допускает наглядную геометрическую иллю- иллюстрацию в пространстве (и^х^у). 2. Вычисление частных производных немвно задан- заданной функции. Остановимся на вычислении частных производ- производных функции, неявно заданной посредством уравнения A5.3). Чи, в частности, от одного аргумента.
576 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 Пусть выполнены условия теоремы 15.1. Тогда для полного приращения функции и = <р(ж,у) справедливо представление A5.10). Это представление и теорема 14.9 позволяют утвер- утверждать, что частные производные функции и = (р(х^у) опреде- определяются формулами aF dF_ ди _J^ ди _^у_ (лълл\ dx dF_' dy dF^' l j Аналогичные формулы справедливы и для случая, когда неявно заданная функция зависит не от двух, а от любого конечного числа аргументов жх, #2, • • • •> хт- В этом случае dF du _ _dxk (k _ 1 2 ч — - ^г (Я - 1,^,... ,raj. Если мы хотим обеспечить существование у неявно заданной функции и = (р(х,у) частных производных второго порядка, то, естественно, приходится усилить требования, наложенные на функцию F{u^x^y) в теореме 15.1, а именно: приходится до- дополнительно требовать, чтобы функция F(u, ж, у) была два раза дифференцируема в рассматриваемой точке. В этих предполо- предположениях остановимся на вычислении частных производных вто- второго порядка. Введем полезное в дальнейшем понятие полной частной про- производной функции. Предположим, что нам дана дифференциру- дифференцируемая функция трех аргументов Ф(к,ж,у), причем один из этих аргументов и сам является дифференцируемой функцией двух других аргументов ж и у Тогда функцию Ф(п,ж,у) можно рас- рассматривать как сложную функцию двух аргументов ж, у. Част- Частные производные этой сложной функции по ж и у будем назы- называть полными частными производными функции Ф(гл, ж,у) по ж и у ж обозначать символами —— и ——. По правилу дифферен- дифференцирования сложной функции мы получим следующие формулы для указанных полных частных производных: ВФ <9Ф du dФ ВФ dФ du dФ Вх du dx dx' By du dy dy ' Переходим к вычислению частных производных второго поряд- порядка неявно заданной функции. Ради определенности вычислим производную . Дифференцируя первую из формул A5.11) по у и принимая во внимание, что каждая из частных произ- dF dF водных —— и —— зависит от трех аргументов и, ж, у, первый из
§ 2 ТЕОРЕМА О СУЩЕСТВОВАНИИ И ДИФФЕРЕНЦИРУЕМОСТИ 577 которых сам является функцией х и у, будем иметь dF' D дх ' dF_ ди! dFl IdF дх\ dF \ди ди Dy дх Dy д2и дудх Dy 1 ам ^aF / d2F ди d2F\ dF^ fd^du д \ дд д дд) д \ д2 д d2F ди \ дхди ду дхду) дх \ ди2 ду диду ди) Вставляя в полученную формулу выражение —, определяемое ау второй из формул A5.11), окончательно будем иметь д2Р dFdF д2Р fdF\2 d2FdFdF д2Р dF дР д и дхди ду ди дхду \ди) ди2 дх ду дуди дх ди дудх (?_Y A5.12) г, д2и Совершенно аналогично вычисляются частные производные -^-^ и -т—г- Аналогичным методом могут быть вычислены и частные ду2 производные третьего и последующих порядков х). Примеры. 1) Вычислить частную производную функции и = if{x^y)) заданной посредством уравнения у = 0. Пре^кде всего, пользуясь формулами A5.11), вычислим частные производные первого порядка ди ди 1 + е ¦ ¦ 1 "дх ~ Ъу ~ ^1 + е^(ж+^+и) ~ ~ Дд2и А алее очевидно, что о о = и. дудх 2) Тот лее вопрос для функции, заданной уравнением и2 +х2 + у2 -а2 = 0. ) При условии, что функция F(u, ж, у) дифференцируема в данной точке соответствующее число раз. 19 В.А. Ильин, Э.Г. Позняк, часть I
578 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 Используя формулы A5.11), получим ди х ди у дх и^ ду и Далее, будем иметь __ху дудх Dy Dy 3. Особые точки поверхности и плоской кривой. Рас™ смотрим некоторую поверхность S (плоскую кривую L), опре™ деляемую в заданной декартовой прямоугольной системе коор- динат уравнением F(xJyJz) = 0 (F(x,y) = 0). Относительно функции F{x1y1z) (F(x^y)) предположим, что она имеет непре- непрерывные частные производные первого порядка по всем аргумен- аргументам всюду в некоторой окрестности любой точки поверхности S (кривой L). Будем называть данную точку поверхности S (кри- (кривой L) особой, если в этой точке обращаются в нуль все частные производные первого порядка функции F(x,y,z) (F{x,y)). В окрестности особой точки нельзя применить к уравнению F(x^y^z) = 0 (F(x^y) = 0) теорему 15.1, т. е. нельзя утверждать, что это уравнение разрешимо хотя бы относительно одной из пе- переменных ж, у, z (ж, у). Таким образом, участок поверхности S (кривой L), прилегающий к особой точке, может не допускать однозначного проецирования ни на одну из координатных плос- плоскостей (ни на одну из осей координат). Структура поверхности S (кривой L) в окрестности особой точки может быть очень слож- сложной и требует дополнительного исследования. Точки поверхности S (кривой L), не являющиеся особыми, принято называть обыкновенными. В окрестности обыкновенной точки действует теорема 15.1, так что прилегающий к обыкно- обыкновенной точке участок поверхности S (кривой L) допускает одно™ значное проецирование хотя бы на одну из координатных плос- плоскостей (хотя бы на одну из осей координат), что существенно облегчает исследование этого участка. Примеры. 1. Найти особые точки кругового конуса х + + у2 — z2 = 0. Поскольку F(x, у, z) = х2 + у2 — z21 то — = 2ж, ар ЙТР ~^— = 2у, ^^ = ^2z. Единственной особой точкой является нача- ду oz ло координат. Хорошо известно, что в окрестности этой точки поверхность конуса не может быть однозначно спроецирована ни на одну из координатных плоскостей (рис. 15.3).
§ 2 ТЕОРЕМА О СУЩЕСТВОВАНИИ И ДИФФЕРЕНЦИРУЕМОСТИ 579 2. Тот же вопрос в отношении плоской кривой ж2 — у2 + ж3 = OF 2 = 0. Частные производные имеют вид ^^ = 2ж + 3ж = жB + 3ж), С/Ж -^— = ^2у. Обе частные производные обращаются в нуль в двух точках плоскости @,0) и (—2/3,0). Из этих двух точек толь- только первая принадлежит рассматриваемой кривой, т. е. является особой. Построив кривую х2 ~~ у2 + ж3 = 0 в окрестности точки @,0), мы убедимся в том, что эта точка является точкой само- самопересечения графика (рис. 15.4). Ясно, что в окрестности этой точки кривую нельзя однозначно спроецировать ни на ось 0ж, ни на ось Оу. х Рис. 15.3 Рис. 15.4 4. Условия, обеспечивающие существование для функции у = /(ж)обратной функции. Применим теорему 15.1 для выяснения условий, при выполнении которых функ- функция у = f(x) имеет в некоторой окрестности точки х® обрат- обратную функцию х = f~1(y), определенную в некоторой окрестно- окрестности точки уо> гДе У о — f(xo)- Будем рассматривать у = f(x) как функцию, определяемую функциональным уравнением ви- вида F(x,у) = f(x) -у = 0. Тогда вопрос о существовании обратной функции совпадает с вопросом о разрешимости относительно х указанного функцио- функционального уравнения. Как следствие теоремы 15.1 и замечания 1 перед доказательством этой теоремы, мы получим следующее утверждение: если функция у = /(ж) имеет отличную от ну- нуля производную в некоторой окрестности точки жо, fno для этой функции в окрестности х® существует обратная функ- 19*
580 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 ция х = /~х(|/), определенная и дифференцируемая в некоторой окрестности точки уо? г^е У о = /(жо)- Производная указанной обратной функции в точке у о в силу второй из формул A5.11) равна § 3. Немвные функции, определяемые системой функциональных уравнений 1. Теорема о разрешимости системы функциональ- функциональных уравнений. В предыдущем параграфе мы рассматривали вопрос о существовании и дифференцируемости неявной функ- функции, определяемой посредством одного функционального урав- уравнения. В этом параграфе мы рассмотрим аналогичный вопрос для совокупности т (га — любое натуральное число) неяв- неявных функций^ определяемых посредством системы функцио- функциональных уравнений. Итак, предположим, что т функций ul = . . ' %Ъ'" 'Хп>' A5.13) Ujji — LPffi\X\^ X2^ . . . , Xfij ищутся как решение системы га функциональных уравнений °' A5.14) Изучим вопрос о разрешимости системы функциональных урав- уравнений A5.14) относительно tii, ti2,... ,ит. Под термином «ре- «решение системы A5.14)» мы в дальнейшем будем понимать совокупность га функций A5.13) таких, что при подстанов- ке этих функций в систему A5.14) все уравнения этой систе- системы обращаются в тождества. Это решение мы будем называть непрерывным и дифференцируемым в некоторой области D из- изменения переменных х\^х2^... ,Хт если каждая из функций A5.13) непрерывна и дифференцируема в области D. Догово- Договоримся обозначать символом R пространство (га + п) перемен- переменных щ, u2l... , umj x\j x2j... , хП1 а символом Rf пространство п переменных x\, x2j... ^xn. Рассмотрим га функций F\, F2,... , Fm, стоящих в левых ча- частях системы A5.14), и составим из частных производных этих
СИСТЕМЫ ФУНКЦИОНАЛЬНЫХ УРАВНЕНИЙ 581 функций следующий определитель: Д = dui д%2 ''' диш dF2 dF2 3F2 dui dum dFm dFrr, dFm A5.15) Будем называть определитель вида A5.15) определителем Якоби1) (или кратко якобианом) функций F\, F2,... , Fm по пе- переменным ui,U2-> • • • ,wTO и кратко обозначать символом D(FUF2,... ,Fm) Имеет место следующее замечательное утверждение. Теорема 15.2 (обобщение теоремы 15.1). Пусть т функций хп), хп), A5.16) дифференцируемы в некоторой окрестности точки Mq(ui, о о о о u2j... ,um,xi,... чхп) пространства it, причем частные про- производные этих функций по переменным щ, u2j ... , ит непре- непрерывны в точке Mq. Тогда^ если в точке М® все функции A5.16) обращаются в нуль, а якобиан ^ ь 2?''' ' т( от- D(Ui,U2j. • • jUm) личен от нуля^ то для достаточно малых положитель- положительных чисел бх,б2,... , sm найдется такая окрестность точки Mq(xi, ... , жп) пространства i?;, что в пределах этой окрест- окрестности существуют единственные т функций A5.13), которые удовлетворяют условиям \щ — щ\ < ?]_, \и2 — и2\ < e2l ... ... , |г^ш — ит < ет и являются решением системы уравнении A5.14), причем это решение непрерывно и дифференцируемо в указанной окрестности точки Mq. 1) Карл Густав Яков Якоби — немецкий математик A804-1851).
582 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 Замечание. При т = 1 теорема 15.2 переходит в доказанную выше1) теорему 15.1, ибо в этом случае якобиан A5.15) обращается в частную производную д?\/ди\. Доказательство теоремы 15.2 прове™ дем методом математической индукции. При т = 1 теорема уже доказана. Поэтому достаточно, предположив теорему 15.2 справедливой для системы т — 1 функциональных уравнений, доказать справедливость этой теоремы и для системы га функ- функциональных уравнений. Поскольку, по предположению, якобиан ,Fm ,Um) dFm-i dFm dFm dum dFm-i dFm A5.17) отличен от нуля в точке Mq, to хотя бы один из миноров (га —1)-го порядка2) этого якобиана отличен от нуля в точке Mq. He ограничивая общности, будем считать, что в точке Mq отличен от нуля обведенный рамкой минор, стоящий в ле™ вом верхнем углу. Тогда, в силу предположения индукции, первые га — 1 уравнений системы A5.14) разрешимы отно- относительно 7ii,?i2,... ,um-i. Точнее, для достаточно малых по™ ло^^ительных чисел е\1е2-)--- ^т-i найдется такая окрест- окрестность точки М'^{ит1 #1, Ж2,... , хп) пространства R" переменных (umj х\1 Х21... , жп), что в пределах этой окрестности определены га — 1 функций щ = A5.18) i ° которые удовлетворяют условиям \u\ — и\ < 6i, ..., о — ит^\ < ет-\ и являются при наличии этих условий един- единственным непрерывным и дифференцируемым решением систе- системы первых га — 1 уравнений A5.14). Подставим найденные функции A5.18) в левую часть послед- г) При этом следует учесть замечание 2 к теореме 15Л. 2) Напомним, что минором (т — 1)-го порядка данного определителя т- го порядка называется определитель (т —- 1)-го порядка, полученный из данного определителя m-го порядка вычеркиванием одной строки и одного столбца.
§ 3 СИСТЕМЫ ФУНКЦИОНАЛЬНЫХ УРАВНЕНИЙ 583 него из уравнений A5.14). При этом левая частв последнего из уравнений A5.14) превращается в функцию, зависящую только ОТ Um^ Х\, • • • 5 %п Fm(ui,... ,ит^ъит,хъ... ,хп) = Fm[$i(um,xi,... ,хп)... , #m_i(tim,ib... ,xn),um,xi,... ,жп] = Ф(г/ш,Ж1,... ,жп) A5.19) (эту функцию мы обозначили буквой Ф). Таким образом, по- последнее из уравнений системы A5.14) приводит нас к уравнению Ф(г/Ш,жь... ,жп)=0. A5.20) В силу равенства A5.19) Ф(г?т,Ж1,... ,жп) можно рассматри- рассматривать как сложную функцию своих аргументов. Тогда, применяя теорему о дифференцируемости сложной функции, мы можем утверждать, что функция Ф(глш,Ж1,... ,хп) дифференцируема « 71 /Г II / ° ° ° \ в некоторой окрестности точки М-^ (um,xi,... ^хп) простран- пространства R". Равенство A5.19) и последнее из уравнений A5.14) по- позволяет утверждать, что Ф(гАт,жх,... , жп) = 0. Поэтому, что- чтобы доказать, что к уравнению A5.20) применима теорема 15.1 и это уравнение разрешимо относительно ит1 достаточно уста™ повить, что частная производная —— непрерывна и отлична от нуля в точке Mq . Чтобы сделать это, вычислим указанную част™ ную производную. Подставим в первые m — 1 уравнений системы A5.14) функции A5.18), являющиеся решением этих уравнений, и продифференцируем полученные при этом тождества по ит. Получим ^i|?i + ... + /^^ + ^l = 0, A5.211) г дРт^г дФт^1 ' ' ' d д ди\ дит ' ' ' dum~i дит дит дит' Далее продифференцируем по ит равенство A5.19). Получим | dFm _ д^ A5 21 dFm дФт^г | dFm _ д^ A5 21W) Умножим теперь равенства A5.211)^A5.21W) на соответствую- соответствующие алгебраические дополнения Д]_,А2,... , Ато элементов по™ следнего столбца якобиана A5.17) и после этого сложим эти ра™
584 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 венства. Получим 771—1 дФк Гд OF! д dF2 д dFm J дФк Гд OF! д dF2 д dFm) fcm L ^lAfe cfofc J In, ' Z, r% I • • • I —''III, ел I —lib ел OUm OUm OUm J 0Um Так как сумма произведений элементов данного столбца опре- определителя на соответствующие алгебраические дополнения эле- элементов этого (другого) столбца равна определителю (нулю), то каждая квадратная скобка равна нулю, а круглая скобка равна якобиану A5.17). Таким образом, мы получим А = Am|J. A5.22) Здесь символом А обозначен якобиан A5.17), а Аш — алгебраи- алгебраическое дополнение последнего элемента последнего столбца, ко- которое совпадает с минором, обведенным рамкой и, по предпо- предположению, отличным от нуля в точке Mq. Поделив равенство A5.22) на Ате, окончательно найдем 1Г- = 4- A5.23) OUm ^m Формула A5.23), справедливая в точке М"д;, доказывает непре- « <9Ф Ъ/Г11 ( Г А А рывность частной производной ^—— в точке Mq (ибо /л и /лт СОСТОЯТ ИЗ ЧаСТНЫХ ПРОИЗВОДНЫХ фуНКЦИЙ A5.16) ПО til, Ii2, • . • ... jUm, непрерывных в точке Mq). Кроме того, из формулы A5.23) вытекает, что -— в точке Mq отлична от нуля (ибо якобиан А отличен от нуля в точке Mq). Тем самым мы доказали, что к уравнению A5.20) можно применить теорему 15.1. Согласно этой теореме для достаточно малого положитель- положительного числа ет найдется такая окрестность точки Mq(xi, ... , хп) пространства Д;, что всюду в пределах этой окрестности опре- определена функция ит = tpm{x\^ Х2ч • • • , хп)^ A5.24) о которая удовлетворяет условию ит — ит < ет и является при наличии этого условия единственным непрерывным и диффе- дифференцируемым решением уравнения A5.20). Имея в виду, что функции A5.18) являются решениями первых т — 1 уравне- уравнений A5.14) при любых Um^xij... , жп из окрестности точки М^,
§ 3 СИСТЕМЫ ФУНКЦИОНАЛЬНЫХ УРАВНЕНИЙ 585 и вставляя найденную функцию A5.24) в A5.18), мы получим функции, зависящие только от переменных жх,... , жп: щ = (Эти функции мы обозначили символами </?х, • • • , <Рт-1-) Теоре- Теорема о дифференцируемости сложной функции дает право утвер™ ждать, что каждая из функций <рх, • • • , <Рт-1 дифференцируема в окрестности точки М"д (ж ]_,... , жп). Таким образом, мы окон™ чательно доказали, что т функций щ = . о . удовлетворяют в окрестности точки Мо условиям щ — щ] < о . < ?х, ..., ит — ит\ < ет и представляют собой при наличии этих условий единственное непрерывное и дифференцируемое в , , о ° \ некоторой окрестности точки М0(жх,... , жп) решение системы A5.14). Остается доказать, что функции A5.25) представляют собой единственное решение системы A5.14), удовлетворяющее усло- условиям \щ — щ\ < si, ..., \ит — ит\ < ет (при достаточно малых положительных Sx,... , sm). Предполо^^им, что, кроме функций A5.25), существуют еще т функций Щ = <Р1(Ж1,Ж2,... ,Хп) й2 = ф2(хъх2,... ,хп) A5.25') также являющихся решением системы A5.14) и удовлетворяю™ о .о щих условиям щ — щ\ < ex, ... , \ит — ит < ет. Тогда, в силу предположения индукции, первые (т —1) функ- функций A5.25) представляют собой при заданном ит = йт един™ ственное и дифференцируемое решение системы первых \т — 1)
586 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 уравнений A5.14). Но при заданном ит единственное решение системы первых (га — 1) уравнений A5.14) дается равенствами A5.18). Таким образом, справедливы соотношения щ = Ф(ЙТО,ЖЬ... ,ЖП), ............... A5.18') в которых Фх,... , Фт_1 — те же функции, что и A5.18). В таком случае последнее уравнение A5.14) и соотношения A5.19) позволяют нам утверждать, что йт является единствен™ ным решением уравнения A5.20), т. е. йт = ит. При наличии равенства йт = ит из соотношений A5.18') и A5.18) сразу же вытекает, что щ = щ, ..., йт-\ = ит-\. Теорема 15.2 полностью доказана. 2. Вычисление частных производных функций, неявно опреде- определяемых посредством системы функциональных уравнений. В этом пункте мы предположим, что выполнены условия теоремы 15.2, и займемся вычислением частных производных функций A5.25). Подставим функции A5.25) в систему уравнений A5.14), решением которой эти функции явля- являются, и продифференцируем получившиеся тождества по х\ (I = 1, 2,... , п). Получим дВ\_дщ_ | dF! дит [ дРг _ Q ди\ dxi ''' дчт dxi dxi ' ..................... A5.26) dFm ди\ dFm дит dFm _ dui dxi dum dxi dxi Равенства A5.26) представляют собой линейную систему уравнений от- дчг дит носительно т неизвестных ——, ... , -^—. Определитель этой системы яко™ OXi OXi биан A5.17) отличен от нуля в окрестности точки М®. Стало быть, система A5.26) имеет единственное решение, определяемое формулами Крамера: дчк _ D(ui,... Выражения для частных производных второго и последующих порядков ) можно получить посредством дифференцирования этих формул. ) Существование этих частных производных обеспечивается дополни- дополнительными ограничениями на функции A5.16).
§ 4 ЗАВИСИМОСТЬ ФУНКЦИЙ 587 3. Взаимно однозначное отображение двух множеств га- мерного пространства. Рассмотрим в некоторой окрестности точки Мо(ж1,... , хт) га функций .. ,хт), -.^). A5<27) Рассматриваемые га функций осуществляют отображение указанной окрестности точки Mq на некоторое множество {iV} m-мерного простран- пространства переменных iai , 1^2,... ,ит. Это отображение называется взаимно од- однозначным, если каждой точке из указанной окрестности точки Mq соответ- соответствует только одна точка множества {N}, так что при этом каждая точка множества {iV} соответствует только одной точке указанной окрестности ТОЧКИ Mq. Из теоремы 15.2 непосредственно вытекает следующее утверждение. Если функции A5.27) дифференцируемы в окрестности точки Mq, причем все частные производные первого порядка непрерывны в самой точ- ( ) ке Mq, а якобиан —-, f отличен от нуля в этой точке, то функ- D(xi,... ,xm) ции A5.27) осуществляют взаимно однозначное отображение некото- некоторой окрестности точки Mq{x\, ... , хт) на некоторую окрестность точки Nq(u\, ... ,ит), где щ = (fi(xi,... ,хт) (i = 1,2,... , га). В самом деле, соотношения A5.27) можно рассматривать как систему функциональных уравнений относительно xi,X2,- • • ,хт, для которой вы- выполнены условия теоремы 15.2. Но тогда эта система всюду в некоторой ,о ° \ окрестности точки J\o[ui,... , иш) имеет единственное решение: .. ,иш), ............ A5.27') Хт = фт(и1,. . . ,Um). Очевидно, что функции A5.27') осуществляют обратное отображение. Заметим, что в условиях сформулированного утверждения как функ- функции A5.27), осуществляющие прямое отображение, так и функции A5.27'), осуществляющие обратное отображение, являются непрерывными. Взаимно однозначное отображение, обладающее таким свойством, называется гомео- морфным. § 4. Зависимость функций 1. Понятие зависимости функций. Достаточное усло- условие независимости. Пусть т функций от одних и тех же п переменных щ = р( )
588 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 определены и дифференцируемы в некоторой открытой п- мерной области1) D. Будем говорить, что одна из этих функций^ например зд, зависит в области D от остальных функций^ если сразу для всех точек (#i, #2,... , хп) области D щ = Ф(^1,... , зд_1, зд_|_1,... , ит)^ A5.29) где Ф — некоторая функция^ определенная и дифференцируем мая в соответствующей области изменения своих аргумен- аргументов. Функции г^1, г/2, • • • jum будем называть зависимыми в области D, если одна из этих функций (все равно какая) за- зависит в области D от остальных. Если же не существует дифференцируемой функции Ф такой, что сразу для всех точек области D справедливо тождество вида A5.29), то мы будем называть функции г/i, г/2, - - - , ит независи- независимыми в области D. Примеры. 1. Легко убедиться в том, что три функции четырех переменных Щ = х\ 4 ¦Х2 х\ зависимы в любой области D четырехмерного пространства, ибо для всех точек (^1,^2,^3,^4) этой области щ = и\ — щ. 2. Покалсем теперь, что две функции двух переменных щ = = х+уи. U2 = х — у независимы в любой области D плоскости жу, содержащей начало координат. Яс- Ясно, что функция щ сохраняет по- постоянное значение нуль на прямой х + у = 0, проходящей через нача- начало координат (рис. 15.5). Но на этой прямой функция U2 имеет перемен™ ное значение г^2 = 2х. Поэтому на том участке этой прямой, который лежит внутри Z), U2 заведомо не за™ висит от щ. Совершенно аналогич- аналогично доказывается, что на лежащем внутри области D участке прямой х — у = О U2 = 0, щ = 2х и, стало быть, tii не зависит от и^- Рис. 15.5 ) В частности, в качестве области D можно взять некоторую окрестность фиксированной точки М® п~мерного пространства.
§ 4 ЗАВИСИМОСТЬ ФУНКЦИЙ 589 Замечание. В курсе линейной алгебры вводится понятие линейной зависимости функций: т функций щ, U2, • • • , иш называются линейно за- зависимыми в области D, если для всех точек области D одна из этих функций выражается в виде линейной функции от остальных. Ясно, что линейная зависимость функций является частным случаем зависимости этих функ- функций, ибо, если функции m,U2, • • • ,ит линейно зависимы в области D, то они зависимы в этой области, но существуют функции, зависимые в об л а™ сти D, но не являющиеся в D линейно зависимыми (например, функции, выписанные в примере 1). Теорема 15.3 (достаточное условие независимости функций). Пусть т функций от п ^ т переменных щ = Чт — (pmyXi^ . . . , %гт определены и дифференцируемы в окрестности точки Mo(#i,... ... , жш, жш+1,... , хп). Тогда если якобиан из этих функций по каким-либо т переменным отличен от нуля в точке Mq, то эти функции независимы в некоторой окрестности точки М®. Доказательство. Не ограничивая общности, будем считать, что в точке Mq отличен от нуля якобиан Докажем теорему от противного. Предположим, что функции til, U2, • • • , ит зависимы в некоторой окрестности точки Mq5 т. е. одна из этих функций, например щ, для всех точек этой окрест™ ности выражается в виде ик = Ф(иъ... ,ик^ъик+ъ... ,г/ш), где Ф — некоторая дифференцируемая функция. Пользуясь пра™ вилом дифференцирования сложной функции, вычислим произ- производную функции щ по любой из переменных х\ (I = 1, 2,... , т). Будем иметь дик _ дФ ди\ дФ duk^i , dxi диг dxi " " " duk-i dxi A5.31) Из формулы A5.31), если их взять для каждого значения I = = 1,2,... ,га в точке Mq, следует, что к~я строка якобиана A5.30) представляет собой линейную комбинацию остальных строк с коэффициентами, соответственно равными -—, -—, ... диг дч2
590 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 дФ дФ дФ .... , тг , ..., тг—. Но в этом случае якобиан A5.30) дик-1 дик+1 дит равен нулю в точке Mq, что противоречит условию теоремы. Пример. Уже рассмотренные выше две функции щ = = х + у ж 42 = х — у независимы в окрестности любой точки М(х1уI ибо якобиан \Ul>U2) — 1 - всюду. 2. Функциональные матрицы и их приложения. Снова рассмотрим т функций от п переменных A5.28): A5.28) ит = На этот раз предположим, что функции A5.28) определе- определены и дифференцируемые в некоторой окрестности точки Mq(x\1 ... , жп), причем все частные производные первого поряд- порядка этих функций непрерывны в самой точке М®. Составим из частных производных функций A5.28) следую- следующую функциональную матрицу: dxi дх2 ' ' ' дхп дх\ дх2 ' ' ' дхп A5.32) дх\ &Х2 ' ' ' дхп содержащую т строк и п столбцов. Имеет место следующее утверждение. Теорема 15.4' Пусть у функциональной матрицы A5.32) : 1) некоторый минор r-го порядка1) отличен от нуля в точке Mo(#i,#2, • • • Jxn)i 2) все миноры (г + 1)-го порядка равны ну- лю в некоторой окрестности точки Mq2). Тогда г функций, представленных в указанном миноре г~го порядка, независимы в окрестности точки Мо, каждая из остальных функций за- зависит в этой окрестности от указанных г функций. Доказательство. Не ограничивая общности, бу- будем считать, что в точке Mq отличен от нуля минор, стоящий ) Напомним, что минором г-то порядка данной матрицы называется определитель, составленный из элементов, стоящих на пересечении каких- либо г столбцов и г строк матрицы. 2) В случае, если г = min(m, п), требование 2) следует опустить.
ЗАВИСИМОСТЬ ФУНКЦИЙ 591 в левом верхнем углу матрицы A5.32), т. е. отличен от нуля определитель дхг dxr A5.33) Тогда независимость в окрестности точки М® функций iii,ii2,... ,ur сразу вытекает из теоремы 15.3. Остается дока- доказать, что любая из функций иг-\.\,... , г^1) зависит в окрест™ ности М® от tii,ti2,... чиг- Докажем, например, что иг-\.\ зави- зависит в окрестности точки М® от г^х, г^2, - - - ,иг- Сосредоточим свое внимание на первых г функциях A5.28). Если обозначить о о о / о о °\ ° , иг числа вида щ = </?х(жъ Ж2,... , жп), через щ = (pr(xi иг = 2j • • • ixn)j т0 ВСЮДУ в некоторой окрестности точки оо ° \ / \ (,, глг, жх,... ,хп) (п + г)™мерного пространства первые г функций A5.28) представляют собой единственное и дифферен™ цируемое решение следующей системы уравнений2): хп) = i,... ,xn) -щ = О, A5.34) —иг = С другой стороны, поскольку якобиан D(Fu...,Fr) D(xu... ,xr)' совпадающий с минором A5.33), отличен от нуля в точке /Vq, то систему A5.34) мо^кно в окрестности этой точки однозначно разрешить относительно жх,... ,жг. Иными словами, всюду в достаточно малой окрестности точки N® система A5.34) имеет единственное и дифференцируемое решение A5.35) хг = ) Конечно, при этом предполагается, что т > г. 2) В самом деле, в указанном точке Щ все функции F\,... , Fr обращают- ся в нуль, а якобиан —-—¦ ¦—™~ = (-— 1)г ф 0, так что выполнены условия D(ui,... , иг) теоремы 15.2.
592 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 Подчеркнем, что равенства A5.35) и первые г равенств A5.28) полностью эквивалентны в окрестности точки Щ. В частно- частности, если подставить х\1 х%1 ... , хГ1 определяемые уравнения- уравнениями A5.35), в первые г равенств A5.28), то указанные равенства обратятся в тождества относительно жг+1, ... ,жп, и\, ... , иг. Дифференцируя эти тождества по переменной х\ (I = г + 1,... ... ,п) и замечая, что щ, ... , иг не зависят от жг+1, ••• > xni будем иметь дфг дфг , , дфг дфг дфг _ п дх\ дхт A5.361; дфг _ g A5.36r) дф^дф^ + + ^ дхг dxi ' ' ' дхг dxi dxi Заметим, что равенства A5.361)-—A5.36' всех значений переменных х\,... , жг, жг_|_1, окрестности точки Mq. Для того чтобы убедиться в том, что функция iir+x зависит справедливы для , хп из некоторой в некоторой окрестности точки от urj подставим зна™ р р , , j чения жх,... ,жг, определяемые уравнениями A5.35), в (г + 1)-е равенство A5.28). При этом иг+\ превращается в функцию ар- аргументов ?ii,... , Tir,rEr+i,... , жп, ибо iir+i = (pr+i(xi,... , жг, ] (эту функцию мы обозначили буквой Ф). Остается доказать, что для всех значений переменных жх,... , жг,жг+1,... , жп, ле- ж:ащих в достаточно малой окрестности точки Mq, функция Ф не зависит от жг_|_1,... , жп. Для этого достаточно доказать, что для всех #i,... , жп из достаточно малой окрестности точки Mq справедливы равенства ??i - п г/ - -и 1 ^ Продифференцируем функцию Ф по переменной ж; ... , п) как сложную функцию. При этом получим дфг+г дфг , , дфг+г дфг дфг+г дФ дхг dxi " " " дхг dxi dxi dxi" Рассмотрим теперь следующий минор ( цы A5.32): A5.37) A = г + 1,... ^. A5.36-+1) OXi 1)-го порядка матри™ Д = дфг дхг дхг дхг дфг+i дхг дхг дфг+г дхг дхг дфг+i дхг A5.38)
ЗАВИСИМОСТЬ ФУНКЦИЙ 593 По условию теоремы этот минор равен нулю всюду в окрестно- окрестности точки Mq. Умножим равенства A5.361)—A5.36r+1) на соот- соответствующие алгебраические дополнения Д]_,... , Ar, Ar+i эле™ ментов последнего столбца минора A5.38) и после этого сложим все эти равенства. В силу теоремы о том, что сумма произведе- произведений элементов данного столбца на соответствующие алгебраиче- алгебраические дополнения элементов этого (другого) столбца равна опре- определителю (нулю), получим1) Д = |*Дг+1. A5.39) В равенстве A5.39) символ Д обозначает минор A5.38), равный нулю всюду в окрестности точки Мо, а алгебраическое допол™ нение Дг+1 совпадает с минором A5.33), отличным от нуля в точке Mq, а стало быть, и в некоторой окрестности этой точ™ ки2). Из равенства A5.39) заключаем, что всюду в некоторой окрестности точки М® справедливы равенства A5.37). Теорема доказана. Пример. Вернемся к исследованию зависимости функций 2 U\ — X-i i Ж Щ = Xi + Х 1 2 2 3 + #4, Функциональная матрица A5.32) имеет вид 2x4 1 Легко убедиться в том, что все определители 3™го порядка то™ ждественно равны нулю, причем в любой точке пространства (жх,Ж2,жз,Ж4), у которой не все четыре координаты жх,Ж2,жз,Ж4 совпадают, хотя бы один из определителей второго порядка 2хг 1 2х2 1 1 2X4 1 1 1 отличен от нуля. Стало быть, в окрестности любой указанной точки щ и U2 независимы, а щ зависит от щ и иъ- х) При этом мы повторяем рассуждения, подробно описанные на с. 584. 2) Поскольку все частные производные, входящие в минор A5.33), непре- непрерывны в точке Мо, то и сам минор A5.33) непрерывен в точке Mq. Но тогда по теореме об устойчивости знака непрерывной функции этот минор отли- отличен от нуля не только в самой точке Мо, но и в некоторой ее окрестности.
594 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 § 5. Условный экстремум 1. Понмтие условного экстремума. В § 6 гл. 14 мы зани- занимались отысканием локальных экстремумов функции, аргумен™ ты которой не связаны никакими дополнительными условиями. Вместе с тем в математике и в ее приложениях часто встречается задача об отыскании экстремумов функции^ аргументы кото- которой удовлетворяют дополнительным условиям связи. Экстре™ мумы такого рода мы будем называть условными^ чтобы отли™ чить их от (безусловных) экстремумов, изученных в § 6 гл. 14. Приведем пример задачи об отыскании условного экстрему- экстремума. Пусть требуется найти экстремум функции и = х2 + у2 при условии, что аргументы этой функции удовлетворяют условию связи х + у — 1 = 0. Таким образом, экстремумы функции и = = х2 + у2 ищутся не на всей плоскости ху^ а лишь на прямой х + у — 1 = 0. Для решения поставленной задачи подставим в уравнение функции и = х2 + у2 значение у, определяемое из условия связи х + у — 1 = 0. Таким путем мы сведем постав- поставленную задачу к задаче об отыскании безусловного экстремума функции и = 2х2 — 2ж + 1. Последний экстремум находится без труда: поскольку и1 = = 4(ж — 1/2), и^ = 4, то функция и = 2х2 — 2х + 1 имеет минимум и = 1/2 при х = 1/2. Таким образом, функция и = = ж2 + у2 с условием связи ж + у^ 1 = 0 имеет условный минимум и = 1/2 в точке A/2,1/2). Отметим, что безусловный минимум функции и = х2 + у2 достигается в точке @, 0) и равен и = 0. Впрочем, далее из наглядных соображений (рис. 15.6) очевидно, что минимум функции и = х2 + у2 (графиком которой служит параболоид вращения) на всей плоскости ху не совпадает с ее минимумом на прямой х + у — 1 = 0. Переходим к общей постановке задачи об отыскании условно- условного экстремума. Пусть требуется найти экстремум функции т+п переменных и = Джь... ,жп,у1,... ,уш) A5.40) при наличии т условий связи Fi(xb... ,xn,yi,... ,ym) = 0, F2(xu... ,xn,yi,... ,ут) =0, (I0.4IJ Рт{хъ... ,хп,уъ... ,уш) = 0. Прежде всего уточним само понятие условного экстремума функции A5.40) при наличии связей A5.41). Будем говорить,
условный экстремум 595 что функция A5.40) при наличии связей A5.41) имеет услов- / ч , , /О ОО ° \ ныи максимум [минимум) в точке Mq{x\^... ,жпу15... ,ymj, координаты которой удовлетворяют условиям связи A5.41), если найдется такая окрестность точки Mq, в пределах ко- которой значение функции A5.40) в точке Mq является наиболь- наибольшим (наименьшим) среди ее значений во всех точках^ коорди- координаты которых удовлетворяют условиям связи A5.41). Для нахождения условного экстре- экстремума функции A5.40) при наличии связей A5.41) предположим, что функ- функции, стоящие в левых частях равенств A5.41), дифференцируемы в некото™ рой окрестности рассматриваемой точ- точки Mq, причем в самой точке Mq част- частные производные указанных функций по ух,... , ут непрерывны, а якобиан ,Fm) A5.42) отличен от нуля. В таком случае в силу теоремы 15.2 для достаточно малых положи- положительных чисел ?i,?2,... j?m найдется такая окрестность точки Mq(xi, ... , жп) пространства переменных (жх,... , жп), что всю- всюду в пределах этой окрестности определены т функций Рис. 15.6 ух = 1/2 = A5.43) Ут = удовлетворяющих условиям \уг -уг\ < еъ ..., \ут - ут\ < ет и являющихся при наличии этих условий единственным и диффе™ ренцируемым решением системы уравнений A5.41). Подставляя найденные функции A5.43) в A5.40), мы сведем вопрос о суще- существовании условного экстремума в точке Mq у функции A5.40) при наличии связей A5.41) к вопросу о существовании безуслов- безусловного экстремума в точке Mq у сложной функции аргументов и = ,хп)] = ). A5.44)
596 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 Вопрос о существовании безусловного экстремума функции A5.44) может быть решен методами, указанными в § 6 гл. 14 г). Изложенная нами общая схема сведения условного экстремума к безусловному была реализована в рассмотренном выше частном примере. Постараемся теперь, не прибегая к решению систе- системы A5.41), установить по крайней мере необходимые условия существования условного экстремума в точке Mq. Итак, пусть функция A5.40) дифференцируема в точке Mq и имеет в этой точке условный экстремум при наличии связей A5.41) или (что то же самое) функция A5.44) имеет в точке Mq безусловный экстремум. Согласно установленному в § 6 гл. 14 необходимым условием безусловного экстремума функции и = Ф(#1,... , хп) в точке Mq является равенство нулю в этой точке дифференциала этой функции du = -— dx\ + ... + -— dxn = 0, A5.45) ОХ л UX тождественное относительно d#i,... , drrn. В силу инвариантно- инвариантности формы первого дифференциала и равенства A5.44) форму™ лу A5.45) можно переписать в виде (В этой формуле все частные производные берутся в точке Mq.) Подчеркнем, однако, что в равенстве A5.46) dyi,... ^dym пред- представляют собой дифференциалы функций A5.43), так что равен- равенство A5.46) не является тождеством относительно dyi,... , dym. Предположим, что в уравнения связи A5.41) мы подставили функции A5.43), являющиеся решением системы A5.41). При этом уравнения A5.41) обратятся в тождества, и мы получим, дифференцируя эти тождества, д-^ dx\ + ... + -^- dxn + -^- dyi + ... + —i- dym = 0, ox i dxn dyi дут ............................. A5.47) ЯР ЯР ЯР ЯР , = о. ox i dxn dyi oym Так как якобиан A5.42), по предположению, отличен от нуля в точке Mq, то из линейной системы A5.47) dyi,... , dym могут быть выражены как линейные функции dx\,... , dxn. Если най- найти эти выражения и подставить их в A5.46), то, собирая в по™ ) При этом, конечно, придется подчинить функцию A5.40) некоторым условиям.
§ 5 УСЛОВНЫЙ ЭКСТРЕМУМ 597 лученном равенстве члены, содержащие dx\,... , dxnj мы будем иметь Aidxi + ... + Andxn = 0, A5.48) где через А\,...,Ап обозначены некоторые рациональные функции частных производных /, i*\,... , Fm в точке Mq. Так как в равенстве A5.48) фигурируют лишь дифференциалы неза- независимых переменных^ то из этого равенства заключаем, что А\ = 0, ..., Ап = 0. Присоединяя к указанным равенствам т условий связи A5.41), мы получим необходимые условия суще™ ствования условного экстремума функции A5.40) при наличии связей A5.41) в виде Ai=0,... ,An = 0,Fi=0,... ,Fm = O. A5.49) Равенства A5.49) представляют собой систему т + п уравне- уравнений для определения т + п координат точки возможного экстре- экстремума. 2. Метод неопределенных множителей Лагранжа. При изложенном выше методе отыскания точек возможного условного экстремума мы нарушили симметрию в отношении переменных ж]_,... ,жп,у]_,... ,ут. Часть из этих переменных жх,... ,хп мы рассматривали как независимые, остальные — как функции этих переменных. В ряде случаев это приводит к усложнению выкладок. Лагранжем предложен метод, сим- метризирующий роль переменных. Изложению этого метода и посвящен настоящий пункт. Умножим равенства A5.47) соот™ ветственно на произвольные (и пока еще неопределенные) по- постоянные множители Ai,... , Хт. Полученные после умножения равенства сложим почленно с равенством A5.46). В результате получим следующее равенство: 1r—dxi + ... + ir- dxn + — dyi + ... + -— dym = 0, A5.50) ox i dxn oyi aym где символом Ф(ж]_,... , xnj y\,... , ym) обозначена следующая функция * = / + AiFi + ... + AmFm. A5.51) Эту функцию мы в дальнейшем будем называть функцией Лагранэюа. Считая, что для функций A5.41) выполнены усло- условия, сформулированные в предыдущем пункте, и что функция A5.40) дифференцируема, выберем множители Ai,... , Ате так, чтобы выполнялись равенства |^=0,...,|* =0. A5.52) дуг ду
598 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 Это заведомо можно сделать, ибо равенства A5.52) приводят к линейной системе m ^ = U, определитель которой (якобиан A5.42)) отличен от нуля. В силу равенств A5.52) равенство A5.50) принимает вид ^-dx1 + ... + ^-dxn = 0. A5.53) 0Х1 ОХ л Поскольку при сделанных выше предположениях переменные #1,... ,жп являются независимыми, то из равенства A5.53) за- заключаем, что »=0,....»=0. A5.54) Присоединяя к уравнениям A5.52) и A5.54) условия связи A5.41), мы получим систему п + 2т уравнений 0 0 0 0 дхг ' ''' ' дхп ' dyi ' ''' ' дут ' A5.55) Fi = 0,... , Fm = 0 для определения п + т координат точек возможного условного экстремума и т множителей Ai,... , Хт. Практически при ре™ ализации этого метода поступают следующим образом. Соста- Составляют функцию Лагранжа A5.51) и для этой функции находят точки возможного безусловного экстремума. Для исключения множителей Ai,... , Ате привлекают условия связи A5.41). Такой путь отыскания точек возможного условного экстремума явля- является законным, ибо он приводит нас как раз к системе п + 2т уравнений A5.55). Пример применения метода множителей Ла- Лагранжа будет рассмотрен в п. 4. 8. Достаточные условия. В этом пункте мы рассмотрим один из путей дополнительного исследования точек возможного условного экстремума. Предположим, что в точке М$ выполне- выполнены необходимые условия экстремума A5.55). Кроме того, допол- дополнительно потребуем двукратной дифференцируемости функций A5.40) и A5.41) в окрестности точки Mq и непрерывности всех частных производных 2-го порядка в самой точке Mq. Из кон- конструкции функции Лагранжа A5.51) очевидно, что при наличии связей A5.41) экстремумы функции A5.40) и функции Лагран-
§ 5 УСЛОВНЫЙ ЭКСТРЕМУМ 599 жа совпадают1). Но тогда из результатов § 6 гл. 14 вытекает, что для получения достаточного условия экстремума в точке М® у функции A5.40) при наличии связей A5.41) следует присо- присоединить к условиям A5.55) требование знакоопределенности в этой точке с!2Ф. При этом в соответствии с результатами § 6 гл. 14 мы можем констатировать наличие в точке М® минимума, если при наличии связей A5.41) с?2Ф|мо >0, и максимума, если с12Ф|м0 < 0- Сделаем еще несколько замечаний практическо- практического характера. Прежде всего отметим, что второй дифференциал с!2Ф можно в данной точке М® возможного экстремума вы- вычислять так^ как если бы все переменные х\,... , жп, ух,... , ут были независимыми. В самом деле, в общем случае второй диф- дифференциал й2Ф функции Ф не обладает свойством инвариант- инвариантности формы и должен был бы с учетом зависимости у\,... , ут от #1,... , хп определяться равенством Но в точке возможного экстремума М® справедливы равенства дуг U' ' ' ' ' Зут U' так что с!2Ф определяться той же формулой x-g- + ... + dxn^- + dVl /- + ... + dxmJ^-Y Ф, ox i 0xn ay i oymj A5.56) что и в случае, когда все переменные жх,... , жп, ух? • • • 5 Ут неза- независимы. Далее, заметим, что поскольку нам требуется уста™ новить знакоопределенность сРФ лишь при наличии связей A5.41), то при проведении вычислений следует в формулу A5.56) для о?2Ф подставить вместо dyx,... ^dym их значения, определяемые из системы A5.47). После этого следует изучить вопрос о знакоопределенности с?2Ф в данной точке М®. Теперь мы можем перейти к рассмотрению примера. ) Это вытекает из того, что при наличии связей A5.41) разноств f(M) — — /(Mo) совпадает с разноствю Ф(М) — Ф(М0).
600 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 4. Пример. Предположим, что нам требуется найти макси™ мальное и минимальное значения величины определителя Д = XI х2 Уг 2/2 Уп A5.57) причем известна сумма квадратов элементов каждой строки это- этого определителя. Задача сводится к отысканию экстремальных значений функции п2 переменных A5.57) при наличии следую- следующих п условий связи г): х\ ¦f/l + ¦yl + ¦ zk = /12, A5.58) xl zl = где /ii, /&2? • • • ihn — заданные пололсительные числа2). Для ре- решения поставленной задачи рассмотрим и решим более про- простую задачу. Фиксируем у определителя A5.57) в экстремаль- экстремальной точке элементы всех строк, за исключением одной к~й строки. В таком случае определитель A5.57) можно рассматри- рассматривать как функцию п переменных Ж?,у?,... , #&. Явное выраже- выражение этой функции можно получить, разложив определитель по элементам fc-й строки: Д = xkXk + ykYk A5.59) Здесь через Xkl Ykl... , Zk обозначены алгебраические дополне- дополнения соответствующих элементов хк, ук,... , zk. Так как элемен™ ты всех строк определителя, кроме fc-й, фиксированы в экстре- экстремальной точке, то Xki Уд., ... , Zk можно рассматривать как постоянные числа. Поставим задачу об отыскании экстремумов щи A5.59) при наличии одного условия связи3) ^2 . 2 |^ |^ 2 l /1 г /^п\ Хд, т~ ук ~г . . . ~г Zfc — '"к" ylD.yjyJj 1) Вопрос о существовании экстремальных значений не вызывает сомне- сомнений, ибо функция A5.57) является непрерывной функцией своих п пере- переменных на замкнутом множестве A5.58). ) Мы опускаем тривиальный случай, когда хотя бы одно из чисел /ii, /&2, • • • ,hn равно нулю. В этом случае определитель A5.57) тождествен- тождественно равен нулю. 3) В качестве этого условия мы берем k-е из условий A5.58).
§ 5 УСЛОВНЫЙ ЭКСТРЕМУМ 601 Для решения этой задачи составим функцию Лагранжа Ф = хкХк + ykYk + ... + zkZk + \{х\ + у* + ... + *| - Л*), A5.61) и для этой функции решим вопрос о безусловном экстремуме. Из условий ? = 0, = Zk + 2Xzk = 0 находим координаты точки возможного экстремума Постоянный множитель А легко исключить из условия связи A5.60). Из этого условия находим два значения: (При этом мы снова опускаем тривиальный случай, когда все Xfc,Yfc,... , Zk равны нулю, ибо в этом случае определитель A5.59) тождественно равен нулю.) Таким образом, мы получаем две точки возможного экстре- экстремума: 2Ai 2Ai ' 2Ai/ V 2A2' 2A2' ' 2A2 Докажем, что в точке М\ реализуется условный минимум, а в точке М~2 — условный максимум. Для этого вычислим второй дифференциал с?2Ф функции Лагранжа A5.61). Легко видеть, что сРФ = 2X[(dxkf + (dykf + ... + (dzkJ}. Из последней формулы вытекает, что арф представляет собой положительно определенную квадратичную форму при А = = Ах > 0 (т. е. в точке М\) и отрицательно определенную — при А = А2 < 0 (т. е. в точке М2). Итак, функция A5.59) при наличии связи A5.60) имеет условный минимум в точке М\ и условный максимум в точке М.^- Не вычисляя наибольшего и наименьшего значений функции A5.59) при наличии условия A5.60), заметим, что в той точке, в которой достигаются эти
602 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 значения, справедливы равенства A5.62), а стало бвхть, спра™ ведливы равенства f-f = - = Ь A5-63) Возвратимся теперь к вычислению экстремальных значений определителя A5.57) при наличии п связей A5.58). Сохраняя смысл принятых выше обозначений Х^, Y&,... , Z^, согласно из™ вестному свойству определителя для любого г, отличного от fc, можем записать ^А + 1/Л + • • • + ziZk = 0 (г ^ fc). A5.64) Из равенств A5.63) и A5.64) находим, что %i%k + УгУк + • • • + ZiZk = 0 (при гфк). A5.65) Равенства A5.58) и A5.65) и правило перемножения определите™ лей позволяют заключить, что при умножении определителя А самого на себя получается определитель, все элементы которо™ го равны нулю, за исключением элементов главной диагонали, которые равны соответственно /ii, h2j • • • ,hn. Таким образом, А- Д = A2 = h1h2...hn. Стало быть, максимальное и минимальное значения величины определителя A5.57) при наличии условий A5.58) соответствен- соответственно равны +\/h\h2 ... hn и —\/^i^2 • • -hn. Тем самым мы получа- получаем, что или \ + ... + z\){xl + ... + 4)...{xl + ... + zl). A5.66) Последнее неравенство, справедливое для произвольного опре- определителя A5.57), называется неравенством Адамара1). Замечание. При п = 3 неравенство Адамара A5.66) до- допускает простую геометрическую интерпретацию. В этом случае | А| представляет собой объем параллелепипеда, построенного на отрезках ОА\, ОА2 и ОАз, соединяющих начало координат О с точками Ai(xi,yi,zi), A2(x2l2/2,22), ^3(^3,2/3,23). Неравенство A5.66) утверждает, что из всех параллелепипедов, имеющих ре™ бра данной длины, наибольший объем имеет прямоугольный па- параллелепипед. г) Жак Адамар — французский математик A865-1963).
ДОПОЛНЕНИЕ 603 ДОПОЛНЕНИЕ ЗАМЕНА ПЕРЕМЕННЫХ В ряде вопросов анализа и других разделов математики встречается задача о замене переменных. Эта задача заключается в следующем. Пред™ положим, что нам задано некоторое выражение содержащее независимые переменные ж, у, функцию z = z(x,y) и ее част- частные производные. Вместо независимых переменных х и у и функции z = = z(x,y) вводятся новые независимые переменные и и v и новая функция w = w(u,v), причем заданы соотношения, посредством которых и, v и w выражаются через ж, у и z: и = (p(x,y,z), v = il>(x,y,z), A5.68) w = x(x,y,z). Требуется преобразовать выражение A5.67) к новым переменным и, v и w. При этом мы будем предполагать, что функции A5.68) достаточное число раз дифференцируемы и что систему A5.68) можно разрешить относитель™ но ж, у и z, а первые два уравнения A5.68) — относительно х и у. Очевидно, для решения поставленной задачи достаточно выразить част™ dz dz dw dw ные производные -т—. -^—. ... через и, v. w. тг™°, -^—, • • • Укаж:ем, как это дх ду ди dv мож:но сделать. Имея в виду, что z = z(x,y), aw = w(u,v), запишем первые дифферен- дифференциалы функций A5.68). Получим dip dtp д(р dip dip dip (dz dz \ du= —dx+ —dy+ —dz= —dx+ —dy+ —\ — dx+ —dy), ox oy dz ox dy dz \dx oy / A5.69) dip , dtp J dtp J dtp . dtp _ dtp /dz J dz 1 \ ^ dx + ^ dy + ^ dz = ^ dx + ^ dy +-?-[ — dx + — dy), dx dy dz dx dy dz \dx dy J A5.70) du dv dx dy dz \dx dy J Подставляя в A5.71) du и dv, определяемые формулами A5.69) и A5.70), и приравнивая коэффициенты при dx и dy, получим систему двух уравнений dwvdcp dip dzi dwidtp dtp dzi _ dx dx dz du L dx dz dxi dv I dx dz dx J dx dz dx' dw г dip dip dzi dw idtp dtp dzi dx dx dz ~duldy+ "dzlfyl + Ihildy + ~dz~dyi ~ Ъу + ~dz~dx'
604 ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ ГЛ. 15 dz dz из которой легко выразить тг™ и тг™: дх ду dw dp dw дф дх dw д(Р dw дФ дХ dz = ЪиЪх+ЪуЪх^ Ъх dz = ди ду dv ду ду dx dw d(p dw dф dx ' dy dw dip dw dф dx ' du dz dv dz dz du dz dv dz dz Если выражение A5.67) зависит также и от частных производных второго порядка, то для определения этих производных через частные производные w по и и v следует записать первые дифференциалы от уже вычисленных производных первого порядка. Замечание 1. Аналогично производится замена и в случае, когда старые переменные связаны с новыми не соотношениями A5.68), а неявными соотношениями вида г) $i(u,v,w,x,y,z) = О, Ф2(щу,'ш,х,у,г) = 0, A5.72) Фз(г?, v, w, ж, у, z) = 0. Замечание 2. Мы ограничились случаем двух независимых переменных лишь для сокращения записи. Указанный прием применим для случая любого числа независимых переменных (и, в частности, для случая одной независимой переменной). Пример. Пусть z есть функция переменных ж и у. Преобразовать 2\ выражение ) F = Az = т— + -х-т dx2 dy2 к полярным координатам и ш v: x = ucosv, y = usinv. A5.73) Отметим, что в данном примере производится лишь замена независи- независимых переменных. Функция z остается при этом неизменной. Из A5.73) вы- вытекает, что dx = cos v du — и sin v dv, dy = sin v du + и cos v dv, поэтому из соотношений dz dz dz dz dz = — dx + — dy = — du + — dv ox dy du dv имеем dz dz dz dz ^^ (cos v du — и sin v dv) + ^— (sin v du + и cos v dv) = 7^ du + 7^ dv. dx dy du dv г) Допускающими, конечно, разрешимость как относительно и, v и w, так и относительно ж, у и z. ' ) Указанное выражение называется оператором Лапласа. Оно играет важную роль в матемашке и ее приложениях. Пьер Симон Лаплас — фран- французский астроном, математик и физик A749-1827).
ДОПОЛНЕНИЕ 605 Приравнивая коэффициенты при du и dv, найдем dz dz . dz — COS V + — Sill V = тг—, аж аг/ cm dz . dz dz -7-usmti + тг-и cost; = -^—. ox dy dv Отсюда сЪ dz 1 . сЪ —- = cost;— - -sinw —, ож du и dv dz . dz 1 а* — = suit; — + -cost;--. uy ou и ov d(—\ Найдем теперь тг—т. Так как тг^т = —?г^—5 т0 из первой формулы A5.74) ох1 ох2 ох находим - -smi; = \У =cost; \Р smi; = dx2 dx du и dv d \ dz 1 . dzi 1 . d г а^ 1 . а^1 = cos t; — cos t; — sin v тг— sin v — cos i; — sin v — . out ou и ovj и ov I ou и ovi После вычислений получим d2z 2 d2z 2 . а2^ 1.2 а2^ ¦тГТ = cos v^— sin г; cos г; + ^r sin ^7^7 + ож2 агг^ ii, ottc/t; u2 dv2 1 . 2 dz 2 . o>^ + -sm t;-™ + -rsmvcosi;™. гг агг гг^ at; Аналогично, из второй формулы A5.74) находим =sini; у + - cos г; at/2 ay an n ov ^2 о a2 1 o>2 1 о . 2 О Z Z . О Z I 2f^J- 2 ^^ = Sin V^-^r -\ Sin V COS V TT^Z 1 о COS VtT^ H COS Vtt du2 и dudv u2 dv2 и du 2 . o>^ Sin V COS V 7Г™ . ti2 at; Таким образом, в полярных координатах и и v оператор Лапласа Az = d2z d2z = тг^7 + тг^т имеет следующий вид: dx2 dy2 Az-— -— — — du2 и du и2 dv2 '
ГЛАВА 16 НЕКОТОРЫЕ ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ § 1. Огибающая и дискриминантнам кривам однопараметрического семейства плоских кривых 1. Предварительные замечания. Мы будем задавать плоские кривые либо при помощи параметрических уравнений x = ip(a), у = ф(а), A6.1) где а — некоторый параметр, либо при помощи уравнений вида F{x,y)=0. A6.2) В дальнейшем нам понадобятся понятия обыкновенной и особой точек кривой. Пусть кривая L определяется параметрическими уравнени- уравнениями A6.1), причем функции х = ip{pt) и у = ф(а) имеют при а = а® непрерывные производные. Точку М®(х®^у®) КРИВ0^ L, координаты х® и у® которой соответственно равны (р(а®) и ф(а®), назовем обыкновенной^ если O. A6.3) Если же при а = а® выполняется соотношение 220, A6.4) то точку М® мы назовем особой точкой кривой L. Пусть кривая L определяется уравнением A6.2), причем функция Р(х^у) дифференцируема в некоторой окрестности точки М®(х®^у®) этой кривой и имеет в указанной точке непре™ рывные частные производные по ж и у. Точку М®(х®^ у®) назовем
§ 1 ОГИБАЮЩАЯ И ДИСКРИМИНАНТНАЯ КРИВАЯ 607 обыкновенной точкой кривой L, если в этой точке выполняется соотношение г) F? + F®jL0. A6.5) Если же в точке Mq выполняется соотношение i^2 + *f = 0, A6.6) то эту точку мы назовем особой точкой кривой L. Убедимся, что если точка Mq кривой L является обыкновенной^ то в неко- некоторой окрестности этой точки кривая L представляет собой либо график некоторой дифференцируемой функции у = /(ж), либо график некоторой дифференцируемой функции х = g{y). В самом деле, пусть кривая L определяется параметрическими уравнениями A6.1) и, кроме того, выполнено условие A6.3). Из непрерывности производных (f'(o) и ф'f(a) при а = а® и из усло- условия A6.3) вытекает, что в некоторой окрестности «о хотя бы од™ на из этих производных, например (рг(а), не равна нулю.. Тогда функция х = ip{pt) является дифференцируемой строго моно- монотонной функцией в отмеченной окрестности. При этих условиях существует дифференцируемая монотонная обратная функция а = ср^1(х). Подставляя эту функцию в выражение у = ф(р/)^ мы убедимся, что кривая L в некоторой окрестности точки М® представляет собой график дифференцируемой функции у = = f(x) = ф[(р^1(х)]. Справедливость сформулированного утвер- утверждения для случая, когда кривая задается при помощи уравне- уравнения A6.2), вытекает из того, что в окрестности обыкновенной точки действует теорема 15.1 о неявных функциях, и поэтому прилегающий к обыкновенной точке участок кривой предста™ вляет собой график дифференцируемой функции у = f(x) или функции х = g (у). Замечание 1. В геометрии точку Mq кривой L называют обык- обыкновенной, если в некоторой окрестности этой точки кривая L представляет собой график некоторой дифференцируемой функции, и особой, если в лю- любой окрестности этой точки кривая L не может быть представлена в виде графика дифференцируемой функции. Мы видели, что точка кривой L, яв™ ляющаяся обыкновенной согласно нашему определению, будет также обык- обыкновенной с геометрической точки зрения. Можно привести примеры, когда точка кривой, являющаяся особой по нашему определению, будет обыкно- обыкновенной с геометрической точки зрения. Таким образом, наше определение обыкновенной точки является более узким, чем геометрическое, но более удобным для приложений. Введем теперь понятие касания кривых L\ и L^ в их общей точке Mq. Будем говорить, что кривые L\ и L2 касаются в их ) Понятия обыкновенной и особой точек для кривой A6.2) уже были введены в п. 3 § 2 гл. 15.
608 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 общей точке Mq , если обе кривые имеют в точке Mq касательные и эти касательные совпадают. В дальнейшем нам понадобится условие касания двух кривых L\ и L2. Пусть кривая L\ определяется уравнением A6.1), а кривая ?*2 — уравнением A6.2) и Mq(xq, у о) — общая точка этих кривых (при этом координаты xq и у® отвечают значению а = olq пара- параметра а). Будем считать, что точка Mq является обыкновенной точкой кривых L\ и L2 и эти кривые касаются в точке Mq. To™ гда эти кривые представляют собой в окрестности Mq графики дифференцируемых функций. Ради определенности будем счи- считать, что L\ и L2 являются графиками функций у = fi(x) и У = f2(x)- Так как по условию кривые L\ и L2 касаются в точ- точке М"о(жо,|/о), то угловые коэффициенты касательных в Mq к графикам функций fi(x) и /2(ж) равны, т. е. /{Ы = /гЫ- A6.7) Используя формулы дифференцирования функций, заданных параметрически (см. § 11 гл. 5), и формулы дифференцирования неявных функций (см. п. 2 § 2 гл. 15), получим ' Ы о) " ~ЩЩ- { ] Формулы A6.8) позволяют придать равенству A6.7) следующий вид: или F^{Mo)<p'(ao) + ^(Мо)^'(ао) = 0. A6.10) Последнее соотношение мы будем в дальнейшем называть усло- условием касания в точке Mq кривых L\ и 1^, заданных соответ- соответственно уравнениями A6.1) и A6.2). Опуская аргументы функ- функций и используя обозначения с// = -^ и фг = -р-, мы запишем и ф = условие касания в следующей форме: 0. A6.11) Замечание 2. Если в общей точке Mq кривых L\ и L2, заданных соответственно уравнениями A6.1) и A6.2), выполне- выполнено условие касания A6.10) (или, что то же самое, A6.11)) и если при этом точка Mq является обыкновенной точкой кривых L\ и 1^2, то кривые L\ ж L2 касаются в точке Mq. В самом деле, из соотношений A6.3), A6.5) и из условия A6.10) вытекает либо
ОГИБАЮЩАЯ И ДИСКРИМИНАНТНАЯ КРИВАЯ 609 т. е. равенство уг- условие A6.9), либо условие -, , ч ловых коэффициентов касательных в общей точке Mq кривых L\ и i/2- Это и означает, что кривые L\ и h^ касаются в Mq. Заметим, что условие касания выполняется также и в случае, когда точка Mq является особой точкой по крайней мере одной из кривых L\ и i/2- Итак, условие касания A6.10) выполняется как в случае, ко- когда кривые L\ и Li2 касаются в точке Mq, так и в случае, ко- когда Mq является особой точкой по крайней мере одной из этих кривых. 2. Однопараметрическме семейства плоских кривых. Характеристические точки кривых семейства. В различ- различных геометрических и физических задачах часто встречаются семейства плоских кривых. В геометрической оптике рассматри- рассматриваются отраженные и преломленные пучки (семейства) лучей, в механике — семейства возможных траекторий материальной ча- частицы в данном поле сил, в геометрии — семейства касательных к кривым линиям. Один из возможных способов задания такого рода семейства линий заключается в следующем. Рассматрива- Рассматривается функция F(x,y,a) трех переменных ж, у, а и для каждого значения параметра а из данного множества {а} х) определяет- определяется кривая семейства при помощи уравнения F(x,y,a)=0. A6.12) Мы будем говорить, что соотношение A6.12) определяет од- нопараметрическое семейство плоских кривых. Параметр а бу- будем называть параметром семейства. Рассмотрим примеры однопараметрических се- Уп мейств плоских кривых. 1°. Уравнение у ~~ (х — — аJ =0 определяет се- семейство парабол, получа- получаемых сдвигом по оси Ох параболы у — х2 = 0 (рис. 16.1). 2°. Уравнение (у — — аJ — (х — аK = 0 опре- определяет семейство полу- полукубических парабол, полученных параллельным сдвигом вдоль биссектрисы первого координатного угла полукубической пара- параболы у2 = ж3 (рис. 16.2). О (а, 0) Рис. 16.1 1) Обычно множество {а} представляет собой некоторый интервал. 20-г В.А. Ильин, Э.Г. Позняк, часть I
610 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 У Пусть функция F(x^y^a) является дифференцируемой функцией в области ее задания. В этом случае можно ввести понятие характеристической точки кривой семейства, определяемого соотношением A6.12). Точка М(х^у) называ™ ется характеристической точ- точкой кривой семейства A6.12), отвечающей данному значению а параметра семейства, если координаты х ж у этой точки удовлетворяют системе уравне™ ний F(x,y,a) =0, A6.13) Рис. 16.2 Рассмотрим геометричес- геометрическую интерпретацию характе- характеристической точки кривой се- семейства A6.12). Для простоты ограничимся случаем, когда любые две кривые семейства пере- пересекаются1). Пусть La и La+Aa — Две кривые семейства A6.12), отвечающие значениям параметра а и а + Аа (рис. 16.3). Ко- Координаты точки N их пересечения удовлетворяют следующей системе уравнений: F(x, у, а) = 0, F(x, y,a или равносильной системе Аа) = 0 F(x, у, а + Аа) - F(x, у, а) _ Аа Если Аа —> 0, то точка Ж, распо- расположенная на кривой F(x^y^a) = 0, Рис. 16.3 стремится, вообще говоря, к некото- некоторой точке М на этой кривой. Так как -,. Fix. у, a + Аа) ~~ Fix. у. а) ,-,// \ lira v 7 v 7 = га(х, у,«), то координаты точ™ Aa^O Aa ки М удовлетворяют уравнениям A6.13), и поэтому точка М является характеристической точкой кривой семейства. Итак, характеристическая точка данной кривой — это та точка, кото™ ) Существуют такие семейства кривых, любые две кривые которых не пересекаются. Примером такого семейства может служить семейство пара- парабол, определяемых уравнением у — (х — аK = 0.
§ 1 ОГИБАЮЩАЯ И ДИСКРИМИНАНТНАЯ КРИВАЯ 611 рая служит пределом при Аа —>• 0 точек пересечения данной кривой La и близкой к ней кривой Ьо+да. 3. Огибающам и дискриминантнам крмвам однопара- метрического семейства плоских кривых. Пусть однопара™ метрическое семейство плоских кривых определяется соотноше- соотношением A6.12). При этом мы будем считать, что функция Р(х, у, а) является дифференцируемой в области ее задания. Введем по- нятие огибающей семейства кривых A6.12). Огибающей однопараметрического семейства кривых A6.12) называется кривая О, которая 1) в каждой своей точке ка- касается только одной кривой семейства A6.12), 2) в разных точках касается различных кривых указанного семейства. На- Наглядные геометрические соображения наводят на мысль о том, что огибающая касается кривых семейства в характеристиче- характеристических точках этих кривых и поэтому при определенных условиях может рассматриваться как геометрическое место харак- характеристических точек кривых семейства. В самом деле, пусть М — точка касания огибающей О и кривой La семейства, отвечающей зна™ чению а параметра семей- La * ства (рис. 16.4), Р — точка касания огибающей и и кри- кривой Ьо+да семейства, отве- р 1fi4 чающей значению а+Аа па- параметра, и N — точка пересечения кривых La и Ьо+да. Нагляд- Наглядно ясно, что при Аа —>• 0 точки Р и N стремятся к точке М, т. е. огибающая О касается кривой La именно в характеристической точке М этой кривой. Будем называть дискриминантной кривой семейства кривых A6.12) геометрическое место характеристических точек кривых этого семейства. Выясним, при каких условиях дискриминант- ная кривая является огибающей. Предварительно докажем еле™ дующую лемму. Лемма, Пусть Mq(xq,!/q) — характеристическая точка се- семейства Р(х^у^а) = 0, отвечающая значению «о параметра семейства. Пусть^ далее, функции Р(х1у1а) и F^(x^y^a) диф- дифференцируемы в некоторой окрестности точки (хо^уо^а®) и частные производные этих функций по х и у непрерывны в са- самой точке (хо^уо^а®). Тогда, если в точке (хо^уо^а®) якобиан D(F F') ¦V ' °[J отличен от нуля, то дискриминантная кривая, про- ходящая через Mq, в некоторой окрестности этой точки мо- может быть задана параметрическими уравнениями х = <р(а) и 201*
612 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 у = ^(а), где ip{pt) и ф{о) — дифференцируемые в некоторой окрестности а® функции. Доказательство. Так как точка М®(х®,у®) яв~ ляется характеристической точкой кривой семейства, отвеча- отвечающей значению а® параметра семейства, то Р(х®^у®,а®) = О и Р^(х®^у®,а®) = 0, и поэтому, в силу условий леммы, систе- система уравнений A6.13), определяющая характеристические точ- точки кривых семейства, удовлетворяет всем требованиям теоре- мы 15.2 о разрешимости системы уравнений относительно х и у. Следовательно, в некоторой окрестности точки а® определены две функции х = <р(а), у = ^(а), A6.14) являющиеся единственным, непрерывным и дифференцируе- дифференцируемым решением системы A6.13). Кривая, определяемая парамет- параметрическими уравнениями A6.14), состоит из характеристических точек и является поэтому дискриминантной кривой семейства, проходящей через точку М®. Отметим, что в силу единственно™ сти решения системы A6.13), различные точки дискриминант- дискриминантной кривой, которая определяется параметрическими уравнени- уравнениями A6.14), являются характеристическими точками различных кривых семейства A6.12). Укажем теперь дополнительные усло- условия, при выполнении которых дискриминантная кривая, про- проходящая через точку Mq, в некоторой окрестности этой точки представляет собой огибающую. Теорема 16.1. Пусть кроме условий, сформулированных в лемме, выполняются следующие условия: 1) в некоторой окрестности точки (х®,у®,а®) производные F'xl F'y, F^x) F^y и F^a непрерывны; 2) в точке (х®^у®^а®) выполняются соотно- соотношения F'x2 + Fy2 ф 0; F^a ф 0. Тогда дискриминантная кривая, проходящая через характеристическую точку Мо(хо^у®)^ явля- является в некоторой окрестности этой точки огибающей рассма- рассматриваемого семейства кривых. Доказательство. Мы уже убедились, что некото- некоторый участок дискриминантной кривой, проходящей через точку Mq, при сформулированных условиях может быть задан пара- параметрическими уравнениями A6.14), которые представляют со- собой решение системы A6.13). Подставим это решение в уравне- уравнения A6.13) и продифференцируем по а полученные тождества F(x,y,a) = 0 и i^,(x,y, а) = 0. Получим р, dx^ pi ф pi = Q da У da A6Л5) рп dx_,pn dyFrr и
§ 1 ОГИБАЮЩАЯ И ДИСКРИМИНАНТНАЯ КРИВАЯ 613 Так как F^ = 0, то первое соотношение A6.15) примет вид pr dx_ > pr dy_ = п xda ^ У da Мы видим, что в каждой точке рассматриваемой дискриминант™ ной кривой выполняется условие касания A6.11) этой кривой и соответствующей кривой семейства. Поэтому, в силу замечания 2 из п. 1, для завершения доказательства теоремы достаточно установить, что каждая характеристическая точка кривой се- мейства, расположенная в некоторой окрестности точки Mq, и каждая точка дискриминантной кривой в этой окрестности яв- являются обыкновенными. По условию теоремы в точке (жо, У(ь ао) выполняется соотношение F^ + F1^ ф О, которое, в силу непре- непрерывности частных производных F'x и F' будет выполнено и в некоторой окрестности указанной точки. Следовательно, в этой окрестности все характеристические точки кривых семейства являются обыкновенными. Из соотношения F^a ф 0 (справед- (справедливого, в силу непрерывности этой производной, в некоторой окрестности точки (жо5Уо5 «о)) и из второго тождества A6.15) вытекает, что в указанной окрестности производные ™и™не обращаются одновременно в нуль1). Таким образом, все точки дискриминантной кривой в некоторой окрестности Mq являют™ ся обыкновенными. Из только что доказанной леммы вытекает также, что различные точки дискриминантной кривой являют- являются характеристическими точками различных кривых семейства. Теорема доказана. Замечание 1. Рассуждения, проведенные при доказа- доказательстве теоремы, показывают, что в случае, когда выполнены только условия леммы, в каждой точке дискриминантной кри- кривой выполнено условие касания этой кривой и кривой семейства. Мы уже отмечали (см. замечание 2 п. 1), что условие касания выполняется и тогда, когда общая точка двух кривых является особой точкой по крайней мере одной из них. Отсюда вытекает, что дискриминантная кривая может представлять собой геомет- геометрическое место особых точек кривых семейства (если в каждой характеристической точке выполняется условие F® + F1^ = 0). Отметим, что и сама дискриминантная кривая может иметь осо- особые точки (если -^ и -j- равны одновременно нулю). 1) Непрерывность этих производных непосредственно вытекает из непре- непрерывности производных F'x, Fy, F^XJ F&y и F^a и из соотношений A6.15), из dx dy которых эти производные — и — могут оыть найдены алгеораически. da da
614 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 Замечание 2. Теорема 16.1 геометрически может быть истолкована следующим образом. Если все кривые семейства и дискриминантная кривая не имеют особых точек^ то указан- указанная дискриминантная кривая является огибающей. Рассмотрим примеры. 1°. Найти дискриминантную кривую семейства у — (х — аJ= 0. Имеем F(x,y,a) = у — (х — aJ, F^(x^y^a) = 2(х — а). Таким образом, система A6.13) имеет вид у - (х - аJ = 0, 2(х - а) = 0. Отсюда вытекает, что характеристические точки имеют коор- координаты (а, 0) (см. рис. 16.1). Поэтому дискриминантная кривая задается параметрическими уравнениями х = а, у = 0. Имеем, далее, Fx = ^2(х ~~ a), F' = 1. В точках дискриминант- ной кривой Fx2 + Fy2 = 1. Кроме того, F^a = ^2^0. Таким образом, дискриминантная кривая — ось Ох является огибаю- огибающей. 2°. Найти дискриминантную кривую семейства (у^аJ^(х^ — аK = 0. Имеем F(x, у, а) = (у — аJ — (х — aK, F'a{x, у, а) = = — 2(у — а) + 3(х — аJ. Система A6.13) имеет вид (у - аJ -(х- аK = 0, -2(у - а) + Цх - аJ = 0. Отсюда вытекает, что дискриминантная кривая представля- представляет собой две прямые линии, определяемые параметрическими уравнениями х = а, у = ажх = ^ + а, у=^+а (см. рис. 16.2). Легко убедиться, что в точках прямой х = а, у = а выполняется условие F12 + F12 = 0, т. е. эта часть дис- криминантной кривой представляет собой геометрическое место особых точек кривых семейства. Читатель легко убедится, что 4 . 8 . г прямая х = - + а, у = ^ + а является огибающей рассматри- рассматриваемого семейства линий. 4. Огибающам и дискриминантнам поверхность однопарамет- рического семейства поверхностей. Рассмотрим однопараметрическое семейство поверхностей, определяемое уравнением F(x,y,z,a) = 0. A6.16) При этом мы будем предполагать, что функция F(x,y,z,a) является диф- дифференцируемой функцией в области ее задания. Линия L на поверхности
§ 2 СОПРИКОСНОВЕНИЕ ПЛОСКИХ КРИВЫХ 615 семейства A6.16), отвечающей значению а параметра семейства, называ- называется характеристической (или характеристикой), если координаты точек этой линии удовлетворяют системе уравнений F{x,y,z,a) = 0, FUx,y,z,a) = 0. Геометрическое место характеристик называется дискрчмчнантной поверх- поверхностью семейства A6.17). Огибающей однопараметрического семейства поверхностей A6.16) называется поверхность О, которая касается всех поверхностей семейства. Можно доказатв следующее утверждение. Если все поверхности семейства и дискриминантная поверхность не имеют особых точек, то указанная дискриминантная поверхность явля- является огибающей. Отметим, что дискриминантная поверхность может представлять собой геометрическое место особых точек поверх- поверхностей семейства и сама может иметь осо- особые точки. Рассмотрим следующий пример. Най- Найти огибающую семейства сфер постоянно- постоянного радиуса R, центры которых находятся в точках данной кривой L ) (на рис. 16.5 изображена одна такая сфера с центром в точке М кривой L), определяемой уравне- уравнениями x = ip(a), у = ф(а), z = x{®)> Рис. 16.5 Рассматриваемое однопараметрическое семейство сфер определяется сле- следующим уравнением: [х - <р(а)]2 + [у- ф{а)}2 + {z- Х(а)]2 - R2 = 0. A6.18) Характеристики указанного семейства сфер определяются из уравнения A6.18) и уравнения [х - <р(а)У(а) + [у- ф(а)]ф'(а) + [z - Х(.<*)]х'(<*) = 0- A6.19) Уравнение A6.19) представляет собой плоскость, проходящую через центр М сферы, перпендикулярно касательной к кривой L. Поэтому харак- характеристиками являются окружности, представляющие собой линии пересече- пересечения рассматриваемых сфер с плоскостями A6.19) (см. рис. 16.5). Отметим, что если L является окружностью, то огибающей будет тор. § 2. Соприкосновение плоских кривых 1. Понятие пормдка соприкосновения плоских кри- кривых. Пусть две кривые L\ и L2 касаются друг друга в некоторой точке Mq 2) (рис. 16.6). Пусть далее М — произвольная точка ) Огибающие таких семейств сфер называются каналовыми поверхно- поверхностями. ) То есть проходят через Mq и имеют в этой точке совпадающие каса- касательные.
616 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 на общей касательной к кривым L\ и L2? а М\ и М~2 — точки не- ресечения с кривыми L\ и L2 соответственно перпендикуляра к указанной касательной, восстановленного в точке М1) (см. рис. 16.6). Будем говорить, что две кривые L\ и L2 имеют в точке М® порядок соприкосновения п, если существует отличный от нуля предел (При этом \M\M2 обозначает длину отрезка М1М2, а \ММ®\ — длину от- Рис. 16.6 резка ММ0.) Замечание 1. Если предел A6.20) равен нулю, то говорят, что кривые L\ и L2 имеют поря- порядок соприкосновения выше п. Замечание 2. Если две кривые L\ и L2 имеют в точке Mq порядок соприкосновения выше любого в, то говорят, что они имеют в этой точке бесконечный порядок соприкосновения. Примеры. 1°. Кривые, являющиеся графиками функций у = ж2 и у = Зж2, касаются друг друга в начале координат О, причем их общей касательной служит ось Ох. Взяв на оси Ох точку М с абсциссой ж, мы получим, что \ОМ\ = |ж|, а \M\M2\ = Поскольку то рассматриваемые кривые имеют в точке О порядок сопри- соприкосновения единица. 2°. Рассмотрим, далее, две кривые L\ и 1^, первая из которых совпадает с осью Ож, а другая является графиком функции {е-1/\х\ ПрИ х ф q^ 0 при ж = 0. Убедимся, что указанные кривые имеют бесконечный порядок соприкосновения в начале координат О. Так как общей каса- касательной в точке О служит ось Ож, то, взяв на этой оси точку М с абсциссой ж, мы получим, что |ОЖ| = |ж|, а |М]_М2| = е^1'\х . л г л- \М1М2\ Достаточно доказать, что для любого п предел lim ' х = ) При этом предполагается, что если точка М достаточно близка к Мо, то перпендикуляр, восстановленный в точке М к касательной, пересекает каждую кривую Li и L2 лишь в одной точке.
§ 2 СОПРИКОСНОВЕНИЕ ПЛОСКИХ КРИВЫХ 617 е^1/|ж| = lim — равен нулю. Полагая t = 1/|ж|, мы сведем этот tn+1 предел к пределу lim ——. В конце п. 2 § 12 гл. 8 доказано, что последний предел равен нулю. 2. Пормдок соприкосновения кривых, являющихся графиками функций. Предположим, что две кривые L\ и L2 являются графиками функций у = f\{x) и у = /2(ж) соответ™ ственно. Предположим, далее, что эти кривые касаются друг друга в некоторой точке Mq(xq^ /i(xq)), причем точка Mq яв- является обыкновенной для каждой из этих кривых 1). Мы дока- докажем, что при этих предположениях данное в предыдущем пунк- пункте определение порядка соприкосновения кривых L\ и L^ можно заменить другим эквивалентным определением, более удобным для приложений. Пусть Ах — произвольное приращение аргумента в точке xq, а х = х® + Ах. Будем говорить, что кривые L\ и L2 имеют в точке Mq(xq1 fi(xo)) порядок соприкосновения п, если суще- существует отличный от нуля предел \f2(x)-Mx)\ Ag 21) \Ах\п+1 Для того чтобы можно было говорить о порядке соприкосно- соприкосновения рассматриваемых кривых L\ и L2 в смысле определения, данного в предыдущем пункте, нужно прежде всего доказать, что в некоторой окрестности Mq эти кривые однозначно проеци- проецируются на свою общую касательную. Этому посвящена приводи- приводимая ниже лемма 1. Остальная часть настоящего пункта посвяще- посвящена доказательству еще двух лемм, из которых непосредственно вытекает эквивалентность двух определений порядка соприкос- соприкосновения КрИВЫХ L\ И Ij2' Летжа 1. Если точка Мо(хо, f(xo)) является обыкновенной точкой кривой L, служащей графиком функции у = /(ж), то кривая L в некоторой окрестности Mq однозначно проецируется на свою касательную. Доказательство. Прежде всего, отметим, что существование ка- касательной к кривой L в точке Mq вытекает из существования производной /;(жо). Перейдем теперь к новой системе декартовых прямоугольных коор- координат XY, поместив новое начало в точку касания Mq и направив ось X вдоль касательной в Mq (рис. 16.7). Если через а обозначить угол между осью х и осью X, то очевидно, что новая система координат получается из старой посредством переноса начала в точку Мо(жо,/(жо)) и поворота осей на угол а. Используя известные формулы преобразования координат г) Определение обыкновенной точки кривой, заданной уравнением F(x^y) = 0, было дано в п. 1 § 1. В частности, для кривой, заданной уравне- уравнением у = /(ж), точка М"о(жо,/(жо)) будет обыкновенной, если производная f'{x) лишь непрерывна в точке xq. 21 В.А. Ильин, Э.Г. Позняк, часть I
618 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 У при переносе и повороте осей (см. выпуск 8), получим следующее выраже- выражение новых координат X, Y точек кривой L через старые координаты ж и У = /(*): X = (ж - ж0) cos а + [/(ж) - /(ж0)] sin а, У = —{х — жо) sin а + [/(ж) — /(жо)] cos а. Наша цель будет достигнута, если мы покажем, что из уравнений A6.22) можно выразить Y как функцию X (это и будет означать, что участок кривой L, примыкающий к Мо, одно™ значно проецируется на ось X, т. е. на касательную). Для этого достаточно доказать, что в окрестности точки Мо первое из уравнений A6.22) однознач™ но разрешимо относительно ж. (В са- самом деле, выразив ж через X из перво- первого уравнения A6.22) и подставив полу- полученное выражение во второе уравнение A6.22), мы и определим Y как функцию X.) Согласно теореме 15.1 достаточно доказать, что производная по ж правой части первого из уравнений A6.22) от- отлична от нуля в точке ж о и непрерывна X Рис. 16.7 в этой точке. Но это очевидно, ибо указанная производная имеет вид cos а + + /; (ж) sin а и в точке жо, в которой /;(жо) = tga, равна 1/cosa. Так как а ф тг/2, то cos a ф 0. Лемма доказана. Пусть кривые L\ и Ьг, представляющие собой графики функций у = = f\(x) и у = /2(ж), касаются друг друга в точке Мо(жо,/х(жо)), которая является обыкновенной для каждой из этих кривых, а ж = жо + Аж. Пусть, далее, из точки М(ж,/2(ж)) опущен перпендикуляр на касательную в Мо (рис. 16.8), Mi — точка пересечения этого перпендикуляра с кривой L\ 1)J а М — с касательной. Тогда справедливы следующие утверждения. Летта 2. Существует от- У* 0 хп ^ х 7 (Mi \ М личный от нуля предел Km |MiM2 A6.23) Лежжа 3. Существует от- отличный от нуля предел lim А |М0М| |дж| ¦ A6.24) Рис. 16.8 Заметим, что из лемм 2 и 3 вытекает, что отличный от нуля предел A6.21) существует тогда и только тогда, когда существует отличный от нуля предел A6.20), ) В силу леммы 1 при достаточно малом Аж такая точка будет только одна.
СОПРИКОСНОВЕНИЕ ПЛОСКИХ КРИВЫХ 619 а это и означает эквивалентность двух определений порядка соприкоснове- соприкосновения. Переходим к доказательству лемм 2 и 3. Доказательство леммы 2. Ради простоты обозначим рассто- расстояние М1М2 через р и ради определенности будем считать, что кривые L\ и L2 расположены так, как указано на рис. 16.8. Если X и Y — координаты точки Mi, а а — угол наклона касательной в Мо к оси Ох, то, очевидно, X = ж + р sin а, У = /2 (ж) — р cos a. Так как точка Mi лежит на кривой L\, то Y = fi(X) или /2 (ж) — р cos a = /i (ж + р sin a). Применяя к правой части последнего равенства формулу Лагранжа по сег- сегменту [ж, ж + psina], будем иметь /2 (ж) — р cos а = Д (ж) + р sin a/; (?), где ? — некоторая точка, лежащая внутри указанного сегмента. Так как р —)¦ 0 при Аж 4 0 и производная /;(ж) непрерывна у j^ в точке жо, то последнее равен™ J / Ь\ ство можно переписать в виде /2 (ж) - р cos a = /i (ж) + A6.25) где е —-> 0 при Аж —> 0. Учиты- Учитывая, что / (жо) = tga, мы полу- получим из A6.25) h(x)-h{x) _ + esina. х Лемма 2 доказана. Доказательство леммы 3. Обозначим че- через /3 угол между хордой М0М2 и касательной MqM (рис. 16.9). Очевидно, что /3 —>• 0 при Аж —>- 0. Из прямоугольных треугольников М0М2Р и М0М2М (здесь MqP параллельно оси Ох) находим Рис. 16.9 |М0М2 |Аж cos(a + /3) Из последней формулы очевидно, что cos f3 \МрМ\ cos/3 ,. \М0М\ hm ^-г-г—г-1 = hm аж^о |Аж| о cos(a +/3) cosa" Лемма 3 доказана. 3. Достаточные условим соприкосновеним пормдка п. Пусть, как и выше, две кривые L\ и L2, служащие графиками функций fi(x) и /2(ж), касаются друг друга в М0(ж0,/i(x0)). Справедливо следующее утверждение.
620 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 Теорема 16.2. Пусть функции y = fi(x) и у = /2B?) (ть + 1) раз дифференцируемы в некоторой окрестности точки жо, при- чем производные порядка п + 1 непрерывны в самой точке х®. Тогда, если в точке х® выполняются соотношения ЛЫ = ЛЫ, ЛЫ = ЛЫ, • • •, Д(п)Ы = /2(п)Ы, (П+1)(П+1) A6.26) то кривые L\ и L2 имеют в точке М®(х®1 fi(xo)) порядок со- соприкосновения п. Доказательство. Пусть F(x) = /2 (х) — fi(x). Достаточно доказать, что существует отличный от нуля предел \F(x)\ lim Так как в силу A6.26) F(x®) = Ff(x®) = ... = F^(x®) = О, р(п+ч (х0) ф о, то, записывая для функции F(x) формулу Тей- Тейлора с остаточным членом в форме Лагранжа, будем иметь F{x) = r±—F^+^(x® + в(х - х®))(х - х®)п+\ 0 < в < 1. A6.27) В силу непрерывности производной порядка п + 1 в точке xq F^+1\x0 + 0(а; - xQ)) = F^+1\x0) + е, A6.28) где е —> 0 при ж —>¦ жо- Из соотношений A6.27) и A6.28) получим, что Нт —!^ 1 (п+ 1)! Теорема доказана. Замечание 1. Если выполнены все условия теоремы 16.2, за исключением, быть может, условия /}те {xq) ф /2 (жо)? то мо^кно утверж:дать, что кривые L\ и L2 имеют в точке Mq порядок соприкосновения не ниже п. Замечание 2. Выясним порядок соприкосновения кривой L, являющейся графиком функции у = f(x) со своей ка- касательной Т в точке Мо(жо, /(жо))- При этом будем считать, что функция f(x) три раза дифференцируема в окрестности точки жо, а ее третья производная непрерывна в точке xq. Напомним, что касательная Т служит графиком линейной функции у = = <р(х) = ff(x0)(x - xq) + /(ж0). Так как <р(х0) = /(ж0), ^;(ж0) = = /;(жо) и (/?/;(жо) = 0, то в случае fff(xo) ф 0 кривая L имеет со своей касательной Т порядок соприкосновения п = 1, а в случае fff(x®) = 0 указанный порядок соприкосновения не ниже двух.
§ 2 СОПРИКОСНОВЕНИЕ ПЛОСКИХ КРИВЫХ 621 4. Соприкасающаяся окружность. Пусть М"о(ж(ьУо) — точка кривой L, являющейся графиком функции у = /(ж), име- имеющей непрерывную третью производную в точке xq. Через точ- точку М® можно провести бесконечно много окружностей, касак> щихся кривой L в этой точке. Легко убедиться в том, что часть каждой такой окружности, расположенная в некоторой окрест- окрестности точки Mq, представляет собой график функции вида у = = у(х). Поэтому мы можем говорить о порядке соприкоснове- соприкосновения кривой L и любой из этих окружностей в их общей точке Mq. Та из этих окружностей, которая имеет с кривой L поря- док соприкосновения не ниже двух1 называется соприкасающей- соприкасающейся окружностью для кривой L в точке Mq. Следующее утвер- ждение устанавливает достаточные условия для существования у кривой L в точке Mq соприкасающейся окружности. Теорема 16.3. Пусть кривая L является графиком функ- функции у = /(ж), причем f(x) имеет в точке xq не равную нулю вторую производную и непрерывную третью производную. То- Тогда для кривой L существует в точке Mo(#o,/(#())) сопРикаса~ ющаяся окружность. Доказательство. Будем искать уравнение соприка- соприкасающейся окружности в виде (х-аJ + (у-ЪJ = р\ A6.29) где а, Ъ и р — постоянные, подлежащие определению. Разрешим уравнение A6.29) относительно у и найденное решение у = у(х) подставим в левую часть A6.29). Тогда мы можем рассматри- рассматривать A6.29) как тождество относительно х (считая при этом, конечно, что у = у(х)). Продифференцируем тождество A6.29) два раза по ж и потребуем, чтобы в полученных при этом со- соотношениях и в самом соотношении A6.29) значения уо, !/си У о функции у = у(х) и ее первых двух производных в точке xq равнялись соответственно /(#о)? /'(жоM /я(жо): Таким образом, мы получим следующую систему уравнений от- относительно а, Ъ и р: (х0 -а) + (уо -Ь)у'0 = О, 1 + Ш2 + (уо-ъм = о. При условии у" = //;(жо) ф 0, р > 0 эта система имеет един- единственное решение: «= *. - ^«4, ь = ш + 1±^, , = ?&?-. чело) Уо Уо \Уо I
622 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 Из приведенных рассуждений вытекает, что для окружно сти, координаты (а, Ь) центра и радиус р которой определяются формулами A6.30), и кривой L выполняются все условия заме- замечания 1 к теореме 16.2. Поэтому указанная окружность будет соприкасающейся. Замечание. Если в условиях теоремы 16.3 требование fff(xo) ф 0 заменить противоположным требованием fll{xo) = = 0, то у кривой L в точке Mq не существует соприкасающейся окружности. Однако в силу замечания 2 к теореме 16.2 в этом случае кри- кривая L и касательная к ней в точке Mq имеют в этой точке по- порядок соприкосновения не ниже двух. Таким образом, можно считать, что в указанном случае соприкасающаяся окружность в точке Mq вырождается в прямую. § 8. Кривизна плоской кривой 1. Понмтие о кривизне плоской кривой. Пусть кривая L задана посредством параметрических уравнений х = x(t), у = = y(t). Будем считать, что для кривой L выполнены условия, оговоренные в § 1 гл. II1). В таком случае в любой точке М кривой L можно выбрать положительное направление. Догово- Договоримся называть положительным направлением в данной точ™ ке М кривой L то направление, в котором точка М будет пере- перемещаться при увеличении параметра t. У а Фиксируем теперь на кривой L неко- торую точку Mq, отвечающую значе- значению параметра to, и предположим, что эта точка является обыкновенной точкой кривой L. Тогда участок кривой L, примыкаю- примыкающий к точке М®, представляет собой гра- график функции вида либо у = /(ж), либо х = /i(y)? причем существует касатель™ Рис. 16.10 ная к КрИВОц ? в точке Mq. На этой ка- касательной мы введем положительное направление, соответству- соответствующее положительному направлению в точке Mq кривой L2). Всюду в дальнейшем мы будем рассматривать только на- направленную касательную. На рис. 16.10 направление касатель™ ной указано стрелкой. О ) То есть будем считать, что кривая L не имеет точек самопересечения и участков самоналегания. ) То есть договоримся называть положительным направлением на каса- касательной то направление, в котором точка, представляющая собой проекцию на касательную точки кривой L, при увеличении параметра будет переме- перемещаться.
КРИВИЗНА ПЛОСКОЙ КРИВОЙ 623 Предположим теперь, что все точки кривой L, расположен™ ные в некоторой окрестности фиксированной нами точки Mq, являются обыкновенными. Пусть М — одна из указанных то- точек. Введем понятие угла смежности участка кривой MqM. Ради определенности будем считать, что точка М соответству- соответствует большему значению параметра, чем М®. Узлом смежности участка кривой MqM назовем угол меж- между направленными касательными к кривой L в точках М и Mq, взятый со знаком плюс в случае, если касательную в точке Mq для совмещения кратчайшим путем с касательной в точке М следует повернуть против часовой стрелки, и со знаком минус — в противном случае. На рис. 16.11 изображен участок MqM, имеющий положи- положительный угол смежности, а на рис. 16.12 — участок MqM ^ име- имеющий отрицательный угол смежности. У' 0 \ У L / —-—— / X О Рис. 16.11 Рис. 16.12 Введем далее понятие средней кривизны участка кривой MqM. Средней кривизной участка кривой MqM назовем отно- отношение угла смежности этого участка к длине этого участка. Так как точку Mq кривой L мы считаем фиксированной, то средняя кривизна участка MqM будет функцией точки М или функцией параметра t. Эту функцию мы обозначим символом мМо(М) или MMo(t). Естественно, возникает вопрос о рассмотрении предела этой функции при стремлении точки М вдоль кривой L к точке Mq (или, что то же самое, при стремлении параметра t к to). Определение. Предельное значение средней кривизны участка кривой MqM при стремлении точки М вдоль кривой к точке Mq называется кривизной в данной точке Mq кривой L и обозначается символом () Таким образом, по определению fc(Mo) = lim кМо(М) = lim M^M t^t
624 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 Предоставим читателю самому убедиться в том, что: 1) как средняя кривизна любого участка прямой линии, так и кривизна в любой точке этой линии равны нулю, 2) как средняя кривизна любого участка окружности радиуса Д, так и кривизна в любой точке этой окружности равны 1/R. Установим формулу для вычисления кривизны в любой точке произвольной кривой L. 2. Формула длм вычисления кривизны. Пусть кривая L задана параметрическими уравнениями х = x(t), у = f/(t), Mq — некоторая фиксированная точка этой кривой, отвечающая зна- значению параметра to. Предположим, что все точки кривой L из некоторой окрестности Mq являются обыкновенными и что функции x(t) и y(t) имеют в точке to вторые производные. При этих предположениях мы установим общую формулу для вы- вычисления кривизны в точке Mq кривой L. Пусть жиж — значения первой и второй производной функ- функции х = x(t) в точке to, а х + Ах — значение первой производной этой функции в точке to + At (At — произвольное приращение параметра t). Таким образом, Ах — приращение первой произ- производной функции х = x(t). Пусть у, у и у+Ау — соответствующие значения производных функции у = y(t). Если считать, что точка Mq, отвечающая значению парамет- параметра to, фиксирована, а точка М отвечает значению параметра t = to + At, то угол смежности участка MqM и длину этого участка можно рассматривать как функции аргумента At. Эти функ™ ции мы обозначим соответственно через «(At) и l(At). По определению кривизна fc(Mo) в точке Mq кривой равна предель- предельному значению о > Докажем, что предельное значе™ х ние A6.31) существует и вычислим это предельное значение. Рис. 16.13 Обозначим через (fQ и ср углы на- наклона к оси Ох касательных к кривой L, проведенных через точки Mq и М соответственно (рис. 16.13). Тогда, очевидно, при любом расположении точек Mq и М для угла смежности a (At) будет справедливо соотношение a(At) =ip-<p0. Из последнего соотношения вытекает, что tga(At) = tsy"tgyo . A6.32) 8 v ; 1 + tg^tg^o v ;
§ 3 КРИВИЗНА ПЛОСКОЙ КРИВОЙ 625 Исходя из геометрического смысла производной (см. п. 4 § 1 гл. 5) и из выражения для производной функции, заданной па- параметрически (см. § 11 гл. 5), мы можем записать Таким образом, формулу A6.32) можно переписать в виде у + ^у _ |/ * + ** А /жлАГ^Ажлг A6.33) Аж) Поскольку функции х = x(t) ж у = y(t) имеют в точке to вторые производные, то первые производные этих функций в точке to непрерывны и, стало быть, llm Ay = 0, lim Ах = 0. At^O At^O Но тогда, в силу равенства A6.33), llm tga(At) = 0. Из последнего равенства и из непрерывности арктангенса выте™ кает, что lim a(At) = 0. AtO Поэтому справедливо равенство lim ^L = urn [cosa(At)-5^U = 1. A6.34) At^Otga(At) At^O [ X ;sma(At)j v ; Равенство A6.34) и теорема о предельном значении произведе- произведения сводит вопрос о вычислении предельного значения A6.31) к вычислению следующего предельного значения: к(М0) = llm = llm ^^l A6.35) At^O At^O l(At) Для вычисления этого предельного значения заметим, что дли- длина /(At) участка кривой MqM определяется формулой l(At)= Г to Применив к интегралу, стоящему в правой части последнего ра- равенства, формулу среднего значения, будем иметь l(At) = Atv^2(**)+y2(<*), A6.36) где t0 ^ t* ^ t0 + At.
626 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 Соотношения A6.35), A6.33) и A6.36) позволяют заключить, что вычисление кривизны сводится к вычислению предельного значения . Ау . Ах к(М0) = lim ЖЛ^Ж [±(х + Ах) + у(у Так как функции х = x(t) и у = y(t) имеют в точке to вторые производные, то существуют предельные значения ^=i и lim ^ = у. A6.38) At At^O At Далее, из непрерывности первых производных функций х = = x(t) и у = у(?) заключаем, что lim Ах = 0, lim Ay = 0, lim Jx2(t*) + |/2(t*) = y/x2+y2. A6.39) Из существования предельных значений A6.38) и A6.39) выте- вытекает, что предельное значение, стоящее в правой части A6.37), существует и равно ху-ху [ж2+2/2]3/2* Таким образом, мы доказали, что кривизна в точке М® кривой L существует и определяется формулой = i-f^-fr,. A6.40) Замечание. Пусть требуется вычислить кривизну к(Мо) в данной точке Mq кривой L, представляющей собой график два- дважды дифференцируемой функции у = f(x). Положив в формуле A6.40) х = t, у = /(?), мы получим для искомой кривизны следующую формулу: = Наконец, если кривая задана полярным уравнением г = г(вI где г@) — дваж:ды дифференцируемая функция полярного угла в, то приняв за параметр t полярный угол в и учитывая, что х = г (в) cos6>, у = r@) sin0, мы получим следующее выражение для кривизны: , _г2(в) + 2[г'(в)]2-г(в)г"(в) {гЦв) + [г'(в)]2}3/2 ' В качестве примера вычислим кривизну в произвольной точ- точке цепной линии у = a ch —.
ЭВОЛЮТА И ЭВОЛЬВЕНТА 627 Поскольку 1 + \ff(r)}2 - eh2 x - y2 fff(r) - l ch x - y то кривизна равна а а от ^ a ch - § 4. Эволюта и эвольвента 1. Нормаль к плоской кривой. Пусть плоская кривая L задана посредством параметрических уравнений х = </?(?), у = ф{р)- A6.41) Будем считать, что кривая L не имеет точек самопересече- самопересечения и участков самоналегания. Кроме того, будем считать, что каждая точка кривой L является обыкновенной 1). Введем понятие нормали к кривой в данной ее точке М. Прямая^ расположенная в плоскости кривой L и проходящая через точку М кривой перпен- перпендикулярно касательной к L в точке М, называется норма- нормалью к L в точке М (рис. 16.14). Найдем уравнение нормали к кривой. Пусть х ж у — коор™ динаты точки М кривой L, a J и Y- координаты любой точки N нормали к кривой. Соглас- Согласно определению нормаль пер™ пендикулярна касательной, и поэтому угловой коэффициент кп нормали связан с угловым коэффициентом kt касательной соотношением 2) knkt = -1. A6.42) Рис. 16Л4 Так как угловой коэффициент kt касательной в случае пара™ метрического задания кривой A6.41) равен -^, то из A6.42) о % У 7 <М(х,у) \n(X,Y) X ) Отметим, что при этих условиях в каждой точке кривой L существует касательная. 2 ) Это соотношение известно из курса аналитической геометрии (см., на- например, выпуск «Аналитическая геометрия» настоящего курса).
628 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 получаем A6.43) Используя известное из курса аналитической геометрии урав- уравнение прямой с данным угловым коэффициентом кП1 получим следующее уравнение нормали к кривой L: Y-y = -^(Х-х). A6.44) Учитывая, что х = ip(t) и у = ф{Ь), перепишем уравнение A6.44) в следующей форме: (pf(X -ф)+ ф'{? -ф)=0. A6.45) Замечание. В случае если касательная в точке М параллельна оси абсцисс, ее угловой коэффициент kt равен ну- нулю, и поэтому соотношения A6.42), A6.43) и A6.44) не имеют смысла. Однако в этом случае уравнение A6.45) все же пред- представляет собой уравнение нормали. Действительно, если kt = О (касательная параллельна оси абсцисс), то ф1 = 0, a ср' ф О 1) и поэтому соотношение A6.44) принимает вид X — <р = 0. А это есть уравнение прямой, перпендикулярной оси Ох и отсекающей на оси Ох отрезок, равный ср. Ясно, что эта прямая совпадает в рассматриваемом случае с нормалью в точке М. 2. Эволюта и эвольвента плоской кривой. Пусть кри- кривая L удовлетворяет тем же условиям, что и в предыдущем пункте. Обратимся к урав- уравнению A6.45). Если в этом уравнении рассматривать t как параметр, то оно пред- представляет собой уравне- уравнение однопараметрического семейства всех нормалей плоской кривой L. Пред- Представление о семействе нор- нормалей плоской кривой дает рис. 16.15. При определенных усло- условиях однопараметрическое семейство нормалей имеет огибающую, которая назы- называется эволютой кривой L. Итак, эволютой плоской кривой L называ- У О Рис. 16.15 1) Напомним, что kt = — и для обыкновенной точки
§ 4 ЭВОЛЮТА И ЭВОЛЬВЕНТА 629 ется огибающая однопараметрчческого семейства нормалей этой кривой. Кривая L по отношению к своей эволюте назы- вается эвольвентой. Выясним условия существования эволюты плоской кривой L и найдем ее параметрические уравнения. Будем считать, что кривая L без особых точек задана по- посредством параметрических уравнений A6.41). Для простоты предположим, что параметр t изменяется на интервале @,1). Допустим также, что функции (p(t) и ^(i), фигурирующие в со™ отношениях A6.41), имеют непрерывные третьи производные на интервале @,1). При этих предположениях справедлива следу- следующая теорема. Теорема 16.4' Пусть во всех точках кривой L ее кривиз- кривизна к и производная кривизны1) не равны нулю. Тогда существу- существует эволюта кривой L, причем параметрические уравнения эво- эволюты имеют вид ,r/*±,l/ . A6-46) Доказательство. Мы определили эволюту как огибаю™ щую однопараметрического семейства нормалей кривой L. Это семейство задается уравнением A6.45). Таким образом, функ™ ция F(Xj У, t), задающая семейство, определяется соотношением F{X, У, t) = (р'(Х - ф) + ф'{? - ф), A6.47) причем t играет роль параметра. Применим теперь выводы § 1 этой главы о существовании огибающей для выяснения вопроса о существовании эволюты (т. е. огибающей семейства A6.45)). Мы должны проверить вы- выполнение условий леммы п. 3 § 1 этой главы и условий теоре™ мы 16.1. Перейдем к проверке указанных условий. Остановимся сначала на проверке условий леммы. Очевидно, при сформули™ рованных требованиях на функции ср и ф функции F(X,Y,t) и F/(X, У, t) дифференцируемы. Убедимся теперь, что якобиан —У^—Ц отличен от нуля. Используя выражение A6.40) для кри- визны к кривой L, можно представить этот якобиан в следую™ щей форме: D(X,Y) ) При условиях, наложенных на функции ср шф, кривизна к представляет собой дифференцируемую функцию параметра t.
630 ПРИЛОЖЕНИЯ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГЛ. 16 По условию теоремы кривизна к отлична от нуля. Кроме того, так как все точки кривой L обыкновенные, то ip'2 + ф12 ф 0. Таким образом, указанный якобиан отличен от нуля, и стало быть, все условия леммы выполнены. Проверим теперь условия теоремы 16.1. Очевидно, что при сформулированных требованиях на функции (р и ф производные F'x, Fy, Щ'хч Щу-> Ш непрерывны. Остается лишь убедиться в справедливости соотношения F[[ ф 0 для всех значений t из интервала @,1) и для характеристических точек на нормалях к кривой L. Так как F('t = <р'"(Х -<р) + ф'"(? -ф)- Ц<р'<р" + ф'ф") A6.48) и согласно п. 2 § 1 этой главы и формулам A6.13), характе- характеристические точки для рассматриваемого случая определяются соотношениями <S(X-<p)+MY-1>) = 0, , , р"(х-<р)+Ф"(у-Ф)-(<р12 + Ф12) = о, ' то значение производной F[[ в характеристических точках в силу A6.48) и A6.49) равно Обратимся к выражению A6.40) для кривизны к кривой L. С учетом обозначений A6.41) из формулы A6.40) путем диффе- дифференцирования получаем С помощью этого соотношения и выраж:ения A6.40) для кри™ визны придадим выражению A6.50) следующую форму: Так как по условию теоремы к и к1 не равны нулю и, кроме того, if12 + ф12 ф 0, то из последнего выражения для F"t следует, что для всех значений t из интервала @,1) и для характеристиче- характеристических точек на нормалях к L F[[ Ф 0. Таким образом, условия теоремы 16.1 также выполнены. Найдем теперь параметрические уравнения эволюты. Так как при сформулированных условиях эволюта есть геометрическое место характеристических точек семейства нормалей, то коор™ динаты X и Y точек эволюты определяются из соотношений
ЭВОЛЮТА И ЭВОЛЬВЕНТА 631 A6.49). Находя из этих соотношений X и Y, мы и получим па™ раметрические уравнения A6.46). Теорема доказана. Замечание. В геометрии часто используются понятия радиуса кривизны и центра кривизны. Радиусом R кривизны кривой L называется величина 1/fc, где к — кривизна L, а цен- центром кривизны — та точка нормали к кривой, которая отстоит от данной точки кривой L в на- направлении вогнутости L на рассто- расстояние R. Отметим, что радиус кривизны кривой равен радиусу соприкасаю- соприкасающейся окружности, а центр кривиз- ны совпадает с центром соприкаса- соприкасающейся окружности. Убедимся, что эволюта предста- представляет собой геометрическое место центров кривизны кривой. В самом деле, из соотношений A6.46) полу- получаем (X - (Y - = F=* Рис. 16.16 т. е. точка эволюты с координатами (X, Y) отстоит от точки кривой L с координатами (<р, i/?) на расстоянии R. Из геометрического смы- смысла эволюты (см. рис. 16.15) ясно, что точка (X,Y) расположена на нормали в сторону вогнутости кривой L. Пример. Найдем уравнения эволюты эллипса ABCD (рис. 16.16), определяемого параметрическими уравнениями х = (p(t) = a cost, у = фA) = fesint. Так как (р1 = ^asint, ф1 = bcost, <р" = ^acost, t/?/; = ^bsint, то ip12 + i/?/2 = a2 sin2 t + b2 cos2 t, a c//t//; — <р"ф' = аЬ. Поэтому, согласно A6.46), параметрические уравнения эволюты эллипса имеют вид X = . cos*31, Y = ¦ sin31. a ' b Таким образом, эволюта эллипса представляет собой так назы- называемую удлиненную астроиду (см. рис. 16.16). Отметим, что в точках Д В, С, D эллипса (т. е. в его верши- вершинах) производная кривизны равна нулю. Поэтому в этих точках не выполнены условия теоремы 16.4. В соответствующих точках А1', Bf, C;, D1 эволюта эллипса имеет особенности — так называ- называемые точки возврата.
ПРИЛОЖЕНИЕ ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ТЕОРИИ ВЕЩЕСТВЕННЫХ ЧИСЕЛ В гл. 2 для введения вещественнв1х чисел мы использова™ ли множество бесконечных десятичных дробей. Определив для множества этих дробей правила сравнения, сложения и умноже- умножения, мы установили, что элементы этого множества обладают 13 основными свойствами (перечисленнвши в п. 1 § 1 гл. 2 для ра- рациональных чисел). Описанный метод введения вещественных чисел, хотя и обладает несомненными эвристическими и методи- методическими достоинствами, не является единственно возможным. Можно было бы ввести вещественные числа с помощью бес- бесконечных двоичных дробей, с помощью так называемых деде- киндовых сечений в области рациональных чисел 1), с помощью последовательностей рациональных чисел2) и другими метода- методами. Чтобы выяснить взаимосвязь между различными методами введения вещественных чисел, привлечем некоторые новые по- понятия и установим еще одно важное свойство множества изу- изученных нами вещественных чисел. 1. Полнота множества вещественных чисел. Два мно- множества, для элементов каждого из которых определены правила сравнения, сложения и умножения, мы будем называть изоморф- изоморфными друз друзу относительно этих правил, если между эле- элементами этих множеств можно установить взаимно однозначное соответствие 3) так, что если элементам а и Ь первого множества ) Способ введения вещественных чисел с помощвю сечений принадлежит немецкому математику Р. Дедекинду A831-1916). Этот способ изложен, например, в гл. I книги Ф. Франклина «Математический анализ» или в гл. I книги Г.М. Фихтенгольца «Основы математического анализа». ) Этот способ введения вещественных чисел принадлежит Г. Кантору. Его изложение можно найти в книге В.В. Немыцкого, М.И. Слудской и А.Н. Черкасова «Курс математического анализа», том I, гл. 2. 3) По поводу взаимно однозначного соответствия между элементами двух множеств см. сноску 1) на с. 91.
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ТЕОРИИ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 633 соответствуют элементы а1 и У второго множества, то: 1) элемен™ ты а1 и У связаны тем же знаком (>, < или =), что и элементы а и Ь; 2) элементу а + Ь соответствует элемент а! + Ъ*\ 3) элементу а • Ь соответствует элемент а1 -У. Аналогично молено было бы говорить не о правилах сравне- сравнения, сложения и умножения, а о каких-либо других правилах, характеризующих соотношения между элементами, и ввести по- понятие множеств, изоморфных друг другу относительно указан™ ных правил. Примером двух множеств, изоморфных друг другу относи- относительно правил сравнения, сложения и умножения, могут слу- служить множество рациональных чисел, введенных в виде отно™ шения целых чисел, с правилами сравнения, сложения и умно- умножения, указанными в сносках на с. 38, и множество рациональ™ ных чисел, записанных в виде бесконечных десятичных дробей, с обычными правилами сравнения, сложения и умножения ве- вещественных чисел. Рассмотрим более внимательно два множества: множество всех рациональных чисел и множество всех вещественных чи- чисел. Для каждого из этих множеств определены правила сравне- сравнения, сложения и умножения и справедливы 13 основных свойств. Вместе с тем ясно, что множество всех вещественных чисел яв- является более «широким», чем множество всех рациональных чи™ сел, ибо в целом множество всех вещественных чисел не изо- изоморфно относительно правил сравнения^ сложения и умноже- ния множеству всех рациональных чисел1), но в множестве вещественных чисел можно выделить часть^ изоморфную от- относительно указанных правил множеству всех рациональных чисел. Естественно, возникает вопрос, нельзя ли и для множества всех вещественных чисел построить более «широкое» множество объектов, обладающее следующими свойствами: 1) в этом бо™ лее «широком» множестве определены правила сравнения, сло- сложения и умножения и справедливы 13 основных свойств; 2) в целом более «широкое» множество не изоморфно относительно указанных правил множеству всех вещественных чисел; 3) в бо- более «широком» множестве можно выделить часть, изоморфную относительно указанных правил множеству всех вещественных чисел. Мы докажем, что такого более «широкого» множества не су- ществует, т. е., как принято говорить в математике, мноэюе- ) Это вытекает из того, что между множеством всех рациональных чи- чисел и всех вещественных чисел нельзя установить взаимно однозначного соответствия (см. п. 6 § 4 гл. 3).
634 ПРИЛОЖЕНИЕ ство всех вещественных чисел является полным относи- относительно правил сравнения^ сложения и умножения и 18 основ- них свойств. Вообще произвольное множество объектов, для которо- которого определены некоторые правила и справедливы некоторые свойства, называется полным относительно этих правил и свойств, если нельзя построить более «широкое» множество объектов такое^ чтобы: 1) в этом более «широком» множе- стве были определены те же правила и справедливы те же свойства; 2) в целом это более «широкое» множество не было изоморфно данному относительно указанных правил; 3) в этом более «широком» множестве существовала часть, изоморфная данному множеству относительно указанных правил. Молено утверждать, что множество всех рациональных чи- чисел не является полным относительно правил сравнения^ сло- сложения и умножения и 18 основных свойству ибо существует более «широкое» множество (множество вещественных чисел), удовлетворяющее требованиям 1), 2) и 3) из только что сфор- сформулированного определения. Докажем теперь, что множество всех вещественных чисел является полным относительно правил сравнения^ сложения и умножения и 18 основных свойств. Предположим противное, т. е. предположим, что существу- существует более «широкое» множество объектов {xf} такое, что: 1) для элементов множества {xf} определены правила сравнения, сло- сложения и умножения и справедливы 13 основных свойств, 2) в целом множество {xf} не изоморфно относительно указанных правил множеству {ж} всех вещественных чисел, 3) существует часть множества {xf} (обозначим ее символом {ж;}), изоморф- изоморфная относительно указанных правил множеству {х} всех веще- вещественных чисел. Заметим, прежде всего, что у множества {xf} существует единственная пара элементов 0' и 1', играющих особую роль нуля и единицы1). Далее, можно утверждать, что элементы О' и V входят в состав множества {хг} и находятся во взаимно одно- однозначном соответствии с вещественными числами 0 и I2). Пусть ) Если бы нашлось два элемента Oi и О2,играющих особую роль нуля, то, в силу свойств суммы, мы получили бы Oi = Oi + О2 = О2 + Oi =02, т. е. Oi = 02. Аналогично доказывается единственность элемента 1/, играющего особую роль единицы. 2) Докажем, например, что элемент 0; входит в состав множества {xf} и находится во взаимно однозначном соответствии с вещественным числом 0. Предположим, что вещественному числу 0 соответствует некоторый эле- элемент О1 множества {ж;}, и пусть а! — любой элемент этого множества, соот™
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ТЕОРИИ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 635 а1 — какой-либо элемент множества {ж;}, не принадлежащий множеству {xf}. В силу правила сравнения мы можем разбить все элементы х1 множества {х1} на два класса — верхний и нижний, отнеся к верхнему классу все элементы ж;, удовлетворяющие неравенству ж' > а', а к нижнему классу все элементы х\ удовлетворяющие неравенству х1 < а. Оба эти класса не являются пустыми. В самом деле, докажем, например, что верхний класс не пуст. По™ вторив элемент V слагаемым достаточное число раз, мы, в силу свойства 13°, получим элемент п1 множества {ж;}, удовлетворяю- удовлетворяющий неравенству п1 > а', т. е. принадлежащий верхнему классу. Из свойства 1° вытекает, что каждый элемент нижнего класса меньше любого элемента верхнего класса. В силу изоморфизма множества {xf} и множества {х} всех вещественных чисел мож- можно утверждать, что множество всех вещественных чисел также разбивается на два класса, причем каждое число из нижнего класса меньше любого числа из верхнего класса. Но это означа- означает, что нижний класс вещественных чисел ограничен сверху и имеет (в силу теоремы 2.1) точную верхнюю грань га, а верх- верхний класс имеет точную нижнюю грань М. Из определения точ- точных граней вытекает, что обе грани т и М заключены между вещественными числами, как угодно близкими между собой, а поэтому га = М. Так как число га = М является одним из ве- вещественных чисел, то оно принадлежит одному из классов, т. е. существует либо наименьший элемент в верхнем классе^ либо наибольший элемент в нижнем классе. Докажем, что оба эти утверждения абсурдны. Пусть (ради определенности) существу- существует наименьший элемент в верхнем классе вещественных чисел. Тогда существует наименьший элемент га' и в верхнем классе, отвечающем разбиению множества {х1}. По определению верх- верхнего класса т! > Ы'. Согласно свойствам суммы существует раз- разность т1 — а', причем, согласно этим свойствам, т1 — а' > 0;. Но тогда, в силу свойства 9°, для элемента т! ~~ а1 существует обратный, который, в силу свойств произведения, равен частно- V му . Согласно свойству 13° элемент 1; можно повторить слагаемым столько раз, что полученный при этом «целый» эле- элемент п1 будет принадлежать {xf} и удовлетворять неравенству V п > — -. Из последнего неравенства, в силу свойств произ- вететвующий вещественному числу а. В силу изоморфности относителвно сложения элементу а + в1 соответствует вещественное число а + 0 = а, т. е. элемент а + в совпадает с элементом а , но это означает, что в (единствен- (единственный!) нулевой элемент, т. е. в = 0 . Аналогично проводятся рассуждения и для единичного элемента.
636 ПРИЛОЖЕНИЕ ведения и суммы, получим 1 j т1 - ^ > а'. (П.1) п Так как элементы тн/, 1; и п1 принадлежат множеству {ж;}, то и элемент 1т — — 1 также принадлежит этому множеству и, очевидно, удовлетворяет неравенству т — — < т . Но тогда неравенство (П.1) означает, что в верхнем классе имеется эле- мент^ меньший т!\ т. е. га' не является наименьшим элемен- элементом. Полученное противоречие доказывает полноту множества вещественных чисел. 2. Аксиоматическое введение множества веществен- вещественных чисел. Полное логическое завершение наших представле- представлений о вещественных числах дает аксиоматический метод введе- введения этих чисел. Этот метод заключается в следующем. Множество вещественных чисел вводится как совокуп- совокупность объектов любой природы, удовлетворяющих 17 аксио- мам, в качестве которых берутся правила сравнения, сложе- сложения и умножения2), 13 основных свойств и аксиома о полноте относительно указанных правил и свойств. Указанные 17 аксиом обычно называют аксиомами веще- вещественного числа. Конкретной реализацией совокупности объек- объектов, удовлетворяющих 17 аксиомам вещественного числа, явля- является изученное нами в гл. 2 множество бесконечных десятичных дробей. Возможны и другие реализации указанной совокупности объектов 3). Полное выяснение вопроса о связи между этими ре- реализациями дает следующее замечательное утверждение. Любая реализация {xf} совокупности объектов, удовлетво- удовлетворяющих 17 аксиомам вещественного числа, изоморфна относи- относительно правил сравнения^ сложения и умножения изученному выше множеству {х} бесконечных десятичных дробей. Доказательство. Ради удобства разобьем доказа™ тельство на отдельные пункты. 1°. Прежде всего, заметим, что аксиомы гарантируют суще™ ствование у множества {xf} элементов (У и 1;, играющих особую 1) Эти свойства обеспечивают применимость всех правил алгебры. 2) Постулируется лишь факт существования правил сравнения, сложения и умножения. Конкретный вид этих правил при этом не указывается. 3) Мы уже указывали во введении к настоящему приложению, что ве- вещественные числа могут быть введены различными способами (с помощью бесконечных двоичных дробей, с помощью так называемых дедекиндовых сечений и другими способами).
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ТЕОРИИ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 637 роль нуля и единицы. В силу аксиомы Архимеда 1/ > 0; 1). Выде- лим у множества {xf} совокупность «рациональных объектов». Для этого заметим, что любое рациональное число может быть получено из чисел 0 и 1 посредством операций сложения, вы™ читания и деления. В самом деле, повторяя число 1 слагаемым нужное число раз, получим любое положительное целое число щ вычитая из числа 0 число 1 нужное число раз, мы получим любое отрицательное целое число; делением двух целых чисел получим любое рациональное число. Так как в множестве {ж;}, согласно аксиомам, определены операции сложения, вычитания и деле™ ния, то с помощью этих операций получим из О' и 1' все «рацио- «рациональные объекты». Эти объекты мы будем обозначать теми же символами, что и рациональные числа, но снабжать штрихами. Докажем, что построенная нами совокупность «рациональ- «рациональных объектов» множества {хг} изоморфна относительно правил сравнения, сложения и умножения совокупности рациональных чисел множества {х}. В самом деле, поставим в соответствие ра- рациональному числу т/п «рациональный объект» т!/п1. Из спо- способа построения «рациональных объектов» вытекает, что сумме и произведению рациональных чисел т/п и p/q соответствует сумма и произведение «рациональных объектов» т!/nf и р1 /qf. Остается убедиться в том, что т!/п1 и р1 /q1 связаны тем же зна- знаком, что и т/п и p/q. Поскольку при нашем построении «рацио- «рациональных объектов» правило сравнения любых «рациональных объектов» посредством умножения на «целые объекты» сводит- сводится к сравнению «целых объектов», то нам достаточно убедиться в том, что для любых «целых объектов» га' и п' т1 > п' при т > п. Для того чтобы убедиться в этом, достаточно в силу аксиом доказать, что (п + 1)' > п1. Последнее вытекает из того, что 1' > 0; и, стало быть, (п + 1); = п1 + 1; > п1 + (У = п1. 2°. Пусть теперь а1 — любой объект множества {хг}. Пока- Покажем, что этому объекту можно поставить в соответствие вполне определенную «бесконечную десятичную дробь» . Ради определенности предположим, что а1 > 0;. В силу аксиомы Ар- Архимеда из «целых объектов», строго меньших а;, найдется наи- наибольший объект, который мы обозначим через а1^] из тех «раци- «рациональных объектов» г) В самом деле, если бы было верно противоположное неравенство V ^ ^ 0 , то из него, в силу аксиом, мы получили бы 1+1+... + 1 ^0+0+... ... + 0 =0 (сколько бы раз число 1 ни было повторено слагаемым), а это противоречит аксиоме Архимеда.
638 ПРИЛОЖЕНИЕ которые строго меньше а;, найдется наибольший объект, кото™ рый мы обозначим через 4, 4? и т- Д- Таким путем мы поставим в соответствие любому объекту бесконечную совокупность «рациональных объектов» a'oja'o,^;... ; a'o, % ... ап;... , (П.2) или, что то же самое, «бесконечную десятичную дробь» а/0,а/1а/2...а/п... (П.З) Те же рассуждения справедливы и для а1 < О', но в этом случае как все объекты (П.2), так и «бесконечная десятичная дробь» (П.З) будут иметь знак минус. Из построения совокупности объектов (П.2) очевидно, что для любого номера п справедливы неравенства 4, 44 •••afn<af ^ а'о, 44 • • • ап + щ^ > (п-4) т. е. любой объект а1 заключен между двумя «рациональными объектами», разность между которыми -—— может быть сде- сделана меньше любого наперед взятого «положительного» объек™ та1). 3°. Докажем теперь, что если два объекта а1 и У могут быть заключены между двумя «рациональными объектами» а1 и Р' (pf > с/), разность между которыми J31 — а1 может быть сде~ лана меньше любого наперед взятого «положительного» объ- екта, то а1 = У'. Предположим, что а1 ф У. Пусть, например, а1 < У'. Тогда а' ^ а' < У ^ р1. Из этих неравенств, в силу аксиом, получим 0; < У - а ^ р1 - а. (П.5) Но тогда для объекта У — а1 найдется обратный f, а для него найдется «целый объект» п1 такой, что так что - < У - а1. п' Сопоставляя последнее неравенство с (П.5), получим г) В самом деле, для любого объекта е1 > 0; в силу аксиом существует ооратныи элемент -у, а для него найдется «целый ооъект» п такой, что
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ТЕОРИИ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 639 что противоречит тому, что разность /3; — а1 может быть сделана меньше любого наперед взятого «положительного» объекта. 4°. Убедимся в том, что двум неравным объектам множе- ства {xf} ставятся в соответствие различные «бесконечные десятичные дроби». В самом деле, предположим, что двум объ- объектам из {xf} ставится в соответствие одна и та же «бесконечная десятичная дробь» (например, (П.З)). Тогда в силу неравенств (П.4) оба эти объекта могут быть заключены между «рацио- «рациональными объектами», разность между которыми может быть сделана меньше любого наперед взятого «положительного» объ- объекта. На основании п. 3° рассматриваемые объекты равны. До- Доказанное утверждение оправдывает представление любого объ™ екта множества {xf} «бесконечной десятичной дробью». 5°. Согласно первым трем аксиомам для объектов множества {xf} определены правила сравнения сложения и умножения. До- Докажем, что если все объекты множества {х1} представить «бесконечными десятичными дробями», то для этих «дробей» правила сравнения и определения суммы и произведения форму- формулируются точно так же, как для обычных бесконечных деся- десятичных дробей, изученных выше. Пусть а1 ж У — любые два объекта множества {ж;}, и пусть этим объектам соответствуют «бесконечные десятичные дро™ би» 1) a;0,ai...<... иб^.-.С.. (П.6) Прежде всего выясним правило сравнения объектов а1 и Ь;, пред- представленных в виде «бесконечных десятичных дробей» (П.6). До- Достаточно доказать следующие два утверждения: 1) если дроби (П.6) совпадают, т. е. если ао = ^о? ai = ^i, ... , ап = Ьп, ... , то объекты а1 и У равны; 2) если найдется номер п такой, что справедливы соотношения 4 = Ь;о, а[ = Ь'ъ ... , а^_х = Ь'п_ъ ап < Ь'п, (П.7) то объекты а1 и У связаны неравенством а1 < У. Утверждение 1) уже доказано в п. 4°. Докажем утверждение 2). Последнее из соотношений (П.7) можно переписать в виде а'п + 14 Ь'п. Пользуясь этим соотношением и остальными соотношениями (П.7) и записывая для а1 правое из неравенств (П.4), а для У ) При установлении правила сравнения можно ограничиться случаем «положительных» объектов а и b , ибо общий случай сводится к этому случаю с помощью правила знаков.
640 ПРИЛОЖЕНИЕ левое из неравенств (П.4), будем иметь 1' а' ^ 4, а[ ... cln_xc!n + ^y =a/0,ai... ^ «о, % ... с!п_$п < Ь'', т. е. а; < Ь;. Докажем теперь, что для объектов а; и У справедливы те же определения суммы и произведения, что и для обычных веще- вещественных чисел. Ограничимся случаем суммы. Пусть о^, о^, /3[ и 02 ~ всевозможные «рациональные объекты», удовлетворяю- удовлетворяющие неравенствам а[ < оЧ 4, #ОЧ $• (П.8) Тогда сумма а; + 6; объектов а1 и 6; представляет собой един- единственный объект, удовлетворяющий неравенствам а[ + р[^ а + ЬЧ 4 + ^. (П.9) В самом деле, из аксиом вытекает возможность почленного сло- сложения неравенств, а отсюда следует, что сумма a! + V удовлетво- удовлетворяет неравенствам (П.9). Кроме того, эта сумма является един- единственным объектом, удовлетворяющим неравенствам (П.9), ибо каждая из разностей <*2-ai И $-#, а стало быть, и разность может быть сделана меньше любого наперед взятого «положи- «положительного» объекта (в силу п. 2°). Аналогично рассматривается случай произведения. 6°. Докажем, наконец, что множество {х1} изоморфно мно- множеству вещественных чисел, представимых бесконечными деся- десятичными дробями. Предположим, что множество {%f} не изо- изоморфно {х}. Объекту а;, представимому «бесконечной десятич- десятичной дробью» a;0, a[af2 ..., поставим в соответствие вещественное число а = ao, «i«2 • • • Пусть двум объектам а1 и У соответствуют вещественные числа а и Ь. Из результатов п. 5 вытекает, что 1) а' и У связаны тем же знаком, что и числа а и Ь, 2) сумме а1 + У соответствует сумма a + Ь; 3) произведению а1 • У соответствует произведение a • Ь1). Так как по предположению {xf} не изоморфно {ж}, то при указанном соответствии не каждому вещественному числу от- отвечает некоторый элемент множества {xf}. Это означает, что ) Ибо сравнение, сложение и умножение объектов а и Ь1 и вещественных чисел а и Ь определяются одними и теми же правилами.
ДАЛЬНЕЙШЕЕ РАЗВИТИЕ ТЕОРИИ ВЕЩЕСТВЕННЫХ ЧИСЕЛ 641 множество {ж;}, будучи не изоморфным всему множеству {ж}, является изоморфным части множества {ж}, что противоречит полноте множества {xf}. Полученное противоречие завершает доказательство утвер- утверждения. 3. Заключительные замечания. В заключение заметим, что аксиоматический метод и понятие изоморфных (относитель- (относительно различных правил) совокупностей объектов широко исполь- используются в разнообразных разделах современной математики и физики (при построении геометрии, теории вероятностей, клас- классической механики, статистической физики, квантовой механи- механики х) и других разделов). Например, в геометрии множество точек прямой вводится как совокупность объектов, удовлетворяющих некоторым ак- аксиомам, среди которых фундаментальную роль играет аксиома о полноте этой совокупности относительно остальных аксиом. Упомянутые аксиомы позволяют установить взаимно однознач- однозначное соответствие между множеством всех точек прямой и мно- множеством всех вещественных чисел2). Это соответствие позволя- позволяет изображать вещественные числа точками на прямой (число- (числовой оси), чем широко пользуются в курсе анализа в иллюстра- иллюстративных целях. х) Так, квантовая механика первоначально возникла в виде двух внешне различных теорий: «Матричной механики» Гейзенберга и «Волновой меха- механики» Шредингера. Позже было доказано, что эти две теории используют две изоморфные друг другу конкретные реализации одной общей совокуп- совокупности объектов, вводимой аксиоматически и называемой абстрактным гиль- гильбертовым пространством (см. по этому поводу часть 2 настоящего курса). ) См. Приложение к выпуску 3 настоящей серии «Аналитическая гео- геометрия» и в более подробном изложении книгу П.В. Ефимова «Высшая геометрия», изд. 1961 г., § 20^23.
ПРЕДМЕТНЫМ УКАЗАТЕЛЬ Абель 367 Абеля-Дирихле признак 458 Абеля-Пуассона метод суммирова- суммирования 472 Абсолютная сходимость бесконечно- бесконечного произведения 465 Абсолютно сходящийся ряд 445 Адамар 602 Адамара неравенство 602 Алгебраический многочлен 207 Алгоритм 36 — Евклида 213 Аналитический способ задания функции 21, 102 Аргумент 20, 101 — промежуточный 21 Архимеда аксиома 39 Асимптота графика вертикальная 318 наклонная 318 Астроида 392 Бесконечная десятичная дробь 41 Бесконечно большая последователь- последовательность 63 функция в точке 108 — малая последовательность 64 функция в точке 108, 488 — малые функции эквивалентные 109 Бесконечное произведение 460 Бином Ньютона 23 Больцано 85 Больцано-Вейерштрасеа теорема 85, 485 Бонне 352 Борель 340 Бореля—Гейне лемма 340 Буняковский 362 Буняковского—Коши неравенство (для интегралов) 364 Буняковского неравенство (для сумм) 362 Валлис 466 Валлиса формула 466 Вейерштрасс 85 Вейерштрасса теорема вторая 259, 496 первая 256, 496 Вейерштрасса-Больцано теорема 85, 485 Векторная функция 160 Векторной функции производная 161 Величина (переменная, постоянная) 19 Вертикальная асимптота 318 Верхняя площадь 384 — сумма 330 Вещественное число 37, 42, 632 , модуль 44 , правило сравнения 44 Взаимно однозначное отображение 587 соответствие 91 «Вилки» метод 402 Внутренняя точка множества 481 сегмента 56 Возрастание функции в точке 260 Выпуклая функция 548 Выпуклое множество 544 Гармонический ряд 431 обобщенный 435 Гармоническое колебание 22 Гейне 340 Гейне-Боре ля лемма 340 Геометрическая прогрессия 427 Гёльдер 361 Гёльдера неравенство для интегра- интегралов 363 сумм 361 Гиперболические функции 125 Гомеоморфное отображение 587 Градиент 510
предметный указатель 643 Градиентный метод поиска экстре- экстремума 543 Граничная точка множества 481 Грань функции (точная верхняя, точная нижняя) 257 — числового множества (верхняя, нижняя) График функции 28, 478 — —, направление выпуклости 308, 548 , точка перегиба 310 Графический способ задания функ- функции 21, 103 Даламбер 436 Даламбера признак 436 Дарбу 326 — интегралы 333 — лемма 334 — теорема 326 Движения закон 20 Диаметр множества 496 Дирихле 102 — функция 102 Дирихле-Абеля признак 457 Дискриминантная кривая 611 — поверхность 614 Дифференциал 164, 505 — высших порядков 186, 518 — дуги 381 Дифференциала инвариантность формы 179, 509 Дифференцирование 23, 163 — сложной функции 26, 175, 505 — суммы, разности, произведения, частного 27, 166, 167 Дифференцируемая функция 162, 499 п раз 183, 515 Длина дуги кривой 374 — максимального частичного сег- сегмента 328 Евклида алгоритм 213 Евклидова плоскость 476 Евклидово пространство 476, 478 Жордан 383 Замечательный предел второй 25, 135 первый 24, 134 Замкнутое множество 481 Знакочередующийся ряд 455 Изоморфные множества 632 Инвариантность формы дифферен- дифференциала 179, 509 Интеграл неопределенный 30, 191 — определенный 32, 328 — эллиптический 245 Интегральная сумма 327 Интегральный косинус 196 — логарифм 196 — синус 196 Интегрирование биномиальных дифференциалов 235 — дробно-линейных иррационально- стей 234 — по частям 199, 357 — рациональной дроби 227 — с помощью замены переменной 196, 356 Интегрируемости условие 335 Интегрируемость функции 328 Интервал 57 Иррациональные числа 43 Итераций метод 405 Итерационная последовательность 406 Итерация 97 Касание кривых 608 Касательная к графику функции 28 — плоскость 501 Касательных метод (метод Ньюто- Ньютона) 403, 408 Квадратичная форма 521 знакоопределенная 534 Квадрируемая плоская фигура 384 Классификация точек разрыва фун- функции 143-145 Колебание функции 336, 497 Комбинированный метод отыскания корней 414 Комплексные числа 203 Координатная плоскость 476 Координатное пространство 476, 478 Корень многочлена 208 кратный, однократный 210 Коши 88 — критерий существования предель- предельного значения функции 250, 488 сходимости последовательности 89, 485 — последовательность 484 — признак сходимости рядов 437 — условие 250, 251, 488 — форма остаточного члена 279 — формула 269 Коши—Буняковского неравенство 364
644 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Коши-Маклорена признак 439 Кривая простая 368 Кривизна кривой 623 Криволинейная трапеция 33, 386 Кубируемое тело 390 Кулона закон 21 Кусочно непрерывная функция 145 Лагранж 263 Лагранжа метод неопределенных множителей 597 — форма остаточного члена 279 — формула конечных приращений 263 — функция 597 Лаплас 604 Лапласа оператор 604 Лебег 340 Лежандр 240 Лейбниц 34 Лейбница признак 455 — ряд 455 — формула 185 Лейбница-Ньютона формула 34, 354 Лиувилль 246 Логарифм интегральный 196 — натуральный 125 Логарифмическая функция 123 Локальная ограниченность функции 252-254 Локальный максимум функции 261, 532 — минимум функции 261, 532 — экстремум 261, 532 Лопиталя правило 270, 271 Маклорен 281 Маклорена формула 281 Маклорена-Коши признак 440 Минковский 362 Минковского неравенство для инте- интегралов 365 сумм 362 Множества внутренняя точка 481 — граничная точка 481 — диаметр 497 — предельная точка 91 Множество вещественных чисел 46, 56 — всех значений функции 101 — конечное, бесконечное 91 — мощности континуума 92 — ограниченное 91 сверху, снизу 46 — плотное в себе 57 — связное 481, 482 — счетное 92 Модуль вещественного числа 44 Монотонная последовательность 73 — функция 113 Муавр 207 Муавра формула 207 Наклонная асимптота 318 Натуральный логарифм 125 — параметр на кривой 374 Начальное понятие 20 Неопределенный интеграл 30, 191 Неопределенных коэффициентов метод 223 — множителей метод (метод Лагран- Лагранжа) 597 Неправильная рациональная дробь 215 Непрерывность функции 24, 110, 490 в точке 110, 249, 490 на множестве 112, 491 прямой 492 односторонняя 111 равномерная 337, 497 , разностная форма 157, 491 Неявная функция 568 Нижняя сумма 330 Нормаль к поверхности 503 Ньютон 20 Ньютона бином 23 — метод касательных 403, 408 Ньютона-Лейбница формула 34, 354 Область 481 — задания функции 101, 482 — замкнутая 481 — ограниченная 481 Обобщенный гармонический ряд 435 Обратная тригонометрическая функция 132 — функция 114, 579 Объем тела (верхний, нижний) 390 Обыкновенная точка кривой 578, 607 поверхности 578 Огибающая семейства кривых 611 поверхностей 614 Ограниченная область 481 — последовательность 62, 485 — функция 252, 253 сверху, снизу 252 Ограниченное множество 91 сверху, снизу 46 Ограниченность локальная функции 254 Однопараметрическое семейство кривых 609
предметный указатель 645 Однородная функция 508 Односторонний предел 104 Односторонняя непрерывность 111 — производная 160 Окрестность точки 57, 480-482 Определенный интеграл 32, 328 Особая точка кривой 578, 607 поверхности 578 Остаток ряда 430 Остаточный член формулы Тейлора 276 в интегральной форме 358 форме Коши 279 Лагранжа 279 Пеано 279 Шлемильха-Роша 276 Остроградский 228 Остроградского метод 228 Открытая полупрямая 57 Отображение взаимно однозначное 587 — гомеоморфное 587 Отрезок в евклидовом пространстве 544 Парабол метод (формула Симпсона) 422 Пеано 279 — форма остаточного члена 279 Первообразная 190 Переменная величина 19, 100 Площадь верхняя 384 — криволинейного сектора 387 — криволинейной трапеции 386 — нижняя 384 — поверхности вращения 393 Поверхность уровня 512 Повторное предельное значение 489 Повторный предел 490 Подпоследовательность 79 Показательная функция 120 Полнота множества вещественных чисел 632 Полупрямая 57 Полусегмент 57 Порядок соприкосновения кривых 595 Последовательность бесконечно большая 63 малая 64 — итерационная 406 — неограниченная 63 — ограниченная 62, 485 — сходящаяся 67, 483 — фундаментальная 88, 484 — числовая 61 Правило сравнения вещественных чисел 41 Правильная рациональная дробь 207 Предел верхний 83 — нижний 84 — повторный 490 — последовательности 67, 483 Предельная точка 81 Предельное значение функции 103, 247, 487 Приведенный многочлен 209, 210 Признаки сравнения для рядов 432, 433 Приращение функции 156 полное 491 частное 491, 492 Проекция точки на множество 545 Произведение бесконечное 460 абсолютно сходящееся 464,465 сходящееся 460 условно сходящееся 464 — вещественных чисел 53 Производная 22, 157, 158 — высшего порядка 183 — по направлению 510 — правая, левая 160 — частная 497, 498 высшего порядка 513 Промежуточный аргумент 21 Пространство евклидово 476, 479 — координатное 476, 478 — метрическое 479 Прямоугольная окрестность точки 480 Прямоугольников метод 416 Пуассон 472 Пуассона интеграл 195 Раабе 443 — признак 443 Радиус кривизны 631 Разность вещественных чисел 54 Разрыв 1-го рода 144 — 2-го рода 144 — устранимый 143 Расстояние точки до множества 544 Рациональная дробь 215 неправильная 215 правильная 215 Рациональное число 37 Риман 328 Римана теорема о перестановках ря- рядов 449 Ролль 262 Ролля теорема 262
646 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Роша-Шлемильха форма остаточно- остаточного члена 276 Ряд абсолютно сходящийся 445 — гармонический 431 — знакочередующийся 455 — Лейбница 455 — расходящийся 427 — сходящийся 426 — условно сходящийся 446 — числовой 426 Ряда сумма 426 — частичная сумма 426 Сегмент 56 Секущая 28 Сильвестр 534 Сильно выпуклая функция 551 Симпсон 422 Симпсона формула (метод парабол) 422 Скорость мгновенная 22 — средняя 22 Сложная функция 26, 141, 494 Соприкасающаяся окружность 621 Способ задания функции 102 аналитический 21, 102 графический 21, 103 табличный 21, 103 Спрямляемая кривая 373 Среднего значения формула вторая 351,352 первая 350, 351 Степенная функция 126 Строфоида 370 Сумма верхняя 330 — вещественных чисел 51 — нижняя 330 — ряда 426 Суммирования методы 470 Сходящаяся последовательность 67, 483 Сходящееся произведение 460 Сходящийся ряд 426 Табличный способ задания функции 21, 103 Тейлор 275 Тейлора формула 275, 527 Точка разрыва функции 111 классификация 143, 144 Трапеций формула 420 Тригонометрические функции 128 обратные 132 "Убывание функции в точке 260 Угловой коэффициент прямой 29 Условно сходящееся произведение 464 — сходящийся ряд 446 Френеля интегралы 195, 196 Фундаментальная последовательность 88, 484 Функция 20, 101, 482 Характеристика 615 Характеристическая точка 610 Хорд метод 404, 412 Центр кривизны 631 Цепная линия 382 Циклоида 189, 382 Частичная сумма ряда 426 Частная производная 497, 498 Частное вещественных чисел 55 — значение функции 101, 482 Чебышев 236 Чезаро 471 — метод суммирования 471 Число е 25, 78, 285 Числовая прямая 57 Числовой ряд 426 Шлемильха-Роша форма остаточ- остаточного члена 276 Штольца теорема 93 Эвольвента 628 Эволюта 628 Эйлер 25 Эйлера подстановка 236, 237 — теорема 508 Эквивалентные бесконечно малые функции 108, 109 — множества 91 Экстремум краевой 325 — локальный 261 —, достаточное условие 301, 303, 306, 315 , необходимое условие 261 — — функций нескольких перемен- переменных 531, 532 , достаточное условие 533 — — — — —, необходимое условие 531, Элементарная функция 143 Эллипс 383 Якоби 581 Якобиан 581
Учебное издание ИЛЬИН Владим,ир Александрович, ПОЗНЯК Эдуард Генрихович ОСНОВЫ МАТЕМАТИЧЕСКОГО АНАЛИЗА Часть I Серия «Курс высшей математики и математической физики» Редакторы М.М. Горячая, Д. А. Миртова Оригинал-макет: Ст.Ю. Мельников ЛР №071930 от 06.07.99 Подписано в печать 01.09.04. Формат 60x90/16 Бумага офсетная Ш1. Печать офсетная. Усл. печ. л. 40,5. Уч.-изд. л. 43,4. Заказ Ш Издательская фирма « Физико-математическая литература» МАИК «Наука/Интерпериодика» 117997, Москва, Профсоюзная ул., 90 E-mail: fizinat@rnaik.ru, frnlsale@rnaik.ru; http://www.fml.ru Отпечатано с готовых диапозитивов в ФГУП «Ивановская областная типография» 153008, г. Иваново, ул. Типографская, 6 ISBN 5-9221-0536-1 7 859221.1053 61