Текст
                    В. А. Зорич
МАТЕМАТИЧЕСКИЙ
АНАЛИЗ
Часть I
Издание второе,
исправленное и дополненное
Рекомендовано Министерством общего и профессионального образования
Российской Федерации в качестве учебника для студентов
математических и физико-математических
факультетов и специальностей
высших учебных заведений
ф
ФАЗИС
Москва • 1997

ББК 22.16 386 УДК 517 Издание осуществлено при поддерж Российского фонда фундаментальна исследований по проекту 96-01-1411. Зорич В. А. Математический анализ. Насть I. Изд. 2-е, испр. и доп. М.: ФАЗИС, 1997. - xiv + 554 с. ISBN 5-7036-0031-6 В книге отражена связь курса классического анализа с современными математическими курсами (алгебры, дифференциальной геометрии, диффе- ренциальных уравнений, комплексного и функционального анализа). Основные разделы первой части: введение в анализ (логическая сим- волика, множество, функция, вещественное число, предел, непрерывность); дифференциальное и интегральное исчисление функций одной переменной; дифференциальное исчисление функций многих переменных. Органической частью текста являются примеры приложений развивае- мой теории, а также большое количество задач. Второе издание дополнено вопросами и задачами коллоквиумов и экзаменов. «Полная строгость изложения... соединена с доступностью и полното а также воспитанием привычки иметь дело с реальными задачами ecmeci вознания» (Из отзыва академика А. Н. Колмогорова о первом издании этой книг! Издательство ФАЗИС (ЛР К» 064705 от 09.08.96) 123557 Москва, Пресненский вал, 42-44 Отпечатано в Московской типографии К» 2 РАН 121099 Москва Г-99, Шубинский пер., 6 Заказ К* 2543 ISBN 5-7036-0031-6 © ФАЗИС, 19!
ОГЛАВЛЕНИЕ Предисловие ко второму изданию..................................... Из предисловия к первому изданию................................... Глава I. Некоторые общематематические понятия и обозначения § 1. Логическая символика....................................... 1. Связки и скобки (1). 2. Замечания о доказательствах (3). 3. Некото- рые специальные обозначения (3). 4. Заключительные замечания (3). Упражнения (4). § 2. Множество и элементарные операции над множествами.......... 1. Понятие множества (5). 2. Отношение включения (7). 3. Простей- шие операции над множествами (8). Упражнения (10). § 3. Функция ................................................... 1. Понятие функции (отображения) (11). 2. Простейшая классифика- ция отображений (15). 3. Композиция функций и взаимно обратные отображения (16). 4. Функция как отношение. График функции (19). Упражнения (22). § 4. Некоторые дополнения....................................... 1. Мощность множества (кардинальные числа) (25). 1. Об аксиомати- ке теории множеств (26). 2. Замечания о структуре математических высказываний и записи их на языке теории множеств (29). 'Упражне- ния (31). Глава II. Действительные (вещественные) числа...................... § 1. Аксиоматика и некоторые общие свойства множества действительных чисел.......................................................... 1. Определение множества действительных чисел (33). 2. Некоторые общие алгебраические свойства действительных чисел (37). 3. Аксиома полноты и существование верхней (нижней) грани числового множе- ства (41). § 2. Важнейшие классы действительных чисел и вычислительные аспекты операций с действительными числами............................. 1. Натуральные числа и принцип математической индукции (43). 2. Ра- циональные и иррациональные числа (46). 3. Принцип Архимеда (50). 4. Геометрическая интерпретация множества действительных чисел и вычислительные аспекты операций с действительными числами (52). Задачи и упражнения (64).
§ 3. Основные леммы, связанные с полнотой множества действительных чисел ......................................................... 1. Лемма о вложенных отрезках (принцип Коши — Кантора) (68). 2. Лемма о конечном покрытии (принцип Бореля —Лебега (69). 3. Лем- ма о предельной точке (принцип Больцано — Вейерштрасса (69). Зада- чи и упражнения (70). § 4. Счетные и несчетные множества............................. 1. Счетные множества (71). 2. Мощность континуума (73). Задачи и упражнения (74). лава III. Предел................................................. § 1. Предел последовательности................................. 1. Определения и примеры (77). 2. Свойства предела последовательно- сти (79). 3. Вопросы существования предела последовательности (83). 4. Начальные сведения о рядах (92). Задачи и упражнения (102). § 2. Предел функции............................................ 1. Определения и примеры (105). 2. Свойства предела функции (109). 3. Общее определение предела функции (предел по базе) (124). 4. Во- просы существования предела функции (128). Задачи и упражне- ния (144). лава IV. Непрерывные функции..................................... § 1. Основные определения и примеры............................ 1. Непрерывность функции в точке (148). 2. Точки разрыва (153). § 2. Свойства непрерывных функций.............................. 1. Локальные свойства (156). 2. Глобальные свойства непрерывных функций (157). Задачи и упражнения (166). лава V. Дифференциальное исчисление.............................. § 1. Дифференцируемая функция.................................. 1. Задача и наводящие соображения (170). 2. Функция, дифферен- цируемая в точке (175). 3. Касательная; геометрический смысл про- изводной и дифференциала (177). 4. Роль системы координат (180). 5. Некоторые примеры (182). Задачи и упражнения (187). § 2. Основные правила дифференцирования........................ 1. Дифференцирование и арифметические операции (189). 2. Диф- ференцирование композиции функций (192). 3. Дифференцирование обратной функции (196). 4. Таблица производных основных элемен- тарных функций (200). 5. Дифференцирование простейшей неявно за- данной функции (200). 6. Производные высших порядков (205). Зада- чи и упражнения (209). § 3. Основные теоремы дифференциального исчисления............. 1. Лемма Ферма и теорема Ролля (210). 2. Теоремы Лагранжа и Коши о конечном приращении (212). 3. Формула Тейлора (215). Задачи и упражнения (228). § 4. Исследование функций методами дифференциального исчисления . . .
1. Условия монотонности функции (231). 2. Условия внутреннего экс- тремума функции (232). 3. Условия выпуклости функции (238). 4. Пра- вило Лопиталя (245). 5. Построение графика функции (246). Задачи и упражнения (255). § 5. Комплексные числа и взаимосвязь элементарных функций........ 2 1. Комплексные числа (258). 2. Сходимость в С и ряды с комплекс- ными членами (262). 3. Формула Эйлера и взаимосвязь элементарных функций (267). 4. Представление функции степенным рядом, анали- тичность (270). 5. Алгебраическая замкнутость поля С комплексных чисел (275). Задачи и упражнения (281). § 6. Некоторые примеры использования дифференциального исчисления в задачах естествознания........................................... 2 1. Движение тела переменной массы (283). 2. Барометрическая фор- мула (285). 3. Радиоактивный распад, цепная реакция и атомный ко- тел (287). 4. Падение тел в атмосфере (289). 5. Еще раз о числе е и функции ехрт (291). 6. Колебания (293). Задачи и упражнения (297). § 7. Первообразная............................................... 3 1. Первообразная и неопределенный интеграл (301). 2. Основные об- щие приемы отыскания первообразной (303). 3. Первообразные ра- циональных функций (309). 4. Первообразные вида JR(cos х, sin х) dx (314). 5. Первообразные вида jR(x,y(x))dx (316). Задачи и упраж- нения (319). Глава VI. Интеграл............................................... 3' § 1. Определение интеграла и описание множества интегрируемых функ- ций ......................................................... з: 1. Задача и наводящие соображения (324). 2. Определение интеграла Римана (326). 3. Множество интегрируемых функций (328). Задачи и упражнения (340). § 2. Линейность, аддитивность и монотонность интеграла........ 3' 1. Интеграл как линейная функция на пространстве 7£[а, 6] (342). 2. Интеграл как аддитивная функция отрезка интегрирования (342). 3. Оценка интеграла, монотонность интеграла, теоремы о среднем (345). Задачи и упражнения (352). § 3. Интеграл и производная................................... 35 1. Интеграл и первообразная (354). 2. Формула Ньютона—Лейбница (356). 3. Интегрирование по частям в определенном интеграле и фор- мула Тейлора (357). 4. Замена переменной в интеграле (359). 5. Неко- торые примеры (361). Задачи и упражнения (365). § 4. Некоторые приложения интеграла........................... 3( 1. Аддитивная функция ориентированного промежутка и интеграл (369). 2. Длина пути (371). 3. Площадь криволинейной трапеции (377). 4. Объем тела вращения (378). 5. Работа и энергия (379). Задачи и упражнения (385). § 5. Несобственный интеграл................................... 3?
1. Определения, примеры и основные свойства несобственных интегра- лов (386). 2. Исследование сходимости несобственного интеграла (391). 3. Несобственные интегралы с несколькими особенностями (398). За- дачи и упражнения (401). Глава VII. Функции многих переменных, их предел и непрерыв- ность ......................................................... 4 § 1. Пространство Rm и важнейшие классы его подмножеств........ 4 1. Множество Rm и расстояние в нем (403). 2. Открытые и замкнутые множества в Rm (405). 3. Компакты в Rm (408). Задачи и упражне- ния (409). § 2. Предел и непрерывность функции многих переменных........... 4 1. Предел функции (410). 2. Непрерывность функции многих пере- менных и свойства непрерывных функций (415). Задачи и упражне- ния (420). Глава VIII. Дифференциальное исчисление функций многих пере- менных ....................................................... 4 § 1. Линейная структура в Rm................................. 4 1. Rm как векторное пространство (421). 2. Линейные отображения L : Rm —> Rn (422). 3. Норма в Rm (423). 4. Евклидова структура в Rm (425). § 2. Дифференциал функции многих переменных.................... 4 1. Дифференцируемость и дифференциал функции в точке (426). 2. Дифференциал и частные производные вещественнозначной функ- ции (427). 3. Координатное представление дифференциала отображе- ния. Матрица Якоби (430). 4. Непрерывность, частные производные и дифференцируемость функции в точке (431). § 3. Основные законы дифференцирования......................... 4 1. Линейность операции дифференцирования (432). 2. 'Дифференциро- вание композиции отображений (434). 3. Дифференцирование обрат- ного отображения (440). Задачи и упражнения (441). § 4. Основные факты дифференциального исчисления вещественнозначных функций многих переменных...................................... 4 1. Теорема о среднем (447). 2. Достаточное условие дифференцируемо- сти функции многих переменных (449). 3. Частные производные выс- шего порядка (450). 4. Формула Тейлора (453). 5. Экстремумы функ- ций многих переменных (454). 6. Некоторые геометрические образы, связанные с функциями многих переменных (461). Задачи и упражне- ния (465). § 5. Теорема о неявной функции.................................. 4 1. Постановка вопроса и наводящие соображения (471). 2. Простей- ший вариант теоремы о неявной функции (473). 3. Переход к случаю зависимости F(x1, ..., хт, у) = 0 (477). 4. Теорема о неявной функ- ции (480). Задачи и упражнения (485). § 6. Некоторые следствия теоремы о неявной функции.............. 4
VII ОГЛАВЛЕНИЕ 1. Теорема об обратной функции (489). 2. Локальное приведение глад- кого отображения к каноническому виду (493). 3. Зависимость функ- ций (497). 4. Локальное разложение диффеоморфизма в композицию простейших (499). 5. Лемма Морса (501). Задачи и упражнения (505). § 7. Поверхность в Rn и теория условного экстремума........... 51 1. Поверхность размерности к в Rn (506).. 2. Касательное простран- ство (511). 3. Условный экстремум (516). Задачи и упражнения (528). Некоторые задачи коллоквиумов.................................... 5; Вопросы к экзамену............................................... 5: Литература........................................................ 5 Алфавитный указатель............................................. 5'
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ В этом, втором издании книги, наряду с попыткой устранить опечатки п< вого1), сделаны отдельные изменения изложения (в основном это касаеа вариантов доказательств отдельных теорем) и добавлены некоторые нов задачи, как правило, неформального характера. В предисловии к перво изданию этого курса анализа уже дана его общая характеристика, указа основные принципы и направленность изложения. Здесь я хотел бы с дела несколько практических замечаний, связанных с использованием книги в уч< ном процессе. Любым учебником обычно пользуются как студент, так и преподаватель каждый для своих целей. Сначала и тот, и другой заинтересованы име книгу, где, помимо формально необходимого минимума теории, имеются возможности разнообразные содержательные примеры ее использования, i яснения, исторический и научный комментарии, демонстрируются взаимоа зи, указываются перспективы развития. Но в момент подготовки к экзаме студент желает видеть тот материал, который выносится на экзамен. П] подаватель точно так же, завершая подготовку курса, отбирает только т материал, который может и должен быть изложен в отведенное курсу вре> В этой связи следует иметь в виду, что текст данного учебника, кон< но, заметно шире того конспекта лекций, на базе которого он написан. Я составило эту разницу? Во-первых, к конспекту добавлен, по существу, ] лый задачник, состоящий, не столько из упражнений, сколько из содера тельных задач естествознания или собственно математики, примыкающие соответствующим разделам теории, а иногда и существенно расширяющих i Во-вторых, в книге, конечно, разобрано много больше примеров, демонст! рующих теорию в действии, чем это удается сделать на лекциях. Након в-третьих, ряд глав, параграфов или отдельных пунктов сознательно напи< ны как дополнение к традиционному материалу. Об этом сказано в раздел Не следует огорчаться: вместо исправленных опечаток не сохранившегося набора п вого издания заведомо появится комплект новых опечаток, так оживляющих, по мнен Эйлера, чтение математического текста.
«О введении» и «О вспомогательном материале» предисловия к первому изд нию. Напомню также, что в предисловии к первому изданию я желал предост речь и студента, и начинающего преподавателя от чрезмерно долгого сквози го изучения вводных формальных глав. Это заметно откладывает собствен] анализ и сильно смещает акценты. Чтобы показать, что на деле остается в реальном лекционном курсе < этих формальных вводных глав, и чтобы в концентрированном виде изложи' программу такого курса в целом, а также отметить возможные ее вариации зависимости от контингента слушателей, я в конце книги привожу некотор1 задачи коллоквиумов, а также экзаменационные вопросы последнего времет за первые два семестра, к которым относится эта часть I. По экзаменационным вопросам профессионал, конечно, увидит и поряд< изложения, и степень развития в нем фундаментальных понятий и методов, привлечение порой материала второй части учебника, когда рассматриваемь в первой части вопрос уже доступен слушателям в более общем виде1). В заключение хотел бы поблагодарить знакомых и незнакомых мне ко лег и студентов за отзывы и конструктивные замечания к первому издани курса. Особенно интересно и полезно мне было прочитать рецензии А. Н. Ко могорова и В. И. Арнольда. Разные по объему, форме и стилю, они в профе сиональном плане имели так ободряюще много общего. Москва, 1997 В. Зорг Часть записей соответствующих лекций опубликована и формально я даю ссылку : изданные по ним брошюры, хотя понимаю, что они уже малодоступны (лекции были проч таны'и изданы ограниченным тиражом в Математическом колледже МНУ и на механик математическом факультете МГУ).
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ Создание Ньютоном и Лейбницем три столетия тому назад основ диффере циального и интегрального исчисления даже по нынешним масштабам пре ставляется крупнейшим событием в истории науки вообще и математики особенности. Математический анализ (в широком смысле слова) и алгебра, переплет ясь, образовали теперь ту корневую систему, на которой держится разветвле ное дерево современной математики и через которую происходит его основ» живительный койтакт с внематематической сферой. Именно по этой причи основы анализа включаются как необходимый элемент даже самых скромна представлений о так называемой высшей математике, и, вероятно, поэтот изложению основ анализа посвящено большое количество книг, адресованш различным кругам читателей. Эта книга в первую очередь адресована математикам, желающим (как должно) получить полноценные в логическом отношении доказательства фу даментальных теорем, но вместе с тем интересующимся также их внема! матической жизнью. Особенности настоящего курса, связанные с указанными обстоятельств ми, сводятся в основном к следующему. По характеру изложения. В пределах каждой большой темы из.г жение, как правило, индуктивное, идущее порой от постановки задачи и в водящих эвристических соображений по ее решению к основным понятиям формализмам. Подробное вначале, изложение становится все более сжатым по мере пр движения по курсу. Упор сделан на эффективном аппарате гладкого анализа. При изложен] теории я (в меру своего понимания) стремился выделить наиболее существе ные методы и факты и избежать искушения незначительного усиления теор< ценой значительного усложнения доказательств. Изложение геометрично всюду, где это представлялось ценным для рг крытия существа дела. Основной текст снабжен довольно большим количеством примеров, а поч' каждый параграф заканчивается набором задач, которые, надеюсь, сущее
венно дополняют даже теоретическую часть основного текста. Следуя ] ликолепному опыту Полна и Сеге, я часто старался представить красив] математический или важный прикладной результат в виде серий доступн: читателю задач. Расположение материала диктовалось не только архитектурой матема! ки в смысле Бурбаки, но и положением анализа как составной части единс математического или, лучше сказать, естественно-математического обра: вания. По содержанию. Курс издается в двух книгах (части I и II). Настоящая первая часть содержит дифференциальное и интегральное ] числение функций одной переменной и дифференциальное исчисление фуь ций многих переменных. В дифференциальном исчислении выделена роль дифференциала как j нейного эталона для локального описания характера изменения перемени величины. Кроме многочисленных примеров использования дифференциал ного исчисления для исследования функциональных зависимостей (монот( ность, экстремумы), показана роль языка анализа в записи простейших ди ференциальных уравнений — математических моделей конкретных явленш связанных с ними содержательных задач. Рассмотрен ряд таких задан (i пример, движение тела переменной массы, ядерный реактор, атмосферное j вление, движение в сопротивляющейся среде), решение которых приводи! важнейшим элементарным функциям. Полнее использован комплексный язь в частности, выведена формула Эйлера и показано единство основных элем< тарных функций. Интегральное исчисление сознательно изложено по возможности на напи ном материале в рамках интеграла Римана. Для большинства приложений эг. го вполне хватает1). Указаны различные приложения интеграла, в том чи< приводящие к несобственному интегралу (например, работа выхода из пс тяготения и вторая космическая скорость) или к эллиптическим функци (движение в поле тяжести при наличии связей, маятник). Дифференциальное исчисление функций нескольких переменных дово. но геометрично. В нем, например, рассмотрены такие важные и полезн следствия теоремы о неявной функции, как криволинейные координаты и . кальное приведение к каноническому виду гладких отображений (теоремг ранге) и функций (лемма Морса), а также теория условного экстремума. Результаты, относящиеся к теории непрерывных функций и диффереш альному исчислению, подытожены и изложены в общем инвариантном вид' двух главах, которые естественным образом примыкают к дифференциа. ному исчислению вещественнозначных функций нескольких переменных. Э две главы открывают вторую часть курса. Вторая книга, в которой, крс Более «сильные» интегралы, как известно, требуют более кропотливых и выбив; щихся из основного русла теоретико-множественных рассмотрений, мало что прибавля эффективному аппарату анализа, который и должен быть освоен в первую очередь.
того, изложено интегральное исчисление функций многих переменных, до: денное до общей формулы Ньютона—Лейбница — Стокса, приобретает, так образом, определенную целостность. Более полные сведения о второй книге мы поместим в предисловии к ней здесь добавим только, что кроме уже перечисленного материала она содерж сведения о рядах функций (степенных рядах и рядах Фурье в том числ об интегралах, зависящих от параметра (включая фундаментальное решен: свертку и преобразование Фурье), а также об асимптотических разложен» (они обычно мало представлены в учебной литературе). Остановимся теперь на некоторых частных вопросах. О введении. Вводного обзора предмета я не писал, поскольку болыш ство начинающих студентов уже имеют из школы первое представление о ди ференциальном и интегральном исчислении и его приложениях, а на больп вступительный обзор вряд ли мог бы претендовать. Вместо него я в перв двух главах довожу до определенной математической завершенности предсг вления бывшего школьника о множестве, функции, об использовании логи1 ской символики, а также о теории действительного числа. Этот материал относится к формальным основаниям анализа и адресов в первую очередь студенту-математику, который в какой-то момент захо^ проследить логическую структуру базисных понятий и принципов, исполь: емых в классическом анализе. Собственно математический анализ в кнь начинается с третьей главы, поэтому читатель, желающий по возможное скорее получить в руки эффективный аппарат и увидеть его приложения, п первом чтении вообще может начать с главы III, возвращаясь к более ранн страницам в случае, если что-то ему покажется неочевидным и вызовет i прос, на который, надеюсь, я тоже обратил внимание и предусмотритель дал ответ в первых главах. О рубрикации. Материал обеих книг разбит на главы, имеющие сплс ную нумерацию. Параграфы нумеруются в пределах каждой главы отдель: подразделения параграфа нумеруются только в пределах этого параграс Теоремы, утверждения, леммы, определения и примеры для большей логи ской четкости выделяются, а для удобства ссылок нумеруются в предел каждого параграфа. О вспомогательном материале. Несколько глав книги написа как естественное окаймление классического анализа. Это, с одной сторон уже упоминавшиеся главы I, II, посвященные его формально-математическ основаниям, а с другой стороны, главы IX, X, XV второй части,, дающие сов] менный взгляд на теорию непрерывности, дифференциальное и интегралы исчисление, а также глава XIX, посвященная некоторым эффективным ас» птотическим методам анализа. Вопрос о том, какая часть материала этих глав включается в лекционн курс, зависит от контингента слушателей и решается лектором, но некотор вводимые здесь фундаментальные понятия обычно присутствуют в любом j ложении предмета математикам.
XIV ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ В заключение я хотел бы поблагодарить тех, чья дружеская и квалиф цированная профессиональная помощь была мне дорога и полезна при рабо над этой книгой. Предлагаемый курс довольно тщательно и во многих аспектах соглас вывален с последующими современными университетскими математически! курсами — такими, например, как дифференциальные уравнения, диффере циальная геометрия, теория функций комплексного переменного, функцв нальный анализ. В этом отношении мне были весьма полезны контакты обсуждения с В. И. Арнольдом и, особенно многочисленные, с С. П. Нови» вым в период совместной работы в экспериментальном потоке при отделен] математики. Много советов я получил от Н. В. Ефимова, заведующего кафедрой ма1 матического анализа механико-математического факультета МГУ. Я признателен также коллегам по кафедре и факультету за замечания ротапринтному изданию моих лекций. При работе над книгой ценными оказались предоставленные в мое рг поряжение студенческие записи моих лекций последнего времени, за что благодарен их владельцам. Я глубоко признателен официальным рецензентам издательства Л. Д. К дрявцеву, В. П. Петренко, С. Б. Стечкину за конструктивные замечания, зв чительная часть которых учтена в предлагаемом читателю тексте. Москва, 1980 В. Зор'
ГЛАВА I НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ И ОБОЗНАЧЕНИЯ § 1. Логическая символика 1. Связки и скобки. Язык этой книги, как и большинства матема: ческих текстов, состоит из обычного языка и ряда специальных символ излагаемых теорий. Наряду с этими специальными символами, которые I дут вводиться по мере надобности, мы используем распространенные сим] лы математической логики Л, V, =>, <=> для обозначения соответствен отрицания «не» и связок «и», «или», «влечет», «равносильно».1) Возьмем, например, три представляющих и самостоятельный интерес е сказывания: L. «Если обозначения удобны для открытий ..., то поразительным об] зом сокращается работа мысли» (Г. Лейбниц2)). Р. «Математика — это искусство называть разные вещи одинаковы именами» (А. Пуанкаре3 4)). G. «Великая книга природы написана языком математики» (Г. Галилей'’ В логике вместо символа А чаще используется символ &. Символ => импликации гики чаще пишут в виде —а отношение равносильности — в виде -<-> или W. Однако будем придерживаться указанной в тексте символики, чтобы не перегружать традиционн для анализа знак —> предельного перехода. 2) Г. В. Лейбниц (1646 — 1716) — выдающийся немецкий ученый, философ и математ которому наряду с Ньютоном принадлежит честь открытия основ анализа бесконечно i лых. 3>А. Пуанкаре (1854 — 1912) — французский математик, блестящий ум которого п образовал многие разделы математики и достиг ее фундаментальных приложений в ма матической физике. 4) Г. Галилей (1564 — 1642) — итальянский ученый, крупнейший естествоиспытатель. I труды легли в основу всех последующих физических представлений о пространстве и в мени. Отец современной физической науки.
£ 1 J1. А. X V/A U UXVin Л ж Тогда в соответствии с указанными обозначениями: Запись Означает В=>Р L влечет Р L<=>P L равносильно Р ((L =► Р) Л ^Р)) => (-£) Если Р следует из L и Р неверно, то L неверно -((L<=>G)V(P^G)) G не равносильно ни В, ни Р Мы видим, что пользоваться только формальными обозначениями, избег, разговорного языка, — не всегда разумно. Мы замечаем, кроме того, что в записи сложных высказываний, сост вленных из более простых, употребляются скобки, выполняющие ту же си таксическую функцию, что и при записи алгебраических выражений. Как в алгебре, для экономии скобок можно договориться о «порядке действир Условимся с этой целью о следующем порядке приоритета символов: Л, V, =>, <=>. При таком соглашении выражение -А. Л В V С => D следует расшифровав как (((-•Л) А В) V С) => D, а соотношение А V В => С — как (Л V В) => С, i не как А V (В => С). Записи А => В, означающей, что А влечет В или, что то же самое, следует из А, мы часто будем придавать другую словесную интерпретаци) говоря, что В есть необходимый признак или необходимое условие А и, свою очередь, А — достаточное условие или достаточный признак В. Т ким образом, соотношение А <=> В можно прочитать любым из следуюгщ способов: А необходимо и достаточно для В; А тогда и только тогда, когда В; А, если и только если В; А равносильно В. Итак, запись А <=> В означает, что А влечет В и, одновременно, В вл чет А. Употребление союза и в выражении А А В пояснений не требует. Следует, однако, обратить внимание на то, что в выражении А V В с юз или неразделительный, т. е. высказывание А V В считается верным, ecj истинно хотя бы одно из высказываний А, В. Например, пусть х — таю
действительное число, что х2 — Зх + 2 = 0. Тогда можно написать, что име место следующее соотношение: (х2 - Зх + 2 = 0) <=> (х = 1) V (х = 2). 2. Замечания о доказательствах. Типичное математическое утвер; дение имеет вид А => В, где А — посылка, а В — заключение. Доказательст такого утверждения состоит в построении цепочки А => Ci => ... => Сп => следствий, каждый элемент которой либо считается аксиомой, либо являет уже доказанным утверждением1). В доказательствах мы будем придерживаться классического правила в: вода: если А истинно и А => В, то В тоже истинно. При доказательстве от противного мы будем использовать также принц] исключенного третьего, в силу которого высказывание А V ->А (А или не . считается истинным независимо от конкретного содержания высказывания Следовательно, мы одновременно принимаем, что <=> А, т. е. повтори отрицание равносильно исходному высказыванию. 3. Некоторые специальные обозначения. Для удобства читателя сокращения текста начало и конец доказательства условимся отмечать знак ми ◄ и ► соответственно. Условимся также, когда это будет удобно, вводить определения посре ством специального символа := (равенство по определению), в котором две точие ставится со стороны определяемого объекта. Например,запись ь [ f(x)dx := lim <т(/;Р,£) J А(Р)—>0 а определяет левую часть посредством правой части, смысл которой предпол гается известным. Аналогично вводятся сокращенные обозначения для уже определенных в: ражений. Например, запись п 1=1 вводит обозначение сг(/; Р, £) для стоящей слева суммы специального вида. 4. Заключительные замечания. Отметим, что мы здесь говорили, i существу, только об обозначениях, не анализируя формализм логических в; водов и не касаясь глубоких вопросов истинности, доказуемости, выводим сти, составляющих предмет исследования математической логики. Запись А => В => С будет употребляться как сокращение для (А => В) Л (В => С).
4 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Как же строить математический анализ, если мы не имеем формали: ции логики? Некоторое утешение тут может состоять в том, что мы всег знаем или, лучше сказать, умеем больше, чем способны в данный момент ф( мализовать. Пояснением смысла последней фразы может служить извести притча о том, что сороконожка даже ходить разучилась, когда ее попроси объяснить, как именно она управляется со всеми своими конечностями. Опыт всех наук убеждает нас в том, что считавшееся ясным или прост! и нерасчленяемым вчера может подвергнуться пересмотру или уточнению < годня. Так было (и, без сомнения, еще будет) и с многими понятиями маг матического анализа, важнейшие теоремы и аппарат которого были открьг еще в XVII —XVIII веках, но приобрели современный формализованный, < позначно трактуемый и, вероятно, потому общедоступный вид лишь по< создания теории пределов и необходимой для нее логически полноценной т< рии действительных чисел (XIX век). Именно с этого уровня теории действительных чисел мы и начнем в глав« построение всего здания анализа. Как уже отмечалось в предисловии, желающие быстрее ознакомиться основными понятиями и эффективным аппаратом собственно дифференг ального и интегрального исчисления могут начать сразу с III главы, bo3bj щаясь к отдельным местам первых двух глав лишь по мере необходимости Упражнения Будем отмечать истинные высказывания символом 1, а ложные — символом Тогда каждому из высказываний ->А, 4 А В, А V В, А => В можно сопоставя так называемую таблицу истинности, которая указывает его истинность в за] симости от истинности высказываний А, В. Эти таблицы являются формальн! определением логических операций -i, A, V, =>. Вот они: А => В
1. Проверьте, все ли в этих таблицах согласуется с вашим представлением соответствующей логической операции. (Обратите, в частности, внимание на 1 что если А ложно, то импликация А => В всегда истинна.) 2. Покажите, что справедливы следующие простые, но очень важные и шире используемые в математических рассуждениях соотношения: а) -(А Л В) 4=> -А V -<В, b) i(AV В) <=> -А Л-В; с) (А => В) 4=$-(->В =>->А); d) (А => В) 4=> -.А V В; е) -п(А => В) <=> А Л -1В. § 2. Множество и элементарные операции над множествами 1. Понятие множества. С конца прошлого — начала нашего столет наиболее универсальным языком математики стал язык теории множес Это проявилось даже в одном из определений математики как науки, и: чающей различные структуры (отношения) на множествах1). «Под множеством мы понимаем объединение в одно целое определеннь вполне различимых объектов нашей интуиции или нашей мысли» — так опис понятие «множество» Георг Кантор2), основатель теории множеств. Описание Кантора, разумеется, нельзя назвать определением, посколь оно апеллирует к понятиям, быть может, более сложным (во всяком случае, определенным ранее), чем само понятие множества. Цель этого описания разъяснить понятие, связав его с другими. Основные предпосылки канторовской (или, как условно говорят, «на! ной») теории множеств сводятся к следующему: 1° Множество может состоять из любых различимых объектов. 2° Множество однозначно определяется набором составляющих его о( ектов. 3° Любое свойство определяет множество объектов, которые этим св< ством обладают. Если х — объект, Р — свойство, Р(х) — обозначение того, что % обладг свойством Р, то через {х | Р(а:)} обозначают весь класс объектов, облада щих свойством Р. Объекты, составляющие класс или множество, называ элементами класса или множества. Бурбаки Н. Архитектура математики. В кн.: Бурбаки Н. Очерки по исто{ математики. М.: ИЛ, 1963. 2)Г. Кантор (1845 —1918) — немецкий математик, создатель теории бесконечных м жесте и родоначальник теоретико-множественного языка в математике.
б ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Множество, состоящее из элементов хг, ..., хп, обычно обозначают к {xi, ..., жп}. Там, где это не вызывает недоразумения, для сокращения зап» мы позволяем себе обозначать одноэлементное множество {а} просто через Слова «класс», «семейство», «совокупность», «набор» в наивной теории mi жеств употребляют как синонимы термина «множество». Следующие примеры демонстрируют применение этой терминологии: множество букв «а» в слове «я»; множество жен Адама; набор из десяти цифр; семейство бобовых; множество песчинок на Земле; совокупность точек плоскости, равноудаленных от двух данных ее точек; семейство множеств; множество всех множеств. Различие в возможной степени определенности задания множества навод на мысль, что множество — не такое уж простое и безобидное понятие. И в самом деле, например, понятие множества всех множеств просто пр тиворечиво. ◄ Действительно, пусть для множества М запись Р(М) означает, что не содержит себя в качестве своего элемента. Рассмотрим класс К = {М | Р(М)} множеств, обладающих свойством Р Если К — множество, то либо верно, что Р(К), либо верно, что -пР(А Однако эта альтернатива для К невозможна. Действительно, Р(К) невс можно, ибо из определения К тогда бы следовало, что К содержит К, т. что верно -iP(.K'); с другой стороны, -уР(К) тоже невозможно, поскольку эг означает, что К содержит К, а это противоречит определению К как клас тех множеств, которые сами себя не содержат. Следовательно, К — не множество. ► Это классический парадокс Рассела1), один из тех парадоксов, к которь приводит наивное представление о множестве. В современной математической логике понятие множества подвергает (как мы видим, не без оснований) тщательному анализу. Однако в таю анализ мы углубляться не станем. Отметим только, что в существующих а сиоматических теориях множество определяется как математический объек обладающий определенным набором свойств. Описание этих свойств составляет аксиоматику. Ядром аксиоматики т ории множеств является постулирование правил, по которым из множес': 1^Б. Рассел (1872 —1970) — английский логик, философ, социолог и общественнь деятель.
g 2. мнижылви n ОПЫАЦИИ ПАД 1 DAMn можно образовывать новые множества. В целом любая из существующих а сиоматик такова, что она, с одной стороны, избавляет от известных прот воречий наивной теории, а с другой — обеспечивает свободу оперирован с конкретными множествами, возникающими в различных отделах матем тики, и в первую очередь именно в математическом анализе, понимаемом широком смысле слова. Ограничившись пока этими замечаниями относительно понятия множ ства, перейдем к описанию некоторых наиболее часто используемых в анали свойств множеств. Желающие подробнее ознакомиться с понятием множества могут проем треть пункт 2 из § 4 настоящей главы или обратиться к специальной литер туре. 2. Отношение включения. Как уже отмечалось, объекты, составля! щие множество, принято называть элементами этого множества. Мы буд< стремиться обозначать множества прописными буквами латинского алфав та, а элементы множества — соответствующими строчными буквами. Высказывание их есть элемент множества X» коротко обозначают си волом х € X (или X Э х), а его отрицание — символом х X (или X $ х). В записи высказываний о множествах часто используются логические ог раторы 3 («существует» или «найдется») и V («любой» или «для любого»), н зываемые кванторами существования и всеобщности соответственно. Например, запись Угг ((z € А) <=> (х Е В)) означает, что для любого объе та х соотношения х 6 А и х 6 В равносильны. Поскольку множество впол определяется своими элементами, указанное высказывание принято обозначать короткой записью А = В, читаемой «А равно В», обозначающей совпадение множеств, А и В. Таким образом, два множества равны, когда они состоят из одних и тех же элементов. Отрицание равенства обычно записывают в виде А В. Если любой элемент множества А является элементом множества В, то пишут А С В или В D А и говорят, что множество является подмножеств ом множества В, или что В содержит А, или что включает в себя А. В связи с этим отношение А С В между множествами . В называется отношением включения (рис. 1).
о 1 JI. HbAUlUKblb VI ЩЬМЛ! i mnvi\*in юплшл Итак, (A С B) := \/ж ((ж € A) => (x € B)). Если АсВиА^В, то будем говорить, что включение А С В cmpot или что А — собственное подмножество В. Используя приведенные определения, теперь можно заключить, что (А = В) <=> (А С В) Л (В С А). Если М — множество, то любое свойство Р выделяет в М подмножеств {х G М | Р(х)} тех элементов М, которые обладают этим свойством. Например, очевидно, что , М = {ж € М | х 6 М}. С другой стороны, если в качестве Р взять свойство, которым не облада ни один элемент множества М, например Р(х) := (ж / ж), то мы получ множество 0 = {ж 6 М | ж / ж}, называемое пустым подмножеством множества М. 3. Простейшие операции над множествами. Пусть А и В — пс множества множества М. а. Объединением множеств А и В называется множество A U В := {ж G М | (ж G А) V (ж G В)}, состоящее из тех и только тех элементов множества М, которые содержа! хотя бы в одном из множеств А, В (рис. 2). Ь. Пересечением множеств А и В называется множество А П В := {ж G М | (ж G А) А (ж G В)}, образованное теми и только теми элементами множества М, которые прина лежат одновременно множествам А и В (рис. 3).
с. Разностью между множеством А и множеством В называется мной ство А \ В := {ж G М | (ж G А) Л (ж £ В)}, состоящее из тех элементов множества А, которые не содержатся в множест В (рис. 4). Разность между множеством М и содержащимся в нем подмножеств* А обычно называют дополнением А в М м обозначают через См А или С когда из контекста ясно, в каком множестве ищется дополнение к А (рис. ' Пример. В качестве иллюстрации взаимодействия введенных понят: проверим следующие соотношения (так называемые правила де Моргана1)} См(А U В) = См АП СмВ, ( См(А П В) = СмАи СмВ. ( ◄ Докажем, например, первое из этих равенств: (х G См(А U В)) => (х (A U В)) => ((ж А) Л (ж В)) => => (ж € См А) Л (ж G СмВ) => (ж € (См А А СмВ)). Таким образом, установлено, что См(А U В) С (См А Г) СмВ). ( С другой стороны, (ж € (См А А СмВ)) => ((ж € См А) Л (ж € СмВ)) => => ((ж А) Л (ж В)) => (ж (A U В)) => (ж G См(А U В)), т. е. (СмА А СмВ) С См(А U В). ( Из (3) и (4) следует (1). ► d. Прямое (декартово) произведение множеств. Для любых двух м> жеств А, В можно образовать новое множество — пару {А, В) = {В, А}, эи ментами которого являются множества А и В и только они. Это множест состоит из двух элементов, если А 0 В, и из одного элемента, если А — В. Указанное множество называют неупорядоченной парой множеств А, в отличие от упорядоченной пары (А, В), в которой элементы А, В наделе! дополнительными признаками, выделяющими первый и второй элементы па] {А, В}. Равенство (А,В) = (С,Р) А. де Морган (1806—1871) — шотландский математик.
1U 1 JI. 1. HJblSAJ ОГЫС иЬЩЬМЛ1ЬМЛ ГПЬЪЛИЕ 1иПЛ1ГЛ упорядоченных пар по определению означает, что А — С и В = D. В час* ности, если А / В, то (А, В) / (В, А). Пусть теперь X и Y — произвольные множества. Множество X х Y := {(х,у) | (х е X) Л (у е К)}, образованное всеми упорядоченными парами (я, у), первый член которых есч элемент из X, а второй член — элемент из Y, называется прямым или дека товым произведением множеств X и Y (в таком порядке!). Из определения прямого произведения и сделанных выше замечаний ( упорядоченной паре явствует, что, вообще говоря, X х Y ^Y х X. Равенст] имеет место, лишь если X = Y. В последнем случае вместо X х X пицц коротко X1 2. Прямое произведение называют также декартовым произведением в чесч Декарта1^, который независимо от Ферма2) пришел через систему коорд нат к аналитическому языку геометрии. Известная всем система декартовь координат в плоскости превращает эту плоскость именно в прямое произв дение двух числовых осей. На этом знакомом объекте наглядно проявляет! зависимость декартова произведения от порядка сомножителей. Наприме упорядоченным парам (0,1) и (1,0) отвечают различные точки плоскости. В упорядоченной паре z = (х^хз), являющейся элементом прямого пр изведения Z = Xi х Х% множеств Xi и Х%, элемент rci называется перв( проекцией пары z и обозначается через ргг z, а элемент Хз — второй прое цией пары z и обозначается через pr2 z. Проекции упорядоченной пары по аналогии с терминологией аналитич ской геометрии часто называют (первой и второй) координатами пары. Упражнения В задачах 1, 2, 3 через А, В, С обозначены подмножества некоторого множ ства М. 1. Проверьте соотношения: а) (А С С) А (В С С) <=> ((A U В) С С); b) (С С А) А (С С В) <=> (С С (А П В))- с) См(СмА) = А; d) (А С СМВ) <=> (В С СмА); е) (А С В) <=> (СмA D СМВ). 1^Р. Декарт (1596 — 1650) — выдающийся французский философ, математик и физи внесший фундаментальный вклад в теорию научного мышления и познания. 2)П. Ферма (1601 —1665) — замечательный французский математик, юрист по спец альности. Ферма стоял у истоков ряда областей современной математики: анализ, анал тическая геометрия, теория вероятностей, теория чисел.
3 о. ^<7 П 2. Покажите, что a) A U (В U С) = (A U В) U С =: A U В U С; Ь) А А (В А С) = (А А В) А С =: А А В А С; с) А А (В U С) = (А А В) U (АП С); d) A U (В А С) = (A U В) A (A U С). 3. Проверьте взаимосвязь (двойственность) операций объединения и пересеч ния: а) См(А U В) = См А А СмВ', Ъ) См(А А В) = См A U СмВ. 4. Проиллюстрируйте геометрически декартово произведение: а) двух отрезков (прямоугольник); Ь) двух прямых (плоскость); с) прямой и окружности (цилиндрическая поверхность); d) прямой и круга (цилиндр); е) двух окружностей (тор); f) окружности и круга (полноторие). 5. Множество Д = {(xi,X2) G X2 | xi = Х2} называется диагональю декарто* квадрата X2 множества X. Проиллюстрируйте геометрически диагонали множеств, полученных в пункт; а), Ь), е) задачи 4. 6. Покажите, что а) (X х Y = 0) <=> (X = 0) V (У = 0), а если X х У 0, то Ь) (А х В С X х У) о (А С X) А (В С У), с) (X х У) U (Z х У) = (X U Z) х У, d) (X х У) А (X' х У') = (X АХ') х (УАУ'). Здесь 0 — символ пустого множества, т. е. множества, не содержащего элементо] 7. Сравнив соотношения задачи 3 с соотношениями а), Ь) из упражнения 2 к § установите соответствие между логическими операциями A, V на высказывали; и операциями С, A, U на множествах. § 3. Функция 1. Понятие функции (отображения). Перейдем теперь к описани фундаментального не только для математики понятия функциональной зав: симости. Пусть X и У — какие-то множества. Говорят, что имеется функция, определенная на X со значениями в У, ес; в силу некоторого закона f каждому элементу х 6 X соответствует элемеь У € Y.
В этом случае множество X называется областью определения функщ символ х его общего элемента — аргументом функции или независимой : ременной; соответствующий конкретному значению Xq € X аргумента х э. мент уо € Y называют значением функции на элементе Хо или значени функции при значении аргумента х = Xq и обозначают через f(xo). При ] менении аргумента х G X значения у = /(ж) € У, вообще говоря, меняются зависимости от значений х. По этой причине величину у = /(ж) часто наз вают зависимой переменной. Множество f(X) := {у е у I Эх ((х ех)л(у = /(х)))} всех значений функции, которые она принимает на элементах множества будем называть множеством значений или областью'значений функции. В зависимости от природы множеств X, Y термин «функция» в различи: отделах математики имеет ряд полезных синонимов: отображение, преоб] зование, морфизм, оператор, функционал. Отображение — наиболее pacnj страненный из них, и мы его тоже часто будем употреблять. Для функции (отображения) приняты следующие обозначения: f-X-+Y, X-^Y. Когда из контекста ясно, каковы область определения и область зна5 ний функции, используют также обозначения ж •-> /(ж) или у = f(x), а ча: обозначают функцию вообще одним лишь символом f. Две функции /1, /2 считаются совпадающими или равными, если они ил ют одну и ту же область определения X и на любом элементе ж € X значен /1(ж), /2(2^) этих функций совпадают. В этом случае пишут /1 = /2- Если А С X, a f : X —> У — некоторая функция, то через f\A или f обозначают функцию р : А —> У, совпадающую с f на множестве А. Точн< /|л(ж) := р(х), если х € А. Функция /|л называется сужением или огра/ чением функции f на множество А, а функция f : X —> У по отношению функции р — /\д : А —> У называется распространением или продолжени функции р на множество X. Мы видим, что иногда приходится рассматривать функцию р : А —> определенную на подмножестве А некоторого множества X, причем облас значений у?(А) функции р тоже может оказаться не совпадающим с У пс множеством множества У. В связи с этим для обозначения любого множест X, содержащего область определения функции, иногда используется терм область отправления функции, а любое множество У, содержащее облас значений функции, называют тогда областью ее прибытия. Итак, задание функции (отображения) предполагает указание трой: (X,f, У), где:
X — отображаемое множество, или область определения функции; Y — множество, в которое идет отображение, или область прибытия функции; / — закон, по которому каждому элементу х € X сопоставляется определенный элемент у G Y. Наблюдаемая здесь несимметричность между X и Y отражает то, ч отображение идет именно из X в К. Рассмотрим некоторые примеры функций. Пример 1. Формулы I = 2ят и V = 17гг3 устанавливают функционал ную зависимость длины окружности I и объема шара V от радиуса г. 1 смыслу каждая из этих формул задает свою функцию f: R+ —> R+, опре^ ленную на множестве ЖЦ. положительных действительных чисел со значенг ми в том же множестве R+. Пример 2. Пусть X — множество инерциальных систем координат. с: X —> Ж — функция, состоящая в том, что каждой инерциальной систе координат х G X сопоставляется измеренное относительно нее значение с( скорости света в вакууме. Функция с : X —> R постоянна, т. е. при люб< х G X она имеет одно и то же значение с (это фундаментальный эксперимс тальный факт). Пример 3. Отображение G : IR2 —> IR2 (прямого произведения IR2 = IR xR = х Кг оси времени К* и пространственной оси Kz) на себя же, за/ ваемое формулами х' = х — vt, t' = t, есть классическое преобразование Галилея для перехода от одной инерциал ной системы координат (x,t) к другой — (х1 ,t'), движущейся относитель первой со скоростью и. Той же цели служит отображение L : IR2 —> IR2, задаваемое соотношения! Это — известное (одномерное) преобразование Лоренца1^, играющее фун/ ментальную роль в специальной теории относительности; с — скорость свеч И Г. А. Лоренц (1853 — 1928) — голландский физик. Указанные преобразования бь найдены им в 1904 г. и существенно использовались в сформулированной в 1905 г. Э1 штейном специальной теории относительности.
1Я 1 1. 1. ПГ/ГккУ 1 1 W ипщ 1V1 iblVAimbVj ИЬ ПиПЛ1Г1Л Пример 4. Проектирование ргг: Х± х Х2 —> Л\, задаваемое соответс вием Xi х Х2 Э (х1,Ж2) Xi € Xi, очевидно, является функцией. Аналоги ным образом определяется вторая проекция рг2 : Х± х Х2 —> Х2. Пример 5. Пусть Р(М) — множество всех подмножеств множества 1 Каждому множеству A 6 Р(М) поставим в соответствие множество См А € Р(М), т. е. дополнение к Ав М. Тогда получим отображение См • Р(ЛГ) —> Р(М) множества Р(М) в себя. Пример 6. Пусть Е С М. Вещественнозначную функцию хе • М —> определенную на множестве М условиями (хе(^) — 1, если х € Е) Л (хе(х) = 0, если х G СмЕ), называют характеристической функцией множества Пример 7. Пусть M(X;Y) — множество отображений множества X множество У, a xq — фиксированный элемент из X. Любой функции f € М(Х;У) поставим в соответствие ее значение /(а?о) 6 У на элементе а Этим определяется функция F: M(X',Y} —> У. В частности, если У = R, т. если У есть множество действительных чисел, то каждой функции f: X —> функция F : М (X; R) —> R ставит в соответствие число F(f) = /(xq). Таю образом, F есть функция, определенная на функциях. Для удобства так функции называют функционалами. Пример 8. Пусть Г — множество кривых, лежащих на поверхносг (например, земной) и соединяющих две ее фиксированные точки. Кажд< кривой 7 G Г можно сопоставить ее длину. Тогда мы получим функци F : Г —> R, которую часто приходится рассматривать с целью отыскан] кратчайшей линии или, как говорят, геодезической линии между даннык точками на поверхности. Пример 9. Рассмотрим множество Af(R;R) всех вещественнозначнь функций, определенных на всей числовой оси R. Фиксировав число a € R, к ждой функции f 6 М(R; R) поставим в соответствие функцию /а G М(R; К связанную с ней соотношением fa(Y) = f(x А- а). Функцию fa(x) обычно н зывают сдвигом на а функции /(ж). Возникающее при этом отображен] A : M(R;R) —> Af(R;R) называется оператором сдвига. Итак, оператор определен на функциях и значениями его также являются функции: fa = A(J Рассмотренный пример мог бы показаться искусственным, если бы мы i каждом шагу не видели реальные операторы. Так, любой радиоприемник есо оператор f 1-^4 /, преобразующий электромагнитные сигналы f в звуковые любой из наших органов чувств является оператором (преобразователем) ( своими областью определения и областью значений. Пример 10. Положение частицы в пространстве определяется упоряд< ченной тройкой чисел (x,y,z), называемой ее координатами в пространств Множество всех таких упорядоченных троек можно себе мыслить как прямс произведение К х К х R = К3 трех числовых осей R. При движении в каждый момент времени t частица находится в некот< рой точке пространства R3 с координатами (x(t),y(t),z(t)). Таким образот
о. г гихц движение частицы можно интерпретировать как отображение 7: К —> R3, г К — ось времени, a IR3 — трехмерное пространство. Если система состоит из п частиц, то ее конфигурация задается поло» нием каждой из частиц, т. е. упорядоченным набором (xi,yi,zr, Х2,У2,^; . ... ; хп, уп, zn) из Зп чиселч Множество всех таких наборов называется кон^ гурационным пространством системы п частиц. Следовательно, конфигур ционное пространство системы п частиц можно интерпретировать как прям произведение R3 х К3 х ... х IR3 = R3n п экземпляров пространства R3. Движению системы из п частиц отвечает отображение 7 : R —> IR3n о времени в конфигурационное пространство системы. Пример 11. Потенциальная энергия U механической системы связанг взаимным расположением частиц системы, т. е. определяется конфигурации которую имеет система. Пусть Q — множество реально возможных конфиг раций системы. Это некоторое подмножество конфигурационного простра ства системы. Каждому положению q € Q отвечает некоторое значение U( потенциальной энергии системы. Таким образом, потенциальная энергия ес функция U: Q —> R, определенная на подмножестве Q конфигурационно пространства со значениями в области К действительных чисел. Пример 12. Кинетическая энергия К системы п материальных част] зависит от их скоростей. Полная механическая энергия системы Е = К + i т. е. сумма кинетической и потенциальной энергий, зависит, таким образо как от конфигурации q системы, так и от набора v скоростей ее частиц. К; и конфигурация q частиц в пространстве, набор и, состоящий из п трехме ных векторов, может быть задан упорядоченным набором из Зп чисел. Уп рядоченные пары (q,v), отвечающие состояниям нашей системы, образу» подмножество Ф в прямом произведении R3n х ]R3n = К6п, называемом фаз вым пространством системы п частиц (в отличие от конфигурационно: пространства R3n). Полная энергия системы является, таким образом, функцией Е : Ф —> 1 определенной на подмножестве Ф фазового пространства IR6n и принимакищ значения в области R действительных чисел. В частности, если система замкнута, т. е. на нее не действуют внешнз силы, то по закону сохранения энергии в любой точке множества Ф состоят системы функция Е будет иметь одно и то же значение £« Е К. 2. Простейшая классификация отображений. Когда функцию X —> Y называют отображением, значение f(x) G Y, которое она принимас на элементе х G X, обычно называют образом элемента х. Образом множества А С X при отображении f: X —> Y называют мн жество f(A) := {у G Y | Зя ((ж € А) А (у = /(ж))} тех элементов Y, которые являются образами элементов множества А.
ID ГЛ. ньлиюгы иЬЩЬМЛ! 1V1A 1 mncixn Множество ципл1 n /-1(В) := {X 6 X I f(x) e B} тех элементов X, образы которых содержатся в В, называют прообраз (или полным прообразом) множества В С Y (рис. 6). Про отображение f:X-^Y говорят, ч Рис. 6 оно: сюръективно (или есть отображение на Y), если f(X) = У; инъективно (или есть вложение, инъ< ция), если для любых элементов rci, х2 mi жества X = f&2)) => (Ж1 = ж2), т. е. различные элементы имеют различи образы; биективно (или взаимно однозначно), если оно сюръективно и инъектив одновременно. Если отображение f: X —> Y биективно, т. е. является взаимно однозш ным соответствием между элементами множеств X и Y, то естественно в< никает отображение f-'-.Y^X, которое определяется следующим образом: если f(x) = у, то /~г(у) = т. е. элементу у € Y ставится в соответствие тот элемент х G X, образ< которого при отображении f является у. В силу сюръективности f так элемент х € X найдется, а ввиду инъективности / он единственный. Таю образом, отображение /-1 определено корректно. Это отображение называ! обратным по отношению к исходному отображению f. Из построения обратного отображения видно, что /-1 : Y —> X само явл ется биективным и что обратное к нему отображение (У-1)-1: X —> Y совг дает с f : X —> Y. Таким образом, свойство двух отображений быть обратными является в: имным: если У-1 — обратное для /, то, в свою очередь, f — обратное для Заметим, что символ /-1(В) прообраза множества В С Y ассоциируете символом /-1 обратной функции, однако следует иметь в виду, что прообр множества определен для любого отображения /: X —> Y, даже если оно является биективным и, следовательно, не имеет обратного. 3. Композиция функций и взаимно обратные отображения. Е гатым источником новых функций, с одной стороны, и способом расчленен сложных функций на более простые — с другой, является операция композ ции отображений.
Если отображения f : X —> У и д : Y —> Z таковы, что одно из них нашем случае д) определено на множестве значений другого (/), то мож построить новое отображение д о f : X -> Z, значения которого на элементах множества X определяются формулой О = £(№))• Построенное составное отображение д о f называют композицией отобр жения f и отображения д (в таком порядке!). Рисунок 7 иллюстрирует конструкцию композиции отображений f и д. С композицией отображений вы уже неоднократно встречались как в г« метрии, рассматривая композицию движений плоскости или пространст! так и в алгебре при исследовании «сложных» функций, полученных ком- позицией простейших элементарных функций. Операцию композиции иногда при- ходится проводить несколько раз под- ряд, и в этой связи полезно отметить, что она ассоциативна, т. е. h ° (д ° /) = (Л о д) ° Л Рис. 7 ◄ Действительно, h о (д о /)(ж) = h((g о /)(ж)) = Л(^(/(ж))) = = (hog)(f(x)) = ((hog)of)(x). ► Это обстоятельство, как и в случае сложения или умножения нескольк чисел, позволяет опускать скобки, предписывающие порядок спаривания. Если в композиции fn ° • •. ° fi все члены одинаковы и равны /, то обозначают коротко /п. Хорошо известно, например, что корень квадратный из положительно числа а можно вычислить последовательными приближениями по формуле X п+1 начиная с любого начального приближения Xq > 0. Это не что иное, как nocj довательное вычисление /п(ж0), где f(x) = | (х 4- -). Такая процедура, ког вычисленное на предыдущем шаге значение функции на следующем шаге сз новится ее аргументом, называется итерационным процессом. Итерационн] процессы широко используются в математике.
18 ГЛ. I. НЕКОТОРЫ БЩЕМАТЕМА ИНЕСКИ 1ЮНЛ 1 И Отметим также, что даже в том случае, когда обе композиции д о f и f о определены, вообще говоря, 9° f / f ° 9- Действительно, возьмем, например, двухэлементное множество {а, Ь} отображения f: {а, Ь} -> а, д : {а, Ь} -> Ь. Тогда, очевидно, д о f : {а, Ь] в то время как f о д : {а,Ь} а. Отображение f: X —> X, сопоставляющее каждому элементу множест! X его самого, т. .е. х ж, будем обозначать через ех и называть тождесъ венным отображением множества X. Лемма. (д о f = ex) => (д сюръективно) А (/ инъективно). ◄ Действительно, если f: X —> У, д : Y X и д о f — ex : X —> X, то X = ех(Х) = (д о /)(Х) = g(f(X)) С g(Y) и, значит, д сюръективно. Далее, если Xi Е X и х2 € X, то (a?i х2) => (ex(®i) / ех(х2)) => ((д о f)(X1) /(до f)(x2)) => => (p(/(*i)) / 9(/Ы) => (f(xi) / f(x2)), следовательно, f инъективно. ► Через операцию композиции отображений можно описать взаимно обра1 ные отображения. Утверждение. Отображения f: X Y, д: Y X являются бие тивными и взаимно обратными в том и только в том случае, когда д о f -ех и f og = eY. ◄ В силу леммы одновременное выполнение условий д о f — ex и. f од = е гарантирует сюръективность и инъективность, т. е. биективность каждо! из отображений /, д. Эти же условия показывают, что у = f(x) в том и только в том случа когда х = д(у). ► Выше мы исходили из явного построения обратного отображения. Из д казанного утверждения следует, что мы могли бы дать менее наглядное, i зато более симметричное определение взаимно обратных отображений как т ких, которые удовлетворяют двум условиям: д о f = ex и f о д — еу (см. этой связи задачу 6 в конце параграфа).
4. Функция как отношение. График функции. В заключение ве немея вновь к самому понятию функции. Отметим, что оно претерпело дл тельную и довольно сложную эволюцию. Термин «функция» впервые появился в 1692 г. у Г. Лейбница (правда, некотором более узком смысле). В смысле, близком к современному, эт< термин употребил в письме к Лейбницу от 1698 г. Иоганн Бернулли1). В формировании современного понимания функциональной зависимое' приняли участие многие крупные математики. Описание функции, почти совпадающее с приведенным в начале парагр фа, встречается уже в учебниках математики С. Лакруа2) (1806 г.), neper денных на русский язык. Активным сторонником такого понимания функщ был Н. И. Лобачевский3). Более того, Н. И. Лобачевский указал (1834 г что «обширный взгляд теории допускает существование зависимости толь в том смысле, чтобы числа одни с другими в связи понимать как бы данные вместе^. Это и есть идея точного определения понятия функции, котор мы теперь собираемся изложить. Приведенное в начале параграфа описание понятия функции представл ется весьма динамичным и отражающим суть дела. Однако с точки зрен: современных канонов оно не может быть названо определением, ибо использ ет эквивалентное функции понятие соответствия. Для сведения читателя n укажем здесь, каким образом дается определение функции на языке теор] множеств. а. Отношение. Отношением TL называют любое множество у поря доче ных пар (ж, у). Множество X первых элементов упорядоченных пар, составляющих 7£, н зывают областью определения отношения TZ, а множество Y вторых элеме тов этих пар — областью значений отношения И. Таким образом, отношение TL можно интерпретировать как подмножест Я прямого произведения X х Y. Если X С X' и Y С У', то, разумеете С X х У с X' х У', поэтому одно и то же отношение может задаваться к; подмножество различных множеств. Любое множество, содержащее область определения отношения, называв областью отправления этого отношения. Множество, содержащее облас значений отношения, называют областью прибытия отношения. г) И. Бернулли (1667 —1748) — один из ранних представителей знаменитого семейст швейцарских ученых Бернулли; аналитик, геометр, механик. Стоял у истоков вариационь го исчисления. Дал первое систематическое изложение дифференциального и интегрально исчисления. 2) С. Ф. Лакруа (1765 — 1843) — французский математик и педагог (профессор Нормал ной и Политехнической школ, член Парижской академии наук). 3)Н. И. Лобачевский (1792 —1856) — великий русский ученый, которому, наряду с вел ким немецким естествоиспытателем К. Ф. Гауссом (1777 —1855) и выдающимся венгерсю математиком Я. Бойяи (1802 —1860), принадлежит честь открытия неевклидовой геоме рии, носящей его имя. Лобачевский Н. И. Полное собр. соч. Т. 5. М.-Л.: Гостехиздат, 1951. С. 44. 2 Зорич В. Л.
ZU 1 JI. 1. FIJOIXV/ 1 V/1 £> Cj X XJ1 1/X 1 *1 11_J IX Г1 1_j Вместо того чтобы писать (х, у) € 7£, часто пишут х Р у и говорят, чтс связано с у отношением Р. Если Р С X2, то говорят, что отношение Р задано на X. Рассмотрим несколько примеров. Пример 13. Диагональ Х = {(а,Ъ)еХ2\а = Ъ} есть подмножество X2, задающее отношение равенства между элемента] множества X. Действительно, а A b означает, что (а, Ь) € А, т. е. а = Ь. Пример 14. Пусть X — множество прямых в плоскости. Две прямые а G X и b Е X будем считать находящимися в отношении и будем писать a Р Ь, если прямая b параллельна прямой а. Ясно, что т самым в X2 выделяется множество Р пар (а, Ь) таких, что аРЬ. Из кур геометрии известно, что отношение параллельности между прямыми облада следующими свойствами: a Р а (рефлексивность); аРЬ => ЬР а (симметричность); (a Р Ь) А (Ь Р с) => a Р с (транзитивность). Любое отношение 7£, обладающее перечисленными тремя свойствами, т. рефлексивное1), симметричное и транзитивное, принято называть отнои нием эквивалентности. Отношение эквивалентности обозначается специал ным символом ~, который в этом случае ставится вместо буквы Р, обоз! чающей отношение. Итак, в случае отношения эквивалентности будем писа а ~ b вместо a Р b и говорить, что а эквивалентно Ь. Пример 15. Пусть М — некоторое множество, а X = Р(М) - cobokj ность всех его подмножеств. Для двух произвольных элементов а и b mi жества X = Р(М), т. е. для двух подмножеств а и b множества М, всег выполнена одна из следующих трех возможностей: а содержится в b; b сод( жится в а; а не является подмножеством Ь и b не является подмножеством Рассмотрим в качестве отношения Р в X2 отношение включения для пс множеств X, т. е. положим по определению а Р b := (а С Ь). Это отношение, очевидно, обладает следующими свойствами: а Р а (рефлексивность); (а Р b) А (& Р с) => аР с (транзитивность); (а Р Ь) А (Ь Р а) => а А Ь, т. е. а — Ь (антисимметричность). Полезно для полноты отметить, что отношение TZ называется рефлексивным, если < область определения и область значений совпадают и для любого элемента а из облас определения отношения TZ выполнено a TZ а.
Отношение между парами элементов некоторого множества X, облада щее указанными тремя свойствами, принято называть отношением настичь го порядка на множестве X. Для отношения частичного порядка вместо а 7 часто пишут а =$ Ь и говорят, что b следует за а. Если кроме отмеченных двух свойств, определяющих отношение част» ного порядка, выполнено условие, что Va Vb V(&7£a)), т. е. любые два элемента множества X сравнимы, то отношение 1Z называв! отношением порядка, а множество X с определенным на нем отношени порядка называется линейно упорядоченным. Происхождение этого термина связано с наглядным образом числовой щ мой R, на которой действует отношение а b между любой парой веществ* ных чисел. Ь. Функция и график функции. Отношение 1Z называется функцч налъным, если (х И Уг) А (ж г/2) => (г/1 = J/г)- Функциональное отношение называют функцией. В частности, если X и Y — два не обязательно различных множества, определенное на X отношение И С X х Y между элементами х из X и у Y функционально, если для любого х € X существует и притом единственш элемент у Е Y, находящийся с х в рассматриваемом отношении, т. е. так* для которого х 1Z у. Такое функциональное отношение 1Z С X х Y и есть отображение из Л Y, или функция из X в Y. Функции мы чаще всего будем обозначать символом /. Если f — функщ то вместо xfy мы по-прежнему будем писать у = f(x) или х у, назыг у — f(x) значением функции f на элементе х или образом элемента х п отображении f. Сопоставление по «закону» / элементу х € X «соответствующего» элемен у Е Y, о чем говорилось в исходном описании понятия функции, как вид» состоит в том, что для каждого х Е X указывается тот единственный элеме У 6 У, что xfy, т. е. (х, у) Е / С X х Y. Графиком функции f: X —> Y, понимаемой в смысле исходного описан] называют подмножество Г прямого произведения X х Y, элементы которс имеют вид (я,/(#)). Итак, Г = {(х, у) € X х Y | у - f(x)}. В новом описании понятия функции, когда мы ее задаем как подмножес-т f С X х Y, конечно, уже нет разницы между функцией и ее графиком.
1 JI. 1. HLAUlUrblb UbiybMAlbMAlHlbLft llVJnn 1 ИЛ Мы указали на принципиальную возможность формального теоретш множественного определения функции, сводящуюся по существу к отож? ствлению функции и ее графика. Однако мы не собираемся в дальнейш ограничиваться только такой формой задания функции. Функциональное с ношение иногда удобно задать в аналитической форме, иногда таблицей зь чений, иногда словесным описанием процесса (алгоритма), позволяющего данному х € X находить соответствующий элемент у G У. При каждом так способе задания функции имеет смысл вопрос о ее задании с помощью г{ фика, что формулируют так: построить график функции. Задание числов! функций хорошим графическим изображением часто бывает полезно тем, ч делает наглядным основные качественные особенности функциональной заг симости. Для расчетов графики тоже можно использовать (номограммы), i как правило, в тех случаях, когда расчет не требует высокой точности. Д точных расчетов используют табличное задание функции, а чаще — алгори мическое, реализуемое в вычислительных машинах. Упражнения 1. Композиция 7^2 ° 7^1 отношений 7^1, определяется следующим образом: 7£2 ° 7^1 := {(ж, z) | By (х Kiy) Л (у Кг г)}. В частности, если 7£i С X х У и 7£г С У х Z, то 7г = 7£г ° 7£i С X х Z, причем хHz := By ((у G У) Л (т 7£ц/) Л (у 7^2z))- а) Пусть Дх — диагональ множества X2, а Ду — диагональ множества У Покажите, что если отношения 7£i С X х Y и 7£г С У х X таковы, что (7£г ° 7£i = Дх) Л (7£i о 7г2 = Ду), то оба они функциональны и задают взаимно обрати) отображения множеств X, Y. Ь) Пусть 7г С X2. Покажите, что условие транзитивности отношения ?г равв сильно тому, что 7г о 7г С 7г. с) Отношение 72/ С У х X называется транспонированным отношением 7г С X х У, если (уК'х) 4=> (х 7г у). Покажите, что антисимметричность отношения К С X2 равносильна условв 7г П 7г' С Дх d) Проверьте, что любые два элемента множества X связаны (в том или инс порядке) отношением 7г С X2, если и только если 7г U К! = X2. 2. Пусть f: X -> У — отображение. Прообраз /-1(у) С X элемента у G У наз) вается слоем над у. а) Укажите слои для отображений ргг: Xi х Хъ —> Xi, рг2 : Xi х Х% —> Хъ- Ь) Элемент xi G X будем считать связанным с элементом Х2 6 X отношение 7г С X2 и писать 7гя?2э если /(xi) = У(хг), т. е. если xi и тг лежат в одном слое Проверьте, что 7г есть отношение эквивалентности.
□ **’ с) Покажите, что слои отображения f: X —> Y не пересекаются, а объединени слоев является все множество X. d) Проверьте, что любое отношение эквивалентности между элементами мной ства позволяет представить это множество в виде объединения непересекающи? классов эквивалентных элементов. 3. Пусть f: X —> Y — отображение из X в У. Покажите, что: если А и В — подмножества X, то а) (А С В) => (/(А) С /(В)) (АС В), Ь) (А ± 0) => (/(А) 0), с) /(АПВ)С/(А)П/(В), d) /(A U В) =/(A) U/(В); если А' и В' - подмножества У, то е) /А' С В') => (/-1(А') С ГЧВ')), f) Г1(А'ПВ') = Г1(А')П/-1(В'), g) г\А'ив') = гЧА')иг\ву, если У D A' D В', то h) /-1(А'\В') = /"1(А')\Г1(В'), i) Г1(СуА') = СхГ1(А'); для любого множества А С X и любого множества В' С У j) D А, к) /(/“ЧВ')) С В'. 4. Покажите, что отображение f: X —> У а) сюръективно, если и только если для любого множества В' С У справедли КГ\ву = в'- Ь) биективно, если и только если для любого множества А С X и любого mi жества В' G У справедливо (r'(.fW) = А) л (/(/-‘(В')) = в'). 5. Проверьте эквивалентность следующих утверждений относительно отобрал ния f: X —> У: a) f инъективно; Ь) /-1(/(А)) = А для любого множества А С X; с) f(A АВ) = /(А) П f(B) для любой пары А, В подмножеств X; d) /(А) П /(В) = 0 <=> АП В = 0; е) /(А \ В) = /(А) \ /(В), если X D A D В. 6. а) Если отображения f : X —> У и д : Y —> X таковы, что д о f — ex, г ex — тождественное отображение множества X, то д называется левым обратт отображением для f, a f — правым обратным для д. Покажите, что, в отличие единственного обратного отображения, может существовать много односторонн обратных отображений.
X Vl. 1. noix 1 vr UlU ULUjlJlVin LJlVin X r lUVIYflU 114/ilJl X Рассмотрите, например, отображения f: X —> Y и g :Y -> X, где X — одног ментное, а У — двухэлементное множества, или отображения последовательност • (*^1 , • , 1 ® 1, • • • , , •••), (j/2, • • • , Уп1 • • • ) 1 (j/1, J/2, • • , J/n, • • Ь) Пусть f:X-tYug:Y-iZ - биективные отображения. Покажите, 1 отображение д о f: X -> Z биективно и что (д ° У)-1 = У-1 ° д"1. с) Покажите, что для любых отображений f : X —> У, д Y —> Z и люб< множества С С Z справедливо равенство (5о/)-1(С) = /-1(5-1(С))- d) Проверьте, что отображение F \ X х У —> У х X, задаваемое соответств! (т,у) (у,х), биективно. Опишите взаимосвязь графиков взаимно обратных от ражений f: X —> У и /-1: У -> X. 7. а) Покажите, что при любом отображении f : X —> У отображение F,: X —> X х У, определяемое соответствием х (х, /(#)), является инъективным. Ь) Пусть частица движется равномерно по окружности У; пусть X — ось в мени и х у — соответствие между моментом времени х G X и положением j = f(x) 6 У частицы. Изобразите график функции f: X —> У в X X У. 8. а) Для каждого из разобранных в § 3 примеров 1 — 12 выясните, является указанное в нем отображение сюръективным, инъективным, биективным или оно принадлежит ни одному из указанных классов. Ь) Закон Ома I = V/R связывает силу тока I в проводнике с напряжением V концах проводника и сопротивлением R проводника. Укажите, отображение О: X —> У каких множеств соответствует закону Ома. Подмножеством какого множес': является отношение, отвечающее закону Ома? с) Найдите преобразования G-1, L-1, обратные к преобразованиям Галилее Лоренца. 9. а) Множество S С X называется устойчивым, относительно отображеь f: X —> X, если f(S) С S. Опишите множества, устойчивые относительно сдв! плоскости на данный лежащий в ней вектор. Ь) Множество I С X называется инвариантным относительно отображен У : X —> X, если У (7) = I. Опишите множества, инвариантные относительно по рота плоскости вокруг фиксированной точки. с) Точка р 6 X называется неподвижной точкой отображения f : X -> X, е< У(р) — Р- Проверьте, что любая композиция сдвига, вращения и гомотетии плос сти имеет неподвижную точку, если коэффициент гомотетии меньше единицы. d) Считая преобразования Галилея и преобразования Лоренца отображения плоскости на себя, при которых точка с координатами (ж, t) переходит в точк; координатами (х ,t'), найдите инвариантные множества этих преобразований. 10. Рассмотрим установившийся поток жидкости (т. е. скорость в каждой то’ потока не меняется со временем). За время t частица, находящаяся в точке х пото переместится в некоторую новую точку ft(x) пространства. Возникающее отоб] жение х ft(x) точек пространства, занимаемого потоком, зависит от времени называется преобразованием за время t. Покажите, что ft2 ° ftx = ftx ° ft2 = ftx и ft о y_t = f0 = ex.
§ 4. Некоторые дополнения 1. Мощность множества (кардинальные числа). Говорят, что mi жество X равномощно множеству Y, если существует биективное отобра> ние X на Y, т. е. каждому элементу х Е X сопоставляется элемент у Е причем различным элементам множества X отвечают различные элемен множества Y и каждый элемент у Е Y сопоставлен некоторому элементу mi жества X. Описательно говоря, каждый элемент х Е X сидит на своем месте у Е все элементы X сидят и свободных мест у Е Y нет. Ясно, что введенное отношение X 1Z.Y является отношением эквивален ности, поэтому мы будем, как и договаривались, писать в этом случае X ~ вместо X1IY. Отношение равномощности разбивает совокупность всех множеств классы эквивалентных между собой множеств. Множества одного кла< эквивалентности имеют одинаковое количество элементов (равномощны) разных — разное. Класс, которому принадлежит множество X, называется мощностью м\ жества X, а также кардиналом или кардинальным числом множества X обозначается символом cardX. Если X ~ У, то пишут cardX = card У. Смысл этой конструкции в том, что она позволяет сравнивать количес! элементов множеств, не прибегая к промежуточному счету, т. е. к измерен: количества путем сравнения с натуральным рядом чисел N = {1, 2, 3, .. Последнее, как мы вскоре увидим, иногда принципиально невозможно. Говорят, что кардинальное число множества X не больше кардинальнс числа множества У, и пишут cardX card У, если X равномощно некоторо подмножеству множества У. Итак, (cardX card У) := (3Z С У | cardX = cardZ). Если X С У, то ясно, что cardX card У. Однако, оказывается, со< ношение X С У не мешает неравенству card У cardX, даже если X ес собственное подмножество У. Например, соответствие х ;—i~т есть биективное отображение прот 1 - |ж| жутка — 1 < х < 1 числовой оси R на всю эту ось. Возможность для множества быть равномощным своей части являеч характерным признаком бесконечных множеств, который Дедекинд1) да предложил считать определением бесконечного множества. Таким образе множество называется конечным (по Дедекинду), если оно не равномош 1)Р. Дедекинд (1831 — 1916) — немецкий математик-алгебраист, принявший актив] участие в развитии теории действительного числа. Впервые предложил аксиоматику м жества натуральных чисел, называемую обычно аксиоматикой Пеано — по имени Дж. Пе; (1858 —1932), итальянского математика, сформулировавшего ее несколько позже.
20 ГЛ. 1, НЬЛОЮГЫЬ иьщьмл П1У1Л 1 *1Е> 1V7FIZ1 1 Г1У1 никакому своему собственному подмножеству; в противном случае оно н зывается бесконечным. Подобно тому, как отношение неравенства упорядочивает действителып числа на числовой прямой, введенное отношение неравенства упорядочива мощности или кардинальные числа множеств. А именно, можно доказать, чг справедливы следующие свойства построенного отношения: 1. (cardX card У) A (card У cardZ) => (cardX cardZ) (очевидно) 2. (cardX card У) A (card У cardX) => (cardX = card У) (теорем Шрёдера—Бернштейна1)). 3. VX УУ (cardX card У) V (card У cardX) (теорема Кантора). Таким образом, класс кардинальных чисел оказывается линейно упоря,д ченным. Говорят, что мощность множества X меньше мощности множества У, пишут cardX < card У, если cardX card У и в то же время cardX card Итак, (cardX < card У) := (cardX card У) A (cardX card У). Пусть, как и прежде, 0 — знак пустого множества, а'Р(Х) — символ мв жества всех подмножеств множества X. Имеет место следующая открыт Кантором Теорема. cardX < cardPfX). ◄ Для пустого множества 0 утверждение очевидно, поэтому в дальнейш* можно считать, что X 0. Поскольку Р(Х) содержит все одноэлементные подмножества X, cardX cardP(X). Для доказательства теоремы теперь достаточно установить, что card X Ф card'P(X), если X / 0. Пусть, вопреки утверждению, существует биективное отображение X —> Р(Х}. Рассмотрим множество А = {ж Е X | х /(ж)} тех элемент х € X, которые не содержатся в сопоставленном им множестве /(ж) Е Р(А Поскольку А € Р(Х}, то найдется элемент a € X такой, что /(а) = А. Д элемента a Е X невозможно ни соотношение a Е А (по определению А), : соотношение а А (опять-таки по определению А). Мы вступаем в против речие с законом исключенного третьего. ► Эта теорема, в частности, показывает, что если бесконечные множест существуют, то и «бесконечности» бывают разные. 2. Об аксиоматике теории множеств. Цель настоящего пункта — дать г тересующемуся читателю представление о системе аксиом, описывающих свойст математического объекта, называемого множеством, и продемонстрировать щ стейшие следствия этих аксиом. ^Ф. Бернштейн (1878 — 1956) — немецкий математик, ученик Г. Кантора; Э. Шрё/ (1841 — 1902) — немецкий математик.
1° Аксиома объемности. Множества А и В равны тогда и только тоге когда они имеют одни и те же элементы. Это означает, что мы отвлекаемся от всех прочих свойств объекта «множества кроме свойства иметь данные элементы. На практике это означает, что если & желаем установить, что А = В, то мы должны проверить, что Vx ((х € А) < о (X 6 В)). 2° Аксиома выделения. Любому множеству А и свойству Р omeeuai множество В, элементы которого суть те и только те элементы множества которые обладают свойством Р. Короче, утверждается, что если А — множество, то и В = {ж 6 А | Р(х)} — то; множество. Эта аксиома очень часто используется в математических конструкциях, ког мы выделяем из множеств подмножества, состоящие из элементов, обладающих т или иным свойством. Например, из аксиомы выделения следует, что существует пустое подмножест 0х = {х G X | х / х} в любом множестве X, ас учетом аксиомы объемности закл чаем, что для любых множеств X и Y выполнено 0х = 0у, т. е. пустое множест единственно. Его обозначают символом 0. Из аксиомы выделения следует также, что если А и В — множества, то А \ В = {х 6 А | х В} — тоже множество. В частности, если М — множество и А — е подмножество, то См А — тоже множество. 3° Аксиома объединения. Для любого множества М множеств сущее вует множество UAf, называемое объединением множества М, состоящее из тг и только тех элементов, которые содержатся в элементах множества М. Если вместо слов «множество множеств» сказать «семейство множеств», то г сиома объединения приобретает несколько более привычное звучание: существу множество, состоящее из элементов множеств семейства. Таким образом, объеди! ние множества есть множество, причем хЕ UM <=> ЗХ ((X Е М)Л(х€Х)). Аксиома объединения с учетом аксиомы выделения позволяет определить nej сечение множества М (семейства множеств) как множество ГШ := {х € UM | VX ((X 6 М) =» (х € X))}. 4° Аксиома пары. Для любых множеств X uY существует множество такое, что X и Y являются его единственными элементами. Множество Z обозначается через {X, У} и называется неупорядоченной пар множеств X и У. Множество Z состоит из одного элемента, если X = У. Как мы уже отмечали, упорядоченная пара (X, У) множеств отличается от неут рядоченной наличием какого-либо признака у одного из множеств пары. Наприм< (Х,У) :={{Л,Х},{Х,У}}. Итак, неупорядоченная пара позволяет ввести упорядоченную пару, а упоря^ ченная пара позволяет ввести прямое произведение множеств, если воспользовать аксиомой выделения и следующей важной аксиомой. 5° Аксиома множества подмножеств. Для любого множества X i ществует множество Р(Х), состоящее из тех и только тех элементов, котор являются подмножествами множества X. Короче говоря, существует множество всех подмножеств данного множества.
Теперь можно проверить, что упорядоченные пары (х,у), где х € X, а у € действительно образуют множество X х Y := {р G Р(Р(Х) U Р(У)) |р = (х, у) Л (х € X) Л (у G У)}. Аксиомы 1°—5° ограничивают возможность формирования новых множес Так, в множестве Р(Х) по теореме Кантора (о том, что cardX < card Р(Х)) имев' элемент, не принадлежащий X, поэтому «множества» всех множеств не сущест ет. А ведь именно на этом «множестве» держится парадокс Рассела. Для того чтобы сформулировать следующую аксиому, введем понятие после вателя Х+ множества X. Положим по определению Х+ — X U {X}. Короче, к добавлено одноэлементное множество {X}. Далее, множество назовем индуктивным, если оно содержит в качестве элемеь пустое множество и последователь любого своего элемента. 6° Аксиома бесконечности. Индуктивные множества существуют. Аксиома бесконечности позволяет с учетом аксиом 1°—4° создать эталонн модель множества No натуральных чисел (по фон Нейману1^), определив No г пересечение индуктивных множеств, т. е. как наименьшее индуктивное множест Элементами No являются множества 0, 0+ = 0U{0) = {0}, {0}+= {0}U{/{0}}, ..., которые и являются моделью того, что мы обозначаем символами 0, 1, 2, ... и на: ваем натуральными числами. 7° Аксиома подстановки. Пусть Р(х, у) — такое высказывание (тонн формула), что при любом хо из множества X существует и притом единств ный объект уо такой, что Р(хо,уо) истинно. Тогда объекты у, для каждого которых существует элемент х € X такой, что Р(х,у) истинно, образуют м жество. Этой аксиомой при построении анализа мы пользоваться не будем. Аксиомы 1°— 7° составляют аксиоматику теории множеств, известную как . сиоматика Цермело — Френкеля2^. К ней обычно добавляется еще одна, независимая от аксиом 1°—7° и часто пользуемая в анализе 8° Аксиома выбора. Для любого семейства непустых множеств сущее вует множество С такое, что, каково бы ни было множество X данного сем ства, множество X Г) С состоит из одного элемента. Иными словами, из каждого множества семейства можно выбрать в точности одному представителю так, что выбранные элементы составят множество С. Аксиома выбора, известная в математике как аксиома Цермело, вызвала горя* дискуссии специалистов. г)Дж. фон Нейман (1903 — 1957) — американский математик. Работы по функциона ному анализу, математическим основаниям квантовой механики, топологическим групп: теории игр, математической логике. Руководил созданием первых ЭВМ. 2) Э. Цермело (1871 — 1953) — немецкий математик; А. Френкель (1891 — 1965) — нем кий, затем израильский математик.
2. Замечания о структуре математических высказываний и зал си их на языке теории множеств. В языке теории множеств имеются / базисных или, как говорят, атомарных типа математических высказывай] утверждение х Е А о том, что объект х есть элемент множества А, и утв< ждение А = В о том, что множества А и В совпадают. (Впрочем, с учет аксиомы объемности второе утверждение является комбинацией утвержден первого типа: (х Е А) <=> (х Е В).) Сложное высказывание или сложная логическая формула строятся из а' марных посредством логических операторов — связок Л, V, => и кв; торов У, 3 с использованием скобок ( ). При этом формирование сколь уг< но сложного высказывания и его записи сводится к выполнению следуюп элементарных логических операций: а) Образование нового высказывания путем постановки отрицания пер некоторым высказыванием и заключение результата в скобки. Ь) Образование нового высказывания путем постановки необходимой св ки Л, V, => между двумя высказываниями и заключение результата в скоб] с) Образование высказывания «для любого объекта х выполнено свой во Р» (что записывают в виде Чх Р(я)) или высказывания «найдется объе х, обладающий свойством Р» (что записывают в виде Зя Р(я)). Например, громоздкая запись Зя (Р(я) Л (Уу ((Р(2/)) =>(?/ = х)))) означает, что найдется объект я, обладающий свойством Р и такой, что ес у — любой объект, обладающий свойством Р, то у = я. Короче: сущест] ет и притом единственный объект я, обладающий свойством Р. Обычно g высказывание обозначают в виде 3!я Р(я), и мы будем использовать таг сокращение. Для упрощения записи высказывания, как уже отмечалось, стараются oi стить столько скобок, сколько это возможно без потери однозначного тол] вания записи. С этой целью кроме указанного ранее приоритета оператор -1, Л, V, => считают, что наиболее жестко символы в формуле связывают знаками Е, =, затем 3, V и потом связками Л, V, =>. С учетом такого соглашения теперь можно было бы написать 3!я Р(я) := Зя (Р(я) Л Чу (Р(у) =Ф у = я)). Условимся также о следующих широко используемых сокращениях: (Уя Е X) Р := У я (я Е X =Ф Р(я)), (Зя Е X) Р := Зя (я Е X Л Р(я)), (Уя > а) Р := Уя (я Е 1ЙЛя > о => Р(я)), (Зя > а) Р := Зя (я Е К Л я > а Л Р(х)). Здесь R, как всегда, есть символ множества действительных чисел.
OU 1 JI. 1. flDAVlUrDlD UDUJ,DlVia A £> VIA UVJXfllJ С учетом этих сокращений и правил а), Ь), с) построения сложного выев зывания, например, можно будет дать однозначно трактуемую запись lim f(x) = А := Уе > 0 35 > 0 Уа; € R (0 < |а; — а| < 5 => |/(а;) — А| < е) х—¥а того, что число А является пределом функции f: R 4 R в точке а € R. Быть может, наиболее важным из всего сказанного в этом параграфе явл ются для нас следующие правила построения отрицания к высказыванию, с держащему кванторы. Отрицание к высказыванию «для некоторого х истинно Р(а;)» означав что «для любого х неверно Р(а;)», а отрицание к высказыванию «для любогс истинно Р(х)» означает, что «найдется х, что неверно Р(х)». Итак, -.За; Р(х)<=>Чх -Р(а;), -.Уа; Р(а;) <=> Эх ->Р(х). Напомним также (см. упражнения к § 1), что -(PaQ)^-PV-Q, -(PVQ)^-PA-Q, (Р => Q) <=> Р А -> Q. На основании сказанного можно заключить, что, например, ((Уз; > а) Р) <=> (За; > а) ~>Р. Написать в правой части последнего соотношения (За; а) ->Р было бы, к нечно, ошибочно. В самом деле, ((Уа; > а) Р) := (Уа; (л € ЙАл > а 4 Р(я))) <=>За;-.(а;Е1ЙЛа;>а=^ Р(х)) <=> <=> За; ((л G КЛа; > а) Л ->Р(а;)) —: (За; > а) Р. Если учесть указанную выше структуру произвольного высказывания, г теперь с использованием построенных отрицаний простейших высказывай] можно было бы построить отрицание любого конкретного высказывания. Например, ( lim f(x) = А) <=> Зе > О У5 > О За; G Е R (0 < |а; — а| < 5 Л |/(а;) — А| е). Практическая важность правильного построения отрицания связана, частности, с методом доказательства от противного, когда истинность в которого утверждения Р извлекают из того, что утверждение -. Р ложно.
Упражнения 1. а) Установите равномощность отрезка {xGR|0^x^1}h интервала {х GR|0<x<1} числовой прямой К. как с помощью теоремы Шрёдера — Бернштей] так и непосредственным предъявлением нужной биекции. Ь) Разберите следующее доказательство теоремы Шрёдера — Бернштейна (cardX card У) Л (card У cardX) => (cardX = card У). ◄ Достаточно доказать, что если множества X, У, Z таковы, что X D У D 2 cardX = cardZ, то cardX = card У. Пусть f : X —> Z — биективное отображен] Тогда биекция д : X —> У может быть задана, например, следующим образом: З(т) = < /(х), если х G /П(Х) \ /П(У) для некоторого п G N, х в противном случае. Здесь fn = f о.. .о f — п-я итерация отображения /, a N - множество натуральн] чисел. ► 2. а) Исходя из определения пары, проверьте, что данное в пункте 2 определен прямого произведения X х У множеств X, У корректно, т. е. множество U Р(У)) содержит все упорядоченные пары (х,?/), в которых х G X и у G У. Ь) Покажите, что всевозможные отображения f: X —> У одного фиксирован! го множества X в другое фиксированное множество У сами образуют множест М(Х,У). с) Проверьте, что если 77 — множество упорядоченных пар (т. е. отношение), первые элементы пар, принадлежащих множеству 77 (как и вторые), сами образу] множество. 3. а) Используя аксиомы объемности, пары, выделения, объединения и бест нечности, проверьте, что для элементов множества No натуральных чисел по ф Нейману справедливы следующие утверждения: 1° х = у => х+ = ?/+; 2° (Vx G No) (x+ / 0); 3° x+ = y+ => x = y\ 4° (Vx G No) (x ± 0 => (By G No) (x = ?/+)). b) Используя то, что No — индуктивное множество, покажите, что для люб] его элементов х и у (а они в свою очередь являются множествами) справедлив следующие соотношения: 1° cardx cardх+; 2° card0 < cardx+; 3° cardx < card у <=> cardx+ < card?/+; 4° cardx < cardx+; 5° cardx < card?/ => cardx+ card?/; 6° x = у <=> cardx = card?/; 7° (x C ?/) V (x D ?/).
62 ГЛ. . НККОТ ГЫЕ иьщьмл МА ич икик НЯ ГИЯ с) Покажите, что в любом подмножестве X множества No найдется такой (н меньший) элемент хт, что (Ух G X) (cardxm card#). (В случае затруднени этой задаче можно вернуться после прочтения главы II.) 4. Мы будем иметь дело только с множествами. Поскольку множество, состоя! из различных элементов, само может быть элементом другого множества, логики множества обычно обозначают строчными буквами. В настоящей задаче это оч удобно. а) Проверьте, что запись Ух By 4z (z € у <=> 3w (z G w A w G x)) выражает аксиому объединения, по которой существует множество у — объедине: множества х. Ь) Укажите, какие аксиомы теории множеств представлены записями Чх Чу 4z ((z G х <=> z E у) <=> x = t/), Ух Чу Bz 4v (v G z <=> (v = x V v = ?/)), Vx By 4z (z E у <=> Чи (и G z => и E x)), Зх (Чу (-< Bz (z E у) У G x) A 4w (w E x => 4u (4v (v E и <=> <=> (v = w V v E w)) <=> и E x)' с) Проверьте, что формула 4z (z E f => (3xi З3/1 (xi G x A yi E у A z = (xi,t/i))) A A Vxi (xi G x => 3t/i Bz (yi E у A z = (a?i,j/i) A z E /)) A A Vxi 4yi 4y2 (3zi 3z2 (zi E f Л Z2 E f Л Zi = (xi,t/i) A A Z2 = (xi,t/2)) => У1 = У2 последовательно накладывает на множество f три ограничения: f есть подмно: ство хх?/; проекция f на х совпадает с х; каждому элементу xi из х отвечает poi один элемент у\ из у такой, что (xi,j/i) G f. Таким образом, перед нами определение отображения f: х —> у. Этот пример еще раз показывает, что формальная запись высказывания отнк не всегда бывает более короткой и прозрачной в сравнении с его записью на раз ворном языке. Учитывая это обстоятельство, мы будем в дальнейшем использовг логическую символику лишь в той мере, в какой она будет нам представляться лезной для достижения большей компактности или ясности изложения. 5. Пусть f: X —> У -— отображение. Запишите логическое отрицание каждого следующих высказываний: a) f сюръективно; b) f инъективно; с) f биективно. 6. Пусть X и У — множества и f С X х У. Запишите, что значит, что множесп f не является функцией.
ГЛАВА II ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Математические теории, как правило, находят свой выход в том, что поз: ляют перерабатывать один набор чисел (исходные данные) в другой наС чисел, составляющий промежуточную или окончательную цель вычислен] По этой причине особое место в математике и ее приложениях занимают ' еловые функции. Они (точнее, так называемые дифференцируемые числов функции) составляют главный объект исследования классического анали Но сколь-нибудь полное с точки зрения современной математики описав свойств этих функций, как вы уже могли почувствовать в школе и в чем ва ре убедитесь, невозможно без точного определения множества вещественн чисел, на котором эти функции действуют. Число в математике, как время в физике, известно каждому, но непош но лишь специалистам. Это одна из основных математических абстракц] которой, по-видимому, еще предстоит существенная эволюция и рассказу которой может быть посвящен самостоятельный насыщенный курс. Здесь мы имеем в виду только свести воедино то, что читателю в основном извест: о действительных числах из средней школы, выделив в виде аксиом фундам< тальные и независимые свойства чисел. При этом наша цель состоит в тс чтобы дать точное, пригодное для последующего математического испо. зования определение вещественных чисел и обратить особое внимание на свойство полноты, или непрерывности, являющееся зародышем предельнс перехода — основной неарифметической операции анализа. § 1. Аксиоматика и некоторые общие свойства множества действительных чисел 1. Определение множества действительных чисел Определение 1. Множество К называется множеством действите. ных {вещественных) чисел, а его элементы — действительными {вещества
1 JI. 11. ^JOrlVlDJf IDJlDnDlD X DCl мылш) числами, если выполнен следующий комплекс условий, называемь аксиоматикой вещественных чисел: (I) Аксиомы сложения Определено отображение {операция сложения) 4- : R X R —К, сопоставляющее каждой упорядоченной паре {х, у) элементов х, у из К нек торый элемент х + у Е R, называемый суммой х и у. При этом выполнез следующие условия: 1+. Существует нейтральный элемент 0 {называемый в случае сл жения нулем) такой, что для любого х Е R я + 0 = 0 + :г = я. 2+. Для любого элемента х Е К имеется элемент —х Е R, называемг пр отпив on о ложным к х, такой, что х 4- (—ж) = (—х) 4- х = 0. 3+. Операция 4- ассоциативна, т. е. для любых элементов х, у, z из выполнено х 4- (у~+ z) = {х 4" У) 4- z. 4+. Операция 4- коммутативна, т. е. для любых элементов х, у из выполнено х 4- у = у 4- х. Если на каком-то множестве G определена операция, удовлетворяющая а сиомам 1+, 2_|_, 3+, то говорят, что на G задана структура группы или чг G есть группа. Если операцию называют сложением, то группу называв аддитивной. Если, кроме того, известно, что операция коммутативна, т. выполнено условие 4+, то группу называют коммутативной или абелевой1 Итак, аксиомы 1+— 4+ говорят, что R есть аддитивная абелева группа. (II) Аксиомы умножения Определено отображение {операция умножения) • : К х К —R, сопоставляющее каждой упорядоченной паре {х,у) элементов х, у из R ъ который элемент х • у Е R, называемый произведением х и у, прич< так, что выполнены следующие условия: 1^Н. X. Абель (1802 — 1829) — замечательный норвежский математик, доказавший i разрешимость в радикалах алгебраических уравнений выше четвертой степени.
1.. Существует нейтральный элемент 1 6 R \ О {называемый в случ умножения единицей) такой, что \fxE R х • 1 = 1 • х = х. 2.. Для любого элемента х Е R\O имеется элемент ж-1 € R, называем! обр атным, такой, что х • х~х = х~1 • х = 1. 3.. Операция • ассоциативна, т. е. для любых х, у, z из R х • {у • z) = {х • у) • z. 4.. Операция • коммутативна, т. е. для любых х, у из R х • у = у • х. Заметим, что по отношению к операции умножения множество R \ 0, к можно проверить, является {мультипликативной) группой. (I, II) Связь сложения и умножения Умножение дистрибутивно по отношению к сложению, т. е. Vх, у, z Е {х + y)z = xz + yz. Отметим, что ввиду коммутативности умножения последнее равенство с хранится, если в обеих его частях поменять порядок множителей. Если на каком-то множестве G действуют две операции, удовлетворяют всем перечисленным аксиомам, то G называется алгебраическим полем и. просто полем. (III) Аксиомы порядка Между элементами R имеется отношение , т. е. для элементов х. из R установлено, выполняется лих или нет. При этом должны ус влетворятъся следующие условия: 0^. Vx Е R {х х). Ч- {х < у) Л {у < х) => {х = у). 2^- (ж < у) Л {у < z) => {х < z). 3^. Vx G R Vy 6 R {x у) V {y x). Отношение в R называется отношением неравенства. Множество, между некоторыми элементами которого имеется отношещ удовлетворяющее аксиомам 0^, 1^, 2^, как известно, называют частично ут рядоченным, а если, сверх того, выполнена аксиома 3^, т. е. любые два элеме та множества сравнимы, то множество называется линейно упорядоченным
Таким образом, множество действительных чисел линейно упорядочено ( ношением неравенства между его элементами. (I, III) Связь сложения и порядка в К Если х, у, z — элементы R, то (х < у) => (ж + z < у + z). (II, III) Связь умножения и порядка в R Если х, у — элементы R, то (О < я) Л (0 у) => (0 < х • у). (IV) Аксиома полноты (непрерывности) Если X и Y — непустые подмножества R, обладающие тем свойстве что для любых элементов х Е X и у Е Y выполнено х у, то существу такое с Е R, что х с у для любых элементов х Е X и у Е Y. Этим завершается список аксиом, выполнение которых на каком бы то было множестве R позволяет считать это множество конкретной реализаць или, как говорят, моделью действительных чисел. Это определение формально не предполагает никакой предварительной i формации о числах, и из него, «включив математическую мысль», опять-та формально мы должны получить уже в качестве теорем остальные свойсз действительных чисел. По поводу этого аксиоматического формализма хог лось бы сделать несколько неформальных замечаний. Представьте себе, что вы не прошли стадию от складывания яблок, ку( ков или других именованных величин к сложению абстрактных натуральн чисел; что вы не занимались измерением отрезков и не пришли к рациона, ным числам; что вам неизвестно великое открытие древних о том, что д] гональ квадрата несоизмерима с его стороной и потому ее длина не моя быть рациональным числом, т. е. нужны иррациональные числа; что у вас ь возникающего в процессе измерений понятия «больше» («меньше»); что вы иллюстрируете себе порядок, например, образом числовой прямой. Если всего этого предварительно не было, то перечисленный набор аксиом не толь не воспринимался бы как определенный итог духовного развития, но, скор показался бы по меньшей мере странным и во всяком случае произвольш плодом фантазии. Относительно любой абстрактной системы аксиом сразу же возникают крайней мере два вопроса. Во-первых, совместимы ли эти аксиомы, т. е. существует ли-множест: удовлетворяющее всем перечисленным условиям. Это вопрос о непротиво^ чивости аксиоматики. Во-вторых, однозначно ли данная система аксиом определяет математи1 ский объект, т. е., как сказали бы логики, категорична ли система аксис
Однозначность здесь надо понимать следующим образом. Если лица А и независимо, построили свои модели, к примеру, числовых систем Яа и 18 удовлетворяющие аксиоматике, то между множествами IRa, можно усг новить биективное соответствие, пусть f: IRa —> , сохраняющее арифмес ческие операции и отношение порядка, т. е. f(x 4- у) = f(x) 4- /(?/), f(x-y) = f(x)> f(y), х^у <=> f(x) f(y). С математической точки зрения IRa и IRb в таком случае являются всез навсего различными (совершенно равноправными) реализациями (моделял действительных чисел (например, IRa — бесконечные десятичные дроби IRb — точки на числовой прямой). Такие реализации называются изомо]. ными, а отображение f — изоморфизмом. Результаты математической д тельности относятся, таким образом, не к индивидуальной реализации, г каждой модели из класса изоморфных моделей данной аксиоматики. Мы не будем здесь обсуждать поставленные выше вопросы и ограничил только информативными ответами на них. Положительный ответ на вопрос о непротиворечивости аксиоматики в гда носит условный характер. В отношении чисел он выглядит так: исходя принятой нами аксиоматики теории множеств (см. гл. I, § 4, п. 2), можно i строить множество натуральных, затем множество рациональных и, након множество IR всех действительных чисел, удовлетворяющее всем перечисл< ным свойствам. Вопрос о категоричности системы аксиом действительных чисел имс положительный ответ. Желающие получат его самостоятельно, решив задг 23, 24, помещенные в конце следующего параграфа. 2. Некоторые общие алгебраические свойства действительн) чисел. Покажем на примерах, как известные свойства чисел получаются приведенных аксиом. а. Следствия аксиом сложения 1° В множестве действительных чисел имеется только один нуль. ◄ Если О] и О2 — нули в 1R, то по определению нуля 01 = 01 4- О2 = О2 + 01 = О2. ► 2° В множестве действительных чисел у каждого элемента имеет) единственный противоположный элемент. ◄ Если xi и х2 — элементы, противоположные х Е IR, то Х1 = X! + 0 = Х1 + (х + X2) = (%1 + х) + х2 = 0 + х2 = Х2. ►
Здесь мы использовали последовательно определение нуля, определе1 противоположного элемента, ассоциативность сложения, снова определе1 противоположного элемента и, наконец, снова определение нуля. 3° Уравнение а + х = b в R имеет и притом единственное решение х = 6 4- (-о). ◄ Это вытекает из существования и единственности у каждого элеме! а Е R противоположного ему элемента: (а +х = Ь) <=> ((х + а) + (-а) = 6 4- (-о)) <=> 4Ф (а: + (° + (~°)) = 6 4- (-о)) <=> (х -I- 0 = 6 4- (-о)) <=> <=> (х = 6+ (-о)). I Выражение 6 4- (—о) записывают также в виде 6 — о. Этой более корот! и привычной записи мы, как правило, и будем придерживаться. Ь. Следствия аксиом умножения 1° В множестве действительных чисел имеется только одна единице 2° Для каждого числа х 0 имеется только один обратный элемент х 3° Уравнение а х — Ъ при а Е R\0 имеет и притом единственное решеч х = 6 • о-1. Доказательства этих утверждений, разумеется, повторяют доказательсс соответствующих утверждений для сложения (с точностью до замены симв< и названия операции), поэтому мы их опустим. с. Следствия аксиомы связи сложения и умножения. Привлекая , полнительно аксиому (I, II), связывающую сложение и умножение, получг дальнейшие следствия. 1° Для любого х Е М х • 0 = 0 • х = 0. ◄ (х • 0 = х (0 + 0) = а:-0 + а:0)=>(а:0 = а:0 + (—(х • 0)) = 0). ► Отсюда, между прочим, видно, что если х Е R\0, то я-1 е R\0. 2° (я • у = 0) => (х = 0) V (у = 0). ◄ Если, например, у 0, то из единственности решения уравнения х у = относительно х находим х = У у~х =0. ► 3° Для любого х Е К —х = (—1) • х. ◄ х 4- (-1) • х = (1 4- (-1)) = 0'1 = 1- 0 = 0, и утверждение следует единственности противоположного элемента. ►
§ 1. АКСИОМАТИК И СВОЙСТВА двист иткльныл ЧИСЕЛ 4° Для любого числа х Е R = я. ◄ Следует из 3° и единственности элемента х, противоположного — х. > 5° Для любого числа х Е R (—я)(—х) = х х. ◄ (-*)(“*) = ((-1) ‘ я)(-ж) = (* ' (-1))(-я) = ж((—1)(—ж)) = х • х. Мы последовательно воспользовались двумя предыдущими утверждениями также коммутативностью и ассоциативностью умножения. ► d. Следствия аксиом порядка. Отметим сначала, что отношение х (читается «х меньше или равно у») записывают также в виде у х («у болы или равно т»); отношение х у при х / у записывают в виде х < у (ч тается «х меньше ?/») или в виде у > х («у больше я») и называют строга неравенством. 1° Для любых х, у Е R всегда имеет место в точности одно из соотъ тений’. х <у, х = у, х > у. ◄ Это следует из приведенного определения строгого неравенства и акси< 1<: и 3<£. ► 2° Для любых чисел х, у, z из R (х < у) Л (у z) => (х < z), (х ^у) Л (у < z) => (х < z). ◄ Приведем для примера доказательство последнего утверждения. По аксиоме 2^ транзитивности отношения неравенства имеем (х у) Л (у < z) <=> (х у) Л (у z) Л (у / z) => (х z). Осталось проверить, что х z. Но в противном случае (х у) Л (у < z) <=> (z у) Л (у < z) <=> (z у) Л (у z) Л (у # z). В силу аксиомы отсюда следует (у = z) Л (у z) — противоречие. ►
яи ГЛ. 11. ДЬИ^1ВИ1ЬЛЬПЫЬ (ВЫЦЬ 1 btlHblbJ 4MLJ1A е. Следствия аксиом связи порядка со сложением и умножение Если в дополнение к аксиомам сложения, умножения и порядка использовг аксиомы (I, III), (II, III), связывающие порядок с арифметическими опера] ями, то можно получить, например, следующие утверждения: 1° Для любых чисел х, у, z, w из № (х < у) => (х 4- z) < (y + z), (О < х) => (—х < 0), (я у) A (z w) => (х -h z у -h ш), (х у) A (z < w) => (х 4- z < у 4- w). ◄ Проверим первое из этих утверждений. По определению строгого неравенства и аксиоме (I, III) имеем (х < у) => (х у) => (х 4- z) (у 4- z). Остается проверить, что х + z у + z. В самом деле, ((х 4- z) = (у 4- z)) => (х = (у 4- z) - z = у 4- (z - z) = у), что несовместимо с условием х < у. ► 2° Если х, у, z — числа из R, то (0 < х) А (0 <?/)=> (0 < ху), (х < 0) А (у < 0) => (0 < ху), (т < 0) А (0 < у) => (ху < 0), (х < у) А (0 < z) => (xz < yz), (х < у) A (z < 0) => (yz < xz). ◄ Проверим первое из этих утверждений. По определению строгого не{ венства и аксиоме (II, III) (0 < х) Л (0 < у) => (0 х) А (0 у) => (0 ху). Кроме того, 0 ху, поскольку, как уже было показано, (х • у = 0) => (х = 0) V (у = 0). Проверим еще, например, и третье утверждение: (х < 0) А (0 < у) => (0 < — х) А (0 < у) => => (0 < (~х) • у) => (0 < ((-1) • х)у) => => (0 < (-1) • (ху)) => (0 < -(ху)) => (ху < 0). ►
Читателю предоставляется возможность доказать самостоятельно оста ные соотношения, а также проверить, что если в одной из скобок левой час наших утверждений стоит нестрогое неравенство, то следствием его так будет нестрогое неравенство в правой части. 3° 0 < 1. ◄ 1 G R\0, т. е. О 0 1. Если предположить, что 1 < 0, то по только что доказанному (1 < 0) Л (1 < 0) => (0 < 1 • 1) => (0 < 1). Но мы знаем, что для любой пары чисел я, у Е R реализуется и притом тол) одна из возможностей: х < у, х = у, х > у. Поскольку 0 / 1, а предпо жение 1 < 0 ведет к несовместимому с ним соотношению 0 < 1, то остаег единственная возможность, указанная в утверждении. ► 4° (0 < х) => (0 < я-1) и (0 < х) Л (х < у) => (0 < у~г) Л (у~1 < я-1). ◄I Проверим первое из этих утверждений. Прежде всего, я-1 0 0. Предположив, что х~г <0, получим (я”1 < 0) Л (0 < х) => (т • х-1 < 0) => (1 < 0). Это противоречие завершает доказательство. ► Напомним, что числа, которые больше нуля, называются положителы ми, а числа меньшие нуля — отрицательными. Таким образом, мы доказали, например, что единица — положителы число, что произведение положительного и отрицательного чисел есть чи< отрицательное, а величина, обратная положительному числу, также полоз тельна. 3. Аксиома полноты и существование верхней (нижней) гран» числового множества Определение 2. Говорят, что множество X С R ограничено све] (снизу), если существует число с 6 К. такое, что х с (соответственно, с для любого х Е X. Число с в этом случае называют верхней (соответственно, нижней) гра\ цей множества X или также мажорантой (минорантой) множества X. Определение 3. Множество, ограниченное и сверху и снизу, назы ется ограниченным. Определение 4. Элемент а Е X называется наибольшим или мак мальным (наименьшим или минимальным) элементом множества X С R, ес х а (соответственно, а х) для любого элемента х Е X.
Введем обозначения и заодно приведем формальную запись определет максимального и минимального элементов соответственно: (о = max А”) := (о 6 X A Vz G X {х а)), (о = min X) := (о € X A Vz 6 X (о х)). Наряду с обозначениями тахХ (читается «максимум X») и minX (чи1 ется «минимум X»), в том же смысле используются соответственно симво max я и min я. х£Х х£Х Из аксиомы 1^ порядка сразу следует, что если в числовом множесг есть максимальный (минимальный) элемент, то он только один. Однако не во всяком, даже ограниченном, множестве имеется максима ный (минимальный) элемент. Например, множество X = {я Е R10 х < 1} имеет минимальный э мент, но, как легко проверить, не имеет максимального элемента. Определение 5. Наименьшее из чисел, ограничивающих множес: Хей сверху, называется верхней гранью (или точной верхней границ* множества X и обозначается supX (читается «супремум X») или sup х. хех Это основное определение настоящего пункта. Итак, s = supX := Vz € X ((я s) A (Vs' < s Зя' € X (s' < я'))). В первой скобке, стоящей справа от определяемого понятия, написано,г s ограничивает X сверху; вторая скобка говорит, что s — минимальное чисел, обладающих этим свойством. Точнее, вторая скобка утверждает, * любое число, меньшее s, уже не является верхней границей X. Аналогично вводится понятие нижней грани {точной нижней гранит множества X как наибольшей из нижних границ множества X. Определение 6. г = inf X := Уя € X ((г я) A (Vi < г' Зя'б X (я'< г'))). Наряду с обозначением infX (читается «инфимум X») для нижней грани употребляется также обозначение inf я. х£.Х Таким образом, даны следующие определения: supX := min {с Е R|Vя Е X (я с)}, inf X := max {с Е R| Vя Е X (с я)}. Но выше мы говорили, что не всякое множество обладает минимальн; или максимальным элементом, поэтому принятые определения верхней и не ней граней числового множества нуждаются в аргументации, которую дос1 вляет следующая
Лемма (принцип верхней грани). Всякое непустое ограниченное с ее] подмножество множества вещественных чисел имеет и притом единств ную верхнюю грань. ◄ Поскольку единственность минимального элемента числового множеся нам уже известна, необходимо лишь убедиться в существовании верхней г] ни. Пусть X С R — данное подмножество, а У = {у Е R| Va: 6 X (х у)} множество верхних границ X. По условию, X 0 и Y 0. Тогда в силу i сиомы полноты существует число с G R такое, что Va: 6 X у Е У (а; с Число с, таким образом, является мажорантой X и минорантой Y. Как ма> ранта X, число с является элементом У, но как миноранта У, число с являег минимальным элементом множества У. Итак, с = min У = supX. ► Конечно, аналогично доказывается существование и единственность ни ней грани у ограниченного снизу числового множества, т. е. имеет место Лемма. (X ограничено снизу) => (3! inf А”). На доказательстве мы не останавливаемся. Теперь вернемся к множеству X = {z6R|0^z<l}. В силу доказанк леммы оно должно иметь верхнюю грань. По самому определению множеся X и определению верхней грани очевидно, что supX 1. Для того чтобы доказать, что supX = 1, таким образом, необходимо п] верить, что для любого числа q < 1 найдется число х Е X такое, что q < т. е., попросту, что между q и 1 есть еще числа. Это, конечно, легко доказе и независимо (например, показав, что q < 2-1(g + 1) < 1), но мы сейчас этс делать не станем, поскольку в следующем параграфе подобные вопросы бу,п обсуждаться последовательно и подробно. Что же касается нижней грани, то она всегда совпадает с минимальн] элементом множества, если множество таковым обладает. Так что уже этого соображения в рассматриваемом примере имеем inf X = 0. Другие, более содержательные примеры использования введенных зд( понятий встретятся уже в следующем параграфе. § 2. Важнейшие классы действительных чисел и вычислительные аспекты операций с действительными числами 1. Натуральные числа и принцип математической индукции а. Определение множества натуральных чисел. Числа вида 1,14 (1-4-1)-4-1ит. д. обозначают соответственно символами 1, 2, 3 и т. д. называют натуральными числами. Принять такое определение может только тот, кто и без него имеет поле представление о натуральных числах, включая их запись, например, в де< тичной системе счисления.
Продолжение какого-то процесса далеко не всегда бывает однозначш поэтому вездесущее «и так далее» на самом деле требует уточнения, кото] доставляет фундаментальный принцип математической индукции. Определение 1. Множество X С R называется индуктивным, е< вместе с каждым числом х 6 X ему принадлежит также число ж 4-1. Например, К. является индуктивным множеством; множество положите ных чисел также является индуктивным множеством. Пересечение X = Q Ха любого семейства индуктивных множеств J аёА если оно непусто, является индуктивным множеством. Действительно, (х Е X = П Ха) => (Va G А (х € Ха)) => ' а£.А ' ((я + 1) € Ха}} => ({х + 1) € А = *) ' аЕА ? Теперь примем следующее Определение 2. Множеством натуральных чисел называется найме шее индуктивное множество, содержащее 1, т. е. пересечение всех индукт ных множеств, содержащих число 1. Множество натуральных чисел обозначают символом N; его элементы зываются натуральными числами. С теоретико-множественной точки зрения, быть может, разумнее на ральные числа начинать с 0, т. е. вводить множество натуральных чисел i наименьшее индуктивное множество, содержащее 0, однако нам удобнее чинать нумерацию числом 1. Следующий фундаментальный и широко используемый принцип являв' прямым следствием определения множества натуральных чисел. Ь. Принцип математической индукции Если подмножество Е множества натуральных чисел N таково, ч 1 Е Е и вместе с числом х Е Е множеству Е принадлежит число я + 1, Е — N. Итак, (Е С N) А (1 Е Е) A (Vz Е Е (х Е Е => (х 4-1) Е Е)) => Е = N. Проиллюстрируем этот принцип в действии, доказав с его помощью сколько полезных и постоянно в дальнейшем используемых свойств натура ных чисел. 1° Сумма и произведение натуральных чисел являются натуральными ‘ сломи.
◄ Пусть т, п 6 N; покажем, что (т + п) е N. Обозначим через Е мной ство тех натуральных чисел п, для которых (т + п) 6 N при любом т Е Тогда 1 € Е, поскольку (m Е N) => ((m + 1) Е N) для любого т Е N. Ес п € Е, т. е. (m+n) G N, той (п4-1) € Е, так как (m+(n+l)) = ((m+n) + l) Е По принципу индукции Е = N, и мы доказали, что сложение не выводит пределы N. Аналогично, обозначив через Е множество тех натуральных чисел n, fl которых (т • п) Е N при любом m G N, находим, что 1 6 Е, так как т • 1 = и если п Е Е, т. е. т • п Е N, то т • (п 4-1) = тп -I- т есть сумма натуральн: чисел, которая по доказанному принадлежит N. Таким образом, (n Е Е) => ((п + 1) Е Е) и по принципу индукции Е = N. ► 2° Покажем, что (n Е N) Л (п 0 1) => ((п — 1) Е N). ◄ Рассмотрим множество Е натуральных чисел вида п — 1, где п — нап ральное число, отличное от 1, и покажем, что Е = N. Поскольку 1 Е N, то 2 := (1 4-1) Е N, а значит, 1 = (2 - 1) Е Е. Если тбЕ, то т = п — 1, где п Е N; тогда т 4-1 = (n +1) — 1 и, посколь (n +1) Е N, имеем (m + 1) Е Е. По принципу индукции заключаем: Е — N. 3° Для любого п Е N в множестве {г Е N|n < z} есть минимально элемент, причем min {т Е N | п < я} = n + 1. ◄ Покажем, что множество Е тех п Е N, для которых утверждение спр ведливо, совпадает с N. Сначала проверим, что 1 Е Е, т. е. min {я Е N| 1 < х} = 2. Это утверждение тоже будем проверять по принципу индукции. Пусть М = {я Е N| (х = 1) V (2 х)}. По определению М имеем 1 Е М. Далее, если х Е М, то либо х = 1 и тог х 4- 1 = 2 Е М, либо 2 х, тогда 2 (х + 1) и снова (х 4- 1) Е М. Таю образом, М = N и, значит, если (х 0 1) А (т Е N), то 2 х, т. е. действитель: min {я Е N| 1 < я} = 2. Итак, 1 Е Е. Покажем теперь, что если п Е Е, то и (п 4-1) Е Е. В самом деле, если х Е {я Е N| п 4-1 < ж}, то ,(х - 1) - у Е {у Е N|n < у}, ибо по доказанному все натуральные числа не меньше 1, поэтому (п 4-1 < х) => (1 < х) => (х 0 1), а тогда в силу утверждения 2° (х — 1) = у Е N. Если п Е Е, то min {j/EN|n<?/} = п4-1,т. е. х — 1 у^п + 1нх п + Значит, (хе {zEN|n + l< х}) => (х п 4 2)
*tu 1 JI. 11. ДС/IU 1 DH 1 DJIDODID 1 ОЬППОШ^ ТКЮЛЛ и, следовательно, min {х 6 N | п 4-1 < ж} = п 4 2, т. е. (п + 1) G Е. По принципу индукции Е — N, и утверждение 3° доказано. ► В качестве прямых следствий доказанных утверждений 2° и 3° получа следующие свойства 4°, 5°, 6° натуральных чисел: 4° (т 6 N) A (n 6 N) A (n < т) => (n 4 1 т). 5° Число (п 4 1) Е N непосредственно следует в N за натуральным < слом п, т. е. нет натуральных чисел х, удовлетворяющих условию п < х < п 4 1, если п Е N. 6° Если п Е N и п / 1, то число (п — 1) Е N и (п — 1) непосредствен предшествует числу п в N, т. е. нет натуральных чисел х, удовлетворя щих условию п — 1 < х < п, если п Е N. 7° Покажем теперь, что в любом непустом подмножестве множест натуральных чисел имеется минимальный элемент. ◄ Пусть М С N. Если 1 Е М, то min М = 1, поскольку Vn Е N (1 п). Пусть теперь 1 $ М, т. е. 1 Е Е = N \ М. В множестве Е должно найти такое натуральное число п Е Е, что все натуральные числа, не превосхо/ щие п, лежат в Е, а (п 4 1) Е М. Если бы такого п не было, то множ ство Е С N, содержащее единицу, вместе с п Е Е содержало бы и (п 4 1) по принципу индукции совпадало бы с N. Последнее невозможно, посколь N\E = М / 0. Найденное число (п41) Е М и будет минимальным в М, поскольку меж, п и п 4 1, как мы видели, уже нет натуральных чисел. ► 2. Рациональные и иррациональные числа а. Целые числа Определение 3. Объединение множества натуральных чисел, множ ства чисел, противоположных натуральным числам, и нуля называется мн жеством целых чисел и обозначается символом Z. Поскольку, как уже было доказано, сложение и умножение натуральнь чисел не выводят за пределы N, то эти же операции над целыми числами i выводят за пределы множества Z. ◄ Действительно, если т,п Е Z, то либо одно из этих чисел равно нул и тогда сумма т 4 п равна другому числу, т. е. (m 4n) Е Z, а произведен] т • п = О Е Z, либо оба числа отличны от нуля. В последнем случае ли( т,п Е N и тогда (т 4 n) Е N С Z и (т • n) Е N С Z, либо (—m), (—n) Е N тогда тп= ((—l)m)((—l)n) Е N, либо (—т),п Е N и тогда (— т-п) Е N, т. т • п Е Z, либо, наконец, т, —п Е N и тогда (—т п) Е N и снова т • п Е Z. Таким образом, Z есть абелева группа по отношению к операции сложени По отношению к операции умножения множество Z и даже Z \ 0 не являв' ся группой, поскольку числа, обратные целым, не лежат в Z (кроме числ обратного единице и минус единице).
g 4>. Ди A LJll * 1ZXV1-/V1 ◄ Действительно, если m E Z и m 0, 1, то, считая сначала m E имеем 0 < 1 < m и, поскольку т • т~1 = 1 > 0, должно быть 0 < т-1 < (см. в предыдущем параграфе^следствия аксиом порядка). Таким образо ш-1 Z. Случай, когда т — отрицательное целое число, отличное от - непосредственно сводится к уже разобранному. ► В том случае, когда для чисел m,n Е Z число к = т n"1 Е Z, т. е. ког, т = к • п, где к Е Z, говорят, что целое число т делится на целое число п и. кратно п, или что п есть делитель т. Делимость целых чисел путем надлежащих изменений знаков, т. е. домн жением на —1, если в этом есть необходимость, немедленно приводится делимости соответствующих натуральных чисел, в рамках которых она и из чается в арифметике. Напомним без доказательства так называемую основную теорему арйфы тики, которой при рассмотрении некоторых примеров мы будем пользоваты Число р 6 N, р / 1, называется простым, если в N у него нет делителе отличных от 1 и р. Основная теорема арифметики. Каждое натуральное число о пускает и притом единственное (с точностью до порядка сомножителе представление в виде произведения п=р!... рк, где pi, ..., pk — простые числа. Числа т, п Е Z называются взаимно простыми, если у них нет общ] делителей, отличных от 1 и —1. Из приведенной теоремы, в частности, видно, что если произведение т взаимно простых чисел т, п делится на простое число р, то одно из чисел i п также делится на р. Ь. Рациональные числа Определение 4. Числа вида т • п-1, где т, п Е Z, называются раци налъными. Множество рациональных чисел обозначается знаком Q. Таким образом, упорядоченная пара (т, п) целых чисел определяет раци нальное число q = т • п-1, если п / 0. Число q = т • п-1 записывают также в виде отношения1) т и п или т< называемой рациональной дроби —. п Правила действий с рациональными числами, относящиеся к такой фо ме их представления дробями, изучавшиеся в школе, немедленно вытекают ] Обозначение Q — по начальной букве англ, quotient — отношение (от лат. quota часть, приходящаяся на единицу чего-либо, и quot — сколько).
48 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА определения рационального числа и аксиом действительных чисел. В част- ности, «от умножения числителя и знаменателя дроби на одно и то же от- - тк личное от нуля целое число величина дроби не изменяется», т. е. дроби —7- и — представляют одно и то же рациональное число. В самом деле, поскольку 71 (n/c)(A:_1n_1) = 1, т. е. (п • А:)-1 = к~1 п~1. то (mA:)(nA:)~1 = = = т • п-1. Таким образом, различные упорядоченные пары (m,n) и (тк,пк) задают одно и то же рациональное число. Следовательно, после соответствующих сокращений любое рациональное число можно задать упорядоченной парой взаимно простых целых чисел. С другой стороны, если пары (mi,ni) и (тг,^) задают одно и то же рациональное число, т. е. mi-nf1 = , тотхПг = и если, например, mi и П1 взаимно просты, то в силу упомянутого следствия основной теоремы арифметики пг • nf1 = m2 • т^1 = к Е Z. Мы показали, таким образом, что две упорядоченные пары (mi,ni), (т-2, Пг) задают одно и то же рациональное число тогда и только тогда, когда они пропорциональны, т. е. существует число к Е Z такое, что, например, m2 = kmi и ng = кщ. с. Иррациональные числа Определение 5. Действительные числа, не являющиеся рациональны- ми, называются иррациональными. Классическим примером иррационального действительного числа является \/2, т. е. число s Е К такое, что s > 0 и s2 = 2. Иррациональность \/2 в силу теоремы Пифагора эквивалентна утверждению о несоизмеримости диагонали и стороны квадрата. Итак, проверим, во-первых, что существует положительное действи- тельное число s Е К, квадрат которого равен двум, и, во-вторых, что s Q. •4 Пусть X и Y — множества положительных действительных чисел такие, что Чх Е X (х2 < 2), V ?/ Е Y (2 < у2). Поскольку 1 Е X, а2бУ, то Хи У- непустые множества. Далее, поскольку для положительных х и у (х < у) <=> (х2 < у2), то любой элемент х Е X меньше любого элемента у Е Y. По аксиоме полноты сущест- вует число s Е К такое, что х s у р,ля Чх Е X и Чу Е Y. Покажем, что s2 = 2. Если бы было s2 < 2, то, например, квадрат числа s -I-т-^~, большего 3s чем s, был бы меньше 2. Действительно, ведь 1 Е X, поэтому I2 s2 < 2 и 0<Д = 2 — s2<l. Значит, ( Д V 9 Д ( Д V 9 Д 9а Ь + т- = S2 + 2 •£ + (- < s2 + 3 • ^ = s2 + Д = 2. \ / О \ os / о
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 49 / д \ Следовательно, Is + — I Е А, что несовместимо с неравенством х s для х ОЗ / любого элемента х 6 X. з2 — 2 Если бы было 2 < з2, то, например, квадрат числа з------—, меньшего оЗ чем з, был бы больше 2. Действительно, ведь 2 € У, поэтому 2 < з2 22 или 0<A = s2 — 2<3 и 0 < — < 1. Отсюда О и мы вступаем в противоречие с тем, что з ограничивает множество Y снизу. Таким образом, реализуется только одна оставшаяся возможность: з2 = 2. Покажем, наконец, что s Q. Предположим, что s € Q, и пусть ™ — несократимое представление з. Тогда т2 = 2-п2, следовательно, т2, а значит, и т делится на 2. Но если т = 2к, то 2к2 = п2 и по той же причине п должно делиться на 2, что противоречит несократимости дроби —. ► п Сейчас мы трудились над тем, чтобы доказать существование иррацио- нальных чисел. Вскоре мы увидим, что в некотором смысле почти все дей- ствительные числа иррациональны. Будет показано, что мощность множества иррациональных чисел больше мощности множества всех рациональных чисел и совпадает с мощностью множества всех действительных чисел. Среди иррациональных чисел выделяют еще так называемые алгебраиче- ские иррациональности и трансцендентные числа. Вещественное число называется алгебраическим, если оно является корнем некоторого алгебраического уравнения аохп + ... + ап-гх + ап = О с рациональными (или, что эквивалентно, с целыми) коэффициентами. В противном случае число называется трансцендентным. Мы увидим, что мощность множества алгебраических чисел такая же, как мощность множества рациональных чисел, а мощность множества трансцен- дентных чисел такая же, как мощность всех действительных чисел; поэтому на первый взгляд кажутся парадоксальными и неестественными трудности в предъявлении конкретного трансцендентного числа, точнее, в доказательстве его трансцендентности. Так, например, только в 1882 г. было доказано, что классическое геометри- ческое число 7г является трансцендентным1), а одна из знаменитых проблем 1^7г — число, равное в евклидовой геометрии отношению длины окружности к ее диаме- тру. Отсюда общепринятое с XIII века обозначение этого числа начальной буквой греческо- го слова тгЕрирЕрю. — периферия (окружность). Трансцендентность тг доказана немецким математиком Ф. Линдеманом (1852—1939). Из трансцендентности тг, в частности, вытека- ет невозможность построения циркулем и линейкой отрезка длины тг (задача о спрямлении окружности), как и неразрешимость этими средствами древней задачи о квадратуре круга.
50 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Гильберта1^ состояла в том, чтобы доказать трансцендентность числа , где а — алгебраическое, (а > 0)A(a^ 1), а /3 — алгебраическое иррациональное число (например, а = 2, /3 = \/2). 3. Принцип Архимеда. Переходим к важному как в теоретическом от- ношении, так и в плане конкретного использования чисел при измерениях и вычислениях принципу Архимеда2). Мы докажем его, опираясь на аксиому полноты (точнее, на эквивалентную ей лемму о верхней грани). При другой аксиоматике множества действительных чисел этот фундаментальный прин- цип часто включают в список аксиом. Заметим, что утверждения, которые мы до сих пор доказывали о натураль- ных и целых числах, совершенно не использовали аксиому полноты. Как будет видно из дальнейшего, принцип Архимеда, в сущности, отражает свойства на- туральных и целых чисел, связанные с аксиомой полноты. С этих свойств мы и начнем. 1° В любом непустом ограниченном сверху подмножестве множества натуральных чисел имеется максимальный элемент. 4 Если Е С N — рассматриваемое множество, то по лемме о верхней грани 3!supE = s G К. По определению верхней грани, в Е найдется натуральное число п € Е, удовлетворяющее условию s — 1 < п s. Тогда п = гпах£?, поскольку все натуральные числа, которые больше п, не меньше n + 1, а п + 1 > s. ► Следствия. 2° Множество натуральных чисел не ограничено сверху. • 4 В противном случае существовало бы максимальное натуральное число. Но п < п + 1. ► 3° В любом непустом ограниченном сверху подмножестве множества целых чисел имеется максимальный элемент. • 4 Можно дословно повторить доказательство утверждения 1°, заменяя N на Z. ► 4° В любом непустом ограниченном снизу подмножестве множества целых чисел имеется минимальный элемент. • 4 Можно, например, повторить доказательство утверждения 1°, заменяя N на Z и используя вместо леммы о верхней грани лемму о существовании нижней грани у ограниченного снизу числового множества. Х)Д. Гильберт (1862—1943) — выдающийся немецкий математик, сформулировавший в 1900 г. на Международном конгрессе математиков в Париже двадцать три относящиеся к различным областям математики проблемы, получившие впоследствии название «проблем Гильберта». Вопрос, о котором идет речь в тексте (седьмая проблема Гильберта), был положительно решен в 1934 г. советским математиком А. О. Гельфондом (1906 — 1968) и немецким математиком Т. Шнайдером (1911 — 1989). 2) Архимед (287—212 гг. до н. э.) — гениальный греческий ученый, про которого один из основоположников анализа Лейбниц в свое время сказал: «Изучая труды Архимеда, пе- рестаешь удивляться успехам современных математиков».
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 51 Можно также перейти к противоположным числам («поменять знаки») и воспользоваться уже доказанным в 3°. ► 5° Множество целых чисел не ограничено ни сверху, ни снизу. • 4 Вытекает из 3° и 4° или прямо из 2°. ► Теперь сформулируем 6° Принцип Архимеда. Если фиксировать произвольное положи- тельное число h, то для любого действительного числа х найдется и при- том единственное целое число к такое, что (k — l)h х < kh. ◄ Поскольку Z не ограничено сверху, множество {nEZ|^<n} — непу- стое ограниченное снизу подмножество множества целых чисел. Тогда (см. 4°) в нем есть минимальный элемент к, т. е. (fc — 1) С x/h < к. Поскольку h > 0, эти неравенства эквивалентны приведенным в формулировке прин- ципа Архимеда. Единственность к Е Z, удовлетворяющего двум последним неравенствам, следует из единственности минимального элемента числового множества (см. § 1, п. 3). ► Некоторые следствия: 7° Для любого положительного числа е существует натуральное число п n 1 такое, что 0 < — < е. п ◄ По принципу Архимеда найдется п Е Z такое, что 1 < е • п. Поскольку О < 1 и 0 < е, имеем 0 < п. Таким образом, пб№иО<-<е. ► п 8° Если число х Е К таково, что 0 х и для любого п Е N выполнено 1 л х < —, то х = 0. п ◄ Соотношение 0 < х невозможно в силу утверждения 7°. ► 9° Для любых чисел a,b Е К таких, что а < Ь, найдется рациональное число г Е Q такое, что а < г <Ь. ◄ Учитывая 7°, подберем n Е N так, что 0 < — < b — а. По принципу Архимеда найдем такое число т Е Z, что ——- а < —. Тогда — < Ь, ибо в п п п противном случае мы имели бы —-- а < b —, откуда следовало бы, что > b — а. Таким образом, г - Е^иа< - < Ь. ► 10° Для любого числа ж Е К существует и притом единственное целое число A: Е Z такое, что к х < к + 1. ◄ Это непосредственно вытекает из принципа Архимеда. ► Указанное число к обозначается [ж] и называется целой частью числа.х. Величина {ж} := ж — [ж] называется дробной частью числа ж. Итак, ж = = [ж] + {ж}, причем {ж} 0. 3 Зорич В. А.
52 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА 4. Геометрическая интерпретация множества действительных чисел и вычислительные аспекты операций с действительными числами а. Числовая ось. По отношению к действительным числам часто исполь- зуется образный геометрический язык, связанный с тем обстоятельством, что, как в общих чертах известно из школы, в силу аксиом геометрии между точками прямой L и множеством R вещественных чисел можно установить взаимно однозначное соответствие f: L —> R. Причем это соответствие свя- зано с движениями прямой. А именно, если Т — параллельный перенос пря- мой L по себе, то существует число t 6 R (зависящее только от Т) такое, что /(Т(з;)) = f(x) + t для любой точки х Е L. Число f(x), соответствующее точке х С L, называется координатой точ- ки х. Ввиду взаимной однозначности отображения f : L —> R координату точки часто называют просто точкой. Например, вместо фразы «отметим точку, координата которой 1», говорят «отметим точку 1». Прямую L при наличии указанного соответствия f : L —> R называют координатной осью, числовой осью или числовой прямой. Ввиду биективности f само множество R вещественных чисел также часто называют числовой прямой, а его элемен- ты — точками числовой прямой. Как отмечалось, биективное отображение f: L —> R, задающее на L коор- динаты, таково, что при параллельном переносе Т координаты образов точек прямой L отличаются от координат самих точек на одну и ту же величину t G К. Ввиду этого f полностью определяется указанием точки с координа- той 0 и точки с координатой 1 или, короче, точки нуль, называемой началом координат, и точки 1. Отрезок, определяемый этими точками, называется единичным отрезком. Направление, определяемое лучом с вершиной 0, содер- жащим точку 1, называется положительным, а движение в этом направлении (от 0 к 1) — движением слева направо. В соответствии с этим соглашением 1 лежит правее 0, а 0 — левее 1. При параллельном переносе Т, переводящем начало координат з?о в точ- ку Xi = Т(хо) с координатой 1, координаты образов всех точек на единицу больше координат прообразов, поэтому мы находим точку Х2 = T'(^i) с ко- ординатой 2, точку хз = Т(х2) координатой 3, ... , точку xn+i = Т(хп) с координатой n + 1, а также точку X-i = Т-1(з;о) с координатой —1, ... , точ- ку X-n-i = Т~1(х-п) с координатой — п— 1. Таким образом, получаем все точки с целыми координатами m G Z. Умея удваивать, утраивать, ... единичный отрезок, по теореме Фалеса его же можно разбить на соответствующее число п конгруэнтных отрезков. Беря тот из них, одним концом которого является начало координат, для координаты х другого конца имеем уравнение п • х = 1, т. е. х ='—. Отсюда m п находим все точки с рациональными координатами — € Q- Но останутся еще точки L, ведь есть же отрезки, несоизмеримые с единич- ным. Каждая такая точка (как и любая другая точка прямой) разбивает пря-
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 53 мую на два луча, на каждом из которых есть точки с целыми (рациональными) координатами (это следствие исходного геометрического принципа Архиме- да). Таким образам, точка производит разбиение или, как говорят, сечение Q на два непустых множества X и Y, отвечающие рациональным точкам (точ- кам с рациональными координатами) левого и правого лучей. По аксиоме полноты найдется чцсло с, разделяющее X и У, т. е. х с у для Ух € X и У у 6 У. Поскольку X U Y = Q, то supX = s = i = inf У, ибо в противном случае s < г и между s и i нашлось бы рациональное число, не лежащее ни в X, ни в У. Таким образом, s = г = с. Это однозначно определенное число с и ставится в соответствие указанной точке прямой. Описанное сопоставление точкам прямой их координат доставляет нагляд- ную модель как отношению порядка в R (отсюда и термин «линейная упорядо- ченность»), так и аксиоме полноты, или непрерывности R, которая на геоме- трическом языке означает, что в прямой L «нет дыр», разбивающих ее на два не имеющих общих точек куска (такое разбиение осуществляется некоторой точкой прямой L). Мы не станем вдаваться в дальнейшие детали конструкции отображения f : L —> R, поскольку геометрическую интерпретацию множества действи- тельных чисел мы будем привлекать исключительно для наглядности и для возможного подключения весьма полезной геометрической интуиции читате- ля. Что же касается формальных доказательств, то, как и до сих пор, они будут опираться либо на тот набор фактов, который мы уже получили из ак- сиоматики действительных чисел, либо непосредственно на эту аксиоматику. Геометрический же язык мы будем использовать постоянно. Введем следующие обозначения и названия для перечисленных ниже число- вых множеств: ]а, Ь[ := {з? Е R | а < х < Ь} — интервал ab] [а, 6] := {a? Е R | а х 6} — отрезок ab; ]а, 5] := {a? Е R | а < х 6} — полуинтервал ab, содержащий конец Ь; [а, 6[ := {я; Е R | а х < 6} — полуинтервал ab, содержащий конец а. Определение 6. Интервалы, отрезки и полуинтервалы называются числовыми промежутками или просто промежутками. Числа, определяющие промежуток, называются его концами. Величина b — а называется длиной промежутка ab. Если I — некоторый промежуток, то длину его мы будем обозначать через |/| (происхождение та- кого обозначения вскоре станет понятным). Множества ]а,+оо[ := {a? Е R|a < х}, ]—oo,b[ := {a? Е < 6}, [a, +оо[ :={□;€ R | а #}, ]— оо, Ь] := {я? G R | х Ь}, а также ] —оо, +оо[ := R, принято называть неограниченными промежутками.
54 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА В соответствии с таким употреблением символов +оо (читается «плюс бес- конечность») и —оо (читается «минус бесконечность») для обозначения неогра- ниченности числового множества X сверху (снизу), принято писать sup А = =+оо (infA = —оо). Определение 7. Интервал, содержащий точку х 6 К, будем называть окрестностью этой точки. В частности, при 6 > 0 интервал ]я — 6, х + [ называется 6-окрестностью точки х. Его длина 26. Расстояние между числами х, у 6 К измеряется длиной промежутка, кон- цами которого они являются. Чтобы не разбираться при этом, «где лево, а где право», т. е. х < у или у < х, и чему равна длина, у — х или х — у, можно использовать полезную функцию {х при х > О, О при х = О, —х при х < О, называемую модулем или абсолютной величиной числа. Определение 8. Расстоянием между х, у G R называется величина к “ 3/1- Расстояние неотрицательно и равно нулю только при совпадении х и у; расстояние от х до у и от у до х одно и то же, ибо к — у| = |з/ — ж|; наконец, если z € R, то к — У\ к — z\ + к — 3/|> т- е- имеет место так называемое неравенство треугольника. Неравенство треугольника следует из свойства абсолютной величины чи- сла, которое также называется неравенством треугольника (ибо получается из предыдущего при z = 0 и замене у на —у). А именно, для любых чисел х, у справедливо неравенство k + i/l < kl + 1у1, причем равенство в нем имеет место в том и только в том случае, когда оба числа х, у неотрицательны или неположительны. •4 Если 0 х и О С У, то 0 х + у, к + У\ = % + У, |дг| = х, |?/| = у и равенство установлено. Если £ 0 и у 0, то х + у 0, к + у\ = ~к + у) = — % — у, kl = ~х-> |з/| = — у и опять равенство имеет место. Пусть теперь одно из чисел отрицательно, а другое положительно, напри- мер, х < 0 < у. Тогда либо х < х + у 0, либо 0 х 4- у < у. В первом случае к + У\ < kl, в0 втором к + Z/I < |?/|> т. е. в обоих случаях к + 3/1 < kl + М- ►
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 55 Используя принцип индукции, можно проверить, что |з?1 + ... + з;п| |з?1| + ... + |атп|, причем равенство имеет место, если и только если все числа a?i, ..., хп одно- временно неотрицательны или одновременно неположительны. Число & часто называется серединой или центром промежутка с кон- цами а, Ь, поскольку оно равноудалено от концов промежутка. В частности, точка х G R является центром своей (J-окрестности ]х—6, x+<J[ и все точки (J-окрестности удалены от х меньше чем на 3. Ь. Задание числа последовательностью приближений. Измеряя ре- альную физическую величину, мы получаем число, которое, как правило, ме- няется при повторном измерении, особенно если изменить инструмент или метод измерения. Таким образом, результатом измерения обычно является некоторое приближенное значение искомой величины. Качество или точность измерения характеризуется, например, величиной возможного уклонения ис- тинного значения величины от ее значения, полученного в результате изме- рения. При этом может случиться, что точное значение величины (если оно в принципе существует) мы так никогда и не предъявим. Встав, однако, на более конструктивную позицию, можно (или следует) считать, что мы впол- не знаем искомую величину, если в состоянии измерить ее с любой наперед заданной точностью. Такая позиция означает отождествление числа с после- довательностью1^ все более точных его приближений числами, получаемыми при измерении. Но всякое измерение есть конечная совокупность сравнений с некоторым эталоном или с соизмеримой с ним его частью, поэтому результат измерения должен выражаться натуральными, целыми или, более общо, ра- циональными числами. Значит, последовательностями рациональных чисел в принципе можно описать все множество вещественных чисел, построив после должного анализа математическую копию или, лучше сказать, модель того, что делают с числами люди, не подозревающие об их аксиоматическом описа- нии. А они вместо сложения и умножения неизвестных им измеряемых вели- чин складывают и умножают их приближенные значения (не всегда, правда, умея сказать, какое отношение имеет результат таких действий к тому, что получилось бы, если бы эти действия производились с точнымй значениями величин; ниже мы обсудим этот вопрос). Отождествив число с последовательностью его приближенных значений, мы, таким образом, желая, например, сложить два числа, должны складывать последовательности их приближенных значений. Получающуюся при этом но- вую последовательность чисел надо считать новым числом, называемым сум- мой первых двух. Но число ли это? Деликатность вопроса состоит в том, что Если п — номер измерения, а хп — результат измерения, то соответствие п хп есть не что иное, как функция / : N —> R натурального аргумента, т. е., по определению, последовательность (в данном случае последовательность чисел). Подробному изучению числовых последовательностей посвящен § 1 гл. III.
56 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА не каждая случайным образом построенная последовательность служит по- следовательностью сколь угодно точных приближений некоторой величины. То есть необходимо еще научиться по самой последовательности узнавать, представляет она некоторое число или нет. Другой вопрос, который возни- кает при попытке математического копирования операций с приближенными числами, состоит в том, что разные последовательности могут быть последо- вательностями приближений одной и той же величины. Соотношение между последовательностями приближений, определяющими число, и самими числа- ми примерно такое же, как между точкой на карте и указкой, которая указы- вает нам эту точку. Положение указки определяет точку, но точка определяет положение только конца указки, не мешая взять указку по-другому, поудоб- нее. Этим вопросам дал точное описание и реализовал всю намеченную здесь в общих чертах программу построения модели вещественных чисел еще О. Ко- ши1). Надо надеяться, что после изучения теории пределов вы будете в состо- янии самостоятельно повторить эти конструкции Коши. Сказанное до сих пор, разумеется, не претендует на математическую стро- гость. Цель этого неформального отступления — обратить внимание читателя на принципиальную возможность одновременного существования различных естественных моделей действительных чисел; я пытался также дать некото- рое представление об отношении чисел к тому, что нас окружает, и пояснить фундаментальную роль натуральных и рациональных чисел; наконец, мне хо- телось показать естественность и необходимость приближенных вычислений. Последующая часть настоящего пункта посвящена используемым в даль- нейшем и представляющим самостоятельный интерес простым, но важным оценкам погрешностей, возникающих при арифметических операциях над приближенными величинами. Переходим к точным формулировкам. Определение 9. Если х — точное значение некоторой величины, а х — известное приближенное значение той же величины, то числа Д(з?) := |ar — i|, <5(4) == |х| называются соответственно абсолютной и относительной погрешностью приближения х. Относительная погрешность при х = 0 не определена. Поскольку значение х неизвестно, значения Д(х) и 6(х) также неизвест- ны. Однако обычно бывают известны оценки сверху Д(х) < Д, 6(х) < 6 этих величин. В этом случае говорят, что абсолютная или относительная погреш- ность приближения х не превосходит Д или 6 соответственно. На практике О. Коши (1789 — 1857) — французский математик, один из наиболее активных творцов современного языка и аппарата классического анализа.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 57 приходится иметь дело только с оценками погрешностей, поэтому сами вели- чины Д и 6 часто называют абсолютной и относительной погрешностями приближения, но мы этого делать не будем. Запись х = х ± Д означает, что х — Д^ат^я + Д. Например, гравитационная постоянная G скорость света в вакууме с постоянная Планка h заряд электрона е масса покоя электрона те = (6,670 ± 0,007) • 10"11 Н • м2/кг2, = (299792,4562 ± 0,0001) км/с, = (6,62517 ± 0,00023) • 10"34 Дж • с, = (1,60206 ± 0,00003) • 10"19 Кл, = (9,1083 ± 0,00003) • 10"31 кг. Основным показателем точности измерения является величина относитель- ной погрешности приближения, обычно выражаемая в процентах. Так, в приведенных примерах относительные погрешности не превосходят соответственно НЛО"4; 35-Ю"11; 35 • 10“5; 2 • 10-5; 33 • 10“7 или, в процентах от результата измерения, 11•10-2%; 35 • 10“9 %; 35 • 10"3 %; 2-10“3%; 33 • 10"5 %. Оценим теперь погрешности, возникающие при арифметических операци- ях с приближенными величинами. Утверждение. Если |аг-я| = Д(я), \у-у\ = А(у), то Д(я + £) := |(дг + 2/) - (i + j/)| Д(я) + Д(£), (1) Д(х • у) := • у - х -у \ |х| Д(£) 4-|j/| Д(х) 4- Д(х) ♦ Д(£); (2) если, кроме того, у/®, У it® « ад) = 4^<1, 13/1 то |е|Д(у) 4- |у| Д(ж) У2 1 1 - &(у) ' (3)
58 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА ◄ Пусть х = х + а, у = у + /3. Тогда Д(х + у) = |(ж 4- у) - (х 4- у)\ = |а 4- 0| |а| 4- |0| = Д(±) 4- Д(£), Д(ж • у) = \ху - ху\ = |(ж 4- а)(у 4- /3) - ху\ = = \х{3 + уа + а/3| |ж| |/3| 4- |j/| |а| 4- |а/3| = = |£| Д(£) 4- |j/| Д(ж) 4- Д(я) • Д(£), (ж 4- а)у ~(у + /3)х У2 1 1 + /3/у И 101 + 1у11<*1 . 1 У2 1 - 6(т/) |х|Д(^) 4- |у| Д(ж) 1 У2 1 - ' Из полученных оценок абсолютных погрешностей вытекают следующие оценки относительных погрешностей: <5(* + V) < , (И |х 4- у\ 5(х -у) <5(х) + 6(у) + 6(х) • 6(у), (2') »(*) М). т \У/ 1-0{у) На практике, при работе с достаточно хорошими приближениями, Д(х) х х Д(£) » 0, <5(х) • 6(у) « 0, 1 — 6(у) « 1, поэтому пользуются соответствую- щими упрощенными, полезными, но формально неверными вариантами фор- мул (2), (3), (29, (3'): Д(ж -^) |х| Д(£) 4- |£| Д(я), |х;д(у) 4- |у| д(ж) У2 • у) 6(ж) 4- 8(у), <5(Т) i(i) + <5(S)- \У/ Формулы (3), (3') показывают, что надо избегать деления на близкие к ну- лю или довольно грубые приближения, когда у или 1 — 6(у) малы по абсолютной величине. Формула (1') предостерегает от сложения приближенных величин, если они близки по абсолютной величине и противоположны по знаку, поскольку тогда |£ 4- у\ близко к нулю.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 59 Во всех этих случаях погрешности могут резко возрасти. Например, пусть ваш рост дважды измерили некоторым прибором. Точ- ность измерения ±0,5 см. Перед вторым измерением вам под ноги подложили лист бумаги. Тем не менее может случиться, что результаты измерений будут такими: Hi = (200 ± 0,5) см и Я2 = (199,8 ± 0,5) см соответственно. Таким образом, бессмысленно искать толщину бумаги в виде разности Н2 — Hi, из которой только следует, что толщина не больше 0,8 см, что, ко- нечно, очень грубо отражает (если это вообще можно назвать «отражает») истинное положение вещей. Стоит, однако, обратить внимание и на другой, более оптимистичный вычислительный эффект, благодаря которому грубыми приборами удается провести сравнительно тонкие измерения. Например, если на том приборе, где только что измерили ваш рост, измерили высоту пачки в 1000 листов той же бумаги и получили результат (20 ± 0,5) см, то толщина одного листа (0,02 ± 0,0005) см= (0,2 ± 0,005) мм, что вытекает из формулы (1). То есть с абсолютной погрешностью, не превышающей 0,005 мм, толщина одного листа равна 0,2 мм. Относительная погрешность этого измерения не превышает 0,025 или 2,5%. Эту идею можно развить и предложить, например, способ выделения сла- бого периодического сигнала из превышающих его случайных радиопомех, называемых обычно белым шумом. с. Позиционная система счисления. Выше говорилось о том, что каж- дое число можно задать последовательностью приближающих его рациональ- ных чисел. Теперь напомним важный в вычислительном отношении метод, который позволяет единообразно для каждого действительного числа строить такую последовательность рациональных приближений. Этот метод ведет к позици- онной системе счисления. Лемма. Если фиксировать число q > 1, то для любого положительного числа х Е R найдется и притом единственное целое число А: Е Z такое, что дк~г х < qk. ◄ Проверим сначала, что множество чисел вида qk, к Е N, не ограничено сверху. В противном случае оно имело бы верхнюю грань s и по определению верхней грани нашлось бы натуральное число т Е N такое, что - < qm з. Но тогда s < qm+1 и з — не верхняя грань нашего множества. Поскольку 1 < q, то qm < qn при т < n, т, п Е Z, поэтому мы заодно показали, что для любого числа с Е R найдется такое натуральное число N Е N, что при любом натуральном п > N будет с < qn. Отсюда вытекает, что для любого числа е > 0 найдется число М Е N такое, что при всех натуральных т > М будет — < е.
60 Гл. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Действительно, достаточно положить с =-, a, N = М; тогда - < qm при Е £ т > М. Итак, множество целых чисел n € Z, удовлетворяющих неравенству х < qm при х > 0, ограничено сцизу. Тогда в нем есть минимальный элемент к, который, очевидно, и будет искомым, так как для него qk~1 х < qk. Единственность такого целого числа к следует из того, что если т, п 6 Z и, например, т < п, то т п — 1, и поэтому если q > 1, то qm gn-1. Действительно, из этого замечания видно, что неравенства q171-1 х < qm и qn-1 х < gn, из которых следует qn~r х < qm, несовместны при т 0 п. ► Воспользуемся этой леммой в следующей конструкции. Фиксируем q > 1 и возьмем произвольное положительное число z 6 R. По лемме найдем единственное число р G Z такое, что qp^x<qp+1. (1) Определение 10. Число р, удовлетворяющее соотношению (1), назы- вается порядком числа х по основанию q или (при фиксированном q) просто порядком числа х. По принципу Архимеда найдем единственное натуральное число ар Е N такое, что apqp х < apqp 4- qp. (2) Учитывая (1), можно утверждать, что Е {1, ..., q — 1}. Все дальнейшие шаги нашего построения будут повторять тот шаг, кото- рый мы сейчас сделаем, исходя из соотношения (2). Из соотношения (2) и принципа Архимеда следует, что существует и при- том единственное число ap-i € {0,1, ..., q — 1} такое, что apqp 4- ap_i9p_1 < х < apqp 4- ap-iqp~x 4- qp~x. (3) Если уже сделано п таких шагов и получено, что aPqp 4- ap-i<7p-1 4-... 4- ap_nqp~n < ^х < apqp 4- ар_19р-1 4- ... 4- ap_nqp~n 4- qp~n, то по принципу Архимеда найдется единственное число ap_n_i € {0,1, ... ..., q — 1} такое, что apqp 4-... 4- ap_nqp~n 4- ap_n-igp_n-1 < < х < apqp 4-... 4- ap_nqp~n 4- ap_n-i9p_n-1 4- qp~n~x. Таким образом, указан алгоритм, по которому положительному числу х однозначно ставится в соответствие последовательность чисел ар, ap-i, ...
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 61 ..., ар-п, ... из множества {0,1,..., q — 1} или, менее формально, последова- тельность рациональных чисел гп специального вида: гп = apqp + ... + ap_nqp~n, (4) причем так, что Иными словами, мы строим всё лучшие приближения снизу и сверху для числа х посредством специальной последовательности рациональных чисел (4). Символ ар ... ар-п • • • есть шифр всей последовательности {гп}. Чтобы по нему можно было восстановить последовательность {гп}, необходимо как-то отметить величину р — порядок числа х. Условились при р 0 после ао ставить точку или запятую; при р < О слева от ар дописывать |р| нулей и после крайнего левого ставить точку или запятую (напомним, что ар 0 0). Например, при q = 10 123,45 := 1 • 102 + 2 • 101 + 3 • 10° + 4 • 10-1 + 5 • 10~2, 0,00123 := 1 • 10“3 + 2 • 10"4 4- 3 • 1(Г5; при g = 2 1000,001 := 1 • 23 + 1 • 2-3. Таким образом, значение цифры в символе ар ... ар_п ... зависит от пози- ции, которую она занимает по отношению к точке или запятой. После этого соглашения символ ар ... ао,... позволяет однозначно восста- новить всю последовательность приближений. Из неравенств (5) видно (проверьте!), что двум различным числам х, х' от- вечают различные последовательности {гп}, {г^}, а значит, и разные символы otp ... otQ,..., dtp ... Qg, • . Теперь решим вопрос, всякому ли символу вида ар ... ао, • • • отвечает не- которое число ж Е R. Оказывается, нет. Заметим, что в силу описанного алгоритма последовательного получения чисел ар-п Е {0,1, ..., q — 1} не может случиться так, что все они, начиная с некоторого, будут одинаковы и равны q — 1. Действительно, если при п > к гп = apqp 4-... + ap-kqp~k 4- (g - l)gp-fc-1 + ... + (g - l)gp-n, t. e. , 1 1 rn = Tk 4- -T--------, (6) qk-p qn-p' A ’ то в силу (5) 1 1 / 1 Tk qk~P qn~P "" X Гк qk~p"
62 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Тогда для любого п > к п . 1 1 О < г к Ч—т---х < -----, qk р дП р что, как мы знаем из доказанной выше леммы, невозможно. Полезно также отметить, что если среди чисел ..., ар-п хотя бы одно меньше q — 1, то вместо (6) можно написать, что 1 1 гп < гк Ч" . _ п—» qK р qn р или, что то же самое, Гп + < Гк + qn р qK р Теперь мы в состоянии доказать, что любой символ ап ... оо, • • •, соста- вленный из чисел {0, — 1}, в котором как угодно далеко встреча- ются числа, отличные от q — 1, соответствует некоторому числу х 0. В самом деле, по символу ар ... ар-п ... построим последовательность {гп} вида (4). В силу того, что го П гп , а также учитывая (6) и (7), имеем го SC... s:r» + ^ + (8) Знак строгого неравенства в последнем соотношении следует понимать так: любой элемент левой последовательности меньше любого элемента правой последовательности. Это вытекает из (7). Если теперь взять х = sup rn (= inf (rn + q~^n~p^), то последовательность n6N neN гп будет удовлетворять условиям (4), (5), т. е. символ ар ... ар-п ... отвечает найденному числу х € R. Итак, каждому положительному числу х € К мы взаимно однозначно со- поставили символ вида ар ... «о» • •, если р 0, или 0,0... 0 ар ..., если р < 0. |р| нулей Он называется q-ичной позиционной записью числа ж; цифры, входящие в сим- вол, называют знаками] позиции знаков относительно запятой называются разрядами. Числу х < 0 условимся сопоставлять взятый со знаком минус символ поло- жительного числа —х. Наконец, числу 0 отнесем символ 0,0 ... 0 ... Тем самым завершено построение позиционной q-ичной системы записи действительных чисел. Наиболее употребительными являются десятичная система (в обиходе) и по техническим причинам двоичная (в электронных вычислительных машинах).
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 63 Менее распространены, но также используются в элементах вычислительной техники троичная и восьмеричная системы. Формулы (4), (5) показывают, что если в g-ичной записи числа х оставить только конечное число знаков (или, если угодно, заменить остальные знаки нулями), то абсолютная погрешность получающегося при этом приближения (4) числа х не превысит единицы последнего сохраняемого разряда. Это наблюдение позволяет в соответствии с полученными в подпункте b формулами оценивать погрешности, возникающие при арифметических опе- рациях над числами в результате замены точных значений чисел соответству- ющими приближенными значениями вида (4). Последнее замечание имеет также определенную теоретическую ценность. А именно, если в соответствии с идеей подпункта b мы отождествим веще- ственное число х с его q-ичной записью, то, научившись выполнять арифме- тические действия непосредственно над q-ичными символами, мы построим новую модель действительных чисел, по-видимому, наиболее ценную с вычи- слительной точки зрения. Основные задачи, которые пришлось бы решать на этом пути, таковы. Надо двум g-ичным символам поставить в соответствие новый символ — сумму исходных. Он, естественно, строится постепенно, а именно, складывая все более точные рациональные приближения исходных чисел, будем получать соответствующие рациональные приближения их суммы. Пользуясь сделан- ным выше замечанием, можно показать, что по мере увеличения точности приближений слагаемых мы будем получать все больше таких g-ичных знаков суммы, которые уже не меняются при последующем уточнении приближений. Тот же вопрос надо решать и относительно умножения. Другой, менее конструктивный путь перехода от рациональных чисел ко всем действительным числам принадлежит Дедекинду. Дедекинд отождествляет действительное число с сечением в множестве Q рациональных чисел, т. е. с разбиением Q на два не имеющих общих элементов множества А, В таких, что Va 6 А V& Е В (а < Ъ). При таком подходе к действительным числам принятая нами аксиома полноты (непрерывности) становится известной теоремой Дедекинда. По этой причине аксиому полноты в принятой нами форме часто называют аксиомой Дедекинда. Итак, в настоящем параграфе выделены важнейшие классы чисел. Показа- на фундаментальная роль натуральных и рациональных чисел. Показано, как из принятой нами аксиоматики1) вытекают основные свойства этих чисел. Дано представление о различных моделях множества действительных чисел. Обсуждены вычислительные аспекты теории действительных чисел: оценки погрешностей при арифметических операциях с приближенными величинами; g-ичная позиционная система счисления. Почти в приведенном выше виде она была сформулирована на рубеже XX века Гиль- бертом; см., например, в кн.: Гильберт Д. Основания геометрии. М.: Гостехиздат, 1948. (Добавление VI: О понятии числа.)
64 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Задачи и упражнения 1. Опираясь на принцип индукции, покажите, что а) сумма Xi 4-... 4-zn вещественных чисел определена независимо от расстановки скобок, предписывающих порядок сложения; Ь) то же для произведения xi... хп; с) |xi + ... + хп| |xi| + |хп|; d) |xi ... хп| = |xi|... |я?п|; е) ((m, n е N) А (тп < n)) => ((n — т) Е N); f) (1 + x)n 1 4- пх при I > -1 и n € N, причем равенство возможно либо при п = 1, либо при х = 0 (неравенство Бернулли)] g) (а + Ь)п = ап 4- £ ап~гЬ 4- ап~2Ь2 4-... 4- ^(w --2- аЬп~г 4- Ьп 1! 2! (п — 1)! (бином Ньютона). 2. а) Проверьте, что Z и Q- индуктивные множества. Ь) Приведите примеры индуктивных множеств, отличных от N, Z, Q, R. 3. Покажите, что любое индуктивное множество не ограничено сверху. 4. а) Любое индуктивное множество бесконечно (т. е. равномощно своему под- множеству, отличному от него самого). Ь) Множество Еп = {х Е N| х < п} конечно (card2?n обозначают через п). 5. а) Алгоритм Евклида. Пусть m, п Е N и т > п. Наибольший общий делитель (НОД (т, п) = d G N) можно за конечное число шагов найти, пользуясь следующим алгоритмом Евклида последовательного деления с остатком: т = qin 4- Г1 (и < п), П = Q2T1 4- г2 (гг < п), П = дзг2 4- гз (гз < г2), гь-1 = qk+irk 4- О, и d = г к- Ь) Если d = НОД (т, п), то можно подобрать числа р, q Е Z так, что pm+qn = d; в частности, если т, п взаимно просты, то рт 4- qn — 1. 6. Попробуйте самостоятельно доказать основную теорему арифметики (форму- лировка в тексте § 2, п. 2а). 7. Если произведение т п натуральных чисел делится на простое число р, т. е. т • п = р • к, где к Е N, то либо т, либо п делится на р. 8. Из основной теоремы арифметики следует, что множество простых чисел бес- конечно. 9. Покажите, что если натуральное число п не имеет вида к™, где А:, т Е N, то уравнение хт = п не имеет рациональных корней. 10. Покажите, что запись рационального числа в любой д-ичной системе счисле- ния периодична, т. е., начиная с некоторого разряда, состоит из периодически по- вторяющейся группы цифр.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 65 11. Иррациональное число а € R назовем хорошо приближаемым рациональными числами, если для любых натуральных чисел n, N € N существует рациональное чи- Р Р 1 ело - такое, что а--< -----. q q Nqn а) Постройте пример хорошо приближаемого иррационального числа. Ь) Докажите, что хорошо приближаемое иррациональное число не может быть алгебраическим, т. е. оно трансцендентно (теорема ЛиувилляУ*). 12. Зная, что по определению дроби — := т п~\ где т € Z, п 6 N, вывести «правила» сложения, умножения, деления дробей, а также условие равенства двух дробей. 13. Проверьте, что рациональные числа Q удовлетворяют всем аксиомам дейст- вительных чисел, кроме аксиомы полноты. 14. Принимая геометрическую модель множества действительных чисел — чи- словую ось, покажите, как в этой модели строить числа a + b, a — b, ab, 15. а) Проиллюстрируйте аксиому полноты на числовой оси. Ь) Докажите, что принцип верхней грани эквивалентен аксиоме полноты. 16. а) Если А С В С R, то sup А sup В, a inf А inf В. Ь) Пусть R D X / 0 к RjY 0. Если Vx G X и Vy G У выполнено х у, то X ограничено сверху, Y — снизу и sup X inf У. с) Если множества X, У из Ь) таковы, что X U У = R, то sup X = inf У. d) Если X, У — множества, определенные в с), то либо 3 max X, либо ЗттУ (теорема Дедекинда). е) (Продолжение.) Покажите, что теорема Дедекинда эквивалентна аксиоме пол- ноты. 17. Пусть А 4- В — множество чисел вида а + Ь и АВ — множество чисел вида а Ьу где а € А С R и b € В С R. Проверьте, всегда ли a) sup (А + В) = sup А 4- sup В, b) sup (А В) = sup А • sup В. 18. Пусть —А есть множество чисел вида —а, где a 6 А С R. Покажите, что sup (—А) = — inf А. 19. а) Покажите, что уравнение хп = а при п € N и а > 0 имеет положительный корень (обозначаемый у/a или а1у/п). Ь) Проверьте, что при а > 0, 6 > 0 и п,тп € N с) (а1/п)т = (ат)1/п =: ат/п и а1/п а1/171 = а1/п+1/т. d) (а™/п)-1 = (а-1)т/п =: а"т/п. е) Покажите, что для любых и, € Q аГ1 аГ2 = аг'+г2 и (аГ1)Г2 = аГ1Г2. ^Ж. Лиувилль (1809 — 1882) — французский математик; работы по комплексному ана- лизу, геометрии, дифференциальным уравнениям, теории чисел, механике.
66 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА 20. а) Покажите, что отношение включения есть отношение частичной (но не полной!) упорядоченности множеств. Ь) Пусть А, В, С — такие множества, что А С С, В С С, А\В 0 и В\А 0. Частичный порядок в этой тройке введем, как в а). Укажите максимальный и мини- мальные элементы множества {А, В, (7}. (Обратите внимание на неединственность!) 21. а) Покажите, что так же, как и множество Q рациональных чисел, множество Q(^/n) чисел вида а 4- by/п, где a, b 6 Q, ап — фиксированное натуральное число, не являющееся квадратом целого числа, есть упорядоченное поле, удовлетворяющее принципу Архимеда, но не удовлетворяющее аксиоме полноты. Ь) Проверьте, Какие из аксиом действительных чисел не будут удовлетворяться для Q(y/n)y если в Q(\/n) оставить прежние арифметические операции, а отношение порядка ввести по правилу (а + by/п а' 4- Ь'у/п) := ((Ь b') V ((Ь = Ь') А (а а'))). Будет ли тогда для Q(>/n) выполнен принцип Архимеда? с) Упорядочите множество Р[х] многочленов с рациональными или действитель- ными коэффициентами, считая Pm(z) = ао 4- aix 4-... 4- агпхт’ >- 0, если ат > 0. d) Покажите, что множество Q(x) всех рациональных дробей ао 4- aix 4-... 4- amxm bo 4- fax 4-... 4- bnxn с коэффициентами из Q или из R после введения в нем порядка Rm,n > 0, если Um bn > 0, и обычных арифметических операций становится упорядоченным, но не архимедовым полем. Это означает, что принцип Архимеда не может быть выведен из аксиом R, минуя аксиому полноты. 22. Пусть п Е N и п > 1. В множестве Еп = {0,1, ..., п} определим сумму и про- изведение элементов как остаток от деления на п «обычной» суммы и произведения этих чисел в R. Множество Еп с так определенными в нем операциями обозначают символом Zn- а) Покажите, что если п не простое число, то в Zn есть такие отличные от нуля числа т, к, что т к = 0. (Такие числа называются делителями нуля.) Это значит, что из а • b = с • b даже при b 0 в Zn не следует, что а = с. Ь) Покажите, что при простом р в Zp отсутствуют делители нуля и Zp есть поле. с) Покажите, что ни при каком простом р поле Zp нельзя упорядочить так, чтобы этот порядок был согласован с арифметическими операциями Zp. 23. Покажите, что если R и R' - две модели множества действительных чисел, a f: R —> R' — такое отображение, что f(x 4- у) = f(x) 4- f(y) и f(x у) = f(x) f(y) для любых х, у G R, то: а) /(0) = О'; b) /(1) = 1', если f(x) О', что мы дальше будем считать выполненным; с) f(m) — т', где т Е Z и т' 6 Z', причем отображение f : Z —> Z' биективно и сохраняет порядок; d) гДе mi п £ Z, n^O, т', п' 6 Z', n'^0', /(m) = m', f(n) = п'. Таким образом, f : Q —> Q' есть сохраняющая порядок биекция. е) f : R —> R' есть биективное, сохраняющее порядок отображение.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 67 24. Опираясь на предыдущую задачу и аксиому полноты, покажите, что акси- оматика множества действительных чисел определяет его полностью с точностью до изоморфизма (до способа реализации), т. е. что если R и R' — два множества, удовлетворяющие аксиоматике, то существует взаимно однозначное отображение /: R —>• R', сохраняющее арифметические операции и порядок: f(x + y) = /(x) + /(j/), /(х • у) = f(x) • f(y) и (х у) & (f(x) f(y)). 25. В ЭВМ число х представляется в виде — мантисса числа х (- М < Я <7 к где р — порядок х, а М = 52 п=1 При этом машина оперирует только с определенным диапазоном чисел: при q = 2 обычно |р| 64, а к = 35. Оцените этот диапазон в десятичной системе. 26. а) Напишите таблицу умножения (размера 6x6) для шестеричной системы счисления. Ь) Пользуясь результатом задачи а), перемножьте «столбиком» в шестеричной системе (532)в (145)6 и проверьте свои действия, повторив вычисления в десятичной системе. с) Поделите «уголком» (1301)6|(25)6 и проверьте свои действия, повторив вычисления в десятичной системе. d) Проведите сложение «столбиком» (4052)б + (3125)6 27. Запишите (100) ю в двоичной и троичной системах. 28. а) Покажите, что наряду с единственностью записи целого числа в виде (0tn0tn-l • • • «0)3, где оц G {0,1,2}, возможна и также единственна его запись в виде (Pn/3n-i .. • Х?о)з, где /3 е {-1,0,1}. Ь) Каково наибольшее число монет, из которых тремя взвешиваниями на чашеч- ных весах можно выделить одну фальшивую, если известно только, что она отлича- ется от остальных монет по весу? 29. Какое наименьшее количество вопросов с ответами «да» или «нет» надо за- дать, чтобы узнать любой из семизначных телефонных номеров? 30. а) Сколько различных чисел можно задать с помощью 20 десятичных знаков (например, два разряда по 10 возможных знаков в каждом)? Тот же вопрос для двоичной системы. В пользу экономичности какой из этих систем говорит сравнение результатов?
68 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Ь) Оцените количество различных чисел, которые можно записать, располагая п знаками g-ичной системы. (Ответ: qn^q.) с) Нарисуйте график функции /(х) = хп^х над множеством натуральных значе- ний аргумента и сравните экономичность различных систем счисления. § 3. Основные леммы, связанные с полнотой множества действительных чисел Здесь мы установим несколько простых полезных принципов, каждый из ко- торых можно было бы положить в основу построения теории вещественных чисел в качестве аксиомы полноты1). Эти принципы мы назвали основными леммами в соответствии с их широ- ким использованием во всевозможных доказательствах теорем анализа. 1. Лемма о вложенных отрезках (принцип Коши — Кантора) Определение 1. Функцию f : N -> X натурального аргумента на- зывают последовательностью или, полнее, последовательностью элементов множества X. Значение /(п) функции /, соответствующее числу п € N, ч&сто обозна- чают через хп и называют n-м членом последовательности. Определение 2. Пусть Xi, Х2, ... , Хп, ... — последовательность каких-то множеств. Если D Х2 D ... D Хп D ..., т. е. Vn Е N (Хп Z) D Хп+1), то говорят, что имеется последовательность рлодюенных множеств. Лемма (Коши —Кантор). Для любой последовательности Ц Э I2 D ... ... D In D ... вложенных отрезков найдется точка с € К, принадлежащая всем этим отрезкам. Если, кроме того, известно, что для любого е > 0 в последовательности можно найти отрезок Z*, длина которого |Д| < е, то с — единственная общая точка всех отрезков. ◄ Заметим прежде всего, для любых двух отрезков Im = [em,6m], 1п = = [ап, &п] нашей последовательности имеет место ат Ьп. Действительно, в противном случае мы получили бы ап Ьп < ат Ьт, т. е. отрезки 1т, 1п не имели бы общих точек, в то время как один из них (имеющий больший номер) должен содержаться в другом. Таким образом, для числовых множеств А = {ат | т е N}, В = {bn | n € N} выполнены условия аксиомы полноты, в силу которой найдется число с Е Ж такое, что € A, Vbn Е В выполнено ат с Ьп. В частности, ап с Ьп для любого n Е N. Но это и означает, что точка с принадлежит всем отрезкам 1п. 1^См. задачу 4 в конце параграфа.
§ 3. ОСНОВНЫЕ ЛЕММЫ, СВЯЗАННЫЕ С ПОЛНОТОЙ R 69 Пусть теперь ci и сг — две точки, обладающие этим свойством. Если они различны и, например, ci < С2, то при любом n G N имеем ап ci < < С2 Ъп, поэтому 0 < С2 — Ci < Ьп — ап и длина каждого отрезка нашей последовательности не может быть меньше положительной величины С2 — Ci. Значит, если в последовательности есть отрезки сколь угодно малой длины, то общая точка у них единственная. ► 2. Лемма о конечном покрытии (принцип Бореля-Лебега) Определение 3. Говорят, что система S — {X} множеств X покрыва- ет множество У, если Ус |J X, (т. е. если любой элемент у множества У xes содержится по крайней мере в одном из множеств X системы S). Подмножество множества S = {X}, являющегося системой множеств, бу- дем называть подсистемой системы S. Таким образом, подсистема системы множеств сама является системой множеств того же типа. Лемма (Борель—Лебег1)). В любой системе интервалов, покрывающей отрезок, имеется конечная подсистема, покрывающая этот отрезок. ◄ Пусть S = {U} — система интервалов U, покрывающая отрезок [а, 6] = = Д. Если бы отрезок Д не допускал покрытия конечным набором интервалов системы S, то, поделив Д пополам, мы получили бы, что по крайней мере одна из его половинок, которую мы обозначим через Д > тоже не допускает конеч- ного покрытия. С отрезком Д проделаем ту же процедуру деления пополам, получим отрезок Д и т. д. Таким образом, возникает последовательность /i D Д D ... D/n D ... вло- женных отрезков, не допускающих конечного покрытия интервалами систе- мы S. Поскольку длина отрезка, полученного на n-м шаге, по построению равна |/п| = |Д| • 2-п, то в последовательности {/п} есть отрезки сколь угод- но малой длины (см. лемму из § 2, п. 4с). По лемме о вложенных отрезках существует точка с, принадлежащая всем отрезкам In, п € N. Поскольку с € Д = [а, Ь], то найдется интервал ]а,/3[ = U € S системы S, содержащий точку с, т. е. а < с < (3. Пусть е = min {с — а, (3 — с}. Найдем в постро- енной последовательности такой отрезок 1п, что |/п| < е. Поскольку с € 1п и |/п| < е, заключаем, что In С U = ]а, /3[. Но это противоречит тому, что отрезок 1п нельзя покрыть конечным набором интервалов системы. ► 3. Лемма о предельной точке (принцип Больцано-Вейерштрасса). Напомним, что окрестностью точки х Е К. мы назвали интервал, содержащий эту точку; 5-окрестностью точки х — интервал ]я — 5, х + 5[. Определение 4. Точка р е R называется предельной точкой множе- ства X С R, если любая окрестность этой точки содержит бесконечное под- множество множества X. 1^Э. Борель (1871 — 1956), А. Лебег (1875 — 1941) — известные французские математики, специалисты в области теории функций.
70 ГЛ. П. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Это условие, очевидно, равносильно тому, что в любой окрестности точ- ки р есть по крайней мере одна не совпадающая с р точка множества X. (Проверьте!) Приведем несколько примеров. Г 1 I п Если X = 0 G BL е R n е N то предельной для X является только точка Для интервала ]а, 6[ предельной является каждая точка отрезка [а, 6], и других предельных точек в этом случае нет. Для множества Q рациональных чисел предельной является каждая точ- ка R, ибо, как мы знаем, в любом интервале вещественных чисел имеются рациональные числа. Лемма (Больцано —Вейерштрасс1)). Всякое бесконечное ограниченное числовое множество имеет по крайней мере одну предельную точку. ◄ Пусть X — данное подмножество R. Из определения ограниченности множества X следует, что X содержится в некотором отрезке [о,&] = / С Ж. Покажем, что по крайней мере одна из точек отрезка I является предельной для X. Если бы это было не так, то каждая точка х Е I имела бы окрестность U (х), в которой либо вообще нет точек множества X, либо их там конечное число. Совокупность {U(ж)} таких окрестностей, построенных для каждой точки х Е I, образует покрытие отрезка I интервалами U(я), из которого по лемме о конечном покрытии можно извлечь конечную систему С7(а?1), ..., U(xn) интервалов, покрывающую отрезок I. Но, поскольку X С /, эта же си- стема покрывает все множество X. Однако в каждом интервале U(xr) только конечное число точек множества X, значит, и в их объединении тоже конеч- ное число точек X, т. е. X — конечное множество. Полученное противоречие завершает доказательство. ► Задачи и упражнения 1. Покажите, что а) если I — произвольная система вложенных отрезков, то sup {а € R | [а, 6] G 7} = — а (3 = inf{6 G R| [а,Ь] Е 1} и [а,/?] = П [а,Ь]; [а,6]е/ Ь) если I — система вложенных интервалов ]а, 6[, то пересечение Q ]а, может оказаться пустым. ]«.ь[е/ Указание: ]ап,Ьп[ = 2. Покажите, что а) из системы отрезков, покрывающей отрезок, не всегда можно выделить ко- нечную подсистему, покрывающую этот отрезок; 0,- ’. п ^Б. Больцано (1781 — 1848) — чешский математик и философ; К. Вейерштрасс (1815 — 1897) — немецкий математик, уделявший большое внимание логическому обоснованию ма- тематического анализа.
§ 4. СЧЕТНЫЕ И НЕСЧЕТНЫЕ МНОЖЕСТВА 71 Ь) из системы интервалов, покрывающей интервал, не всегда можно выделить конечную подсистему, покрывающую этот интервал; с) из системы отрезков, покрывающей интервал, не всегда можно выделить ко- нечную подсистему, покрывающую этот интервал. 3. Покажите, что если вместо полного множества R всех вещественных чисел взять только множество Q рациональных чисел, а под отрезком, интервалом и окрестностью точки г € Q понимать соответствующие подмножества Q, то ни одна из доказанных выше трех основных лемм не останется в силе. 4. Покажите, что если в качестве аксиомы полноты множества действительных чисел взять а) принцип Больцано — Вейерштрасса или Ь) принцип Бореля — Лебега, то получится равносильная прежней система аксиом R. Указание. Из а) следует принцип Архимеда и аксиома полноты в прежней форме. с) Замена аксиомы полноты принципом Коши — Кантора приводит к системе аксиом, которая становится равносильной исходной, если кроме принципа Коши — Кантора постулировать также принцип Архимеда (см. задачу 21 предыдущего па- раграфа) . § 4. Счетные и несчетные множества Сейчас мы сделаем небольшое, полезное для дальнейшего добавление к тем сведениям о множествах, которые уже были изложены в главе I. 1. Счетные множества Определение 1. Множество X называется счетным, если оно равно- мощно множеству N натуральных чисел, т. е. cardX = cardN. Утверждение, а) Бесконечное подмножество счетного множества счетно. Ь) Объединение множеств конечной или счетной системы счетных мно- жество есть множество счетное. ◄ а) Достаточно проверить, что всякое бесконечное подмножество Е мно- жества N натуральных чисел равномощно N. Нужное биективное отображение f : N -4 Е построим следующим образом. В Ei := Е имеется минимальный элемент, который мы сопоставим числу 1 Е N и обозначим ei £ Е. Мно- жество Е бесконечно, поэтому Е2 := Е \ ei непусто. Минимальный элемент множества Е% сопоставим числу 2 и назовем его 62 G Е2. Затем рассмотрим Е3 := E\{ei, 62} и т. д. Поскольку Е — бесконечное множество, то построение не может оборваться ни на каком шаге с номером n Е N, и, как следует из принципа индукции, таким способом каждому числу n Е N будет сопоставле- но некоторое число еп € Е. Построенное отображение f: N -4 Е, очевидно, инъективно.
72 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Остается проверить его сюръективность, т. е. что /(N) = Е. Пусть е £ Е. Множество {n € N | п е} конечно, и тем более конечно его подмножество {п £ Е | п е}. Пусть k — число элементов в последнем множестве. Тогда по построению е = е*. Ь) Если Xi, ..., Хп, ... — счетная система множеств, причем каждое мно- жество Хт = , ..., х^, ... } само счетно, то поскольку мощность множе- ства X = |J Хп, состоящего из элементов где т, п Е N, не меньше мощ- ности каждого из множеств Хт, то X — бесконечное множество. Элемент х^ £ Хт можно отождествить с задающей его упорядоченной парой (тп,п) натуральных чисел. Тогда мощность X не больше мощности множества та- ких упорядоченных пар. Но отображение f: N х N -> N, задаваемое формулой , ч (тп + п)(тп + п +1) , (тп, п) ।—> 2------------- + т, как легко проверить, биективно (оно име- ет наглядный смысл: мы нумеруем точки плоскости с координатами (тп,п), последовательно переходя от точек одной диагонали, где т + п постоянно, к точкам следующей, где эта сумма на 1 больше). Таким образом, множество упорядоченных пар (тп, п) натуральных чисел счетно. Но тогда card X card N и, поскольку X — бесконечное множество, на основании доказанного в а) заключаем, что cardX = cardN. ► Из доказанного утверждения следует, что любое подмножество счетного множества либо конечно, либо счетно. Если про множество известно, что оно либо конечно, либо счетно, то говорят, что оно не более чем счетно (равно- сильная запись: cardX cardN). Мы можем, в частности, утверждать теперь, что объединение не более чем счетного семейства не более чем счетных множеств само не более чем счетно. Следствия. 1) cardZ = cardN. 2) cardN2 = cardN. Этот результат означает, что прямое произведение счетных множеств счетно. 3) cardQ = cardN, т. е. множество рациональных чисел счетно. ◄ Рациональное число — задается упорядоченной парой (тп,п) целых чисел. Две пары (m,n), (т', п') задают одно и то же рациональное число в том и только в том случае, когда они пропорциональны. Таким^рбразом, выби- рая каждый раз для записи рационального числа единственную пару (тп, п) с минимальным возможным натуральным знаменателем п £ N, мы получим/ что множество Q равномощно некоторому бесконечному подмножеству мно- жества ZxZ. Но cardZ2 = cardN и, значит, cardQ = cardN. ►
§ 4. СЧЕТНЫЕ И НЕСЧЕТНЫЕ МНОЖЕСТВА 73 4) Множество алгебраических чисел счетно. ◄ Заметим сначала, что из равенства cardQ х Q = cardN по индукции получаем, что для любого k € N выполнено cardQ* = cardN. Элемент г € Q* есть упорядоченный набор (ri, ..., г*) к рациональных чисел. Алгебраическое уравнение степени к с рациональными коэффициентами можно записать в приведенном виде хк -I- г^хк~1 +.. . + гк =0, где коэффици- ент при старшей степени равен 1. Таким образом, различных алгебраических уравнений степени к столько же, сколько различных упорядоченных наборов (ri, ..., г к) рациональных чисел, т. е. счетное множество. Алгебраических уравнений с рациональными коэффициентами (произволь- ных степеней) тоже счетное множество как счетное объединение (по степе- ням) счетных множеств. У каждого такого уравнения лишь конечное число корней, значит, множество алгебраических чисел не более чем счетно. Но оно бесконечно и, значит, счетно. ► 2. Мощность континуума Определение 2. Множество Ж действительных чисел называют также числовым континуумом1^, а его мощность — мощностью континуума. Теорема (Кантор). card N < card К. Теорема утверждает, что бесконечное множество К. имеет мощность боль- шую, чем бесконечное множество N. ◄ Покажем, что уже множество точек отрезка [0,1] несчетно. Предположим, что оно счетно, т. е. может быть записано в виде после- довательности xi, х2, •. •, хп, ... Возьмем точку a?i и на отрезке [0,1] = /0 фиксируем отрезок ненулевой длины, не содержащий точку a?i. В отрезке /1 строим отрезок 12, не содержащий х2, и если уже построен отрезок 1п, то, поскольку |/п| > 0, в нем строим отрезок In+i так, что xn+i In+i и | /п+11 > 0. По лемме о вложенных отрезках найдется точка с, принадлежащая всем отрезкам /о, Д, ..., /п, ... Но эта точка отрезка Iq = [0,1] по построе- нию не может совпадать ни с одной из точек последовательности xj, х2, ..., ► Следствия. 1) Q0K и существуют иррациональные числа. 2) Существуют трансцендентные числа, поскольку множество алгебра- ических чисел счетно. (После решения задачи 3, помещенной в конце параграфа, читатель, навер- ное, захочет переиначить последнее утверждение и сформулировать его так: «В множестве действительных чисел иногда встречаются также и алгебраи- ческие числа».) Continuum (лат.) — непрерывное, сплошное.
74 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Уже на заре теории множеств возник вопрос о том, существуют ли мно- жества промежуточной мощности между счетными множествами и множе- ствами мощности континуума, и было высказано предположение, называемое гипотезой континуума, что промежуточные мощности отсутствуют. Вопрос оказался глубоко затрагивающим основания математики. Он был окончательно решен в 1963 г. современным американским математиком П. Ко- эном. Коэн доказал неразрешимость гипотезы континуума, показав, что и она сама, и ее отрицание порознь не противоречат принятой в теории множеств аксиоматике, а потому гипотеза континуума не может быть ни доказана, ни опровергнута в рамках этой аксиоматики,— ситуация, вполне аналогичная не- зависимости пятого постулата Евклида о параллельных от остальных аксиом геометрии. Задачи и упражнения 1. Покажите, что множество всех действительных чисел равномощно множеству точек интервала ]—1,1[. 2. Установите непосредственно взаимно однозначное соответствие между а) точками двух интервалов; Ь) точками двух отрезков; с) точками отрезка и интервала; d) точками отрезка [0,1] и множеством R. 3. Покажите, что а) любое бесконечное множество содержит счетное подмножество; Ь) множество четных чисел равномощно множеству всех натуральных чисел; с) объединение бесконечного множества и не более чем счетного множества име- ет ту же мощность, что и исходное бесконечное множество; d) множество иррациональных чисел имеет мощность континуума; е) множество трансцендентных чисел имеет мощность континуума. 4. Покажите, что а) множество {ni < П2 < ...} возрастающих последовательностей натуральных чисел равномощно множеству дробей вида 0, ацаг • • •; Ь) множество всех подмножеств счетного множества имеет мощность конти- нуума. 5. Покажите, что а) множество Р(Х) подмножеств множества X равномощно множеству всех функций на X со значениями 0,1, т. е. множеству отображений f : X -> {0,1); Ь) для конечного множества X из п элементов cardP(X) = 2П; с) учитывая результаты задач 4Ь) и 5а), можно писать, что cardP(X) = 2cardx и, в частности, cardP(N) = 2cardN = cardR; d) для любого множества X caxdX < 2cardx) в частности, п < 2п при любом п € N. Указание. См. теорему Кантора в п. 1 § 4, гл. I.
§ 4. СЧЕТНЫЕ И НЕСЧЕТНЫЕ МНОЖЕСТВА 75 6. Пусть Xi, ..., Хт — конечная система конечных множеств. Покажите, что card ( (J Xi j = 52 card Хгг — 52 card (Х^ П Xi2) + t—1 Ч Ч<*2 + 52 card (Х,ПХ<2П-Х|з)-... 4- (-1)171-1 card (Xi П ... ПХте), *1 <»2<‘3 причем суммирование ведется по всевозможным наборам индексов в пределах 1, ... ..., тп, удовлетворяющих указанным под знаком суммы неравенствам. 7. На отрезке [0,1] С R изобразите множество чисел х Е [0,1], троичная запись которых х = 0, ацаг с*з • • , где а, Е {0,1,2}, обладает свойством: a) ai # 1; b) (qi # 1) Л (а2 / 1); с) Vi Е N (ctj 1) (канторов о множество). 8. (Продолжение задачи 7.) Покажите, что а) множество тех чисел х Е [0,1], троичная запись которых не содержит 1, равно- мощно множеству всех чисел, двоичное представление которых имеет вид 0, /3102 • • •; Ь) канторово множество равномощно множеству всех точек отрезка [0,1].
ГЛАВА III ПРЕДЕЛ Обсуждая различные стороны понятия действительного числа, мы, в частно- сти, отметили, что при измерении реальных физических величин получаются последовательности их приближенных значений, с которыми затем и прихо- дится работать. Такое положение дел немедленно вызывает по крайней мере три следующих вопроса: 1) Какое отношение имеет полученная последовательность приближений к измеряемой величине? Мы имеем в виду математическую сторону дела, т. е. мы хотим получить точную запись того, что вообще означает выражение «последовательность приближенных значений» и в какой мере такая последо- вательность описывает значение величины; однозначно ли это описание или одна и та же последовательность может отвечать разным значениям измеря- емой величины. 2) Как связаны операции над приближенными значениями величин с теми же операциями над их точными значениями и чем характеризуются те опера- ции, при выполнении которых допустима подмена точных значений величий приближенными? 3) Как по-самой последовательности чисел определить, может ли она быть последовательностью сколь угодно точных приближений значения некоторой величины? Ответом на эти и близкие к ним вопросы служит понятие предела функ- ции — одно из основных понятий анализа. Изложение теории предела мы начнем с рассмотрения предела функций на- турального аргумента (последовательностей) ввиду уже выяснившейся фун- даментальной роли этих функций и потому, что на самом деле все основные факты теории предела отчетливо видны уже в этой простейшей ситуации.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 77 § 1. Предел последовательности 1. Определения и примеры. Напомним следующее Определение 1. Функция f: N -> X, областью определения которой является множество натуральных чисел, называется последовательностью. Значения /(п) функции / называются членами последовательности. Их принято обозначать символом элемента того множества, в которое идет ото- бражение, наделяя символ соответствующим индексом аргумента, хп := /(п). Саму последовательность в связи с этим обозначают символом {zn}, а также записывают в виде ®i, а?2, ..., а?п, • • и называют последовательностью в X или последовательностью элементов множества X. Элемент хп называется п-м членом последовательности. Всюду дальше в ближайших параграфах будут рассматриваться только последовательности f: N -> R действительных чисел. Определение 2. Число А 6 R называется пределом числовой после- довательности {я7п}, если для любой окрестности У(А) точки А существует такой номер N (выбираемый в зависимости от У(А)), что все члены последо- вательности, номера которых больше N, содержатся в указанной окрестности точки А. Ниже мы приведем формально-логическую запись этого определения, но прежде укажем другую распространенную формулировку определения преде- ла числовой последовательности: Число A G R называется пределом последовательности {атп}, если для любого е > 0 существует номер N такой, что при всех п > N имеем |а?п - А| < £. Эквивалентность этих формулировок легко проверить (проверьте!), ес- ли заметить, что в любой окрестности V(А) точки А содержится некоторая б-окрестность этой же точки. Последняя формулировка определения предела означает, что, какую бы точность е > 0 мы ни задали, найдется номер N такой, что абсолютная по- грешность приближения числа А членами последовательности {шп} меньше чем 5, как только п > N. Запишем теперь приведенные формулировки определения предела в логи- ческой символике, договорившись, что запись « lim хп = А» означает, что п—>оо А — предел последовательности {яп}. Итак, lim хп = А := VV(A) 3N е N Vn > N (хп € V(A)) n—>oo и соответственно lim xn = A := Ve > 0 3N e N Vn > N (|Жп - Al < e). n—>oo
78 ГЛ. III. ПРЕДЕЛ Определение 3. Если lim хп = А, то говорят, что последовательность п—>оо {тп} сходится к А или стремится к А и пишут хп —> А при п —> оо. Последовательность, имеющая предел, называется сходящейся. Последова- тельность, не имеющая предела, называется расходящейся. Рассмотрим некоторые примеры. Пример 1. г- 1 п—>оо 71 lim — = 0, так как — — О ------, п J. п Е при п > N = - Пример 2. lim П—>ОО 71 = 1, так как ^-1 п 1 — < Е при п п г .Е. Пример 3. lim п—>оо так как :1П-1 71 ) N = п 1_ п е при п > N = Ls sin п _ q п Пример 4. Пример 5. 1. v Sin 71 п lim ----= 0, так как П~ЮО 71 lim — = 0, если |о| > n->oo qn ' 171 Проверим это по определению предела. Как п. 4с, для любого Е > 0 можно найти число N € скольку |(?| > 1, то для любого п 1. п Е при п > N = доказано в гл. II, § 2, Е. По- N будем иметь —— О 9 было N такое, что 1_< J_<£ (I" l«lN Ls и определение предела удовлетворено. Пример 6. Последовательность 1, 2, |, 4, |, б, |, ... с n-м членом хп = п G N, — расходящаяся. Действительно, если А — предел последовательности, то, как следует из определения предела, в любой окрестности А лежат все члены последователь- ности, за исключением, быть может, конечного их числа. Число А ф 0 не может быть пределом данной последовательности, ибо вне л |А1 п е-окрестности А при е = 1 > 0 лежат все члены нашей последовательности 1 1 . |А| ВИДа 2Г+Т’ ДЛЯ КОТОрЫХ 2fc+T < — Число 0 тоже не может быть пределом этой последовательности, посколь- ку, например, вне единичной окрестности нуля, очевидно, тоже имеется бес- конечно много членов нашей последовательности. Пример 7. Аналогично можно проверить, что последовательность 1,-1, 4-1, — 1, ... , для которой хп = (—1)п, не имеет предела. [ж] — целая часть числа х; см. следствие 10° принципа Архимеда, гл. II, § 2, п. 3.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 79 2. Свойства предела последовательности а. Общие свойства. Мы выделим в эту группу те свойства, которыми обладают, как будет видно из дальнейшего, не только числовые последователь- ности, хотя здесь мы эти свойства будем рассматривать только для числовых последовательностей. Последовательность, принимающую только одно значение, будем называть постоянной. Определение 4. Если существуют число А и номер N такие, что хп = = А при любом п > N, то последовательность {жп} будем называть финально постоянной. Определение 5. Последовательность {zn} называется ограниченной, если существует число М такое, что |жп| < М при любом п G N. Теорема 1. а) Финально постоянная последовательность сходится. Ь) Любая окрестность предела последовательности содержит все члены последовательности, за исключением конечного их числа. с) Последовательность не может иметь двух различных пределов. d) Сходящаяся последовательность ограничена. ◄ а) Если хп = А при п > N, то для любой окрестности У (А) точки А имеем хп G У(А) при п > N, т. е. lim хп — А. п—>оо Ь) Утверждение непосредственно следует из определения предела последо- вательности. с) Это важнейший пункт теоремы. Пусть lim хп — Ai и lim хп = А2. п—>оо п—>оо Если Ai ф Аг, то фиксируем непересекающиеся окрестности V(Ai), V(A2) точек Ai, Аг- В качестве таковых можно взять, например, «5-окрестности этих точек при <5 < ^|Ai — Аг|. По определению предела найдем числа Ni и Л2 так? что Уп > > Ni (хп 6 V(Ai)) и Уп > Д2 (хп 6 У(А2)). Тогда при п > тах{М,^} получим хп £ V(Ai) А V(А2). Но это невозможно, поскольку V(Ai) А V(А2) = = 0. d) Пусть lim хп = А. Полагая в определении предела £ = 1, найдем номер п—>оо N такой, что Уп > N (|zn — А| < 1). Значит, при п > N имеем |жп| < |А| 4-1. Если теперь взять М > max{|a;i|, ..., \хп|, |А| + 1}, то получим, что Уп > N (|xn| < М). ► Ь. Предельный переход и арифметические операции Определение 6. Если {хп}, {уп} — две числовые последовательности, то их суммой, произведением и частным (в соответствии с общим определе- нием суммы, произведения и частного функций) называются соответственно последовательности {(«„ + «„)}, {(зд»)}, {(?;)}•
80 ГЛ. Ш. ПРЕДЕЛ Частное, разумеется, определено лишь при уп 0, п G N. Теорема 2. Пусть {жп}, {t/n} — числовые последовательности. Если lim хп = A, lim уп ~ В, то: п—>оо п—>оо a) lim (жп 4- уп) = А 4- В; п—>оо b) lim хп • уп = А • В; п—>оо с) lim — = 77, если уп ф 0 (n = 1, 2, ...) и В ф 0. п—>оо уп а ◄ В качестве упражнения воспользуемся уже известными нам (см. гл. II, § 2, п. 4) оценками абсолютных погрешностей, возникающих при арифмети- ческих операциях с приближенными значениями величин. Положим |А — жп| = Д(жп), |В — з/п| = Д(уп). Тогда для случая а) имеем |(А 4- В) - (zn 4- уп)\ А(жп) + А(Уп)- Пусть задано число е > 0. Поскольку lim хп = А, найдется номер N' та- п—>оо кой, что Vn > N' (Д(жп) < е/2). Аналогично, поскольку lim уп = В, найдет- п—>оо ся номер N" такой, что Vn > N" (А(уп) < е/2). Тогда при n > max{An, N"} будем иметь |(А-ЬВ) - (жп 4- 2/„)| < £, что в соответствии с определением предела доказывает утверждение а). Ь) Мы знаем, что |(А • В) - (хп т/п)| |хп| Д(т/П) 4- |2/„| Д(жп) 4- Д(жп) • Д(уп). По заданному е > 0 найдем числа N' и N" такие, что Vn>N' Тогда при п > N = max{7V', N"} будем иметь I £ I Г s Д(жп) • Д(уп) < min р, - f • min р, - £ 3
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 81 Таким образом, при п > N ^|д^)<(|л1+1)-з(йги)Ч’ W^X(lBl + i)-3MTij = f’ д(жп) • Д(г/П) < О поэтому \АВ — хпуп\ < £ при п > N. с) Воспользуемся оценкой А _хп |хп| Д(уп) ~Ь |уп| А(жта) 1 в Уп у1 1 - 6(Уп) ’ где = -КГ- При заданном £ > 0 найдем числа N' и N" так, что Vn>N" Тогда при n > max{N',N"} будем иметь |жп| < |А| + Д(яп) < |А| 4-1, Ы > |В| - Д(У„) > |В| - Ф > ф, 1 2 Ы |в| ’ о < «Ы = фф < |1/п | |В|/4 = 1 |В|/2 2’ поэтому 1 - ^(Уп) > Ы.±ДЫ<(|Л| + 1).А._^_ = £, 1 Уп д(х ) < . £151 — £ ( п) |В| 8 "4’ 1 1 - 6(уп)
82 ГЛ. III. ПРЕДЕЛ и, следовательно, А Хп В Уп < е при п> N. ► Замечание. Формулировка теоремы допускает и другой, менее кон- структивный путь доказательства, вероятно, известный читателю по школь- ному курсу начал анализа. Мы напомним его, когда будем говорить о пределе произвольных функций. Но здесь, рассматривая предел последовательности, нам хотелось обратить внимание на то, как именно по ограничениям на по- грешность результата арифметической операции ищутся допустимые погреш- ности значений величин, над которыми эта операция производится. с. Предельный переход и неравенства Теорема 3. а) Пусть {жп}, {уп} — dee сходящиеся последовательно- сти, причем lim хп — Af lim уп = В. Если А < В, то найдется номер п—>оо п—>оо N € N такой, что при любом п > N выполнено неравенство хп < уп- Ь) Пусть последовательности {жп}, {?/n}, {zn} таковы, что при любом п > N £ N имеет место соотношение хп уп zn. Если при этом последо- вательности {жп}, {zn} сходятся к одному и тому же пределу, то последо- вательность {jZn} также сходится и к этому же пределу. ◄ а) Возьмем число С такое, что А < С < В. По определению предела найдем числа N' и N" так, чтобы при любом п > N' иметь |жп — А| < С — А и при любом п > N" иметь |?/п — В| < В — С. Тогда при п > N = max {TV', N"} получим хп < А 4- {С — А) = С = В — (В — С) < уп. Ь) Пусть lim хп = lim zn — А. По е > 0 найдем числа и N" так, п—>оо п—>оо чтобы при любом п > N' иметь А — е < хп и при любом п > N" иметь zn < < А+е. Тогда при п > N = max{7V', N"} получим А—е < хп уп zn < А+е или |j/n - А| < е, т. е. А = lim уп. ► п—>оо Следствие. Пусть lim хп = А и lim уп — В. п—>оо п-юо Если существует номер N такой, что при любом п > N: а) хп > уп, тоА^В; Ь) хп Уп, тоА^В- с) хп > В, то А В\ d) хп В, то А В. ◄ Рассуждая от противного, из пункта а) теоремы немедленно получа- ем первые два утверждения. Третье и четвертое утверждения суть частные случаи первых двух, получающиеся при уп = В. ► Стоит заметить, что строгое неравенство в пределе может перейти в ра- венство. Например, — > 0 при любом п G N, но lim — = 0. п п—>оо п
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 83 3. Вопросы существования предела последовательности а. Критерий Коши Определение 7. Последовательность {хп} называется фундаменталь- ной (или последовательностью Коши1^), если для любого числа е > 0 най- дется такой номер N G N, что из n>Nnm>N следует \хт — жп| < Е. Теорема 4 (критерий Коши сходимости последовательности). Числовая последовательность сходится тогда и только тогда, когда она фундамен- тальна. ◄ Пусть lim хп = А. По числу е > 0 найдем номер N так, чтобы при п—>оо п > N иметь |жп — А| < Если теперь т > N и п > N, то \хт — хп| < Л» < 1хт — А| + )хп — А| < 14- | = е и, таким образом, проверено, что сходящаяся последовательность фундаментальна. Пусть теперь {ж*} — фундаментальная последовательность. По заданному е > 0 найдем номер N такой, что из m^Nnk^N следует \хт — гг* | < Фиксировав т = N, получаем, что при любом k > N Xn ~ f < Xk < XN + I ’ но поскольку имеется всего конечное число членов последовательности {жп} с номерами,-не превосходящими N, то мы доказали, что фундаментальная последовательность ограничена. Для п € N положим теперь ап := inf Xk, bn := sup#*. к^п Из этих определений видно, что ап an+i &п+1 Ъп (поскольку при переходе к меньшему множеству нижняя грань не уменьшается, а верхняя не увеличивается). Последовательность вложенных отрезков [ап, &п] имеет, по лемме о вложенных отрезках, общую точку А. Поскольку при любом п € N А Ьп, а при к п ап = inf хк xk < sup ж* = Ьп, к>п к^п то при к п имеем |А Ьп ап. (2) Но из (1) следует, что при п > N xn z inf Xk ~ bn = sup Xk xn 4~ тг, О к^п 3 Последовательности Коши ввел Больцано, пытавшийся, не располагая точным поняти- ем вещественного числа, доказать сходимость фундаментальной последовательности. Коши дал такое доказательство, приняв за очевидное принцип вложенных отрезков, обоснованный впоследствии Кантором. 4 Зорич В. А.
84 ГЛ. III. ПРЕДЕЛ поэтому при п > т Ь„ - а„ < < е. (3) О Сравнивая (2) и (3), находим, что при любом к > N |А - Zfcl < £, и мы показали, что lim = А. ► к—>оо Пример 8. Последовательность (—l)n (n = 1, 2, ...) не имеет предела, поскольку она не является фундаментальной. Хотя это и очевидно, но все же проведем формальную проверку. Отрицание утверждения, что последова- тельность {жп} фундаментальная, выглядит так: 3e>0 V7V6N 3n>7V Bm>N (|жт-жп| > е), т. е. найдется £ > 0 такое, что при любом N € N найдутся числа п, т, боль- шие N, для которых |xm — Хп| В нашем случае достаточно положить е = 1. Тогда при любом N € N будем иметь - xn+2I = |1 - (-1)1 = 2 > 1 = £. Пример 9. Пусть = 0, 3J2 = O,Q!i, жз = 0,0:102, • ••, жп — 0,OiO2 ... ап, ... — некоторая последовательность конечных двоичных дробей, причем каждая следующая дробь получается дописыванием знака 0 или 1 к предыдущей. По- кажем, что такая последовательность всегда сходится. Пусть т > п. Оценим разность хт — хп: I । _ ап4-1 ат .1 1 )хт-хп\- ^+Г + ---+2^ <^+1 + ••• + “ /1\п+1 /1'\тп+1 _ У2/ ~ Ш 1 4 Таким образом, подобрав по заданному £ > 0 число N так, что < £ для £ любых т > п > N, получаем оценку \хт - жп| < — < — < £, доказывающую фундаментальность последовательности {хп}. Пример 10. Рассмотрим последовательность {жп}, где з;п = 1 4- — 4- ... -|—. 2 п Поскольку для любого п £ N |^2п *^п| 1 t t 1 > n 1 _ 1 n 4-1 п 4- п 2п 2 ’ то в силу критерия Коши эта последовательность не имеет предела.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 85 b. Критерий существования предела монотонной последовательности Определение 8. Последовательность {хп} называется возрастающей, если Уп € N (хп < Zn+i); неубывающей, если Уп € N (хп яп+1); невозра- стающей, если Уп € N (хп xn+i); убывающей, если Уп € N (хп > жп+1). Последовательности этих четырех типов называют монотонными последова- тельностями. Определение 9. Последовательность {жп} называется ограниченной сверху, если существует число М такое, что Уп 6 N (хп < М). Аналогично определяется последовательность, ограниченная снизу. Теорема 5 (Вейерштрасс). Для того чтобы неубывающая последова- тельность имела предел, необходимо и достаточно, чтобы она была огра- ниченной сверху. ◄ То, что любая сходящаяся последовательность ограничена, было дока- зано при рассмотрении общих свойств предела последовательности, поэтому интерес представляет только второе утверждение теоремы. По условию множество значений последовательности {хп} ограничено сверху, значит, оно имеет верхнюю грань s — supхп. n€N По определению верхней грани, для любого е > 0 найдется элемент хм € Е {жп} такой, что s — е < хм з. Поскольку последовательность {zn} не- убывающая, при любом п > N теперь получаем s — е < хм хп s, т. е. |$ — жп| = s — хп < е. Таким образом, доказано, что lim хп = s. ► п—>оо Разумеется, аналогичную теорему можно сформулировать и доказать для невозрастающей последовательности, ограниченной снизу. В этом случае lim хп = inf хп. n->oo n6N Замечание. Ограниченность сверху (снизу) неубывающей (невозраста- ющей) последовательности на самом деле, очевидно, равносильна ограничен- ности этой последовательности. Рассмотрим несколько полезных примеров. если q = то хп+1 = • хп, п 6 N. Поскольку lim (1 + —'j • lim - = 1- = -<1, то най- п—>оо \ П/ п—>оо <7 Q Q 1. Таким -образом, при Пример 11. lim — = О, п—>оо qn ◄ Действительно, если хп г п + 1 г (л . 1 А 1 lim ---- = lim (1-1— ) - = п—юо nq п—>оо \ п/ q дется номер N такой, что при п > N будет ---- nq п > N будем иметь xn+i < хп, т. е. после члена хм наша последовательность монотонно убывает. Поскольку конечное число членов последовательности, как видно из определения предела, не влияет на сходимость последователь- ности и ее предел, то достаточно теперь найти предел последовательности ^N+l > X JV4-2 > • •
86 ГЛ. III. ПРЕДЕЛ Члены последовательности положительны, т. е. последовательность огра- ничена снизу. Значит, она имеет предел. 71 4“ 1 Пусть х = lim хп. Из соотношения xn+i =------хп теперь следует п—>оо nq г / \ г /п + 1 \ .. п 4-1 .. 1 х = lim (тп+1) = lim (-----хп = hm ---------- hm хп = -х, п—>оо п—>оо \ nq / n—>оо nq п—>оо д откуда находим ^1 — х = 0 и х = 0. ► Следствие 1. lim у/п = 1. п—>оо ◄ При фиксированном е > 0 по доказанному найдется N G N такое, что при п > N будем иметь 1 n < (1 + е)п. Тогда при n > N получим 1 у/п < < 1 4- е и, значит, действительно lim у/п = 1. ► п—>оо Следствие 2. lim у/a, — 1 при любом а > 0. п—>оо ◄ Пусть а 1. Для любого е > 0 найдем N G N так, что при п > N 1 а < (14-е)п, и тогда при п > N получаем 1 у/а < 14-е, т. е. lim у/а = 1. п—»оо Если 0 < а < 1, то 1 < - и а <Г п! п! ’ п Пример 12. lim = 0; здесь q — любое действительное число, п G N, П—>ОО 71! п! := 1 • 2 •... • п. ◄ Если q = 0, то утверждение очевидно. Далее, поскольку то достаточно доказать утверждение для q > 0. Рассуждая в этом случае, как и в предыдущем, замечаем, что яп+1 = —^--хп. Поскольку множество п 4-1 натуральных чисел не ограничено сверху, найдется номер N такой, что при п > N будет 0 < —< 1. Тогда при n > N будем иметь zn+i < хп и, п 4-1 учитывая положительность членов последовательности, можно теперь гаран- тировать существование предела lim хп = х. Но тогда п—>оо х = lim zn+i = lim —^—гхп = lim —• lim xn = 0 • x = 0. ► n—>OO n—>OO Tl 4" 1 n—>OO n 4“ 1 n—>oo с. Число e / 1 \n Пример 13. Докажем существование предела lim 114—) . n—>OO \ 71/ Пределом в данном случае является число, обозначаемое после Эйлера буквой е, столь же характерное для анализа, как для арифметики 1 или для геометрии тг. К нему мы еще неоднократно будем возвращаться по очень разным поводам.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 87 Проверим сначала следующее неравенство: (1 4- а)п 1 4- па при nGN и а > — 1 (называемое иногда неравенством Я. Бернулли1)). ◄ При п = 1 утверждение справедливо. Если оно справедливо для п G N, то и для п 4-1 тоже, поскольку тогда (1 + a)n+1 = (1 + а)(1 + а)" > (1 + а)(1 + па) = = 1 + (п + 1)а + па2 1 + (п + 1)а. По принципу индукции утверждение, таким образом, справедливо для любого п £ N. Из выкладки, кстати, видно, что при а ф 0 имеет место строгое неравен- ство. ► ( 1\ Покажем теперь, что последовательность уп = 11 4— ) убывающая. \ п/ ◄ Пусть п 2. Используя доказанное неравенство, находим, что ( 1 V Уп-1 _ V + п — 1/ _ п2п п _ Уп ~ / 1 \n+1 “ (п2 - 1)п * П + 1 “ \ nJ = (i+ 1 У-^-аГ1+ п }-?-> (i + ^-?- = i. \ п2 — 1/ п4-1 \ п2 — 1/П4-1 \ njn + l Поскольку члены последовательности положительны, существует предел / -I \п+1 lim (14--) п—>ОО \ П/ Но тогда (I \ n / 1 \ п+1 / -I \ —1 14— ) = lim (14— ) (14— ) = П / п—>оо \ п / \ П / * / 1\п+1 1 / 1V+1 = lim (14— ) • lim ----=- = lim (14— I . ► п—>оо \ п J п—>оо J 1 п—>оо \ п / П Итак, Определение 10. 7 ч п е := lim (14— ) . п—>оо \ п / ^Якоб Бернулли (1654 — 1705) — швейцарский математик, представитель знаменитого семейства ученых Бернулли; стоял у истоков вариационного исчисления и теории вероят- ностей.
88 ГЛ. III. ПРЕДЕЛ d. Подпоследовательность и частичный предел последовательности Определение 11. Если xi, Х2, ..., хп, ... — некоторая последова- тельность, а П1 < П2 < ... < я* < . *. — возрастающая последовательность натуральных чисел, то последовательность яП1, яП2, ... , хПк, ... называется подпоследовательностью последовательности {яп}. Например, последовательность 1, 3, 5, ... нечетных натуральных чисел, взятых в их естественном порядке, является подпоследовательностью после- довательности 1, 2, 3, ... Но последовательность 3, 1, 5, 7, 9, ... уже не является подпоследовательностью последовательности 1, 2, 3, ... Лемма 1 (Больцано —Вейерштрасс). Каждая ограниченная последова- тельность действительных чисел содержит сходящуюся подпоследователь- ность. <4 Пусть Е — множество значений ограниченной последовательности {яп}. Если Е конечно, то существуют по крайней мере одна точка х G Е и после- довательность П1 < П2 < ... номеров такие, что яП1 = яП2 = ... = х. Подпо- следовательность {.Tnfc} постоянна и, значит, сходится. Если Е бесконечно, то по принципу Больцано — Вейерштрасса оно обла- дает по крайней мере одной предельной точкой х. Поскольку х — предельная точка Е, можно выбрать ni G N так, что |яП1 — < 1. Если € N уже выбрано так, что |rrnfc — я| < то, учитывая, что х — предельная точка Е, К найдем nfc+i € N так, что Пк < Пк+i и |znfc+1 - «| < rvT- Поскольку lim у = 0, построенная подпоследовательность хП1, х к-¥со к П2 J * • хПк, . . . СХОДИТСЯ К X. ► Определение 12. Условимся писать хп -> +оо и говорить, что после- довательность {ггп} стремится к плюс бесконечности, если для каждого числа с найдется номер N 6 N такой, что хп > с при любом п > N. Запишем это и два аналогичных определения в логических обозначениях: хп —> +оо := Vc G IR 37V € N Vn > N (c < xn), xn —> —oo := Vc € IR 37V € N Vn > N (xn < c), xn oo := Vc € IR 37V € N Vn > N (c < |a;n|). В последних двух случаях говорят соответственно: последовательность {rrn} стремится к минус бесконечности и последовательность {а;п} стре- мится к бесконечности. Заметим, что последовательность может быть неограниченной, но не стре- миться ни к плюс, ни к минус, ни просто к бесконечности. Например, хп — зхП^1)”.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 89 Последовательности, стремящиеся к бесконечности, мы не причисляем к сходящимся. Легко видеть, что в соответствии с этими определениями можно дополнить только что доказанную лемму, сформулировав ее несколько иначе. Лемма 2. Из каждой последовательности действительных чисел мож- но извлечь сходящуюся подпоследовательность или подпоследовательность, стремящуюся к бесконечности. ◄ Новым является только тот случай, когда последовательность {тп} не ограничена. Тогда по k G N будем выбирать Пк € N так, что Jrrnfc | > к и nk < Пк+i- Получим подпоследовательность {a;nfc}, которая стремится к бес- конечности. ► Пусть {ж*} — произвольная последовательность действительных чисел. Если она ограничена снизу, то можно рассмотреть (уже встречавшуюся нам при доказательстве критерия Коши) последовательность гп = inf Xk- По- к^п скольку in гп+1 для любого п € N, то либо последовательность {гп} имеет конечный предел lim in = I, либо in -> +оо. п—>оо Определение 13. Число I = lim inf Xk называется нижним преде- п->оо к^п лом последовательности {я*;} и обозначается lim Хк или lim. inf я^. Если к—>оо fc—>оо гп -> +оо, то принято говорить, что нижний предел последовательности ра- вен плюс бесконечности, и писать lim Хк = +оо или liminf Хк = +оо. Если fc->oo к^°° исходная последовательность {а^} не ограничена снизу, то при любом п € N будем иметь in = inf Хк — —оо. В этом случае говорят, что нижний предел к^п последовательности равен минус бесконечности, и пишут lim Хк — — оо или к—>оо lim inf Хк = —оо. к—>оо Итак, с учетом всех перечисленных возможностей запишем теперь кратко определение нижнего предела последовательности {я*}: lim Хк := lim inf Xk- fc—>оо п-^оок^п Аналогично, рассматривая последовательность зп — sup я*, приходим к к^п определению верхнего предела последовательности {□?*;}. Определение 14. lim Хк '-= lim suprcfc. k->oo п^юо к>п Приведем несколько примеров.
90 ГЛ. III. ПРЕДЕЛ Пример 14. Xk = (—l)fe, к G N: lim Xk — lim inf Xk = lim inf (—l)fc — lim (—1) = —1, k-HX) П-4ОО k'Zn n->oo k^n n—>oo lim Xk = lim sups* = lim sup(—l)fe = lim 1 = 1. к^ОО П-4ОО k>n П-4ОО k>n Tl->OO Пример 15. Xk = k( 1^fc, к G N: lim k^ — lim inf k^ = lim 0 = 0, n—>oo fc>n n—>oo lim k<- 1^fc = lim supA/ ^k = lim (+oo) = +oo. fc—>OO П—>OO k^n П—>OO Пример 16. Xk = k, A; G N: lim к = lim inf к = lim n = +oo, k—^CQ n~*°° n—>oo lim к = lim sup к = lim (+oo) = +oo. k—>oo n—>oo k^n n—+oo (~l}k Пример 17. Xk = гк G N: К f_iU / iI —, если n = 2m + 1 I lim —-— = lim inf —-— = lim < n n > = 0, к n^oo^n к n^oo-------------если n = 2m I к n +1 J fl n 1 —, если n = 2m I П 1 > = 0. —Ц-, если n = 2тп 4-1 n 4-1 J Пример 18. Xk = — к2, к G N: lim (—A?2) = lim inf (—A;2) = —oo. k-too n-+oo*^nv Пример 19. Xk = (-l)*fc, к G N: Inn (—l)kk= lim inf (—l)fcA;= lim (—oo) = —oo, k—tco n—+oo k^n n—>oo lim (—l)kk = lim sup(—l)feA; = lim (+oo) = 4-oo. Jk—>oo n—>oo k>n n—>oo Чтобы разобраться в происхождении терминов «верхний» и «нижний» пре- делы последовательности, введем следующее
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 91 Определение 15. Число (или символ —оо или +оо) называют частич- ным пределом последовательности, если в ней есть подпоследовательность, стремящаяся к этому числу. Утверждение 1. Нижний и верхний пределы ограниченной последо- вательности являются соответственно наименьшим и наибольшим из ее частичных пределов^. ◄ Докажем, это, например, для нижнего предела i = lim хк- Про последо- fc—>оо вательность гп = inf Хк нам известно, что она неубывающая и lim in = i € R. к^п n—>oo Для чисел n e N, используя определение нижней грани, по индукции подберем числа кп 6 N так, что in xl < in + — и кп < fcn+i. Поскольку lim in = п п->оо = lim (in Ч—) =i, то, опираясь на свойства предела, можем утверждать, п—>ОО \ п/ что lim Хкп = Мы доказали, что i — частичный предел последовательно- 71—700 сти {а^}. Это наименьший частичный предел, поскольку для каждого £ > О найдется число п € N такое, что г — е < in, т. е. i — е < in = inf Хк Хк при любом к п. к^п Неравенство i — е < Хк при к > п означает, что ни один частичный предел нашей последовательности не может быть меньше i — е. Но £ > 0 произвольно, поэтому он также не может быть меньше г. Для верхнего предела доказательство, разумеется, аналогично проведен- ному. ► Заметим теперь, что если последовательность не ограничена снизу, то из нее можно выделить подпоследовательность, стремящуюся к — оо. Но в этом случае и lim Хк = — оо и можно условиться считать, что снова нижний пре- к—>оо дел есть наименьший из частичных пределов. Верхний предел при этом может быть конечным, и тогда по доказанному он является наибольшим из частич- ных пределов; он может быть и бесконечным. Если lim Хк = +оо, то последо- к—>оо вательность не ограничена также и сверху и можно выделить подпоследова- тельность, стремящуюся к +оо. Если же lim Хк — —сю, что тоже возможно, к—too то это означает, что sup Хк = sn —оо, т. е. и сама последовательность {гг*,} к~^п стремится к —оо, ибо sn хп. Аналогично, если lim Хк = +оо, то Хк —> +оо. к—too Учитывая сказанное, можно, таким образом, заключить, что справедливо Утверждение 1'. Для любой последовательности нижний предел есть наименьший из ее частичных пределов, а верхний предел последовательно- сти — наибольший из ее частичных пределов. При этом считаются принятыми естественные соотношения — оо < х < +оо между символами —оо, 4-оо и числами х Е R.
92 ГЛ. III. ПРЕДЕЛ Следствие 1. Последовательность имеет предел или стремится к минус или плюс бесконечности в том и только в том случае, когда нижний и верхний пределы последовательности совпадают. ◄ Случай, когда lim Xk = lim Xk = +oo, и случай, когда lim Xk = к—>oo fc—>oo fc—>oo = lim Xk = —оо, уже разобраны выше, поэтому можно считать, что lim Xk = fc^°° fc—>оо = lim Xk = A 6 К. Поскольку in = inf Xk xn sup a:*; = sn и по условию fc->oo k^n k^n lim in = lim sn = А, то по свойствам предела также lim xn = A. ► n—>oo n—>oo n—>oo Следствие 2. Последовательность сходится тогда и только тогда, когда сходится любая ее подпоследовательность. ◄ Нижний и верхний пределы подпоследовательности заключены между нижним и верхним пределами самой последовательности. Если последователь- ность сходится, то ее нижний и верхний пределы совпадают. Тогда совпадают нижний и верхний пределы подпоследовательности, откуда вытекает ее схо- димость, причем, разумеется, к пределу всей последовательности. Обратное утверждение очевидно, поскольку в качестве подпоследователь- ности можно взять саму последовательность. ► Следствие 3. Лемма Больцано — Вейерштрасса как в узкой, так и в расширенной формулировке вытекает из утверждения 1 и утверждения 1' соотв етств енно. ◄ Действительно, если последовательность {х*;} ограничена, то точки i = = lim Xk и s = lim Xk конечны и по доказанному являются частичными к—>оо к—too пределами последовательности. Только при i = з последовательность имеет лишь одну предельную точку; при i < з их уже по крайней мере две. Если последовательность не ограничена с какой-то стороны, то существует подпоследовательность, стремящаяся к соответствующей бесконечности. ► Заключительные замечания. Мы выполнили (и даже с некото- рым превышением) все три пункта намеченной перед началом параграфа программы: дали точное определение предела последовательности, доказали единственность предела, выяснили связь операции предельного перехода со структурой множества действительных чисел, получили критерий сходимо- сти последовательности. Теперь рассмотрим один специальный часто встречающийся и очень по- лезный вид последовательностей — ряды. 4. Начальные сведения о рядах а. Сумма ряда и критерий Коши сходимости ряда. Пусть {ап} — последовательность действительных чисел. Напомним, что сумму ар + ap+i + + ... + aq (р q) принято обозначать символом £2 ап • Мы хотим теперь п—р
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 93 придать точный смысл выражению ai + аг + • • • 4- ап 4- • • •, подразумевающему суммирование всех членов последовательности {ап}. Определение 16. Выражение ai 4-аг +... + ап +... обозначают симво- ОО лом 52 ап и обычно называют рядом или бесконечным рядом (чтобы подчерк- 71=1 нуть отличие его от суммы конечного числа слагаемых). Определение 17. Элементы последовательности {an}, рассматривае- мые как элементы ряда, называют членами ряда; элемент an называют п-м членом ряда. п Определение 18. Сумму sn = 52 ak называют частичной суммой ряда k=l или, когда желают указать ее номер, n-й частичной суммой ряда1). Определение 19. Если последовательность {зп} частичных сумм ряда сходится, то ряд называется сходящимся. Если последовательность {зп} не имеет предела, то ряд называют расходящимся. Определение 20. Предел lim sn = з последовательности частичных 71—>ОО сумм, если он существует, называется суммой ряда. Именно в этом смысле мы и будем в дальнейшем понимать запись оо = S. 71=1 Поскольку сходимость ряда равносильна сходимости последовательности его частичных сумм {зп}, то применением к {зп} критерия Коши сразу полу- чается Теорема 6 (критерий Коши сходимости ряда). Ряд ai 4- ... + ап 4- ... сходится тогда и только тогда, когда для любого £ > 0 найдется такое число N € N, что из m^n>N следует |an 4-... 4- am| < £ Следствие 1. Если в ряде изменить только конечное число членов, то получающийся при этом новый ряд будет сходиться, если сходился исходный ряд, и будет расходиться, если исходный ряд расходился. ◄ Для доказательства достаточно в критерии Коши считать число N пре- вышающим максимальный из номеров измененных членов ряда. ► Следствие 2. Для того чтобы ряд 4- ... 4- ап 4-.. сходился, необ- ходимо, чтобы его члены стремились к нулю при п оо, т. в» необходимо lim ап = 0. 71—ЮО Таким образом, на самом деле под рядом мы подразумеваем упорядоченную пару (П \ sn = 22 ak) • fc = l '
94 ГЛ. III. ПРЕДЕЛ ◄ Достаточно положить в критерии т = п и воспользоваться определени- ем предела последовательности. ► Вот другое доказательство: ап = sn—sn_i и, коль скоро lim зп = з, имеем п—>оо lim ап = lim (sn — sn-i) = lim sn — lim sn-i = s — s = 0. n—>oo n—>oo n—>oo n—>oo Пример 20. Ряд l + g + g2 + ... + gn + ... часто называют суммой бесконечной геометрической прогрессии. Исследуем его сходимость. Поскольку |gn| = |g|n, то при |g| 1 будет |gn| 1 и в этом случае не выполнен необходимый признак сходимости ряда. Пусть теперь |g| < 1. Тогда 1 — лп зп = 1 + ? + ••• + 1 = ~----- l~q и lim зп = —-—, поскольку lim qn = 0, если |g| < 1. п—>оо 1 — q п—>оо оо Таким образом, ряд £2 ?п-1 сходится тогда и только тогда, когда |g| < 1 п=1 и в этом случае его сумма равна 1 1 -д' Пример 21. Ряд 1 + | 4-... + — + ... называется гармоническим, по- 2 п скольку каждый член этого ряда, начиная со второго, является средним гар- моническим соседних с ним членов (см. задачу 6 в конце этого параграфа). Члены ряда стремятся к нулю, но последовательность его частичных сумм Sn — 1 + г + • • • Ч—> 2 п как было показано с помощью критерия Коши в примере 10, расходится. Это означает в данном случае, что sn —> +оо при п —> оо. Итак, гармонический ряд расходится. Пример 22. Рассмотрим теперь следуюйщй пример. Ряд 1 — 1 4- 1 — ... 4- (—l)n+1 + ... расходится, что видно и по последова-' тельности 1, 0, 1, 0, ... его частичных сумм, и по тому, что члены ряда не стремятся к нулю. Если расставить скобки и рассмотреть новый ряд (1 -1) + (1 -1) +..., членами которого являются суммы, заключенные в скобки, то этот новый ряд уже сходится, причем его сумма, очевидно, равна нулю. Если скобки расставить иначе и рассмотреть ряд 1 + (—1 + 1) + (—1 + 1) + ... , то получится сходящийся ряд с суммой, равной 1.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 95 Если в исходном ряде переставить все члены, равные —1, на две позиции вправо, то получим ряд 1 + 1 - 1 4-1 - 1 + 1 - ... , расставив в котором скобки, придем к ряду (1 + 1) + (—1 + 1) + (—1 + 1) + ... , сумма которого равна двум. Эти наблюдения показывают, что привычные законы обращения с конеч- ными суммами, вообще говоря, не распространяются на ряды. И все-таки есть важный тип рядов, с которыми, как это потом выяснится, можно обращаться так же, как с конечными суммами. Это так называемые абсолютно сходящиеся ряды. Именно с ними мы главным образом и будем работать. Ь. Абсолютная сходимость; теорема сравнения и ее следствия оо Определение 21. Ряд ^2 ап называется абсолютно сходящимся, если оо n==1 СХОДИТСЯ ряд Х}|вп|. п=1 Поскольку |ап +... + ат| |ап| +... + |ат|, из критерия Коши следует, что если ряд сходится абсолютно, то он сходится. То, что обратное утверждение, вообще говоря, не имеет места, т. е. что аб- солютная сходимость есть требование более сильное, чем просто сходимость ряда, можно продемонстрировать на примере. Пример 23. Ряд 1 — 1 + 1 — | + | — | + ..., частичные суммы которого Z Z о о равны либо —, либо 0, сходится к нулю. Вместе с тем ряд из абсолютных величин его членов расходится, что, как и для гармонического ряда, следует из критерия Коши: п+1 п+1 п + п п + п = 2 f——• + ... +—^—^ > 2п • —= 1. \п + 1 п + п/ п + п Для того чтобы научиться отвечать на вопрос, сходится ли ряд абсолютно или нет, достаточно научиться исследовать на сходимость ряды с неотрица- тельными членами. Имеет место
96 ГЛ. III. ПРЕДЕЛ Теорема 7 (критерий сходимости рядов с неотрицательными членами). Ряд щ + ... + ап + ..., члены которого — неотрицательные числа, сходит- ся тогда и только тогда, корда последовательность его частичных сумм ограничена сверху. ◄ Это следует из определения сходимости ряда и критерия сходимости неубывающей последовательности, каковой в данном случае является последо- вательность si 32 зп . частичных сумм нашего ряда. ► Из этого критерия вытекает следующая простая, но на практике очень полезная ОО оо Теорема 8 (теорема сравнения). Пусть 52 ап, Ьп — два ряда с 71=1 71=1 неотрицательными членами. Если существует номер N G N такой, что при любом п > N имеет место неравенство ап Ьп, то из сходимости оо оо оо ряда Ъп вытекает сходимость ряда 52 ап, а из расходимости ряда 52 ап 71=1 71=1 71=1 вытекает расходимость ряда 52 Ьп- 71=1 ◄ Поскольку конечное число членов не влияет на сходимость ряда, можно без ограничения общности считать, что ап Ьп для любого n € N. Тогда п п оо Ап = 52 ak 52 Ьк = Вп. Если ряд 52 Ьп сходится, то последовательность fc=l к=1 71=1 {Вп}, не убывая, стремится к пределу В. Тогда Ап Вп В при любом оо п € N и, следовательно, последовательность {Ап} частичных сумм ряда 52 ап 71=1 ограничена. В силу критерия сходимости ряда с неотрицательными членами ОО (теорема 7) ряд 52 ап сходится. 71=1 Второе утверждение теоремы, рассуждая от противного, немедленно по- лучаем из уже доказанного. ► Пример 24. Поскольку --------— < п\п + 1) ОО J сравнения заключаем, что ряды 52 ~т и 71=1 п2 одновременно. — < -----тг— при п > 2, по теореме п2 (п — 1)п ОО | V —-----— сходятся или расходятся п=1 n(n+ 1) Но последний ряд можно просуммировать непосредственно, заметив, что, 111 nl 1 °°1 ту:---т = ~ — т:-тт И ПОЭТОМУ 52 777-7Т = 1----77- ЗнаЧИТ, 52 7----7Т = к(к+1) к (& + 1) *=1^(^ + !) п+1 T^in(n + 1) ОО J — 1. Следовательно, ряд 52 —т также является сходящимся. Любопытно, что П2 °° 1 7Г2 м 1 52 — = — • В дальнейшем это будет доказано. 71=1 п ° Пример 25. Следует обратить внимание на то, что теорема сравнения относится только к рядам с неотрицательными членами. Действительна,
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 97 оо положим, например, ап = — п, а Ьп = 0, тогда ап < Ьп, ряд 52 Ьп сходится, П=1 оо но ряд 52 ап расходится. тг=1 Следствие 1 (мажорантный признак Вейерштрасса абсолютной сходн- ое оо мости ряда). Пусть ^ап и 52 — ^ва Рлда. Пусть существует номер 71=1 П—1 N G N такой, что при любом п > N имеет место соотношение |ап| Ьп. ОО При этих условиях для абсолютной сходимости ряда 52 ап достаточно, оо n=1 чтобы ряд 52 Ьп сходился. П—1 оо <4 Действительно, по теореме сравнения тогда ряд 52 lan | будет сходиться, п=1 оо что и означает абсолютную сходимость ряда 52 ап • ► п=1 Этот важный достаточный признак абсолютной сходимости часто форму- лируют кратко: если члены ряда (по абсолютной величине) мажорируются членами сходящегося числового ряда, то исходный ряд сходится абсолютно. тт ос г> V"* sin п ~ Пример 26. Ряд У. —абсолютно сходится, так как .“i п2 П—1 ОО J ряд 52 как мы выяснили в примере 24, сходится. П=1 sin п п2 2 ’ & П£ оо Следствие 2 (признак Коши). Пусть 52 ап ~ "данный ряд и а = 71=1 = lim \/|anI. Тогда справедливы следующие утверждения: п—>оо оо а) Если а < 1, то ряд 52 ап абсолютно сходится. 71=1 ОО Ь) Если а > 1, то ряд 52 ап расходится. 71=1 с) Существуют как абсолютно сходящиеся, так и расходящиеся ряды, для которых а = 1. <4 а) Если а < 1, то можно выбрать число q € R так, что а < q < 1. Фиксировав число q, в соответствии с определением верхнего предела найдем номер N G N такой, что при п > N выполнено \/|an| < q. Таким образом, ОО при п > N будем иметь |an| < qn и, поскольку ряд 52 Qn ПРИ l?l < 1 сходит- оо П=1 „ . ся, ряд 52 ап (по теореме сравнения или признаку Вейерштрасса) сходится 71=1 абсолютно.
98 ГЛ. III. ПРЕДЕЛ Ь) Поскольку а является частичным пределом последовательности {ап} (см. утверждение 1), то найдется подпоследовательность {апь} такая, что lim пу/~а^ — а. Если а > 1, то найдется номер К G N такой, что при любом к—>оо v к > К будет |anJ > 1, тем самым необходимое условие сходимости (ап —> 0) оо для ряда 52 ап не выполнено и он расходится. п=1 ОО | ОО 1 с) Мы уже знаем, что ряд 52 ~ расходится, а ряд 52 “7 сходится п=1п п=1п (абсолютно, так как 1 П2 = Дг). Вместе с тем lim П* п—>оо / , \ 2 lim -т= = 1 и lim \ = lim \ п—>оо V П^ п—>оо \ Пример 27. Исследуем, при каких значениях х 6 R ряд оо £(2+(-1)")”*” П=1 сходится. Подсчитаем а = lim Ч/1(2 + (—1)п)пжп| = |ж| lim |2 + (—1)п| = 3|ж|. п—>оо п—>оо Таким образом, при |ят| < - ряд сходится и даже абсолютно, а при |ят| > - О о ряд расходится. Случай |я| = - требует специального рассмотрения. В на- шем примере оно элементарно, ибо при |ж| = - для четных значении п имеем О (2 + (—1)2Л)ж2А = З2* (-) = 1 и ряд расходится, поскольку для него не выполнено необходимое условие сходимости. ет предел lim п—>оо а) Если а < Gn ОО Следствие 3 (признак Даламбера1)). Пусть для ряда 52 ап существу- П=1 = а. Тогда справедливы следующие утверждения: оо 1, то ряд 52 ап сходится абсолютно. П=1 оо Если а > 1, то ряд 52 ап расходится. п—1 Существуют как абсолютно сходящиеся, так и расходящиеся ряды, для которых а = 1. •4 а) Если а < 1, то найдется такое число q, что а < q < 1; фиксировав q и учитывая свойства предела, найдем номер N G N такой, что при любом п > N будет Ь) Gn q. Поскольку конечное число членов не влияет на характер ^Ж. Л. Даламбер (1717 — 1783) — французский ученый, прежде всего механик, входив- ший в группу философов-энциклопедистов.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 99 сходимости ряда, без ограничения общности будем считать, что при любом п 6 N. Поскольку 9 Gn Qn+1 Qn Qn Qn—1 0-2 Ql мы получаем, что |а |ai| очевидно, равна -—1 Но ряд _ Qn+i ai ’ оо ^2 |«i |<7п сходится (его сумма, п=1 оо ), поэтому ряд 52 ап абсолютно сходится. 1 “ 9 П=1 1, то, начиная с некоторого номера N 6 N, при любом п > N оо |an+i|, и5 следовательно, для ряда $2 ап П=1 Gn Ь) Если а будем иметь не выполнено условие ап —> 0, необходимое для сходимости. с) Примерами в данном случае, как и в признаке Коши, могут служить ОО 1 ОО 1 El 1 - и Е ► П=1п п-1 п Пример 28. Выясним, при каких значениях х € К сходится ряд При х = 0 он, очевидно, сходится и даже абсолютно. При х 0 0 имеем lim = цт — о. п—>оо ап п—>оо П + 1 Таким образом, этот ряд абсолютно сходится при любом значении х 6 К. Рассмотрим, наконец, еще один более специальный, но часто встречающий- ся класс рядов: ряды, члены которых образуют монотонную последователь- ность. Для таких рядов имеет место следующий необходимый и достаточный признак сходимости. ОО Утверждение 2 (Коши). Если 0, то ряд 52 ап схо- П=1 оо дится тогда и только тогда, когда сходится ряд 52 2ka2k = Qi 4- 2ог 4- л=о 4- 4о4 4- 8о8 4-... •4 Поскольку 02^02^01, 2о4 аз 4- о4 2ог, 4о8 4- as 4~ 07 4- а8 4о4, 2П(22п + 1 О2п+1 4" ... 4“ О2" + 1 2ПО2п,
100 ГЛ. III. ПРЕДЕЛ то, складывая эти неравенства, получим 2 (^n+l ®1) А2" + 1 <21 где Ак =ai + ...4-а*:, Sn = ai 4-2а2 4-.. .4-2na2n — частичные суммы рассматри- ваемых рядов. Последовательности {А*} и {Sn} неубывающие, и потому из полученных неравенств можно заключить, что они либо одновременно ограни- чены, либо одновременно не ограничены сверху. Но по критерию сходимости рядов с неотрицательными членами отсюда следует, что рассматриваемые два ряда действительно сходятся или расходятся одновременно. ► Отсюда вытекает полезное Следствие. Ряд — сходится при р > 1 и расходится при р I.1) п=1 пР •4 Если р 0, то по доказанному наш ряд сходится или расходится вместе с рядом ОО ОО S2‘72^ = E(2W)‘> Jfe=o ' k—0 а для сходимости последнего ряда необходимо и достаточно, чтобы было q = _ 21-р < 1, т. е. р > 1. ос i Если р 0, то расходимость ряда ^2 ~ очевидна, поскольку в этом случае п=1 пР все члены ряда больше 1. ► ос i Важность этого следствия состоит в том, что ряд ^2 — часто служит л=1 пР основой для сравнения при исследовании сходимости рядов. с. Нисло е как сумма ряда. Заканчивая рассмотрение рядов, вернемся еще раз к числу е и получим ряд, доставляющий уже довольно удобный способ вычисления е. Мы будем использовать формулу бинома Ньютона при разложении выра- / 1\п жения (1 4- — ] Те, кто не знаком с этой формулой из школы или не решил задачу 1g) из гл. II, § 2, могут, без потери связности изложения, опустить настоящее добавление о числе е и вернуться к нему после формулы Тейлора, частным случаем которой можно считать формулу бинома Ньютона. / J \п Нам известно, что е = lim 11 4— ) . п—>оо \ 71/ Формально в нашей книге мы пока определили пр только для рациональных значений р, поэтому читатель тоже пока вправе понимать это утверждение только для тех р, для которых определено пр.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 101 По формуле бинома Ньютона п(п — 1) - n(n — 1)... (n — fc 4-1) 1 1 + к* пк пп / 1 \п 1 1 Полагая (14--) = еп и 14-14- т? 4-... 4—; = sn, таким образом, имеем \ п/ 2! п! еп < (п = 1, 2, . . . С другой стороны, при любом фиксированном к и п к, как видно из того же разложения, имеем При п —> сю левая часть этого неравенства стремится к Sk, а правая — к е, поэтому мы теперь можем заключить, что s* е для любого к G N. Но тогда из соотношения en зп е при п —> сю получаем, что lim sn = е. п—>оо В В соответствии с определением суммы ряда мы теперь можем записать Это уже вполне пригодное для вычисления представление числа е. Оценим разность е — sn: (п + 1)! + (п + 2)! +"’ 1 1 п 4- 2 1 (п4-1)! 1 1 п! (п 4-1)2 п!п п + 2 Таким образом, чтобы абсолютная погрешность приближения числа е чи- слом sn не превосходила, например, 10“3, достаточно, чтобы было -у— < п'.п 1000 Этому условию удовлетворяет уже $6-
102 ГЛ. III. ПРЕДЕЛ Выпишем несколько первых десятичных знаков числа е: е = 2,7182818284590... Полученную оценку разности е — зп можно записать в виде равенства е = з„+4-> п'.п где 0 < вп < 1. Из такого представления числа е немедленно следует его иррациональ- ность. В самом деле, если предположить, что е = должно быть целым, а вместе с тем Р Т.Т I где р, q G N, то число qie q ,!e=g!^,+— «! 1! 2! «! ? 0, и тогда число — тоже должно быть целым, что невозможно. q Для сведения читателя отметим, что число е не только иррационально, но' даже трансцендентно. Задачи и упражнения 1. Покажите, что число х 6 R рационально тогда и только тогда, когда его запись в любой Q-ичной системе счисления периодична, т. е., начиная с некоторого разряда, состоит из периодически повторяющейся группы цифр. 2. Мяч, упав с высоты h, подскакивает на высоту qh, где q — постоянный коэф- фициент, 0 < q < 1. Найти время, за которое он окажется покоящимся на земле, и путь, который он к этому моменту пролетит. 3. На окружности отмечаются точки, получающиеся из некоторой фиксирован- ной ее точки поворотами окружности на всевозможные углы в п 6 Z радиан. Ука- жите все предельные точки построенного множества. 4. Выражение ni +-----------— П2 Ч----- ПЗ + . пк-i Ч--- Пк где щ € N, называется конечной цепной или непрерывной дробью, а выражение П1 Ч----------— П2 Ч-----— Пз + — бесконечной цепной дробью. Дроби, получающиеся из цепной дроби при отбрасы- вании всех ее звеньев, начиная с некоторого звена, называют подходящими дробями.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 103 Бесконечной цепной дроби в качестве значения сопоставляется предел последова- тельности ее подходящих дробей. Покажите, что: а) Каждое рациональное число —, где тп, п € N, может быть разложено и притом п единственным способом в цепную дробь: т 1 — — Qi 4--~ n q2 + Qn-l 4--- Qn Указание. Числа qi, ..., qn, называемые неполными частными, получаются из алгоритма Евклида ТП = П • Q1 4- Г1, П = Г1 • Q2 + Г2, Г1 = Г2 • Q3 4- Гз, если его записать в виде Ь) Подходящие дроби Ri = Qi, R2 — qi 4-, ... удовлетворяют неравенствам 92 R1 < R3 < • • • < R2k-1 < — < Rik < Rik-2 < ... < R2- n с) Числители Pk и знаменатели Qk подходящих дробей Rk формируются по за- кону Рк = Pk-iqk 4- Рк-2, Р2 = Q1Q2, Pi = Qi, Qk = Qk-lQk 4- Qk-2, Q2 = Q2, Ql = 1. d) Разность соседних подходящих дробей вычисляется по формуле е) Каждая бесконечная цепная дробь имеет определенное значение. f) Значение бесконечной цепной дроби иррационально. х 14- у/5 1 t 1 h) Числа Фибоначчи 1, 1, 2, 3, 5, 8, ... (т. е. ип = un-i 4- ип-2 и гц = и2 = .1), получающиеся как знаменатели подходящих дробей в g), задаются формулой
104 ГЛ. III. ПРЕДЕЛ - V5 Рк 2 Qk i) Подходящие дроби Rk = в g) таковы, что Чк ните этот результат с утверждениями задачи 11, § 2, гл. II. . Срав- 5. Покажите, что: а) При п 2 справедливо равенство 1 + 1! + 2! + ‘' * + п! + п\п 3 1-2-2! ' (п — 1)п • п! °° 1 Ь) е “ 3 _ S (« + 1)(« + 2)(п + 2)Г с) Для приближенного вычисления числа е значительно лучше формула е~14- + Д + • •. 4- Д 4—г-, а не исходная формула ewl+Д + ... + Д (оцените погрешности, 1! п! п'.п 1! п! посчитайте и сравните результат со значением е, приведенным на с. 102). 6. Если а и b — положительные числа, ар — произвольное отличное от нуля вещественное число, то средним порядка р чисел а и b называется величина 1/р В частности, получаем при р = 1 среднее арифметическое, при р = 2 — среднее квадратическое, при р = — 1 — среднее гармоническое чисел а, Ь. а) Покажите, что среднее Sp(a,b) любого порядка заключено между числами а и Ь. Ь) Найдите пределы последовательностей {S„(a,b)}, {S_„(a,6)}. 7. Покажите, что если а > 0, то последовательность xn-t-i = 1 ( хп 4- — ) при лю- 2 X хп / бом Xi > 0 сходится к арифметическому квадратному корню из а. Оцените скорость сходимости, т. е. величину абсолютной погрешности |жп — а| — |ДП| в зависимости от п. 8. Покажите, что a) So(ri) 1° 4-... -f- п° = п, с ( х ,i . .1 п(п+1) 1 2 . 1 5i(n) = l +... + п =--------= -п^ + -п, £ ми Q („X _ 12 , 2 _ П(П 4" 1)(2п + 1) _ 1 з 1 2 , 1 оз(п) — 1 4-. • 4-п —------------— —п +-п 4- — п, О <3 2 О с („X- п2(п4-1)2 _ 1 4 , 1 3j_ 1 2 5з(п) -------------П +-п 4-^п, и вообще Sk(n) = ak+ink+1 4-... 4- ain 4- ао — многочлен от п степени к 4-1- Ь) п-»оо nfc+l 1 . к 4-1
§ 2. ПРЕДЕЛ ФУНКЦИИ 105 § 2. Предел функции 1. Определения и примеры. Пусть Е — некоторое подмножество мно- жества R действительных чисел и а — предельная точка множества Е. Пусть f: Е R — вещественнозначная функция, определенная на Е. Мы хотим записать, что значит, что при приближении точки х Е Е к а значения f(x) функции f приближаются к некоторому числу А, которое естественно назвать пределом значений функции f или пределом функции f при х, стремящемся к а. Определение 1. Будем (следуя Коши) говорить, что функция f: Е —> —> R стремится к А при х, стремящемся к а, или что А является пределом функции f при х, стремящемся к а, если для любого числа е > 0 существует число 6 > 0 такое, что для любой точки х 6 Е такой, что 0 < |ж — а| < д, выполнено соотношение |/(ж) — А| < е. В логической символике сформулированные условия запишутся в виде Уе > 0 35 > 0 Vx G Е (0 < |ж - а| < 5 => |/(х) - А| < е). Если А — предел функции /(ж) при х, стремящемся по множеству Е к точке а, то пишут f(x) —> А при х —> а, х 6 Е, или lim f(x) = А. Вместо х—>а,х€Е символа х —> а, х 6 Е, мы, как правило, будем использовать более короткое обозначение Е Э х -» а и вместо lim f(x) будем писать lim /(яг) = А. x—ta,xfEE “ ЕЭх^а Пр и мер 1. Пусть Е = R \ 0, f(x) = х sin -. Проверим, что 27 I- In lim х sin - = 0. ЕЭх—►О 27 Действительно, при заданном е > 0 возьмем 6 = е, тогда при 0 < И < <5 = = £, учитывая, что . 1 х sin - X < |ж|, будем иметь . 1 X sin — X Е. Из этого примера, кстати, видно, что функция f : Е -> R может иметь предел при Е Э х -> а, даже не будучи определенной в самой точке а. Как раз эта ситуация чаще всего имеет место при вычислении пределов и, если вы обратили внимание, это обстоятельство учтено в определении предела в виде неравенства 0 < |ж — а|. Напомним, что окрестностью точки a G R мы назвали любой интервал, содержащий эту точку. Определение 2. Проколотой окрестностью точки называется окрест- ность точки, из которой исключена сама эта точка. Если U (а) — обозначение окрестности точки а, то проколотую окрестность этой точки будем обозначать символом U(a).
106 ГЛ. III. ПРЕДЕЛ Множества UE(a) ^ЕпЩа), UE(a) :=EHU(a) будем называть соответственно окрестностью и проколотой окрестностью точки а в множестве Е. О Если а — предельная точка Е, то UE(a) 0 0, какова бы ни была окрест- ность 17(a). О g g Если на минуту принять громоздкие символы UE(a) и VR(A) для обозна- чения проколотой 5-окрестности точки а в множестве Е и е-окрестности точки А в R, то приведенное выше так называемое «е - ^-определение» Коши предела функции можно переписать в виде lim f(x) = A- VVg(A) 3&‘(a) С V‘(A)). Эта запись говорит, что А является пределом функции /:£*-> R при х, стремящемся к а по множеству Е, если для любой б-окрестности VR(A) точки А найдется проколотая (5-окрестность UE(a) точки а в множестве Е, образ которой f(UE(a)) при отображении f: Е —> R полностью содержится в окрестности VR(A). Учитывая, что в любой окрестности точки числовой оси содержится так- же некоторая симметричная окрестность ((5-окрестность) этой же точки, мы теперь приходим к следующей форме записи определения предела, которую и будем считать основной. Определение 3. О о lim f(x) = А := VVr(4) 3UE(a) C Vr(4)). E$x —>a Итак, число А называется пределом функции /: Е -> R при х, стремящемся по множеству Е к точке а (предельной для Е), если для любой окрестности точки А найдется проколотая окрестность точки а в множестве Е, образ кото- рой при отображении /: Е -> R содержится в заданной окрестности точки А. Мы привели несколько формулировок определения предела функции. Для числовых функций, когда a, A Е R, как мы видели, эти формулировки экви- валентны. Вместе с тем для разных целей бывает удобна то одна, то другая из них. Например, при численных оценках удобна исходная форма, указыва- ющая допустимую величину отклонения х от а, при которой уклонение f(x) от А не превысит заданной величины. А вот с точки зрения распространения понятия предела на более общие функции, определенные не на числовом мно- жестве, наиболее удобной является последняя формулировка, которую мы и выделили. Из нее, кстати, видно, что мы сможем определить понятие предела
§ 2. ПРЕДЕЛ ФУНКЦИИ 107 отображения /: X —> Y, если нам будет сказано, что такое окрестность точки в X и в У, или, как говорят, если в X и Y будет задана топология. Рассмотрим еще некоторые, поясняющие основное определение примеры. Пример 2. Функция (1 при х > 0, 0 при х = 0, —1 при х < 0 (читается «сигнум ж»1^) определена на всей числовой оси. Покажем, что у нее нет предела при х, стремящемся к 0. Это значит, что О о VA 6 В 3V(A) Vt/(O) 3xEU(0) (/(я) £ V(A)), т. е., какое бы А (претендующее на то, чтобы быть пределом sgna: при х -» 0) мы ни взяли, найдется такая окрестность V(А) точки А, что, какую бы (ма- 0 лую) проколотую окрестность U(0) точки 0 ни взять, в ней есть по крайней мере одна точка х 6 U(0), значение функции в которой не лежит в V(A). Поскольку функция sgna: принимает только значения —1, 0, 1, то ясно, что никакое число А, отличное от них, не может быть пределом функции, ибо оно имеет окрестность V(A), не содержащую ни одно из этих трех чисел. Если же А € {—1,0,1}, то возьмем в качестве V(А) б-окрестность точки А при е = 1/2. В такую окрестность заведомо не могут попасть одновременно обе точки —1 и 1. Но, какую бы проколотую окрестность £7(0) точки 0 ни взять, в ней есть как положительные, так и отрицательные числа, т. е. есть и точки ж, где /(ж) = 1, и точки, где f(x) = — 1. Значит, найдется точка х 6 t/(0) такая, что f(x) У (А). Условимся, если функция /: Е -> В определена во всей проколотой окрест- ООО ности некоторой точки о G R, т. е. когда Ue(o) = Ujt(a) = U(d), вместо записи Е Э х —> а употреблять более короткую запись х —> а. Пример 3. Покажем, что lim Isgnя| = 1. х—>0 Действительно, при х 6 В \ 0 имеем |sgn ят| = 1, т. е. функция постоянна О и равна 1 в любой проколотой окрестности [7(0) точки 0. Значит, для любой окрестности У(1) получим /(С7(0)) = 1 G У(1). Обратите внимание, что хотя в данном случае функция | sgn х | и определена в самой точке 0 и |sgn 01 = 0, но это значение не имеет никакого влияния на величину рассматриваемого предела. Таким образом, не следует смешивать значение /(а) функции в точке а с пределом lim f(x) функции при х, стремящемся к а. х—>а V Signum (лат.) — знак.
108 ГЛ. III. ПРЕДЕЛ Пусть 1R_ и — множества отрицательных и положительных чисел со- ответственно. Пример 4. В примере 2 мы видели, что предел lim sgnz не суще- ЙЭа:->0 ствует. Замечая, однако, что ограничение sgn|R_ функции sgn на 1R_ есть постоянная функция, равная —1, a sgn|R+ есть постоянная, равная 1, можно, как и в примере 3, показать, что lim sgna; = —1, lim sgna; = 1, R— Эж—>0 R-I-Эж—>0 т. e. ограничение одной и той же функции на различные множества может иметь различные пределы в одной и той же точке или даже не иметь его, как это было в примере 2. Пример 5. Развивая идею примера 2, можно аналогично показать, что функция sin — не имеет предела при х —> 0. v и ° Действительно, в любой проколотой окрестности £7(0) точки 0 всегда есть точки вида ---- ~ — и . - .—, где п G N, в которых функция принима- —'KI& 4- 2тгп 7Г/2 4- 2тгп ет значения —1 и 1 соответственно. Но оба эти числа не могут одновременно содержаться в s-окрестности У (А) точки A G 1R, если е < 1. Значит, ни одно число А € К не может быть пределом этой функции при х —> 0. Пример 6. Если = (а: 6 К | х =--—, п G м) I 1 —7Г/2 4-27ГП J и Е+ - {X 6 К | х = —, п е I 1 7Г/2 4-27ГП J то, подобно рассмотренному в примере 4, получаем, что 1 1 lim sin - = —1 и lim sin - = 1. Е—Зх—>0 X Е^-Эх—>0 X Между изученным в предыдущем параграфе понятием предела последова- тельности и введенным здесь понятием предела произвольной числовой функ- ции имеется тесная связь, которую выражает следующее Утверждение I1). Соотношение lim f(x) — А имеет место тогда Е3х-+а и только тогда, когда для любой последовательности {а;п} точекхп G Е\а, сходящейся к а, последовательность {/(яп)} сходится кА. 1^Его иногда называют утверждением о равносильности определений предела по Коши (через окрестности) и по Гейне (через последовательности). Э. Гейне (Хайне) (1821 — 1881) — немецкий математик.
§ 2. ПРЕДЕЛ ФУНКЦИИ 109 ◄ То, что ( lim /(т) — А) => ( lim f(xn) = -А), сразу следует из опре- делений. Действительно, если lim f(x) = А, то для любой окрестности ЕЭх—ta 0 У (А) точки А найдется проколотая окрестность 0е(о) точки а в Е такая, О что для х б Ue(o) имеем /(т) б V(A). Если последовательность {тп} точек множества Е \ а сходится к а, то найдется номер N такой, что при п > N будет хп б Ue(cl) и, значит, /(хп) б V(A). На основании определения предела последовательности, таким образом, заключаем, что lim f(xn) = А. п—>оо Перейдем к доказательству обратного утверждения. Если А не является пределом f[x) при Е Э х —> а, то найдется окрестность У (А) такая, что при любом п б N в --окрестности точки а найдется точка хп € Е \ а такая, что f(xn) V(A). Но это означает, что последовательность {/(тп)} не сходится к А, хотя последовательность {тп} стремится к а. ► 2. Свойства предела функции. Теперь установим ряд постоянно ис- пользуемых свойств предела функции, многие из которых аналогичны уже до- казанным свойствам предела последовательности и потому, в сущности, нам уже знакомы. Более того, на основании только что доказанного утвержде- ния 1 многие важные свойства предела функции, очевидно, немедленно следу- ют из соответствующих свойств предела последовательности: единственность предела, арифметические свойства предела, предельный переход в неравен- ствах. Тем не менее мы вновь проведем все доказательства. В этом, как выяснится, есть определенный смысл. Мы хотим обратить внимание читателя на то, что для установления всех свойств предела функции требуются всего два свойства проколотых окрест- ностей предельной точки множества: Bi) Ue(o) / 0, т. е. проколотая окрест- ность непуста, и В2) V-L^(a) VL^(a) С 6#(a) ClU^Ca)), т. е. в пересечении любой пары проколотых окрестностей содержится проколотая окрестность. Это наблюдение приведет нас к общему понятию предела функ- ции и возможности в будущем использовать теорию предела уже не только для функций, определенных на числовых множествах. Чтобы изложение не было простым повторением сказанного в § 1, мы используем здесь некоторые новые полезные приемы и понятия, которые не демонстрировались в § 1. а. Общие свойства предела функции. Сначала несколько определе- ний. Определение 4. Функцию / : Е —> 1R, принимающую только одно зна- чение, будем, как и прежде, называть постоянной. Функция f: Е —> 1R назы- вается финально постоянной при Е Э х —> а, если она постоянна в некоторой проколотой окрестности Ue[o) точки а, предельной для множества Е. Определение 5. Функция /: Е —> 1R называется ограниченной, ограни- ченной сверху, ограниченной снизу, если найдется число С б К такое, что для любого х б Е выполнено соответственно |/(т)| < С, f(x)<C, С < f(x).
110 ГЛ. III. ПРЕДЕЛ В случае, если первое, второе или третье из этих соотношений выполнено лишь в некоторой проколотой окрестности Ue(o) точки а, функция /: Е -> К называется соответственно финально ограниченной при Е Э х —> а, финаль- но ограниченной сверху при Е Э х —> а, финально ограниченной снизу при Е Э х —> о. Пример 7. Функция f(x) — (sin - 4- х cos-), определенная этой фор- \ X X / мулой при х / 0, не является ограниченной на области определения, но она финально ограничена при х —> 0. Пример 8. То же самое относится к функции /(х) = х на 1R. Теорема 1. a) (f: Е —> К при Е Э х —> а есть финально постоян- ная А) => { lim f(x) = А). \ЕЭх^а / Ь) (3 lim /(ж)) => (ft Е —> 1R финально ограничена при Е Э х —> а), х ЕЭх-ьа f с) ( lim /(ж) = А1)л( lim f(x) = А2) => (Ах = А2). х ЕЭх-^а / х ЕЭх—ьа / <4 Утверждение а) о наличии предела у финально постоянной функции и утверждение Ь) о финальной ограниченности функции, имеющей предел, вы- текают прямо из соответствующих определений. Обратимся к доказательству единственности предела. Предположим, что Ai 0 А2. Возьмем тогда окрестности V(Ai), V(А2) так, чтобы они не имели общих точек, т. е. V(Ai) Г) V(A2) = 0. По определению предела имеем О о lim f(x) = Дх => ЗС7Ь(а) (/№(«)) С V(A,)), о о lim f(x) = А2 => ЗЩ(а) (f(U'^a)) С V(A2) . ЕЭх-ta О Возьмем теперь проколотую окрестность £7# (а) точки а (предельной для Е) такую, что Ue(o) *С U'e(o>) О ^(а) (например, можно взять Ue(o>) = = Ug(a) Г) U^(a), поскольку это пересечение тоже есть проколотая окрест- ность) . Поскольку Ue(o) / 0, берем х Тогда f(x) G V(Ai) И V(A2), что невозможно, так как окрестности V(Ai), V(A2) по построению не имеют общих точек. ► Ь. Предельный переход и арифметические операции Определение 6. Если две числовые функции f t Е —> IR, д i Е —> 1R имеют общую область определения Е, то их суммой, произведением и част- ным называются соответственно функции, определенные на том же множестве
§ 2. ПРЕДЕЛ ФУНКЦИИ 111 следующими формулами: (/ + 5)(я) := f(x)+g(x), (f-g)(x) := /(ж) д(х), ( f(x] I — ) (х) := —г—г, если д(х) / 0 при х € Е. \gj д(х) Теорема 2. Пусть f: Е —> 1R и д : Е —> 1R — две функции с общей областью определения. Если lim f(x) = A, lim g(x) = В, то: ЕЭх—ЕЭх— a) lim (/ + g)(x) = А + В; ЕЗх— b) lim (f-g)(x) = Л-В; ЕЭх—>а (f\ — ) (от) = —, если В 0 и д(х) / 0 при х G Е. д' Эта теорема, как уже отмечалось в начале пункта 2, непосредственно вы- текает из соответствующей теоремы о пределах последовательностей, если учесть утверждение, доказанное в пункте 1. Теорему можно получить также, повторив доказательство теоремы об арифметических свойствах предела последовательности. Все изменения в до- казательстве, которые при этом придется провести, сведутся к тому, что всю- ду, где раньше мы выбирали nN G N, начиная с которого...», нужно будет выбирать некоторую проколотую окрестность Up; (а) точки а в множестве Е. Советуем читателю проверить это. Здесь же мы получим эту теорему из ее простейшего частного случая, когда А = В = 0 (утверждение с) при этом, разумеется, не рассматривается). Функцию f: Е —> К принято называть бесконечно малой при Е Э х —> а, если lim f(x) — 0. Еэх^а V ’ Утверждение 2. а) Если а: Е —> 1R и /3 : Е —> 1R — бесконечно малые функции при Е Э х —> а, то их сумма а -I- /? : Е —> 1R — также бесконечно малая функция при Е Э х а. Ь) Если а: Е —> 1R и (3: Е —> 1R — бесконечно малые функции при Е Э х —> -> а, то их произведение а • /?: Е —> К. — также бесконечно малая функция при Е Э х —> а. с) Если а : Е —> 1R — бесконечно малая функция при Е Э х —> а, а /? : Е —> —> 1R — финально ограниченная функция при Е Э х —> а, то произведение а • /? : Е —> 1R есть бесконечно малая функция при Е Э х —> а. ◄ а) Проверим, что ( lim а(х) = 0) Л [ lim /3(х) = 0 ) => f lim (а 4- /3)(х) = 0]. \ЕЭх—*а / \ЕЭх-+а / \ ЕЭх—/
112 ГЛ. III. ПРЕДЕЛ Пусть задано число £ > 0. По определению предела имеем ( lim q(t) = 0 ) => {BUE(a) Чх € UE(a) \ЕЭх~+а J \ v \ / о о lim $(х) = 0 ) => (3 U'M \/хе UE(a) ЕВх-+а / \ (mi < I))- \ £* / / ООО Тогда для проколотой окрестности {/^(а) С U'E(a) Г) UE(a) получаем О Vx € UE(a) |(а 4- /3)(ж)| = |а(ж) + /3(х)\ |а(ж)| 4- \/3(х)| < £, т. е. проверено, что lim (а 4- /3)(я) = 0. ЕВх—>а Ь) Это утверждение есть частный случай утверждения с), поскольку всякая функция, имеющая предел, финально ограничена. с) Проверим, что / X , О О ч ( lim а(х) = 0) Л (ВМе К 3UE(a) Уж € UE(a) (|/?М < М)) => \ ЕВх—ьа J => ( lim а(х) (3(х) = 0 \ Е^х— Пусть задано е > 0. По определению предела имеем (\ / О О / р \ \ lim а(х} = 0) => (3 UE(d) Vx G ^(а) (|а(я)| < — ) ). ЕВх—ta / \ \ M/J ООО Тогда для проколотой окрестности UE(a) С U'E(a) Г) Ue(o) получаем Vx е Щ(а) |(а • /3)0) | = ОО) £0)1 = |а(х)| |0(*)| < М = е. Тем самым проверено, что lim а(ж)/3(ж) = 0. ► ЕВх-t-a Теперь сделаем следующее полезное Замечание. lim f(x) = А <=> (f(x) = А 4- а(х)) Л ( lim а(х) — 0 ). ЕВх—>а \ЕВх—^а / Иными словами, функция f : Е -+ 1R стремится к А тогда и только то- гда, когда она может быть представлена в виде суммы А 4- а(х), где а(х) — бесконечно малая при Е Э х —> а функция (уклонение f(x) от А).1) Любопытная деталь: это почти очевидное, но очень полезное в вычислительном плане и важное в идейном отношении представление особо отмечалось французским математиком и механиком Лазаром Карно (1753 — 1823), революционным генералом и академиком, отцом родоначальника термодинамики Сади Карно (1796 — 1832).
§ 2. ПРЕДЕЛ ФУНКЦИИ 113 Это непосредственно следует из определения предела, в силу которого lim /(ж) = А <=> lim (/(ж) — А) — 0. —►л ЕЭх—►о Приведем теперь доказательство теоремы об арифметических свойствах предела функции, основанное на этом замечании и установленных свойствах бесконечно малых функций. ◄ а) Если lim f(x) = А и lim д(х) = В, то /(ж) = А 4- а(х) и д(х) = ЕЭх —ЕЭх—*а = В 4- /3(ж), где а(ж) и /3(ж) — бесконечно малые при Е Э х —> а. Тогда (/ + 9}&) - f(x) 4- д(х) = А 4- а(ж) 4- В + /3(х) = (А 4- В) + у(х), где у(х) = = а(ж) 4- /3(ж), как сумма бесконечно малых, есть бесконечно малая функция при Е Э х —> а. Таким образом, lim (/ + д)(х) = А 4- В. ЕЭх—^а Ь) Вновь представив /(ж) и д(х) в виде /(ж) = А 4- о(ж) и д(х) = В 4- /3(ж), имеем (/ • 9){х) = /(ж)р(ж) = (А + а(ж))(В + /3(ж)) = А • В + 7(ж), где 7(ж) = А/3(ж) 4- Ва(х) 4- а(ж)/3(ж) по свойствам бесконечно малых есть бесконечно малая функция при Е Э х —> а. Таким образом, lim (/ • д)(х) = А • В. ЕЭх-+а с) Вновь запишем, что /(ж) = А4-а(ж) и д(х) — В + /3(х), где lim а(х) = ЕЭх—^а — О, lim /3(ж) = 0. ЕЭх— Поскольку В 0, существует проколотая окрестность Ue(а), в любой точ- ке которой |/?(ж)| < ф, и потому |р(ж)| = \в 4- /?(ж)| |В| - |/?(ж)| > —L £ £ 0 12 1 Тогда в Ve(o) будем иметь также . < т. е. функция —г финально I0WI |В| д\х) ограничена при Е Э ж —> а. Теперь запишем 9 А _ /(ж) _ А _ А 4- а(ж) _ А _ В д(х) В В + 0(х) В = ‘ (Ва(х) + А^(х)) = 7(^)- ^(ж) В По свойствам бесконечно малых (с учетом доказанной финальной ограничен- ности ~7^) функция 7(ж) есть бесконечно малая при Е Э ж —> а. Таким / f \ Л образом, доказано, что lim ( — )(ж) = —. ► с. Предельный переход и неравенства Теорема 3. а) Если функции f : Е —> К и д: Е —> К таковы, что lim f(x) = A, lim д(х) = В и А < В, то найдется проколотая окрест- ЕЭх—>а 0 ЕЗх— ность Ue(o,) точки а в множестве Е, в любой точке которой выполнено неравенство f(x) < д(х).
114 ГЛ. III. ПРЕДЕЛ Ь) Если между функциями / : В —> R, g : Е —> R' в Л : В —> R на множе- стве Е имеет место соотношение f{x) g(x) h(x) и если lim f(x) = ЕЭх—ta — lim h(x) = С, то существует также предел д(х) при Е Э х —> а, причем ЕЭх->а lim д(х) = С. ЕЭх^а ◄ а) Возьмем число С такое, что А < С < В. По определению преде- О о ла найдем проколотые окрестности (7^ (а) и UE (а) точки а в множестве Е так, чтобы при х 6 UE(a) иметь |/(ят) — А| < С — А и при х 6 L^(a) иметь |<7(ат) — В| < В — С. Тогда в любой проколотой окрестности ^(а), содержа- О о щейся в UE(a) A UE(a), получим f(x) < А + (С - А) = С = В - (В - С) < р(ж). Ь) Если lim f(x} = lim h(x) = С, то по любому фиксированному е > О ЕЭх—ЕЭх-^а 0 о найдутся такие проколотые окрестности U'E(a) и UE(a) точки а в множестве О о Е, что при х G UE(a) имеем С — е < /(ж) и при х 6 UE(a) имеем h(x) < С + е. О 0 0 Тогда в любой проколотой окрестности Ue(cl}-> содержащейся в UE(a) A UE(а), будем иметь С — £ < f(x) д(х) h(x) < С 4- е, т. е. |«/(ат) — С| < е, и, следовательно, lim д(х) = С. ► ЕЭх— Следствие. Пусть lim f(x) = А и lim д(х) = В. Если в некоторой ЕЭх—*а ЕЭх—*а о проколотой окрестности Ue(o,) точки а: а) выполнено f(x) > д(х), то А В; Ь) выполнено /(ж) д(х), то А В; с) выполнено /(ж) > В, то А В; d) выполнено /(ж) В, то А В. ◄ Рассуждая от противного, из утверждения а) теоремы 3 немедленно получаем утверждения а), Ь) доказываемого следствия. Утверждения с), d) получаются из первых двух при д(х) = В. ► d. Два важных примера. Прежде чем переходить к дальнейшему изло- жению теории предела функции, продемонстрируем на двух важных примерах использование уже доказанных теорем. Пример 9. .. sin ж - lim----= 1. ж—>0 ж Здесь мы будем апеллировать к школьному определению sin ж как ордина- ты точки, в которую переходит точка (1,0) при повороте (с центром в начале координат) на угол ж (радиан). Полнота такого определения всецело зависит
§ 2. ПРЕДЕЛ ФУНКЦИИ 115 от того, насколько тщательно установлена связь между поворотами и действи- тельными числами. Поскольку сама система действительных чисел в школе не была описана достаточно подробно, надо считать, что нам необходимо уточнить определение sin х (то же самое отно- сится и к функции cost). В свое время мы это сделаем и обоснуем те рассуждения, которые сейчас будут опираться на наглядность. а) Покажем, что 2 SHIT . „ | | 7Г cos х <------< 1 при 0 < т < —. х 2 ◄ Так как cos2 х и — четные функции, то достаточно рассмотреть х случай 0 < х < тг/2. Из рис. 8 и определения cost и sinT, сравнивая площади сектора <OCD, треугольника к О АВ и сектора <ОАВ, имеем S<.ocd = i |ОС| • |СР| — (cosт)(тcost) = |tcos2t < А А < Здоав - | |ОА| • |ВС| = I * 1 * sinT = | sinT < Ai Ai Ai <S<Oab = ||О4| • |АВ| = 1 1 -х = к. Ai Ai Разделив эти неравенства на | т, получаем то, что и утверждалось. ► £i b) Из а) следует, что |sinT| |т| при любом т € R, причем равенство имеет место только для т = 0. ◄ При 0 < |т| < тг/2, как показано в а), имеем |sinT| < |т|. Но |sinт| 1, поэтому для |т| тг/2 > 1 также выполнено последнее неравен- ство. И только при т = 0 имеем sin т = т = 0. ► с) Из Ь) следует, что lim sin т — 0. х—>0 ◄ Поскольку 0 |sin т| |т| и поскольку lim |т| = 0, на основании тео- х —>0 ремы о связи предела функции с неравенствами получаем, что lim |sinT| = 0, х—>0 следовательно, lim sinT — 0. ► х—>0 d) Теперь докажем, что lim = 1. х —>0 X 5 Зорич В. Л.
116 ГЛ. III. ПРЕДЕЛ ◄ Считая, что |ж| < 7г/2, в силу полученного в а) неравенства имеем , .2 sm# 1 1 — sin х <----< 1. х Но lim (1 — sin2 х) = 1 — lim sin я • lim sinx = 1 — 0 = 1, значит, по теореме о ®-ИГ г->0 ж->0 v sin а; , предельном переходе в неравенствах можем заключить, что hm---= 1. ► х-+0 X Пример 10. Определение показательной, логарифмической и степен- ной функций на основе теории предела. Мы продемонстрируем сейчас, чем и как можно было бы дополнить школьное определение показательной и ло- гарифмической функций, если располагать теорией действительного числа и теорией предела. Для удобства ссылок и полноты картины проделаем всё с самого начала. а) Показательная функция. Пусть а > 1. 1° Для n € N полагаем по индукции а1 := a, an+1 := ап • а. Таким образом, на N возникает функция ап, которая, как видно из опре- деления, обладает свойством — =ат~п, а" если т, п G N и т > п. 2° Это свойство приводит к естественным определениям а°:=1, а~п := — при п G N, ап после которых функция ап оказывается распространенной на множество Z целых чисел и для любых т, п 6 Z ат ап = ат+п 3° В теории действительных чисел мы отметили, что для а > 0 и п 6 N существует единственный арифметический корень n-й степени из а, т. е. число х > 0 такое, что хп = а. Для него принято обозначение а1/”. Оно удобно, если мы желаем сохранить закон сложения показателей: а = а1 = (а1/п)п = а1/п... а1/” = oVn+...+i/n По той же причине естественно положить ат!п := (а1/”)”1 и а-1/п := = (а1/”)-1 для п G N и т G Z. Если окажется, что = amfn для k G Z,’to можно считать, что мы определили аг для г 6 Q. 4° Для чисел 0 < х, 0 < у по индукции проверяем, что для п € N (ж < у) <=> (хп < уп),
§ 2. ПРЕДЕЛ ФУНКЦИИ 117 поэтому, в частности, {х = у) О (хп = уп). 5° Это позволяет доказать правила действий с рациональными показате- лями, в частности, что а(тЛ)/(пЛ) = ат/п при И ami/ni . ат2/п2 _ атп1/п1 + т2/п2 ◄ Действительно, > О и amfn > 0. Далее, поскольку (a(mfc)/(nJfe))n* _ ^Ql/{nk)ynkyik _ (а1/(пЛ))т*п* _ = ((а1/**1*))”*)”1* =атк и (am/n)n* = ((а1/71)")771* = атк, то первое из проверяемых равенств в соответствии с 4° установлено. Аналогично, mi/ni . m2/n2\nin2 (4 (4 1 аТП1/щ\^2 /ат2/п2\П1П2 = И (flnu/ni+m2/n2)nin2 _ ^a(mm2+m2ni)/(nin2)^nin2 _ = ((а1/(П1П2))П1П2 )Ш1П2 + rn2ni _ amin2 + m2ni поэтому второе равенство также доказано. ► Таким образом, мы определили аг для г G Q, причем аг > 0 и для любых ri, г2 € Q аГ1-агг =аГ1+Г2. 6° Из 4° следует, что для п, г 2 6 Q (ri < 7*2) => (аГ1 < аГ2). ◄ Поскольку (1 < а) <=> (1 < а1/”) для п G N, что сразу следует из 4°, то (а1/”)”1 = amfn > 1 при п, т 6 N, что опять-таки следует из 4°. Таким образом, при 1 < а для г > 0, г G Q имеем ar > 1. Тогда при ri < Г2 на основе 5° получаем аГ2 = аГ1 • аГ2-Г1 > аГ1 • 1 = аГ1. ► 5*
118 ГЛ. III. ПРЕДЕЛ 7° Покажем, что для г о € Q lim аг — аг°. Q9r—>го ◄ Проверим, что ар —> 1 при Q Э р -> 0. Это следует из того, что при |р| < — имеем в силу 6° а"1/п < ар < а1/”. Мы зйаем, что а1/” —> 1 (и а-1/п —> 1) при п оо. Тогда стандартным рассуждением проверяем, что для е > 0 найдется 6 > 0 такое, что при |р| < <5 будет 1 — £<ap<l + s. В качестве 6 можно взять —, если 1 — е < а-1/п и а1/” < 1 + е. п Теперь докажем основное утверждение. По е > 0 подберем 6 так, что при |р| < 6 1 — Ea~r° < ар < 1 + Еа~Го. Если теперь |г — го| < &, то аг°(1 — Еа~г°) < аг = аг°• аг-г° < аГо(1 + Еа~Го), или аГо — е < аг < аг° + е. ► Итак, на Q определена функция аг со свойствами: а1 = а > 1; аГ1-аГ2 =аГ1+Г2; аГ1 < аГ2 при Г1 < г2', аГ1 аГ2 при Q Э Г1 —> Г2- Продолжим ее на всю числовую ось следующим образом. 8° Пусть I € R, з = sup аг и i = inf аг. Ясно, что s, i 6 R, так как Q9r<z Q9r>z при Г1 < х < г2 имеем аГ1 < аГ2. Покажем, что на самом деле s — i (и тогда эту величину мы обозначим через ах). ◄ По определению s и г, при и < х < г2 имеем ari s г аГ2. Тогда 0 i — s аГ2 — аГ1 = аГ1(аГ2-Г1 — 1) < з(аГ2-Г1 — 1). Но ар —> 1 при Q Э р —> 0, поэтому для любого е > 0 найдется 6 > 0 такое, что при
§ 2. ПРЕДЕЛ ФУНКЦИИ 119 О < Г2 — Г1 < 6 будет аГ2 Г1 — 1 < e/s. Тогда получим, что 0 i — з < £, и, поскольку е > 0 произвольно, заключаем, что i = з. ► Положим ах := s = i. 9° Покажем, что ах = lim аг. Q9r—>х ◄ Учитывая 8°, для е > 0 найдем г' < х так, что з — £ < ar з = ах, и г" так, что ах — i ar" < i + е. Поскольку т' < г < г" влечет аг < аг < аг , для всех г 6 Q, лежащих в интервале ]г', гп[, будем тогда иметь ах — £ < аг < ах + £. ► Займемся теперь свойствами построенной функции ах на R. 10° Для xi,Z2 G R при а > 1 (а?1 < ж2) => (а11 < а®2). ◄ На интервале ]a?i,Х2[ найдутся два рациональных числа и < г2. Если xi 7*1 < г2 я2, то по определению ах, данному в 8°, и свойствам функции ах на Q имеем а®1 ^аГ1 <аГ2 а®2. ► 11° Для любых Xi, Х2 € R верно аХ1 • аХ2 = аХ1+х2. ◄ В силу известных нам оценок абсолютной погрешности произведения и свойства 9° можно утверждать, что для любого е > 0 найдется число 6' > 0 такое, что при |xi — ri| < У, |я2 - г2| < 6' будет а®1. аХ2 - | < аГ1 • аГ2 < аХ1 • а®2 + 4» 4» Уменьшая, если нужно, 6', можно подобрать 6 < 6' так, что при |xi —ri| < 6, |ж2 — г2| < J, т. е. при 1(^1 + х2) — (ri + г2)| < 26, будем иметь также дП + Гг _ £ < qX1 + X2 < дГ14-Г2 | £ 2 2 Но аГ1 • а1"2 = аГ1+Г2 для ri,r2 G Q, значит, из полученных неравенств вытекает, что аХ1 • а®2 - £ < а®1+®2 < а®1 • а®2 + £. Поскольку е > 0 произвольно, заключаем, что аХ1- аХ2 = а®1+®2. ► 12° lim ах — аХо. (Напомним, что «х xq» — принятое сокращение для X—¥хо «R Э х яо»-) ◄ Проверим сначала, что lim ах = 1. По е > 0 найдем п G N так, что • х—>0 1 - £ < a“1/n < а1/” < 1 + £.
120 ГЛ. III. ПРЕДЕЛ Тогда в силу 10° при |я| < 1/п будем иметь 1 — е < а-1/” < ах < а1/” < 1 + €, т. е. проверено, что lim ах = 1. х—>0 Если теперь взять 6 > 0, чтобы при |х — Хо| < <5 было (а®-10 — 1| < еа-®0, то получим ах° - £ < ах = ах° (ах~х° - 1) < а®0 4- € и тем самым проверено, что lim а® = а®0. ► X— 13° Покажем, что множеством значений построенной функции х ах является множество IR_|_ всех положительных действительных чисел. ◄ Пусть уо € I&+- Если а > 1, то, как нам известно, найдется число п G N такое, что а~п < уо < ап. В силу этого оба множества А = {х G R| ах < уо} и В = {х G R| уо < а®} непусты. Но поскольку (xi < Х2) <=> (а®1 < а®2) (при а > 1), то для любых чисел Xi, Х2 € R таких, что Xi € А и х% G В, имеем xi < X2- Следовательно, к множествам А и В применима аксиома полноты, из которой следует суще- ствование числа Xq такого, что xi х0 %2 для любых элементов xi € А и Х2 G В. Покажем, что а®0 = у0- Если бы было а®0 < 3/0, то, поскольку а®°+1/п -> ах° при п —> оо, нашлось бы число п G N такое, что ахо+1/п < уо. Получилось бы, что (хо 4—) G А, \ п/ в то время как точка xq разделяет А и В. Значит, предположение а®0 < уо неверно. Аналогично проверяем, что неравенство а®0 > уо тоже невозможно. По свойствам действительных чисел отсюда заключаем, что а®0 = уо. ► 14° Мы пока считали, что а > 1. Но все построения можно было бы по- вторить и для 0 < а < 1. При этом условии 0 < ar < 1, если г > 0; по- этому в 6°, а затем окончательно в 10° теперь получим, что при 0 < а < 1 (zi < Х2) => (а®1 > а®2). Итак, при а > 0, а / 1 на множестве R действительных чисел' мы постро- или действительнозначную функцию х •-> ах со следующими свойствами: 1) а1 = а; 2) а®1- а®2 = аХ1+Х2; 3) а® —> а®0 при х -> xq; 4) (а®1 < а®2) <=> (xi < Х2), если а > 1, (а®1 > а®2) <=> (xi < £2), если 0 < а < 1; 5) множеством значений функции х •-> а® является множество 1&+ = {у G G R10 < у} всех положительных чисел.
§ 2. ПРЕДЕЛ ФУНКЦИИ 121 Определение 7. Отображение х •-> ах называется показательной или экспоненциальной функцией при основании а. Особенно часто встречается функция х ех, когда а = е, которую нередко обозначают через ехрж. В связи с этим для обозначения функции х •-> ах также иногда используется символ ехро х. Ь) Логарифмическая функция. Поскольку отображение ехра : R -> R+, как видно из свойств показательной функции, биективно, оно имеет обратное отображение. Определение 8. Отображение, обратное к ехра : R -> R+, называется логарифмической функцией при основании а (0 < а, а / 1) и обозначается символом : ®Ч- К. Определение 9. При основании а = е логарифмическая функция, или логарифм, называется натуральным логарифмом и обозначается In: R+ -> R. Причина такой терминологии прояснится при другом, во многом даже бо- лее естественном и прозрачном подходе к логарифмам, который мы изложим после построения основ дифференциального и интегрального исчисления. По определению логарифма как функции, обратной экспоненциальной, имеем Vx е R (log^a”) = х), VyeR+ (а'°ы = у). Из этого определения и свойств показательной функции, в частности, полу- чается, что в области R+ своего определения логарифм обладает следующими свойствами: Г) logoa = 1; 2') loga(j/i ’ У2) = logo yi 4- loga у2; 3') logo у -> logoуо при R+ Э у у0 G R+; 4') (logoj/i < loga у2) <=> (2/1 < 2/2), если а > 1, (loga yi > loga 2/2) <=> (yi < 2/2), если 0 < a < 1; 5') множество значений функции loga: R+ -> R совпадает с множеством R всех действительных чисел. ◄ Из свойства 1) показательной функции и определения логарифма полу- чаем 1')- Из свойства 2) показательной функции получаем 2'). Действительно, пусть xi = logo 2/1 и х2 = loga 2/2- Тогда 2/1 = а®1, у2 = а®2 и по 2) 2/1 • У2 = а®1 • а®2 = = а®1+®2, откуда loga(2/i • 2/2) =«i+ я2.
122 ГЛ. III. ПРЕДЕЛ Аналогично, свойство 4) показательной функции влечет свойство 4') лога- рифмической. Очевидно, 5) => 5'). Осталось доказать 3'). В силу свойства 2') логарифма (У — Уо поэтому неравенства -£ < loga у - loga у0 < £ равносильны соотношению loga (a *) = -£< loga ( ) <6 = loga (ae), \Уо/ которое по свойству 4') логарифма равносильно -а£<У- Уо при а а а£ У З/о при 0 < а а В любом случае мы получаем, что если уоа £ <у < уоае при а или уоа£ <у < уоа £ при 0 < а то -£ < loga у - loga уо < е. Таким образом, проверено, что D lin* 1оёа У = 1оКа У0 • R+Э у—>• уо На рис. 9 изображены графики функций е®, 10®, In ж, log10a; = =: logх, а на рис. 10 — графики функций (- 1 , (0,1)®, logj/gX, log01z. \ е / Остановимся еще на одном свойстве логарифма, которым тоже часто при- ходится пользоваться.
§ 2. ПРЕДЕЛ ФУНКЦИИ 123 Покажем, что для любого Ь > 0 и любого а 6 К справедливо равенство 6') logo(6a) = ologa&. ◄ 1° Равенство справедливо при а = п G N, ибо из свойства 2') логарифма по индукции получаем loga(yi... уп) = loga j/i + ... + loga уп, значит, loga(fen) = toga &+••+ toga Ь = n loga b. 2° loga(b-1) = - loga 6, ибо если (3 = loga 6, то b = a0, 6-1 = a~0 и loga (6-1) = —/3. 3° Из 1° и 2° теперь заключаем, что для a G Z равенство loga(6a) = a loga b справедливо. 4° loga(6^n) = loga b при п G Z. Действительно, 71 loga b = loga (61/n)n = nloga (Ь1/п). 5° Теперь можно проверить, что для любого рационального числа а = — G G Q утверждение справедливо. В самом деле, loga b = mloga (61/n) = loga (&1/n)m = loga (6m/n). IV 6° Но если равенство loga br = rloga b справедливо для любого г £ Q, то, устремляя г по Q к а, на основании свойства 3) показательной и свойства 3')
124 ГЛ. III. ПРЕДЕЛ логарифмической функций получаем, что если г достаточно близко к а, то Ьг близко к Ьа и loga br близко к loga bQ. Это означает, что lim loga6r = loga6a. Q3r—>ot Ho loga br = r loga b, поэтому loga ba = lim loga br — lim r loga b = a loga b. ► QSr—>ot Q3i—►<* Из доказанного свойства логарифма можно сделать вывод, что для любых а, /3 € К и а > 0 имеет место равенство 6) (ааУ = аа^. ◄ При a = 1 считаем, по определению, Iе* = 1 для a € R. Таким образом, в этом случае равенство тривиально. Если же а 1, то по доказанному loga((aa)^) = £loga(aa) = 0 • alogaa = /3 • а = loga(aa/?), что в силу свойства 4') логарифма доказывает справедливость указанного равенства. ► с) Степенная функция. Если считать 1а = 1, то при любом я > 0 и a € R мы определили величину ха (читается «ж в степени а»). Определение 10. Функция х •-> ха, определенная на множестве положительных чисел, называ- ется степенной функцией, а число а называется показателем степени. Степенная функция, очевидно, является композицией показатель- ной и логарифмической функций, точнее, ха = alo8»<®e) = ааХо^х. На рис. 11 изображены графики функции у = ха при различных зна- чениях показателя степени. 3. Общее определение предела функции (предел по базе). Дока- зывая свойства предела функции, мы убедились, что от проколотых окрест- ностей, в которых были определены наши функции и которые возникали в процессе доказательств, кроме свойств Bi), В2), указанных во введении к предыдущему пункту 2, действительно ничего не потребовалось. Это обсто- ятельство служит оправданием для выделения следующего математического объекта.
§ 2. ПРЕДЕЛ ФУНКЦИИ 125 а. База; определение и основные примеры Определение 11. Совокупность В подмножеств В С X множества X будем называть базой в множестве X, если выполнены два условия: Bj) VBgB (В/0); В2) VBi G В VB2eB ВВеВ (В С Bt П В2). Иными словами, элементы совокупности В суть непустые множества и в пересечении любых двух из них содержится некоторый элемент из той же совокупности. Укажем некоторые наиболее употребительные в анализе базы. Обозначение базы Чтение обозначения Из каких множеств (элементов) состоит база Определение и обозна- чение элементов базы х —> а х стремится к а База проколотых окрестностей точ- ки а € R U(a) := — {х € R | а — <51 < <х<а +62 Лх^ а}, где <51 > 0, <52 > 0 я —> оо х стремится к бесконечности База окрестностей бесконечности [/(оо) := = {х € R|<5 < |т|}, где <5 € R х —> а, х € Е или Е Э х —> а или х —> а еЕ х стремится к а по множеству Е База*) проколотых окрестностей точки а в множестве Е UE(a) :=EfW(a) х —> оо, х € Е или Е Э х —> оо или х —> оо еЕ х стремится к бесконечности по множеству Е База**) окрестностей бесконечности в мно- жестве Е Ue(oo) := ВП[/(оо) Предполагается, что а — предельная точка множества Е. **) Предполагается, что множество Е не ограничено. Если Е — Е+ = {ж G R| х > а} (В = Е~ = {ж G R|x < а}), то вместо х а, х G Е пишут х —> а + О (х —> а — 0) и говорят, что х стремится к а справа или со стороны больших значений (соответственно, слева или со стороны меньших значений). При а = 0 принята краткая запись х —> +0 (х —> —0) вместо х —> 0 + 0 (х —> 0 — 0).
126 ГЛ. III. ПРЕДЕЛ Запись Е Э х -> а + О (Е Э х -> а - 0) будет употребляться вместо х -> а, х 6 ЕГ\ Е+ (х -> а, х G Е П Е~}. Она означает, что х стремится по множеству Е к а, оставаясь больше (меньше), чем а. Если Е = Е+, = {ж G R| с < ж} (Е = Е^ = {ж G К|ж < с}), то вместо х —> оо, х G Е пишут х -> +оо (х —> —оо) и говорят, что х стре- мится к плюс бесконечности (соответственно, к минус бесконечности}. Запись Е 3 х —> +оо (Е Э х —> —оо) будет употребляться вместо х —> оо, х е Е П Е+ (х оо, х е Е П Е^). При Е = N вместо х -> оо, х G N мы (если это не ведет к недоразумению) будем, как это принято в теории предела последовательности, писать п —> оо. Заметим, что все перечисленные базы обладают той особенностью, что пе- ресечение любых двух элементов базы само является элементом этой базы, а не только содержит некоторый элемент базы. С другими базами мы встретимся при изучении функций, заданных не на числовой оси1). Отметим также, что используемый здесь термин «база» есть краткое обо- значение того, что в математике называется «базисом фильтра», а введенный ниже предел по базе есть наиболее существенная для анализа часть созданно- го современным французским математиком А. Картаном понятия предела по фильтру2). Ь. Предел функции по базе Определение 12. Пусть f: X —> R — функция на множестве X; В — база в X. Число А € R называется пределом функции f : X -> R по базе В, если для любой окрестности V(А) точки А найдется элемент В G В базы, образ которого f(B} содержится в окрестности У (А). Если А — предел функции f: X —> R по базе В, то пишут lim/(ж) = А. Повторим определение предела по базе в логической символике: lim/(ж) = А := VV(A) ЗВ G В (/(B)CV(A)). Поскольку мы сейчас рассматриваем функции с числовыми значениями, полезно иметь в виду и следующую форму этого основного определения: lim/(ж) = А := Ve > О ЗВ G В Ухе В (|/(ж) - А| < е). ^Например, совокупность открытых (без граничной окружности) кругов, содержащих данную точку плоскости, является базой. Пересечение двух элементов базы не всегда круг, но всегда содержит круг из нашей совокупности. 2)Подробнее об этом см.: Бурбаки Н. Общая топология. М.: ИЛ, 1958.
§ 2. ПРЕДЕЛ ФУНКЦИИ 127 В этой формулировке вместо произвольной окрестности V(А) берется сим- метричная (относительно точки А) окрестность (^-окрестность). Эквивалент- ность этих определений для вещественнозначных функций вытекает из того, что, как уже говорилось, в любой окрестности точки содержится некоторая симметричная окрестность этой же точки (проведите доказательство полно- стью!). Мы дали общее определение предела функции по базе. Выше были рас- смотрены примеры наиболее употребительных в анализе баз. В конкретной задаче, где появляется та или иная из этих баз, необходимо уметь расшифро- вать общее определение и записать его для конкретной базы. Так, lim /(х) = А := Vs > О 3J>0 VxG]a — а[ (|/(х) — А| < s), х—>а—О lim f(x) = А := Vs > О 36 G R Чх<6 (|/(х) - А| < s). х—>—оо Рассматривая примеры баз, мы, в частности, ввели понятие окрестности бесконечности. Если использовать это понятие, то в соответствии с общим определением предела разумно принять следующие соглашения: lim/(x) = оо := VV(oo) ЗВ G В (/(В)) С V(oo)} или, что то же самое, lim/(x) = оо := Vs > О ЗВ G В Vx G В (s < |/(х)|), lim/(х) = +оо := Vs G R 3BGB VxGB (s < /(x)), lim/(x) = -oo := Vs G R 3B G В Vx G В (/(x) < s). Обычно под s подразумевают малую величину. В приведенных определе- ниях это, разумеется, не так. В соответствии с принятыми соглашениями, например, можем записать lim /(х) = -оо := Vs G R 3J G R Vx > 3 (/(х) < s). X—► + оо Советуем читателю самостоятельно написать полное определение предела для различных баз в случае конечных (числовых) и бесконечных пределов. Для того чтобы можно было считать доказанными и в общем случае пре- дела по произвольной базе все те теоремы о пределах, которые мы доказали в пункте 2 для специальной базы Е Э х —> а, необходимо дать соответствую- щие определения: финально постоянной, финально ограниченной и бесконечно малой при данной базе функций. Определение 13. Функция f: X —> R называется финально постоянной при базе В, если существуют число A G К и такой элемент В G В базы, в любой точке х G В которого /(х) = А.
128 ГЛ. III. ПРЕДЕЛ Определение 14. Функция /: X —> IR называется ограниченной при базе В или финально ограниченной при базе В, если существуют число с € К и такой элемент В СВ базы, в любой точке х € В которого |/(я)| < с. Определение 15. Функция f: X —> R называется бесконечно малой при базе В, если lim f(x) = 0. После этих определений и основного наблюдения о том, что для доказа- тельства теорем о пределах нужны только свойства Bi) и Вэ) базы, можно считать, что все свойства предела, установленные в пункте 2, справедливы для пределов по любой базе. В частности, мы можем теперь говорить о пределе функции при х —> оо, или при х —> —оо, или при х —> Ч-оо. Кроме того, мы обеспечили себе возможность применения теории пределов и в том случае, когда функции будут определены не на числовых множествах; в дальнейшем это окажется особенно ценным. К примеру, длина кривой есть числовая функция, определенная на некотором классе кривых. Если мы знаем эту функцию на ломаных, то потом предельным переходом определяем ее для более сложных кривых, например для окружности. В данный же момент основная польза от сделанного наблюдения и введен- ного в связи с ним понятия базы состоит в том, что они избавляют нас от проверок и формальных доказательств теорем о пределах для каждого кон- кретного вида предельных переходов или, в нашей нынешней терминологии, для каждого конкретного вида баз. Для того чтобы окончательно освоиться с понятием предела по произволь- ной базе, доказательства дальнейших свойств предела функции мы проведем в общем виде. 4. Вопросы существования предела функции а. Критерий Коши. Прежде чем формулировать критерий Коши, да- дим следующее полезное Определение 16. Колебанием функции f: X —> Ж на множестве Е С X называется величина w(/;E) := sup |/(zi) - /(ж2)|, Xl т. е. верхняя грань модуля разности значений функции на всевозможных парах точек xi, Х2 6 Е. Примеры. 11) o>(z2; [-1,2]) =4. 12) w(s; [-1,2]) =3. 13) си(щ;] - 1,2[) = 3.
§ 2. ПРЕДЕЛ ФУНКЦИИ 129 14) cj(sgnz; [-1,2]) = 2. 15) cu(sgnz; [0,2]) = 1. 16) cu(sgnz; ]0,2]) =0. Теорема 4 (критерий Коши существования предела функции). Пусть X — множество и В — база в X. Функция f: X —> Ж илсеетл предел по базе В в том и только в том случае, когда для любого числа е > 0 найдется элемент В 6 В базы, на котором колебание функции меньше е. Итак, a lim/(z) <=> Уе > 0 ЗВ е В < е). ◄ Необходимость. Если lim/(z) = А, то для любого е > 0 найдется элемент В базы В, в любой точке х которого |/(z) — А| < е/3. Но тогда для любых Xi, Z2 из В - f(x2)\ < 1/(^1) - А| + |/(г2) - А| < Ь О и, значит, си(/; В) < е. Достаточность. Докажем теперь основную часть критерия, утвер- ждающую, что если для любого е > 0 найдется элемент В базы В, на котором cj(/; В) < е, то функция f имеет предел по базе В. тт л 1 1 Придавая е последовательно значения 1, -, ... , -, ..., получим послед о- 2 п вательность Bi, В2, ... , Вп, ... элементов базы таких, что шг(/;Вп) < 1/п, п 6 N. Поскольку Вп И 0, в каждом Вп можно взять по точке хп. После- довательность /(zi), /(^2), ... , f(xn), ... фундаментальная. Действительно, Вп П Вт 0, и, взяв вспомогательную точку х G Вп П Вт, получим, что |/(zn) - f(xm)\ < \f(xn) - /(ж) I + |/(z) - /(zm)| < 1/n + 1/rn. По доказанному для последовательностей критерию Коши, последовательность {/(zn), п 6 N} имеет некоторый предел А. Из установленного выше неравенства при т —> оо следует, что |/(zn) — А| 1/п, а отсюда, учитывая, что w(J;Bn) < 1/п, за- ключаем теперь, что если п > N — [2/е] 4-1, то в любой точке х 6 Вп будет |/(z) - А\ < Е. ► Замечание. Проведенное доказательство, как мы увидим позже, оста- ется в силе для функций со значениями в любом так называемом полном про- странстве У. Если же У = R, а этот случай нас сейчас в первую очередь и интересует, то при желании можно пользоваться той же идеей, что и в дока- зательстве достаточности критерия Коши для последовательностей. ◄ Полагая тв = inf /(z), Mb — sup/(z) и замечая, что для любых эле- ®св хев ментов Bi,B2 базы В выполнено твх пгв^Вз Мвгпв2 -Мв2> по аксио- ме полноты найдем число А € R, разделяющее числовые множества {тпв} и
130 ГЛ. III. ПРЕДЕЛ {Мв}, где В G В. Поскольку cj(/; В) = Мв~тв, то теперь можно заключить, что как только си(/;В) < е, так |/(т) - А| < е в любой точке х G В. ► Пример 17. Покажем, что в случае, когда X = N и В есть база п оо, n G N, доказанный общий критерий Коши существования предела функции совпадает с рассмотренным ранее критерием Коши существования предела последовательности. Действительно, элементом базы п —> оо, п € N является множество В = = N Cl U(оо) — {п € N | п > N} тех натуральных чисел п € N, которые больше некоторого числа N € К. Без ограничения общности можно считать, что N G N. Соотношение a>(f;B) < е в нашем случае означает, что Уп1,П2 > N имеем |/(П1) — /(пг)! < е. Таким образом, условие, что для любого е > 0 найдется элемент В 6 В базы, на котором колебание о?(/; В) функции f меньше е, для функции f: N —> —> R равносильно условию фундаментальности последовательности {/(п)}. Ь. Предел композиции функций Теорема 5 (о пределе композиции функций). Пусть Y — множество; Ву — база в Y; g : У —> Ж — отображение, имеющее предел по базе Ву- Пусть X — множество, Вх — база в X и f: X —> У — такое отображе- ние X в Y, что для любого элемента By 6 Ву базы Ву найдется элемент Вх G Вх базы Вх, образ которого f(Bx} содержится в Ву. При этих условиях композиция g о f : X —> R отображений fug опреде- лена, имеет предел по базе Вх и lim(<? °/)(х) = limp(j/). Вх Ву ◄ Композиция g о f: X —> Ж определена, поскольку f(X) С У. Пусть limg(y) — А. Покажем, что lim (gof)(x) — А. По заданной окрестно- му Вх сти У(А) точки А найдем элемент By G Ву базы Ву такой, что g(By) С У(А). По условию найдется элемент Вх 6 Вх базы Вх такой, что f(Bx) С Ву. Но тогда (д о f}(Bx) = g(f(Bx)) С д(Ву) С У(А) и мы, таким образом, прове- рили, что А является пределом функции (д о /): X —> Ж по базе Вх. ► тт юг sin 7т „ Пример 18. lim—— = ? х-+о ~х Если положить д(у) = а /(т) = 7т, то (д о /)(т) = в нашем У 7х случае У = R\0, X = R. Поскольку lim д(у) = lim = 1, то для примене- у-+0 у-+0 у ния теоремы надо проверить, что, какой бы элемент базы у —> 0 мы ни взяли, найдется элемент базы т —> 0, образ которого при отображении /(т) = 7т со- держится в указанном элементе базы у —> 0. Элементами базы у —> 0 являются О проколотые окрестности Ву(О) точки 0 € R. Элементами базы т —> 0 также являются проколотые окрестности t/x(0) точки 0 G R. Пусть ?7у(0) = {j/ G 1R | от < з/ < /?, (где а, Д € R, причем
§ 2. ПРЕДЕЛ ФУНКЦИИ 131 а < 0, /3 > 0) — произвольная проколотая окрестность нуля в Y. Если взять Ux(ty = {х € Ж | ~ < х < то эта проколотая окрестность нуля в X 7 7 ооо уже обладает тем свойством, что /(?/х)(0) = С?у(0) С С?у(0). Условия теоремы выполнены, и теперь можно утверждать, что ,. sm7z ,. smw - lim —— = hm —- = 1. x—>o 7x y->o у Пример 19. Функция g(y) = |sgny|, как мы уже видели (см. пример 3), имеет предел lim |sgnj/| = 1. J/-+0 Функция у — f(x) — я; sin -, определенная при х ф 0, также имеет предел X lim х sin - = 0 (см. пример 1). Однако функция (д о /) (ж) = ( • sgn х sin - \ х / при х —> 0 не имеет предела. sgn (х sin - \ х Действительно, в любой проколотой окрестности точки х = 0 имеются ну- , 1 ли функции sm -, поэтому функция X принимает и значение 1, и значение 0 и по критерию Коши не может иметь в любой такой окрестности предел при х —> 0. Не противоречит ли это доказанной теореме? Проверьте, как мы сделали это в предыдущем примере, выполнены ли здесь условия теоремы. Пример 20. Покажем, что / 1V lim (14— ) — е. ◄ Пусть У = N, Ву — база п —> оо, п € N; X = Ж.+ = {х 6 Ж. | х > 0}, Вх ~ база х —> +оо; f : X —> У есть отображение х [х], где [я] — целая часть числа х (т. е. наибольшее целое число, не превосходящее числа х). Тогда для любого элемента By = {п € N|n > N} базы п -> оо, п € N, очевидно, найдется элемент Вх = {ж 6 R|® > ^ + l} базы х -> +оо, образ которого при отображении х —> [я] содержится в Ву. Функции д(п) = (1 + -) , ^(п) = (14- , 52 (п) = (1 + + , как \ П/ \ пт I/ \ П/ нам уже известно, имеют своим пределом по базе п —> оо, п Е N число е.
132 ГЛ. III. ПРЕДЕЛ По теореме о пределе композиции функций можно утверждать, что тогда функции / л \[«] / I \И (^o/)(z)= ^14-^jJ , (gio/)(g) = + + > / 1 \(®]+1 (Р2°/)(ж) = (j +эд,) также имеют своим пределом по базе х —> 4-сю число е. Теперь остается заметить, что при х 1 и так как при х —> +оо крайние члены стремятся к е, то по свойствам предела / 1 \х (теорема 3) получаем lim (1 4- -J = е. Используя теорему о пределе композиции функций, покажем теперь, что lim (14--) = е. х—>—оо\ X/ Запишем / 1N* ( 1 / 1\— lim (14- — ) = lim (1 4- 7—г I = lim (1----------------) = Х-+-00 \ х) (-t)->-Oo\ (— t) J t-*+<x> \ t/ / 1 V /1 V"1 / 1 = lim (1 4- -—7 ) = lim (14- -—7 ) lim (1 4- -—7 t—►-boo \ t — 1 / t—►-boo \ 1 / t—►'boo \ t — 1 / 1 V-1 ( iv — lim ( 1 4- -—7 ) = lim (14— ) — e. t—>+00 \ t — 1 / и—>+00 \ и / Написанные равенства с учетом произведенных замен и = t — 1 и t = — х обосновываются с конца (!) на основе теоремы о пределе композиции функ- (1 \и 14-- ) , и / существование которого уже доказано, теорема позволяет утверждать, что предыдущий предел тоже существует и равен этому. Тогда и стоящий перед ним предел существует, и конечным числом таких переходов придем к ис- ходному пределу. Это довольно типичный пример процедуры использования теоремы о пределе сложной функции при вычислении пределов. Итак, мы имеем / 1\® / 1V lim (14- — ) = е lim (14— ) . х-+—00 \ х / Х-++00 \ х / / 1 X ® Отсюда следует, что lim (14— ) = е. х—>00 \ X/ Действительно, пусть задано число е > 0.
§ 2. ПРЕДЕЛ ФУНКЦИИ 133 / 1 \ж Поскольку lim (14--) = е, найдется число Ci G Ж такое, что при х < Ci х—>—оо \ X/ / 1\« будет (14— ) — е < е. ( 1 \ и Поскольку lim (14--) — е, найдется число сг € Ж такое, что при сг < х z-H-oo\ X/ / J \« будет (14--) — е \ х / Тогда при |х| > с = max{|ci|, |с2|} будем иметь / 1 \® самым проверено, что lim (14--) = е. ► х—>оо \ х/ е. 1 \ж - ) — e < e. Тем xj Пример 21. ◄ После замены х дыдущем примере. ► Пример 22. lim (1 4-= е. t->ov ' = 1/t возвращаемся к пределу, рассмотренному в пре- X lim — =0, если q > 1. ◄ Мы знаем (см. § 1, пример 11), что lim — = 0, если q > 1. n—>оо qn Теперь, как и в примере 3, можно рассмотреть вспомогательное отобра- жение f: > N, осуществляемое функцией [ж] (целая часть ж). Воспользовавшись неравенствами 1 [ж] х q дИ qx и учитывая, что по теореме о пределе сложной функции крайние члены стре- мятся к нулю при я —> +оо, заключаем, что lim — — 0. к Q Пример 23. lim 2^ = 0. х—++оо х ◄ Пусть а > 1. Полагаем t — logaz, находим х ~ а( . По свойствам показательной и логарифмической функций (учитывая неограниченность ап, п € N) имеем (х —> 4-оо) <=> (t —> 4-оо). Используя теорему о пределе сложной функции и результат примера 4, получаем loga х t lim —— = lim — = 0. x—>4-00 X t—>4-oo Cr Если 0 < a < 1, то положим — t = logax, x = a~l. Тогда (т"—> 4-oo) <=> О (t —> +oo), и так как 1/a > 1, то снова г г г t п hm -----— = hm —- = — hm --------------7 = 0. ► x—>4-oo X t—>4-oo a 1 t—>4-oo (1/д)Е
134 ГЛ. III. ПРЕДЕЛ с. Предел монотонной функции. Рассмотрим теперь один частный, но весьма полезный класс числовых функций — монотонные функции. Определение 17. Функция f: Е —> R, определенная на числовом мно- жестве Е С К, называется возрастающей на Е, если Vari, х2 € Е (xi < х2 => /(xi) < /(z2)); неубывающей на Е, если Vzi,z2 G Е (xi <х2=> №i) f(x2Y); невозрастающей на Е, если Vsci,х2 ЕЕ (®i < х2 => /(zx) /(z2)); убывающей на Е, если Vzb х2 ЕЕ (zx < х2 => /(zx) > f(x2)j. Функции перечисленных типов называются монотонными на множестве Е. Предположим, что числа (или символы —оо, +оо) i = inf 7? и s = sup I? являются предельными точками множества Е и f : Е —> R — монотонная функция на Е. Имеет место следующая Теорема 6 (критерий существования предела монотонной функции). Для того чтобы неубывающая на множестве Е функция f : Е —> R. имела предел при х —> s, х 6 Е, необходимо и достаточно, чтобы она была ограни- чена сверху, а для того чтобы она имела предел прих —> i, х 6 Е, необходимо и достаточно, чтобы она была ограничена снизу. ◄ Докажем теорему для предела lim /(z). ЕЭх—ts Если этот предел существует, то, как и всякая функция, имеющая предел, функция f оказывается финально ограниченной при базе Е Э х —> з. Поскольку / — неубывающая на Е функция, отсюда следует, что f огра- ничена сверху. На самом деле можно утверждать даже, что /(z) lim /(z) ЕЭх—ts для любого х 6 Е. Это будет видно из дальнейшего. Перейдем к доказательству существования предела lim /(z) при условии Еэх-^s ограниченности / сверху. Если / ограничена сверху, то существует верхняя грань значений, кото- рые функция принимает на множестве Е. Пусть А = sup /(z); покажем, что х£Е lim /(z) = А. По е > 0, на основании определения верхней грани множе- ЕЭХ-+3 ства, найдем точку zq 6 Е, для которой А — £ < f(xo) А. Тогда ввиду неубывания f на Е получаем, что при zq < х € Е будет А — £ < /(z) А. Но
§ 2. ПРЕДЕЛ ФУНКЦИИ 135 множество {х € Е|х0 < ж}, очевидно, есть элемент базы х —> s, х е Е (ибо s = supE1). Таким образом, доказано, что lim /(х) = А. ЕЭх-+з Аля предела lim /(х) все рассуждения аналогичны. В этом случае имеем ЕЭх-ti lim J(x) = inf/(ж). ► ЕЭх—tt х£Е d. Сравнение асимптотического поведения функций. Этот пункт мы начнем поясняющими тему примерами. Пусть 7г(х) — количество простых чисел, не превосходящих данного ве- щественного числа х 6 Ж. Имея возможность при любом фиксированном х найти (хотя бы перебором) значение 7г(ж), мы тем не менее не в состоянии сразу ответить, например, на вопрос о том, как ведет себя функция тг(х) при х —> Ч-оо или, что то же самое, каков асимптотический закон распределения простых чисел. От Евклида нам известно, что тг(х) —> 4-оо при х -> 4-оо, но доказать, что тг(х) растет примерно как т-^-, удалось только в прошлом веке 1ХХ X П. Л. Чебышеву1^. Когда возникает вопрос об описании поведения функции вблизи некоторой точки (или бесконечности), в которой, как правило, сама функция не опреде- лена, говорят, что интересуются асимптотикой или асимптотическим по- ведением функции в окрестности этой точки. Асимптотическое поведение функции обычно характеризуют с помощью другой, более простой или более изученной функции, которая в окрестности исследуемой точки с малой относительной погрешностью воспроизводит зна- чения изучаемой функции. Так, тг(х) при х -> 4-ос ведет себя как функция при х —> О ведет себя как постоянная функция, равная 1; говоря о поведении функции 9.1 х 4- х 4- sm - при х —> оо, мы, ясно, скажем, что она в основном ведет себя х как функция х2, а при х —> 0 — как sin -. X Дадим теперь точные определения некоторых элементарных понятий, от- носящихся к асимптотическому поведению функций. Этими понятиями мы будем систематически пользоваться уже на первом этапе изучения анализа. Определение 18. Условимся говорить, что некоторое свойство функ- ций или соотношение между функциями выполнено финально при данной базе В, если найдется элемент В Е В базы, на котором оно имеет место. Именно в этом смысле мы до сих пор понимали финальное постоянство или финальную ограниченность функции при данной базе. В этом же смысле мы дальше будем говорить, например, о том, что финально выполнено соотно- шение f(x) = g(x)h(x) между некоторыми функциями /, g, h. Эти функций ^П. Л. Чебышев (1821 — 1894) — великий русский математик и механик, основатель большой математической школы в России.
136 ГЛ. III. ПРЕДЕЛ могут даже иметь разные исходные области определения, но если мы инте- ресуемся их асимптотическим поведением при базе В, то нам важно только, чтобы все они были определены на некотором элементе базы В. t Определение 19. Говорят, что функция f есть бесконечно малая по сравнению с функцией д при базе В и пишут / == о(д) или f = о(д) при В, если финально при базе В выполнено соотношение f(x) = а(х) • д(х), где а — функция, бесконечно малая при базе В. Пример 24. х2 — о(х) при х —> 0, так как х2 — х • х. Пример 25. х — о(х2} при х —> оо, так как финально, когда уже х ф О, 1 о X = - • X. X Из этих примеров надо сделать вывод, что указание базы, при которой f = о(р), совершенно необходимо. Обозначение / = о(д) читается «/ есть о малое от д». Из определения следует, в частности, что получающаяся при д(х) = 1 за- пись f = о(1) означает просто, что f есть бесконечно малая при базе В. Определение 20. Если f = о(д) и функция д сама есть бесконечно в малая при базе В, то говорят, что f есть бесконечно малая более высокого по сравнению с д порядка при базе В. Пример 26. х 2 = — при х —> оо есть бесконечно малая более высокого X А м -1 1 порядка по сравнению с бесконечно малой х = -. х Определение 21. Функцию, стремящуюся к бесконечности при данной базе, называют бесконечно большой функцией или просто бесконечно большой при данной базе. Определение 22. Если f и g — бесконечно большие при базе В и f = o(g), то говорят, что g есть бесконечно большая более высокого порядка по сравнению с f. Пример 27. - —> оо при х —> 0, -Д- —> оо при х —> 0 и - = of—) X X2 X \х2 / при х —> 0, поэтому — есть бесконечно большая более высокого порядка по X 1 п сравнению с - при х —> 0. ' Вместе с тем при х —> оо функция х2 есть бесконечно большая более высо- кого порядка, чем х. Не следует думать, что, выбрав степени хп для описания асимптотическо- го поведения функций, мы сможем каждую бесконечно малую или бесконечно большую характеризовать некоторым числом п — ее степенью.
§ 2. ПРЕДЕЛ ФУНКЦИИ 137 Пример 28. Покажем, что при а > 1 и любом п € Z хп lim — = О, —i-4-rvi Л® х—>+оо а: т. е. хп = о(ах) при х —> +оо. ◄ Если п 0, то утверждение очевидно. Если же п 6 N, то, полагая q = Va имеем q > 1 и — = х—>+оо ах х—>+<х> \ qx I-+4-OO qx . • lim — — 0. Г.—>4-<Vl Z7® х—>+оо q Мы воспользовались, по индукции, теоремой о пределе произведения и результатом примера 22. ► Таким образом, при любом п G Z получаем хп = о(ах) при х —> +оо, если а > 1. Пример 29. Развивая предыдущий пример, покажем, что при а > 1 и любом а € Ж ха lim — = О, —*4-пг> Л® х—>4-оо а: т. е. ха = о(ах) при х —> +оо. ◄ Действительно, возьмем число п G N такое, что п > а. Тогда при х > 1 получим ах ах Опираясь на свойства предела и результат предыдущего примера, получаем, ха что lim — = 0. ► х—>4-00 ах Пример 30. Покажем, что при а > 1 и любом a G R й+Э®->0 Ха т. е. а Х!х = o(zQ) при х —> 0, х G IR_|_. ◄ Полагая в этом случае х — — 1/t, по теореме о пределе сложной функции, используя результат предыдущего примера, находим й+Э®->0 Ха ta lim — = 0. ► —V-UfYi Л* £->4-оо d‘ Пример 31. Покажем, что при а > О ^OgaX lim х—>4-оо Ха
138 ГЛ. III. ПРЕДЕЛ т. е. при любом положительном показателе степени а имеем logax = о(ха) при х —> Ч-оо. -4 Если а > 1, то положим х = а^а. Тогда по свойствам показательной функции и логарифма, опираясь на теорему о пределе композиции функций и результат примера 29, находим loga х (t/a) 1 t hm - = hm ' = — hm — = 0. x—>+oo xa t—>4-oo аг Q t—>4-oo 0,г Если 0 < a < 1, то 1/a > 1 и после замены х = получаем .. logaz .. (~t/a) 1 t _ hm = lim -—= hm -------------------------T =0. ► X—>4-00 xa t—>4-00 a f Q t—>4-00 (1/q)c Пример 32. Покажем еще, что при любом а > О ха loga х = о(1) при х —> О, X 6 R4-. -4 Нам нужно показать, что r lim ° ха loga х = 0 при а > 0. Полагая х — 1/f, применяя теорему о пределе композиции функций и результат пре- дыдущего примера, находим lim xalogax = lim _ Um 12^1 = 0. ► й+Эх->0 oa t->4-oo ta t->4-oo ta Определение 23. Условимся, что запись f = О(д) или / = 0(g) при базе В (читается «/ есть О большое от д при базе В») будет означать, что финально при базе В выполнено соотношение f(x) = /3(х)д(х), где /3(х) — финально ограниченная при базе В функция. В частности, запись / = 0(1) означает, что функция f финально ограни- чена при базе В. Пример 33. Г- 4- sinх\х = О(х) при х -> оо. \ X / Определение 24. Говорят, что функции fug одного порядка при базе В, если одновременно / = 0(g) и g = 0(f). Пример 34. Функции (2 4- sinx)x и х одного порядка при х —> оо, но (1 4- sinx)£ и х не являются функциями одного порядка при х -> оо. Условие, что функции f и g одного порядка при базе В, очевидно, равно- сильно тому, что найдутся числа ci > О, С2 > 0 и элемент В базы В такие, что на В имеют место соотношения С1|^(ж)| |№)| с2 |<?(хе)| или, что то же самое, 7-I/WI |9«| С2 С1
§ 2. ПРЕДЕЛ ФУНКЦИИ 139 Определение 25. Если между функциями fag финально при базе В выполнено соотношение /(я) = 7(т)р(я), где lim 7(2;) — 1, то говорят, что при базе В функция f асимптотически ведет себя как функция g или, короче, что f эквивалентна g при базе В. Будем в этом случае писать f ~ g или f ~ g при базе В. Употребление термина «эквивалентна» оправдано тем, что (/ S Л {f ~ 9)^(9 ~ f), (f ~ 9)Л(д ~ Л). Действительно, соотношение f ~ f очевидно, в этом случае 7(2:) = 1. Да- 1 & 2 лее, если lim 7(2;) = 1, то lim = 1 и д(х) = —^7 Здесь надо только В В у(х) 4 у(х) ' объяснить, почему можно считать, что 7(2:) / 0. Если соотношение f(x) = 1 3 = 7(2;) д(х) имеет место на элементе Bi G В, а соотношение < |?(®)I <2 на элементе В2 € В, то мы можем взять элемент В С Bi Г1В2, на котором будет выполнено и то и другое. Всюду вне В, если угодно, можно вообще считать, что 7(2:) = 1. Таким образом, действительно (/ ~ д) => (д ~ f). Наконец, если f(x) = 7i(2?)p(x) на Bi € В и д(х) = 72(2;) h(x) на В2 € В, то на элементе В € В базы В таком, что В С В\ П В2, оба эти соотно- шения выполнены одновременно, поэтому f(x) = 71 (2;) 72 (2;) h(x) на В. Но lim 71 (2;) 72 (я) = lim 71 (я) • lim 72 (я) = 1 и тем самым проверено, что f ~ h. Полезно заметить, что поскольку соотношение lim 7(2;) = 1 равносильно тому, что у(х) = 1 + а(2:), где lima(x) = 0, то соотношение f ~ 9 равносильно тому, что f(x) = д(х) + а(х)д(х) = д(х) + о(д(х)) при базе В. Мы видим, что относительная погрешность |а(я)| = жения функции с помощью функции д(х), эквивалентной f(x) при базе В, есть величина бесконечно малая при базе В. Рассмотрим некоторые примеры. Пример 35. х2 + х = (1 + -) х2 ~ х2 при х -> оо. \ х / Абсолютная величина разности этих функций /(ж) -ff(s) 9(х) прибли- | (х2 + х) - х21 = |:г| х И 1 стремится, к бесконечности, однако относительная погрешность ^2 = за- мены функции х2 + х на эквивалентную величину х2 стремится к нулю при х —> оо.
140 ГЛ. III. ПРЕДЕЛ Пример 36. В начале этого пункта мы говорили о знаменитом асим- птотическом законе распределения простых чисел. Теперь мы в состоянии записать его точную формулировку: 7г(х) = ~--| при X —> ОО. ш х \ ш х ) Пример 37. Поскольку lim — 1, то sin я ~ х при х -4 0, что можно х—>0 X написать также в виде равенства sin х = х 4- о(я) при х -4 0. Пример 38. Покажем, что In(1 4- х) ~ х при х —> 0. ◄ Пш + ж) _ цт _ 1п / iim (J + я)1/®') = Ine = 1. х—>0 X х—>0 \ х—>0 / Мы воспользовались в первом равенстве тем, что loga(6a) = ologa&, а во втором тем, что lim logo t ~ loga6 = logo ( lim t). ► t—>6 \ t—>6 / Итак, ln(l 4- x) = x 4- o(x) при x —> 0. Пример 39. Покажем, что ex = 1 4- x 4- о(я) при x -4 0. ex — 1 t ◄ lim------~ lim ———— = 1. x—>o x t—>o ln(l 4-t) Мы сделали замену x = ln(l 4-1), ex — 1 = t и воспользовались тем, что ех -4 е° = 1 при х -> 0, причем ех / 1 при х / 0. Таким образом, на основании теоремы о пределе композиции и результата предыдущего примера утверждение доказано. ► Итак, ех — 1 ~ х при х -4 0. Пример 40. Покажем, что (1 4- х)а = 14- ах 4- о(х) при х -4 0. .. (14-ж)а- 1 aln(14-z) ◄ hm -----------= hm —т—~--------г- --------L — х-И) х х->о aln(14-$) х е* - 1 .. 1п(1 4- х} = a hm —— • hm — -------- =»а. t—>0 t х—>0 х В этой выкладке мы, предполагая а / 0, сделали замену aln(l 4- х) = t и воспользовались результатами двух предыдущих примеров. Если же а = 0, то утверждение очевидно. ► Таким образом, (1 4- х)а — 1 ~ ах при х -4 0. При вычислении пределов иногда бывает полезно следующее простое Утверждение 3. Если f ~ f, то limf(x)g(x) = \imf(x)g(x), если один из этих пределов существует.
§ 2. ПРЕДЕЛ ФУНКЦИИ 141 ◄ Действительно, коль скоро /(х) = 7(х)/(х) и lim7(x) = 1, то lim/(x)^(x) = 1ш17(х)/(х)д(х) = Пт7(х) • lim/(x)^(x) = lim/(x)0(x). ► Пример 41. .. In COS X hm ——=- x->o sinx2 1 In cos2 x 1,. ln(l-sin2x) - hm 5— = - hm — 5--------------- 2 x-+o xl 2 x-+o xl 1 — sin2 x 1 x2 1 - hm------=— = — - hm — = - 2 x—>0 x2 2 x—>0 x2 2 Мы воспользовались тем, что 1п(1 + а) ~ о при а -> 0, sinx ~ х при х -> О, -Д-х ~ 4 при в -> 0 и sin2 х ~ х2 при х —> 0. sin р р Мы доказали, что в одночленах при вычислении пределов можно заменять функции на им эквивалентные при данной базе. Не следует распространять это правило на суммы и разности функций. Пример 42. \/х2 + х ~ х при х -> +оо, но lim (ух2 + х — х) lim (х — х) = 0. х—>+oov 7 X —>4-00 В самом деле, lim (\/ х2 + х — х) = lim —- ---------= lim —\----------= 4 х->+оо х->+оо у/х2 + X + X х->+оо А _|_ 1 _|_ j 2 V X Отметим еще следующие широко используемые в анализе правила обраще- ния с символами о(-), О(-). Утверждение 4. При данной базе: а) о(/) + о(/) = о(/); Ь) о(/) есть также 0(f)', С) о(7) + 0(/) = 0(/); d) О(/)+О(/)=О(/); \ \ / л о(/(х)) (f(.x)\ O(f(x)) f(x)\ е) если д(х) / 0, то v / 77 = о( ) и = ОI . 5(х) \g(x)J д(х) \g(x)J Обратите внимание на особенности действий с символами о(-), О(-), выте- кающие из смысла этих символов. Например, 2о(/) = o(f), или о(/) -I- 0(f) = = ^(/) (хотя, вообще говоря, o(f) / 0), или o(f) = O(f), но Off) / o(f). Здесь знак равенства всюду имеет значение слова «есть». Сами символы о(-), О(-) обозначают не столько функцию, сколько указание на характер ее асим- птотического поведения, которым, кстати, обладают сразу многие функции, например, и /, и 2/, и т. п.
142 ГЛ. III. ПРЕДЕЛ ◄ а) После сделанного уточнения утверждение а) перестает выглядеть не- ожиданным. Первый символ о(/) в нем означает некоторую функцию вида ai(x)f(x), где limai(a;) = 0. Второй символ о(/), который можно (или нужно) было бы снабдить пометкой, отличающей его от первого, означает некоторую функцию вида ot2(x)f(x), где lima^Or) = 0. Тогда ai(x)f(x) -I- ot2(x)f(x) = = (а1(я) + а2(я))/(я) = а3(а:)/(ж), где Ита3(ж) = 0. Ь) Следует из того, что всякая функция, имеющая предел, является фи- нально ограниченной. с) Следует из b) nd). d) Следует из того, что сумма финально ограниченных функций финально ограничена. o(fM) _ a(x)f(x) _ , f(x) f f(x)\ ’ «(«) UWA Аналогично проверяется и вторая часть утверждения е). ► Пользуясь этими правилами и эквивалентностями, полученными в при- мере 40, теперь можно следующим прямым методом искать предел из при- мера 42: lim (Vх2 4- х — х) = lim х х—>4-оо ' ' х—>-Ьоо lim х—>4-оо Г Л 1 1 1 -ь Л = lim х I 1 4- ----------hoi — х—>4-оо \ 2 X \Х х—>4-00 \ 2 /2 Несколько позже мы докажем следующие важные соотношения, которые уже сейчас стоит запомнить как таблицу умножения: е’ = 1 + Б . + ^хп + ... п! cos а: = 1-^*- 2! х2 4- х4 4-. 4! + (z-L)* x2k + ••+ (2it)! +--' 1 sin х — — X — -X3 + + 3! +'" + 2*4-1 . (2fc + l)l +-'- 1п(1 4-а:)=т-^2:24-|а:34-...4- -——------хп 4-... 2 О TL х/у „ а а(а — 1) ? (1 + х)а = 1 + -х + I 2! ’ х2 + ... а(а - 1)... (а - п + 1) ... 4-----------:---------х 4- . . . при х 6 К, при х € К, при х 6 К, при |гг| < 1, при |®| < 1.
§ 2. ПРЕДЕЛ ФУНКЦИИ 143 Эти соотношения, с одной стороны, уже могут служить вычислительными формулами, а с другой стороны, как будет видно, содержат в себе следующие асимптотические формулы, обобщающие формулы, полученные в примерах 37-40: ех = 14- ^х + Д я2 + ... + Дя" + О(я"+1) при х -> 0, 1! 2! п! cosх - 1 - х2 4- я4 4-... 4- х2к 4- О(я2*+2) при х -> 0, sin я = х - я3 4-... 4- я2*+1 4- О(я2*+3) при я -> 0, 1п(1 4- я) = х — я2 4- 77 я3 4-.... 4- -——-я" + О(яп+1) при х -> 0, 2 3 n 7 (1 + г)« = 1 + £1+2(^)ж2 + ... + а(а - 1). „ (о - n +1) д„ ofcn+i) при х_>0 Эти формулы обычно являются наиболее эффективным средством при отыс- кании пределов элементарных функций. При этом полезно иметь в виду, что О(ят+1) = хт+1 0(1) = хт • х 0(1) = хт • о(1) = о(хт) при х —> 0. Рассмотрим в заключение несколько примеров, показывающих эти форму- лы в работе. Пример 43. х — sin я hm---=----= hm х—>0 Xd х—>0 (х — х3 4- О(я5)) х3 = lim 4- О(я2Й = х—>о \3! v '/ 3! Пример 44. lim х2 (% — cos - ] = ? х->оо у у 14-я3 XJ Имеем при х -> оо: 51±£ = l±£l = (1 + ±W1 + ±r1 14-я3 14-я-3 \ я2 / \ х3 J cos - = 1 - — • — + О -Т х 2! х2 \х4
144 ГЛ. III. ПРЕДЕЛ откуда получаем 7 х3 +х К 9 1 . лП \ \ 1 ! з ~ cos - ‘ ~2 + “з ) V 1 + г х 14 , х2 \хА/ при х —> оо. Таким образом, искомый предел равен lim х2 X—¥ОО 9 14' Пример 45. lim - fl 4- — х—>оо е \ х / х Г / / 1 \ж = lim exp< я ( In(14— ) X —¥<Х> I \ \ X / = lim exp < х2 In (1 4— х—>оо \ х = lim ехр< х2(- - —Ц- 4- ofA)) - х 1 = *->оо 2х2 \x3JJ J = lim exp/ — 4- о(—= е 1^2. i->oo t 2 \xj) Задачи и упражнения 1. а) Докажите, что существует и притом единственная определенная на R функ- ция, удовлетворяющая требованиям: /(1) = а (а > 0, а / 1), /(®i) • f(x2) f(xi 4-х2), /(х) —> /(хо) при х -► хо. Ь) Докажите, что существует и притом единственная определенная на R+ функ- ция, удовлетворяющая требованиям: /(а) = 1 (а > 0, а / 1), /(*1) 4-/(х2) = /(xi х2), /(х) —> /(хо) при хо € R+ и R+ Э х -> хо- Указание. Просмотрите еще раз конструкцию показательной и логарифмиче- ской функций, разобранную в примере 10. 2. а) Установите взаимно однозначное соответствие : R —> R+ так, чтобы для любых х, у Е R было <р(х 4- у) — <р(х) • <р(у), т. е. чтобы операции сложения в прообразе (в R) отвечала операция умножения в образе (в R+). Наличие такого
§ 2. ПРЕДЕЛ ФУНКЦИИ 145 отображения означает, что группы (R, +) и (R+, •) как алгебраические объекты одинаковы, или, как говорят, изоморфны. Ь) Докажите, что группы (R, +) и (R \ 0+, •) не изоморфны. 3. Найдите пределы: a) lim Xх; ' Х-++0 b) lim х^х-, х—>4-оо с) lim!£Mi+^); ®->0 X d) lim——. sc—+0 X 4. Покажите, что 1 + ^+ ...+ — = Inn + с + о(1) при п —> оо, где с — постоянная. (Число с = 0,57721... называется постоянной Эйлера.) Указание. Можно воспользоваться тем, что I П "f” 1 _ 1 (л . 1 \ _ 1 . z-ч ( 1 \ . In —1— — In (14— ) — —F О -т I при n -4 оо. п \ п/ п \пг / 5. Покажите, что: оо оо а) если два ряда 52 52 с положительными членами таковы, что ап ~ Ъп П=1 П = 1 при п -4 оо, то эти ряды сходятся или расходятся одновременно; оо 1 Ь) ряд 53 S^n —р СХОДИТСЯ только при р > 1. п=1 п 6. Покажите, что: 00 (1 \ а) если ап аП4-1 > 0 при любом п € N и ряд 52 ап сходится, то ап = о ( — ) при п=1 'п' п -4 оо; (1 \ °° —), то всегда можно построить сходящийся ряд 52 ап такой, П=1 что Ъп = о(ап) при п -4 оо; оо оо с) если ряд 52 ап с положительными членами сходится, то ряд 52 Ап, где Ап = П = 1 Я=1 I оо I оо = ч/12а* — ч/ 52 тоже сходится, причем ап = о(Ап) при п -4 оо; у к=п у fc=n4-l оо оо d) если ряд 52 ап с положительными членами расходится, то ряд 52 Ап, где п=1 п=2 In [п — 1 Ап = 4 /52 ак — 4 /12 тоже расходится, причем Ап = о(ап) при п —> оо. у fc=l у к=1 Из с) и d) следует, что никакой сходящийся (расходящийся) ряд не может слу- жить универсальным эталоном для установления сходимости (расходимости) других рядов путем сравнения с ним.
146 ГЛ. III. ПРЕДЕЛ 7. Покажите, что: ОО а) ряд 1п ап, где ап > 0, п G N, сходится тогда и только тогда, когда после- п=1 довательность {Пп — ai ... ап} имеет отличный от нуля предел; ОО Ъ) ряд 1п(1 + ftn)> где |an| < 1, абсолютно сходится тогда и только тогда, п=1 ОО когда сходится абсолютно ряд 52 ап n—1 Указание. См. задачу 5а). ОО 8. Говорят, что бесконечное произведение е*, сходится, если последователь- п „ fc=1 w ность чисел Пп = П е* имеет конечный, отличный от нуля предел П. Тогда пола- ОО гают П = П ек • Покажите, что ОО а) если бесконечное произведение fj еп сходится, то еп —> 1 при п —> оо; П=1 оо Ь) если Vn € N (еп >0), то бесконечное произведение fj еп сходится тогда и П=1 оо только тогда, когда сходится ряд 52 1пеп; п=1 ОО с) если еп — 1+ап и все ап одного знака, то бесконечное произведение fj (1+<*п) оо n=1 сходится тогда и только тогда, когда сходится ряд 52 п—1 9. а) Найдите fj (1 +т2п г). П = 1 ОО х Ь) Найдите cos — и докажите следующую формулу Виета1); П=1 2 с) Найдите функцию f(x), если /(0) = 1, /(2х) = cos2 х f(x), f(x) —> /(0) при х —> 0. Указание: х = 2• 2 г)ф. Виет (1540 —1603) — французский математик, один из создателей современной алгебраической символики.
§ 2. ПРЕДЕЛ ФУНКЦИИ 147 10. Покажите, что Ь °° а) если —— = 1 4- 0п, п = 1, 2, ..., и ряд 52 fln абсолютно сходится, то суще- °п+1 п=1 ствует предел lim bn — b € R; п—>оо оо Ь) если —— = 1 + - + ап, п = 1, 2, ..., причем ряд 52ап абсолютно сходится, ап+1 П П=1 с то ап ~ —- при п -> оо: пр оо оо с) если ряд 52 Q-п таков, что —— = 1+ —+ап и ряд 52 ап абсолютно сходится, п=1 От» 4-1 п П=1 ОО то ряд 52 абсолютно сходится при р > 1 и расходится при р 1 {признак Гаусса п=1 абсолютной сходимости ряда). 11. Покажите, что для любой последовательности {ап} с положительными чле- нами Пт (1 + а-+1 Г > е п-+оо \ ап / и эта оценка неулучшаема.
ГЛАВА IV НЕПРЕРЫВНЫЕ ФУНКЦИИ § 1. Основные определения и примеры 1. Непрерывность функции в точке. Пусть/ —вещественнозначная функция, определенная в некоторой окрестности точки a G R. Описательно говоря, функция f непрерывна в точке а, если ее значения f(x) по мере приближения аргумента х к точке а приближаются к значению /(а) функции в самой точке а. Уточним теперь это описание понятия непрерывности функции в точке. Определение 0. Функция f называется непрерывной в точке а, если для любой окрестности V(/(a)) значения /(а) функции в точке а найдется та- кая окрестность U(а) точки а, образ которой при отображении f содержится В v(/(a)). Приведем формально-логическую запись этого определения вместе с двумя его вариациями, часто используемыми в анализе: f непрерывна в точке а := VV(/(a)) 317(a) (/(17(a)) С V(/(a))), Ve > 0 317(a) Vx G U(a) (|/(x) - /(a)| < e), Ve > 0 35 > 0 Vx G R (|x — a| < 6 => |/(x) - /(a)| < e). Эквивалентность этих формулировок для вещественнозначных функций следует из того, что (как уже неоднократно отмечалось) любая окрестность точки содержит некоторую симметричную окрестность этой точки. Например, если по любой е-окрестности Vе(/(a)) точки /(а) можно подо- брать окрестность 17(a) точки а так, что Vx G Ufa) (|/(х) — /(a)| < е), т. е. /(17(a)) С V£(/(a)), то и для любой окрестности V(/(a)) тоже можно подо- брать соответствующую окрестность точки а. Действительно, достаточно сначала взять Vе(f (a)) С V(/(a)), а затем по Vе(f(a)) найти 17(a). Тогда /№)) С V‘(/(a)) С V(/(a)).
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 149 Таким образом, если функция непрерывна в точке а в смысле второго из приведенных определений, то она непрерывна в ней и в смысле исходного определения. Обратное очевидно, поэтому эквивалентность первых двух фор- мулировок проверена. Дальнейшую проверку оставляем читателю. Чтобы не отвлекаться от основного определяемого понятия непрерывности функции в точке, мы сначала для простоты предположили, что функция f определена в целой окрестности точки а. Рассмотрим теперь общий случай. Пусть f >Е —> R — вещественнозначная функция, определенная на некото- ром множестве Е с R, и а — точка области определения функции. Определение 1. Функция f: Е —> R называется непрерывной в точ- ке a G Е, если для любой окрестности V(/(a)) значения /(а) функции, при- нимаемого ею в точке а, найдется такая окрестность UE(a) точки а в мно- жестве1) Е, образ которой /(СТе(а)) содержится в V(/(a)). Итак, / : Е —> R непрерывна в a G Е := = VV(/(a)) 3%(а) (f(UE{a)) С V(/(a))). Разумеется, определение 1 тоже можно записать в б-5-форме, рассмотрен- ной выше. Там, где нужны числовые оценки, это бывает полезно и даже не- обходимо. Запишем эти вариации определения 1: f: Е —> R непрерывна в a G Е := = Уб > О 3UE(a) Vx G UE(d) (|/(х) - /(а)| < б), или f : Е —> R непрерывна в a G Е := = Уб > 0 35 > 0 Уя G Е (|z - а| < 5 => |/(z) - /(а)| < б). Обсудим теперь детально понятие непрерывности функции в точке. 1° Если а — изолированная, т. е. не предельная, точка множества Е, то найдется такая окрестность U(а) точки а, в которой нет других точек множе- ства Е, кроме самой точки а. В этом случае UE(d) = а, и поэтому f(UE(a)) — = /(о) С V(/(a)), какова бы ни была окрестность V(/(a)). Таким образом, в любой изолированной точке области определения функция, очевидно, непре- рывна. Но это вырожденный случай. Напомним, что ^(а) = Е П Ща).
150 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ 2° Содержательная часть понятия непрерывности относится, таким обра- зом, к тому случаю, когда а 6 Е и а — предельная точка множества Е. Из определения 1 видно, что (У: Е —> R непрерывна в а 6 Е, где а — предельная точка Е) О f lim /(х) = У(а)1 \ ЕЭх—>а / В самом деле, если а — предельная точка Е, то определена база Е Э х —> а проколотых окрестностей Ue(o) = Ue(o) \а точки а. Если У непрерывна в точке а, то, найдя для окрестности У(У(а)) окрест- ность Ue(q) такую, что У(СУе(а)) С У(У(а)), мы одновременно будем иметь /(UeW) С Vи в силу определения предела, таким образом, lim f (rr) = ЕЭх—>а = /(<>) Обратно, если известна, что lim f(x) = f(a), то по окрестности У(У(а)) о о найдем проколотую окрестность Ue(g) так, что f(UE(a)) С У(У(а)). Но по- скольку У(а) G У(У(а)), то тогда и У(С7.Е(а)) С У(У(а)). В силу определения 1 это означает, что функция У непрерывна в точке a G Е. ► 3° Поскольку соотношение lim У(гг) = У(а) можно переписать в форме мы теперь приходим к полезному заключению, что непрерывные в точке функ- ции (операции) и только они перестановочны с операцией предельного пере- хода. Это означает, что то число f(a), которое получается при выполнении операции f над числом а, можно сколь угодно точно аппроксимировать зна- чениями, получаемыми при выполнении операции f над соответствующими заданной точности приближенными значениями х величины а. 4° Если заметить, что при а 6 Е окрестности Ue(o) точки а образуют базу Ва (независимо от того, является ли а предельной или изолированной точкой множества), то мы увидим, что само определение 1 непрерывности функции в точке а совпадает с определением того, что число У (а) — значение функции в точке а — является пределом функции f по этой базе, т. е. (У : Е —> R непрерывна в а 6 Е) <=> (lim f(x) = f(a)\. X Ва / 5° Заметим, однако, что если 1ппУ(ге) существует, то, поскольку a G Ue(q) для любой окрестности Ue(o), этот предел неизбежно оказывается равным /(<*). Таким образом, непрерывность функции f: Е —> R в точке a G Е равно- сильна существованию предела этой функции по базе Ва окрестностей (но не проколотых окрестностей) Ue(o) точки а в Е.
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 151 Итак, (У : Е —> R непрерывна в а € Е) О (3 Нт №))• 6° В силу критерия Коши существования предела теперь можно сказать, что функция непрерывна в точке a G Е тогда и только тогда, когда для любого е > 0 найдется окрестность Ue(o) точки а в Е такая, на которой колебание о?(У; С7е(а)) функции меньше е. Определение 2. Величина и> (f; а) = lim <*>(У; t^(a)) (где С7|(а) есть 6—>+о ^-окрестность точки а в множестве Е) называется колебанием функции f: Е —> R в точке а. Формально символ о?(У; X) уже занят, он обозначает колебание функции на множестве X. Однако мы никогда не будем рассматривать колебание функ- ции на множестве, состоящем из одной точки (это колебание, очевидно, равно нулю); поэтому символ о?(У;а), где а — точка, всегда будет обозначать то понятие колебания функции в точке, которое мы только что ввели определе- нием 2. Колебание функции на подмножестве не превышает колебания функции на множестве, поэтому величина «>(/; ^(о)) есть невозрастающая функция от 6. Поскольку она неотрицательна, то либо она имеет конечный предел при 5 —> -4-0, либо при любом 6 > 0 выполнено u?(y;I7g(a)) = +оо. В последнем случае естественно полагают о?(У;а) = +оо. 7° Используя определение 2, сказанное в 6° теперь можно резюмировать так: функция непрерывна в точке тогда и только тогда, когда ее колебание в этой точке равно нулю. Зафиксируем это: (У: Е —> JR непрерывна в a G Е) <=> (w(f; а) = 0). Определение 3. Функция f: Е —> R называется непрерывной на мно- жестве Е, если она непрерывна в каждой точке множества Е. Совокупность всех вещественнозначных функций, непрерывных на множе- стве Е, условимся обозначать символом С(Е; R) или, короче, С(Е). Мы обсудили понятие непрерывности функции. Рассмотрим теперь некоторые примеры. Пример 1. Если У: Е —> R — постоянная функция, то У G С(Е). Это утверждение очевидно, ибо f(E) = сС V(c), какова бы ни была окрестность V(c) точки с€ R. Пример 2. Функция f(x) — х непрерывна на R. Действительно, для любой точки xq G R имеем |У(гг) — f(xo)\ = |rr — zo| < е, как только |гг — 2?о| < б = е.
152 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Пр имер 3. Функция /(гг) = sinrr непрерывна на R. В самом деле, для любой точки xq G R имеем | sin re — sinzol = „ X + Xq . X — Xq 2 cos ——— sin —-— 2 2 п . X - Xq 2 sin X — So ~~2 = k - ®o| < e, 2 2 как только k “ sol < 6 = e. Мы воспользовались неравенством |sinrr| kl, доказанным в гл. Ill, §2, п. 2d, пример 9. Пример 4. Функция f(x) = cos х непрерывна на BL Действительно, как и в предыдущем примере, для любой точки xq Е К имеем I COS ГС — COSXol = п . X + XQ . х - Хо -2 sin -——- sin ——- 2 2 < 2 sin X — Xq ~~2 k - sol < е, как только k ~ so| < 5 = е. Пример 5. Функция f(x) — ах непрерывна на R. Действительно, по свойству 3) показательной функции (см. гл. III, § 2, п. 2d, пример 10а) в любой точке xq G R имеем lim ах = ах°, X—Ьхо что, как мы теперь знаем, равносильно непрерывности функции ах в точке xq. Пример 6. Функция f(x) — logarr непрерывна в любой точке xq G R+ области определения R_|_ = {гс G R | х > 0}. В самом деле, по свойству 3) логарифмической функции (см. гл. III, § 2, п. 2d, пример 10b) в любой точке хо 6 К_|_ имеем lim logaz = logarc0, —Но что равносильно непрерывности функции loga х в точке xq. Попробуем, кстати, по заданному е > 0 найти окрестность Ur+(xq) точки гео так, чтобы в любой точке х G Ur+(xq) иметь |loga гс — loga гс0| < е. Это неравенство равносильно соотношению ~£ < 106a Т- < £- XQ Пусть для определенности a > 1; тогда последнее соотношение равносильно условию хоа~£ < х < хоа£.
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 153 Интервал ]ггоа-£, яоа£[ и есть искомая окрестность точки xq. Полезно обратить внимание на то, что эта окрестность зависит как от величины е, так и от самой точки xq, чего не наблюдалось в примерах 1 — 4. Пример 7. Любая последовательность f : N —> R есть функция, непре- рывная на множестве N натуральных чисел, поскольку каждая точка множе- ства N является его изолированной точкой. 2. Точки разрыва. Для того чтобы лучше освоиться с понятием непре- рывности, выясним, что происходит с функцией в окрестности той точки, где она не является непрерывной. Определение 4. Если функция f : Е —> R не является непрерывной в некоторой точке множества Е, то эта точка называется точкой разрыва функции /. Построив отрицание к утверждению «функция f : Е —> R непрерывна в точке a G Е», мы получаем следующую запись определения того, что а — точка разрыва функции /: a G Е — точка разрыва функции f := = ЗУ(/(а)) Vt7k(a) Зх 6 UE(a) (/(г) £ V(/(a))). Иными словами, a G Е — точка разрыва функции f: Е —> R, если найдется такая окрестность V(/(a)) значения /(а) функции в точке а, что в любой окрестности Ue(q) точки а в множестве Е найдется точка х G Ue(o), образ которой не содержится в V(/(a)). В Е-<£-форме это же определение выглядит так: Эе > О V5 > 0 Эя G Е (|ж - а| < 5 Л \f (х) - f(a)\ > е). Рассмотрим примеры. Пример 8. Функция f(x) = sgn а; постоянна и, значит, непрерывна в окрестности любой точки о G К, отличной от нуля. В любой же окрестности нуля ее колебание равно 2. Значит, 0 — точка разрыва функции sgn я. За- метим, что функция имеет в точке 0 и предел слева lim sgn а; = — 1, и пре- ж->—о дел справа lim sgn rr = 1, но, во-первых, они не совпадают между собой, а х—>4-0 во-вторых, ни один из них не совпадает со значением sgn 0 = 0 функции в точке 0. Это прямая проверка того, что 0 — точка разрыва функции. Пример 9. Функция f(x) = |sgnrr| имеет предел lim |sgnrr| = 1 при х—>0 х —> 0, но /(0) = |sgn 0| = 0, поэтому lim f(x) f(0) и 0 — точка разрыва . х—>0 функции. Заметим, однако, что в данном случае, изменяя значение функции в точке 0 и полагая его равным 1, мы получим функцию, непрерывную в точке 0, т. е. устраним разрыв.
154 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Определение 5. Если точка разрыва a G Е функции /: Е —> R такова, что существует непрерывная функция f: Е -> R такая, что /\е\о. — f\E\a, то а называется точкой устранимого разрыва функции f: Е —> R. Таким образом, точка устранимого разрыва характеризуется тем, что су- ществует предел lim f(x) = А, но А ф f(a), и достаточно положить ЕЭх-*а №) = при х G Е, х ф а, при х = а, как мы уже получим непрерывную в точке а функцию f: Е —> R. Пример 10. Функция при 10 0, при х = 0 разрывна в точке 0. При этом она даже не имеет предела при х —> 0, ибо, как было показано в гл. III, § 2, п. 1, пример 5, не существует предела lim sin -. 1 х—>о х График функции sin - изображен на рис. 12. х Примеры 8, 9 и 10 поясняют следующую терминологию. Определение 6. Точка а 6 Е называется точкой разрыва первого рода для функции f: Е —> R, если существуют пределы1) lim /(®) =:/(а-0), lim f(x) =: f(a + 0),. ЕЭх—>а—0 ЕЭх—>а4-0 О Если а — точка разрыва, то а — предельная точка множества Е. Однако может слу- читься, что все точки множества Е в некоторой окрестности точки а лежат по одну сторону от точки а. В этом случае рассматривается только один из указанных в определении пре- делов.
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 155 но по крайней мере один из этих пределов не совпадает со значением /(а) функции в точке а. Определение 7. Если а е Е — точка разрыва функции f: Е -> R и в этой точке не существует по меньшей мере один из пределов, указанных в определении 6, то а называется точкой разрыва второго рода. Таким образом, имеется в виду, что всякая точка разрыва, не являющаяся точкой разрыва первого рода, является точкой разрыва второго рода. Приведем еще два классических примера. Пример 11. Функция Р(х) = < 1, О, если х 6 Q, если х G R \ Q, называется функцией Дирихле Эта функция разрывна во всех точках, причем, очевидно, все ее точки разрыва — второго рода, так как на любом интервале есть как рациональные, так и иррациональные числа. Пример 12. Рассмотрим функцию Римана1 2^ ( £ I о, m _ л m - если x = — G Q, где-----несократимая дробь, п п если х G R \ Q. Заметим, что, каковы бы ни были точка о G К и ее ограниченная окрест- ность U(а) и каково бы ни было число N G N, в U (а) имеется только конечное число рациональных чисел —, т 6 Z, п G N, таких, что п < N. п Уменьшая окрестность, можно, таким образом, считать, что знаменатели всех рациональных чисел, попадающих в нее (кроме, быть может, числа а, если а € Q), уже больше чем N. Таким образом, в любой точке х G U(a) |Я(®)| < 1/N. Мы показали тем самым, что в любой точке a € R \ Q lim 'R.(x) — 0. х—>а Значит, функция Римана непрерывна в любой иррациональной точке. В остальных точках, т. е. в точках х G Q, функция разрывна, и все эти точки являются точками разрыва первого рода. 1^П. Г. Л. Дирихле (1805 — 1859) — крупный немецкий математик-аналитик, занявший пост ординарного профессора Геттингенского университета после смерти К. Гаусса (1855). 2)Б. Ф. Риман (1826 — 1866) — выдающийся немецкий математик, фундаментальные ра- боты которого легли в основу целых областей современной геометрии и анализа.
156 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ § 2. Свойства непрерывных функций 1. Локальные свойства. Локальными называют такие свойства функ- ций, которые определяются поведением функции в сколь угодно малой окрест- ности точки области определения. Таким образом, сами локальные свойства характеризуют поведение функ- ции в каком-то предельном отношении, когда аргумент функции стремится к исследуемой точке. Например, непрерывность функции в некоторой точке области определения, очевидно, есть локальное свойство функции. Укажем основные локальные свойства непрерывных функций. Теорема 1. Пусть f: Е —> R — функция, непрерывная в точке а Е Е. Тогда справедливы следующие утверждения: 1° Функция f ограничена в некоторой окрестности Ue(cl) точки а. 2° Если f(a) 0, то в некоторой окрестности Ue(o,) точки а все значе- ния функции положительны или отрицательны вместе с f(a). 3° Если функция g: Ue(o) —> R определена в некоторой окрестности точ- ки а и, как и f: Е —> R, непрерывна в самой точке а, то функции: а) (/ + д)(х) := /(я) + д(х), Ь) (/-Р)(я) := f(x)-g(x), с) := (при условии, что д(х) 0) определены в некоторой окрестности точки а и непрерывны в точке а. 4° Если функция д : Y —> К непрерывна в точке b G Y, а функция f такова, что f: Е —> У, f(a) = Ъ и f непрерывна в точке а, то композиция (9 ° f) определена на Е и также непрерывна в точке а. ◄ Для доказательства теоремы достаточно вспомнить (см. § 1), что не- прерывность функции f или д в некоторой точке а области определения рав- носильна тому, что предел этой функции по базе Ва окрестностей точки а существует и равен значению функции в самой точке a: lim/(я) = f(a), lim0(z) =д(а). Da Таким образом, утверждения 1°, 2°, 3° теоремы 1 непосредственно вы- текают из определения непрерывности функции в точке и соответствующих свойств предела функции. тэ f(x) В пояснении нуждается только то, что отношение в самом деле опре- 9(х) делено в некоторой окрестности Ue(o) точки а. Но, по условию, д(а) 0 и в силу утверждения 2° теоремы найдется окрестность Ue(o), в любой точке f(x) которой д(х) ф 0, т. е. определено в (7в(а). Pl3-)
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 157 Утверждение 4° теоремы 1 является следствием теоремы о пределе компо- зиции, в силу которой о у)(а?) = lim^G/) = д(б) = g(f(a)) = (д о У)(а), вв «Ь что равносильно непрерывности (д о у) в точке а. Однако для применения теоремы о пределе композиции нужно проверить, что для любого элемента Uy(b) базы Вь найдется элемент Ue(u) базы Ва та- кой, что /(?Ze(o)) С Uy(b). Но в самом деле, если С7у(Ь) = Y A U(b), то по определению непрерывности функции f: Е —> Y в точке а для окрестности U(b) — найдется окрестность Ue(cl) точки а в множестве Е такая, что f(UE(a)) С С7(У(а)). Поскольку f действует из Е в Y, то /(Ue(o)) С Y А А Е(У (а)) = Uy(b) и мы проверили законность применения теоремы о пределе композиции. ► Пример 1. Алгебраический многочлен Р(х) = а^хп + airrn-1 + ... + ап является функцией, непрерывной на R. х Действительно, из пункта 3° теоремы 1 по индукции следует, что сумма и произведение конечного числа непрерывных в некоторой точке функций есть функция непрерывная в этой точке. Мы проверили в примерах 1 и 2 § 1, что постоянная функция и функции f(x) = х непрерывны на R. Тогда на R непрерывны и функции ахт = а • х... х, а следовательно, и полином Р(х). Пример 2. т раз Рациональная функция R(х) — Q(x) — отношение полино- мов — непрерывна всюду, где она определена, т. е. где Q(x) 0. Это следует из примера 1 и утверждения 3° теоремы 1. Пример 3. Композиция конечного числа непрерывных функций непре- рывна в любой точке области своего определения. Это по индукции вытекает из утверждения 4° теоремы 1. Например, функция esm2(ln|cosa:|) непрерывна всюду на R, за исключением точек ^(2к + 1), к G Z, где она не определена. 2. Глобальные свойства непрерывных функций. Глобальным свой- ством функции, описательно говоря, называется свойство, связанное со всей областью определения функции. Теорема 2 (теорема Больцано —Коши о промежуточном значении). Если функция, непрерывная на отрезке, принимает на его концах значения разных знаков, то на отрезке есть точка, в которой функция обращается в нуль. В логической символике эта теорема имеет следующую запись (У G С[а, Ц) Л (/(а) - f(b) < 0) => Зс G [а, 6] (У(с) = 0). Напомним, что символ С[Е) обозначает совокупность всех функций, непрерывных на множестве Е. В случае Е = [а, Ь] вместо С([а,Ь]) часто пишут сокращенно С[а, Ь].
158 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ ◄ Делим отрезок [а, Ь] пополам. Если в точке деления функция не равна нулю, то на концах одного из двух полученных в результате деления отрезков функция снова принимает значения разных знаков. С этим отрезком посту- паем теперь так же, как и с исходным отрезком [а, Ь], т. е. делим его пополам, и продолжаем процесс дальше. Тогда мы либо на каком-то шаге попадем в точку с € [а, &], где /(с) = О, либо получим последовательность {Zn} вложенных отрезков, длины которых стремятся к нулю и на концах которых f принимает значения разных знаков. В последнем случае на основании леммы о вложенных отрезках найдется един- ственная точка с € [а, &], общая для всех этих отрезков. По построению су- ществуют две последовательности и {ж"} концов отрезков 1п такие, что /(ж^) < 0, /(^п) > 0, lim х'п — lim ж" — с. По свойствам предела и опреде- п—>оо п—>оо лению непрерывности получаем lim f(x*) = /(с) 0, lim f(_x”) = /(с) 0. п—>оо п—>оо Таким образом, /(с) — 0. ► Замечания к теореме 2. 1° Доказательство теоремы доставляет простейший алгоритм отыскания корня уравнения /(х) — 0 на отрезке, в концах которого непрерывная функция имеет значения разных знаков. 2° Теорема 2, таким образом, утверждает, что при непрерывном измене- нии нельзя перейти от положительных значений к отрицательным или наобо- рот, не приняв по дороге значения нуль. 3° К описательным высказываниям типа 2° следует относиться с разум- ’ ной осторожностью, поскольку в них обычно подразумевается больше, чем высказывается. Рассмотрим, например, функцию, равную —1 на отрезке [0,1] и равную 1 на отрезке [2,3]. Ясно, что эта функция непрерывна на обла- сти своего определения, принимает там значения разных знаков, но нигде не обращается в нуль. Это замечание показывает, что свойство непрерывной функции, выраженное теоремой 2, действительно проистекает от некоторо- го свойства ее области определения (которое, как впоследствии выяснится, состоит в том, что это множество должно быть свлзныж). Следствие теоремы 2. Если функция <р непрерывна на интервале и в каких-то точках а и Ь интервала принимает значения (р(а) — А и <р(Ъ) = В, то для любого числа С, лежащего между А и В, найдется точка с, лежащая между точками а и Ъ, в которой tp(c) = С. ◄ Отрезок I с концами а, b лежит в нашем интервале, поэтому функ- ция f(x) — <р(х) — С определена, непрерывна на I и, поскольку /(а) • /(b) = = (Д — С)(В — С) < 0, по теореме 2 между а и b найдется точка с, в которой /(с) = <р(с) - С = 0. ► Теорема 3 (теорема Вейерштрасса о максимальном значении). Функ- ция, непрерывная на отрезке, ограничена на нем. При этом на отрезке есть точка, где функция принимает максимальное значение, и есть точка, где она принимает минимальное значение.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 159 ◄ Пусть f: Е —> R — непрерывная функция на отрезке Е = [а, 6]. В силу локальных свойств непрерывной функции (см. теорему 1) для любой точки х е Е найдется окрестность U(x) такая, что на множестве Ue(x) = EnU(x) функция ограничена. Совокупность таких окрестностей U(x), построенных для всех точек х € Е, образует покрытие отрезка [а, 6] интервалами, из кото- рого по лемме о конечном покрытии можно извлечь конечную систему U(xi), ...,U (хп) интервалов, покрывающих в совокупности отрезок [а, 6]. Поскольку на множестве Er\U(xk) = Usixk) функция ограничена, т. е. ть f(x) М*, где тп*, Mk € R и х е Ue(xic)> то в любой точке х € Е = [а, Ь] имеем min {mi, ..., mn} f(x) max {Mi, ..., Mn}. Ограниченность функции на отрезке [а, Ь] установлена. Пусть теперь М = sup/(ж). Предположим, что в любой точке х € Е хеЕ < М). Тогда непрерывная на Е функция М — f(x) нигде на Е не обра- щается в нуль, хотя (в силу определения М) может принимать значения, сколь угодно близкие к нулю. Тогда функция ——*, с одной стороны, в силу ло- кальных свойств непрерывных функций, непрерывна на Е, а с другой — не ограничена на Е, что противоречит уже доказанной ограниченности функ- ции, непрерывной на отрезке. Итак, существует точка хм € [а, Ь], в которой /(^м) — М. Аналогичным образом, рассмотрев m — inf f(x) и вспомогательную 1 хеЕ функцию . .—, докажем, что существует точка хт € [а, &], в которой Т (X J 771 f(xm) = т. ► Заметим, что, например, функции fi(x) = х, /2(я) = - непрерывны на х интервале Е = (0,1), но fi не имеет на Е ни максимального, ни минимально- го значений, а функция /2 не ограничена на Е. Таким образом, выраженные теоремой 3 свойства непрерывной функции также связаны с некоторым свой- ством области определения, а именно с тем, что из покрытия множества Е окрестностями его точек можно извлечь конечное покрытие. Такие множе- ства мы впоследствии назовем компактами. Прежде чем перейти к следующей теореме, дадим Определение 1. Функция f: Е —> R называется равномерно непрерыв- ной на множестве Е С R, если для любого числа е > 0 найдется число 6 > О такое, что для любых точек a?i,-a?2 € -Е таких, что |xi — я2| <5, выполнено |/(*1) - /(х2)| < е. Короче, f: Е —> R равномерно непрерывна := = Ve > 0 25 > 0 Vx! е Е Vz2 € Е (1^ - я2| < 6 => |/(zi) - f(x2)\ < е).
160 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Обсудим понятие равномерной непрерывности. 1° Если функция равномерно непрерывна на множестве, то она непрерыв- на в любой его точке. Действительно, достаточно в приведенном определе- нии положить 2:1 — х и Х2 — а и мы видим, что определение непрерывности функции f: Е —> R в точке а Е Е удовлетворено. 2° Непрерывность функции, вообще говоря, не влечет ее равномерную не- прерывность. Пример 4. Уже неоднократно встречавшаяся нам функция f(x) = sin - X на интервале ]0,1[ = Е непрерывна. Однако в любой окрестности точки 0 в множестве Е функция принимает как значение —1, так и значение 1, поэтому при е < 2 для нее уже не выполнено условие |/(xi) — /(^2)1 < £• Полезно в этой связи записать в явном виде отрицание свойства функции быть равномерно непрерывной: f: Е —> R не является равномерно непрерывной := = Зе > 0 V5 > 0 Зз?1 € Е Зя2 € Е (|xi - ж2| < 6 Л |/(xi) - /(ж2)| е). Рассмотренный пример делает наглядным различие между непрерывно- стью и равномерной непрерывностью функции на множестве. Чтобы ука- зать то место в определении равномерной непрерывности, откуда проистека- ет это различие, приведем подробную запись того, что значит, что функция f: Е —> R непрерывна на множестве Е: f: Е —> R непрерывна на Е := = Va € Е Ve > 0 35 > 0 Vz € Е (|ж - о| < 6 => [/(ж) - /(а)| < е). Таким образом, здесь число 6 выбирается по точке a G Е и числу е и потому при фиксированном е может меняться от точки к точке, как это и происходит в случае функции sin рассмотренной в примере 1, или в случае функции loga х или ах, рассматриваемых на полной области их определения. В случае же равномерной непрерывности гарантируется возможность вы- бора 6 только по числу е > 0 так, что во всех точках a G .Е из |х — а| < 5 при х Е Е будет следовать \f(x) — /(а)| < е. Пример 5. Если функция f: Е -> R не ограничена в любой окрестности фиксированной точки хо Е Е, то она не является равномерно непрерывной. Действительно, тогда при любом 6 > 0 в ^-окрестности Xq найдутся точ- ки х1} х2 Е Е такие, что |/(rri) — /(ж2)| > 1, хотя - s2| <6. Так обстоит дело с функцией /(ж) = —, рассматриваемой на множестве R \ 0. В данном случае zq = 0. Так обстоит дело и с функцией loga х, определенной на множестве положи- тельных чисел и неограниченной в окрестности точки х0 = 0.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 161 При мер 6. Функция f(x) = х2, непрерывная на R, не является равно- мерно непрерывной на Ж. В самом деле, в точках х' — у/п 4-1, х" — у/п, где п 6 N, имеем fix') = = П + 1, /(»п) = п> поэтому /(я$) - f(x“) = 1. Но lim (у/п 4-1 — у/п) = lim —===-----— = О, П-+ОО 4 ' П-+ОО у/п 4-14- у/п поэтому при любом 6 > 0 найдутся точки х'п, х” такие, что — я"| < д, в то время как f(x'n) - /«) = 1. Пример 7. Функция f(x) = sins2, непрерывная и ограниченная на R, не является равномерно непрерывной на R. Действительно, в точках х'п = - у^(п 4-1), х" - где п 6 N, имеем \f(x'n) - /(z")| = 1, в то время как lim \х'п — х"1 = 0. п—>оо1 1 После этого обсуждения понятия равномерной непрерывности функции и сопоставления непрерывности и равномерной непрерывности мы можем те- перь оценить следующую теорему. Теорема 4 (теорема Кантора—Гейне о равномерной непрерывности). Функция, непрерывная на отрезке, равномерно непрерывна на этом отрезке. Отметим, что в имеющейся литературе эту теорему обычно называют тео- ремой Кантора. Чтобы избежать разночтений, мы в дальнейшем при ссылках сохраняем это распространенное наименование. ◄ Пусть f: Е —> К. — данная функция; Е = [а, 6] и f G С(Е). Посколь- ку f непрерывна в любой точке х Е Е, то (см. § 1, п. 1, 6°) по е > 0 можно найти такую 5-окрестность U5(x) точки х, что колебание u?(/; U&(x)) функ- ции f на множестве U/(x) = Е П U6(x) точек области определения функции, лежащих в U6(x), окажется меньше е. Для каждой точки х G Е построим окрестность U6(x), обладающую этим свойством. Величина 5 при этом мо- жет меняться от точки к точке, поэтому правильнее, хотя и более громоздко, обозначить построенную окрестность символом Us^(x), но, поскольку весь символ определяется точкой х, можно условиться в следующей сокращенной записи: U(x) — U6(x\x) hV(x)~ U6(x^2(x). Интервалы V(a:), x E E, в совокупности образуют покрытие отрезка Е = = [а, Ь], из которого по лемме о конечном покрытии можно выделить конеч- ное покрытие У(я?1), ..., V(xn). Пусть 5 = ’ 2 жем, что для любых точек х/, х" Е Е таких, что — х"\ < 5, выполнено \f(x') — f(x")\ < е. Действительно, поскольку система интервалов V"(^i),... ... , V(xn) покрывает Е, найдется интервал У(х/) этой системы, который со- держит точку х', т. е. |ж' — < ^5(xj). Но в таком случае |ж" - Zi| lx' -я"| 4- |я/ - Xi| < 5 4- | 5(li) х5(ж<) 4- |<5(Яг) = <5(Яг)- £ £
162 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Следовательно, х1, х" € (^») = ЕП и6^(х$ и потому \f(x') - /(я")| ^^,и6Е^М)<8. ► Приведенные выше примеры показывают, что теорема Кантора сущест- венно опирается на некоторое свойство области определения функции. Из доказательства видно, что, как и в теореме 3, это свойство состоит в том, что из любого покрытия множества Е окрестностями его точек можно извлечь конечное покрытие. Теперь, после того как теорема 4 доказана, полезно вновь вернуться к разобранным выше примерам непрерывных, но не равномерно непрерывных функции и выяснить, как, например, функция smi, равномерно непрерывная по теореме Кантора на каждом отрезке вещественной прямой, оказывается не равномерно непрерывной на R. Причина здесь вполне аналогична той, по которой вообще непрерывная функция может оказаться не равномерно непре- рывной. На сей раз мы предоставляем читателю возможность самостоятельно разобраться в этом вопросе. Теперь перейдем к последней теореме параграфа — теореме об обратной функции. Нам предстоит выяснить условия, при которых непрерывная на отрезке вещественнозначная функция имеет обратную и в каких случаях эта обратная функция непрерывна. Утверждение 1. Непрерывное отображение f: Е —> R отрезка Е = • = [а, Ь] в R инъективно в том и только в том случае, когда функция f строго монотонна на отрезке [а, Ь]. ◄ Если функция f возрастает или убывает на произвольном множестве Е С R, то отображение /: Е —> R, очевидно, инъективно: в различных точках множества Е функция принимает различные значения. Таким образом, наиболее содержательная часть утверждения 1 состоит в том, что всякое непрерывное инъективное отображение f: [а, 6] —> R отрезка осуществляется строго монотонной функцией. Предположив, что это не так, мы найдем три точки Xi < Х2 < хз отрезка [а, 6] такие, что /(#2) не лежит между f(xi) и /(яз). В таком случае либо /(2:3) лежит между f(xi) и либо f(xi) лежит между /(#2) и /(я3). Пусть для определенности имеет место последняя из двух указанных возможностей. По условию функция f непрерывна на отрезке [я2,яз], и потому (см. следствие теоремы 2) на нем есть точка х^ такая, что /(xj) = Таким образом, Xi < Xi и f(xi) = /(^1), что несовместимо с инъективностью отображения. Случай, когда /(яз) лежит между f(xi) и f(x2), разбирается аналогично. ► Утверждение 2. Каждая строго монотонная функция f:X —> R, определенная на числовом множестве X С R, обладает обратной функцией f-1: Y —> которая определена на множестве Y = f(X) значений функции f и имеет на Y тот же характер монотонности, какой имеет функция f на множестве X.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 163 ◄ Отображение f: X —> Y = f(X) сюръективно, т. е. является отображе- нием на множество Y. Пусть для определенности f:X-^Y возрастает на X. В этом случае Vari € X Vz2 € X (xi < х2 <=> /(^1) < /(^г))- (1) Таким образом, отображение f: X —> Y в различных точках принимает различные значения, т. е. оно инъективно. Следовательно, /: X —> Y биектив- но, т. е. f — взаимно однозначное отображение X на Y. Значит, определено обратное отображение /-1: Y -> X, задаваемое формулой х = У-1 (у), если У = /(я)- Сопоставляя определение отображения /-1: Y —> X с соотношением (1), приходим к соотношению VyitY Vy2eY (f 1(?/1)</ 1 (2/2) У1 < У2), (2) означающему, что функция /-1 возрастает на области своего определения. Случай, когда f : X —> Y убывает на X, очевидно, разбирается анало- гично. ► В соответствии с доказанным утверждением 2, если интересоваться не- прерывностью функции, обратной к вещественнозначной функции, полезно исследовать условия непрерывности монотонных функций. Утверждение 3. Функция f: Е —> R, монотонная на множестве Е С С R, может иметь на Е разрывы только первого рода. ◄ Пусть, для определенности, f — неубывающая функция. Предположим, что a G Е есть точка разрыва функции /. Поскольку а не может быть изоли- рованной точкой множества Е, то а — предельная точка по крайней мере для одного из двух множеств Е~ = {я € Е | х < а], Е+ = {xe£?|a:>a}. Посколь- ку f — неубывающая функция, для любой точки х 6 Е~ имеем f(x) /(а) и ограничение /|F- функции f на множество Е~ оказывается неубывающей ограниченной сверху функцией. Тогда существует предел lim _/(«) = /(а —0). ЕЭх—>а—О Аналогично доказывается существование предела lim f(x) — /(а + 0), ЕЭх->а+О если а — предельная точка множества Е+. Случай, когда f — невозрастающая функция, можно либо разобрать, по- вторив проведенное доказательство, либо, перейдя к функции —свести дело к уже рассмотренному случаю. ► Следствие 1. Если а — точка разрыва монотонной функции f'.E-t R, то по крайней мере один из пределов Нт _./(*) = /(а-0), Ит /(ж) =/(а + °) ЕЭх—>а—О ЕЭх—>а+0
164 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ определен; по крайней мере в одном из неравенств f(a — 0) /(а) /(а 4-0), если f — неубывающая (или f(a — 0) /(а) f(a 4- 0), если f — невозра- стающая) функция, имеет место знак строгого неравенства; в интервале, определяемом этим строгим неравенством, нет ни одного значения функции; указанные интервалы, отвечающие различным точкам разрыва монотонной функции, не пересекаются. ◄ Действительно, если а — точка разрыва, то она предельная для множе- ства Е и в силу утверждения 3 является точкой разрыва первого рода. Таким образом, по крайней мере одна из баз ЕЭх-> а — 0, Е Э х -> а 4-0 определена и по ней (а в случае определенности обеих баз — по каждой из них) существует предел функции f. Пусть, для определенности, / — неубывающая функция. Поскольку а — точка разрыва, то по крайней мере в одном из неравенств f(a — 0) f(a) f(a 4- 0) на самом деле имеет место строгое неравенство. Поскольку f(x) lim f(x) = f(a — 0), если х 6 Е и х < а, и, аналогично, ЕЭх-+а—О f(a 4- 0) f(x), если х € Е и а < х, то интервал, определяемый строгим неравенством f(a — 0) < f(a) или f(a) < f(a + 0), действительно свободен от значений функции. Пусть «1, 02 — две различные точки разрыва функции, и пусть ai <а2. Тогда, в силу неубывания функции /, имеем f(ai - 0) /(щ) /(ai + 0) f(a2 - 0) f(a2) f(a2 + 0). Отсюда следует, что не содержащие значений функции интервалы, отве- чающие различным точкам разрыва, не пересекаются. ► Следствие 2. Множество точек разрыва монотонной функции не бо- лее чем счетно. ◄ С каждой точкой разрыва монотонной функции свяжем, по следствию 1, интервал, определяемый значением функции в точке разрыва и одним из пре- делов функции при приближении аргумента справа или слева к точке разрыва. Эти интервалы не пересекаются. Но на прямой может быть не более чем счет- ное множество непересекающихся интервалов. В самом деле, в каждом из них можно выбрать по рациональной точке, и тогда множество интервалов ока- жется равномощным подмножеству счетного множества Q всех рациональных чисел. Значит, оно само не более чем счетно. Вместе с ним, таким образом, не более чем счетно и равномощное ему по построению множество точек разрыва монотонной функции. ► Утверждение 4 (критерий непрерывности монотонной функции). Мо- нотонная функция f: Е —> R, заданная на отрезке Е = [а, Ь], непрерывна на нем тогда и только тогда, когда множество f(E) ее значений само явля- ется отрезком с концами1) f(a) и f(b). При этом /(а) f(b), если f — неубывающая, и f(b) /(а), если f — невозрастающая функция.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 165 ◄ Если f — непрерывная монотонная функция, то ввиду монотонности f все значения, которые функция принимает на отрезке [а, 6], лежат между значениями /(а) и У (6), которые она принимает в концах отрезка. Ввиду не- прерывности функции она обязана принимать также и все промежуточные значения между /(а) и У (5). Таким образом, множество значений функции, монотонной и непрерывной на отрезке [а, 6], действительно является отрезком с концами У (а) и f(b). Докажем теперь обратное утверждение. Пусть f — монотонная на от- резке [а, Ь] функция. Если она разрывна в некоторой точке с 6 [а, Ь], то по следствию 1 утверждения 3 один из интервалов ]/(с — 0), /(с)[, ]У(с), /(с + 0)[ заведомо определен и в нем нет значений нашей функции. Но ввиду моно- тонности функции этот интервал содержится в отрезке с концами /(a), f(b), поэтому если на отрезке [а, 6] монотонная функция имеет хотя бы одну точ- ку разрыва, то весь отрезок с концами f(a), f(b) не может лежать в области значений функции. ► Теорема 5 (теорема об обратной функции). Функция f:X —> R, строго монотонная на множестве X С R, имеет обратную функцию У-1 : Y —> —> R, определенную на множестве Y = f(X) значений функции f. Функция /-1: Y —> R монотонна и имеет на Y тот же вид монотонности, какой имеет функция f: X —> R на множестве X. Если, кроме того, X есть отрезок [а, Ь] и функция f непрерывна на нем, то множество Y = есть отрезок с концами f(a), f(b) и функция У-1: Y —> R непрерывна на нем. ◄ Утверждение теоремы о том, что в случае X — [а, 6] и непрерывности / множество Y •= f(X) есть отрезок с концами f(a), f(b), следует из доказанно- го выше утверждения 4. Остается проверить, что У-1: Y —> R — непрерывная функция. Но У-1 монотонна на У, У есть отрезок и У-1 (У) = X = [а, Ь] — тоже отрезок. В силу утверждения 4 заключаем, что функция У-1 непрерывна на отрезке У с концами f(a), f(b). ► Пример 8. Функция у = f{x) = sin я: возрастает и непрерывна на от- резке [— у, Значит, ограничение этой функции на отрезок [—тр имеет обратную функцию х — J"1 (у), обозначаемую х = arcsin?/, определенную на отрезке [sin sin — [—1> 1], возрастающую от — до ~ и непрерыв- ную на этом отрезке. Пример 9. Аналогично, ограничение функции у = cos я: на отрезок [0,7г] есть убывающая непрерывная функция, которая в силу теоремы 5 име- ет обратную функцию, обозначаемую х = arccosy, определенную на отрезке [—1,1] и убывающую на нем от значения тг до значения 0. Пример 10. Ограничение функции у — tgz на интервал X — [ есть возрастающая от —оо до +оо непрерывная функция, которая в силу пер- вой части теоремы 5 имеет обратную функцию, обозначаемую х = arctgy,
166 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ определенную на всей числовой прямой у € R и возрастающую на ней в пре- делах интервала ] — своих значений. Чтобы доказать непрерывность функции х — arctg у в любой точке т/о ее области определения, возьмем точку xq = arctg ?/о и отрезок [гг0 — е, xq + е], содержащий xq внутри и содержащийся в интервале ] f [• Если xQ - е = arctg (г/о - и x0 + e = arctg (yo + 5г), то ввиду возрастания функции х — arctg у можно утверждать, что при любом у € R таком, что уо — <51 < у < уо + , будем иметь xq — е < arctg?/ < xG 4- е. Итак, |arctgу — arctgу0| < £ при —<51 < у — уо < 62 и тем более при \у — г/о| < < 6 = min {<51,52}, пто и проверяет непрерывность функции х = arctg у в точке Уо € R. Пример 11. Рассуждениями, аналогичными проведенным в предыдущем примере, устанавливаем, что поскольку ограничение функции у = ctgz на интервале ] 0, тг[ есть убывающая от +оо до — оо непрерывная функция, то она имеет обратную функцию, обозначаемую х = arcctgy, определенную на всей числовой оси R, убывающую на ней в пределах интервала своих значений ]0, тг[ от тг до 0 и непрерывную на R. Замечание. При построении графиков взаимно обратных функций у = = f(x) и х = f~1(y) полезно иметь в виду, что точки плоскости с координа- тами (x,f(x)) = (х,у) и (у,/-1 (у)) = (ув одной и той же координатной системе (в которой лишь указана первая и вторая оси координат, а не ось х или ось у) симметричны относительно биссектрисы первого координатного угла. Таким образом, графики взаимно обратных функций, изображенные в од- ной системе координат, оказываются симметричными относительно этой бис- сектрисы. Задачи и упражнения 1. Покажите, что: а) Если f G С(А) и В С А, то f\B G С(В). Ь) Если функция /: Ei U 2?2 ~> R такова, что € £(£»), i = 1, 2, то не всегда f G C(Ei U В2). с) Функция Римана 7£, как и ее ограничение 7£|q на множество рациональных чисел, разрывна в каждой точке множества Q, кроме нуля, и все точки разрыва при этом устранимые (см. § 1, пример 12). 2. Покажите, что если функция f € С[а,6], то функции m(ar) = min /(i), М(х) = max /(i) a£t<x a<t<x также непрерывны на отрезке [а, Ь]. 3. а) Докажите, что функция, обратная функции, монотонной на интервале, не- прерывна на области своего определения. Ь) Постройте монотонную функцию со счетным множеством точек разрыва.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 167 с) Покажите, что если функции f : X Y и f"1: Y X взаимно обратны (здесь X,Y — подмножества R) и f непрерывна в точке хо € X, то из этого еще не следует непрерывность функции /-1 в точке уо = f(xo) € Y. 4. Покажите, что: а) Если / € С[а, &] и д € С[а, Ь], причем f(a) < д(а) и f(b) > д(Ь), то существует точка с € [а, 6], в которой /(с) = д(с). Ь) Любое непрерывное отображение f: [0,1] -> [0,1] отрезка в себя имеет непо- движную точку, т. е. точку х € [0,1] такую, что f(x) — х. с) Если два непрерывных отображения f к д отрезка в себя коммутируют, т. е. f ° 9 — 9 ° f > т0 они имеют общую неподвижную точку. d) Непрерывное отображение f: R —> R может не иметь неподвижной точки. е) Непрерывное отображение /: ]0,1[ —> ]0,1[ может не иметь неподвижной точки. f) Если отображение f: [0,1] —> [0,1] непрерывно, /(0) = 0, /(1) = 1 и (/°/)(я) = = х на [0,1], то f(x) = х. 5. Покажите, что множеством значений любой непрерывной на отрезке функции является отрезок. 6. Покажите, что: а) Если отображение f: [0,1] -> [0,1] непрерывно, /(0) =0, /(1) = 1 и при не- котором п € N fn(x) := ( /о ... of )(х) = х на [0,1], то f(x) = х. п раз Ь) Если функция f: [0,1] [0,1] непрерывна и не убывает, то для любой точки х € [0,1] реализуется по крайней мере одна из двух возможностей: либо х — непо- движная точка, либо fn(x) стремится к неподвижной точке (здесь fn(x) = /о.. .of — п-я итерация /). 7. Пусть /: [0,1] —> R — непрерывная функция такая, что /(0) = /(1)- Покажите, что а) при любом п 6.N существует горизонтальный отрезок с концами на графике “ 1 этой функции, длина которого равна —: п Ь) если число I не имеет вида —, то найдется функция указанного вида, в график которой уже нельзя вписать горизонтальный отрезок длины I. 8. Модулем непрерывности функции f: Е -> R называется функция и(5), опре- деляемая при 6 > 0 следующим образом: и(<5)= sup |/(si)-/(aj2)|. Таким образом, верхняя грань берется по всевозможным парам точек xi, х% множе- ства Е, удаленным друг от друга меньше чем на 6. Покажите, что: а) Модуль непрерывности — неубывающая неотрицательная функция, имеющая предел1^ ш(+0) = b) Для любого е > 0 найдется 6 > 0 такое, что для любых точек а; 1,0:2 6 Е соотношение |o:i — хга| <5 влечет |/(o:i) — /(0:2)! < а>(-|-0) 4- е. Поэтому модуль непрерывности обычно рассматривают при 6 0, полагая ш(0) = = ш(+0).
168 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ с) Если Е — отрезок, интервал или полуинтервал, то для модуля непрерывности функции /: Е —> R имеет место соотношение о>(<514- <$2) о>(<51) 4- w(^2)« d) Модулем непрерывности функции х и sin ж2, рассматриваемых на всей число- вой прямой, являются соответственно функция ш(8) = 6 и постоянная ш(6) = 2 в области S > 0. е) Функция f равномерно непрерывна на множестве Е тогда и только тогда, когда о;(4-0) = 0. 9. Пусть / и д — ограниченные функции, определенные на одном и том же множе- стве X. Величина Д = sup \f(x) — р(«)| называется расстоянием между функциями х£Х fug. Она показывает, насколько хорошо одна функция аппроксимирует другую на данном множестве X. ПустьX — отрезок [а,Ь]. Покажите, что если f,g G С[а,Ь], то 3a?o € [а, Ь], где Д = |/(®о) — р(«о)|, и что для произвольных ограниченных функций это, вообще говоря, не так. 10. Пусть Рп(х) — многочлен (полином) степени п. Будем приближать ограни- ченную функцию f: [а, Ь] —► R многочленами. Пусть Д(Р„)= sup |/(ж) - Р„(х)| и En(/) = inf Д(РП), z€[a,b] где нижняя грань берется по всевозможным многочленам степени п. Многочлен Рп называется многочленом (полиномом) наилучшего приближения функции /, если для него Д(РП) = En(f). Покажите, что: а) Существует многочлен Ро(х) = ао наилучшего приближения степени нуль. Ъ) Среди многочленов Q\(x) вида ХРп(х), где Рп — фиксированный многочлен, найдется такой многочлен Q\o, что A(Qxo) = пнпД(Фх). с) Если существует многочлен наилучшего приближения степени п, то существу- ет также многочлен наилучшего приближения степени п 4-1. d) Для любой ограниченной на отрезке функции и любого п = 0, 1, 2, ... най- дется многочлен наилучшего приближения степени п. 11. Покажите, что: а) Многочлен нечетной степени с действительными коэффициентами имеет по крайней мере один вещественный корень. Ъ) Если Рп— многочлен степени п, то функция sgn Рп(х) имеет не более п точек разрыва. с) Если на отрезке [а,Ь] имеется п 4- 2 точки хо < < ... < ®n+i такие, что величина sgn[(/(®*) - Рп(«»))(-!)*] постоянна при i = 0, ..., п 4-1, то En(f) min |/(«*) — Рп(«*)| (теорема Валле- O^t^n+l Пуссена1)). (Определение En(f) см. в задаче 9.) 1)Ц1. Ж. ла Валле-Пуссен (1866—1962) — бельгийский математик и механик.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 169 12. а) Покажите, что при любом п G N функция Тп(х) = cos (narccoss), опреде- ленная на отрезке [—1,1], является алгебраическим многочленом степени п (поли- номы Чебышева). Ь) Найдите явное алгебраическое выражение полиномов Ti, Тг, Тз, Тд и нари- суйте их графики. с) Найдите корни многочлена Тп(х) на отрезке [—1,1] и те точки отрезка, где величина |ТП (х)| достигает максимума. d) Покажите, что среди многочленов Рп (х) степени п с коэффициентом 1 при хп многочлен Тп(х) является единственным многочленом, наименее уклоняющимся от нуля, т. е. Еп(0) = max |ТП(х)| (определение En(f) см. в задаче 9). 13. Пусть f G С[о,5]. а) Покажите, что если для полинома Рп(х) степени п найдутся п -I- 2 точки хо < ... < Zn+i (называемые точками чебышевского альтернанса) такие, что f(xi) — Pn(xi) = (-1)’Д(РП) а, где Д(РП) = max |/(х) - Рп(х)|, а а — постоянная, sc G [л,Ь] равная 1 или —1, то Рп(х) является и притом единственным полиномом наилучшего приближения функции f степени п (см. задачу 9). Ь) Докажите теорему Чебышева: многочлен Рп(х) степени п тогда и только тогда является многочленом наилучшего приближения функции f € С[а, Ь], когда на отрезке [а, 6] найдется по крайней мере п + 2 точки чебышевского альтернанса. с) Покажите, что для разрывных функций предыдущее утверждение, вообще говоря, не верно. d) Найдите многочлены наилучшего приближения нулевой и первой степени для функции |х| на отрезке [—1,2]. 14. В § 2 мы обсуждали локальные свойства непрерывных функций. Настоящая задача уточняет понятие локального свойства. Две функции f и д будем считать эквивалентными, если найдется такая окрест- ность U(а) фиксированной точки a € R, что Vi € U(a) имеем f(x) = д(х). Это отношение между функциями, очевидно, рефлексивно, симметрично и транзитивно, т. е. действительно является отношением эквивалентности. Класс эквивалентных между собой в точке а функций называется ростком функ- ций в данной точке а. Если рассматривают только непрерывные функции, то гово- рят о ростке непрерывных функций в точке а. Локальные свойства функций — это свойства ростков функций. а) Определите арифметические операции над ростками числовых функций, за- данными в одной и той же точке. Ь) Покажите, что арифметические операции над ростками непрерывных функ- ций не выводят из этого класса ростков. с) Покажите, учитывая а) и Ь), что ростки непрерывных функций образуют кольцо — кольцо ростков непрерывных функций. d) Подкольцо I некоторого кольца К называется идеалом кольца К, если про- изведение любого элемента кольца К и элемента подкольца I лежит в I. Найдите идеал кольца ростков функций, непрерывных в точке а. f 15. Идеал кольца избывается максимальным^ если он не содержится ни в каком большем идеале, кроме самого кольца. Множество С[а, Ь] функций, непрерывных на отрезке, образует кольцо относительно обычных операций сложения и умножения числовых функций. Найдите.максимальные идеалы этого кольца.
ГЛАВА V ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ § 1. Дифференцируемая функция 1. Задача и наводящие соображения. Предположим, что, следуя Нью- тону1), мы хотим решить кеплерову2) задачу двух тел, т. е. хотим объяс- нить закон движения одного небесного тела т (планета) относительно дру- гого тела М (звезда). Выберем в плоскости движения декартову систему координат с началом в М (рис. 13). Тогда положе- ние т в момент времени t можно охарактеризо- вать численно координатами (x(i), y(i)) точки т в этой системе координат. Мы хотим найти функ- ции x(i), y(t). Движением т относительно М управляют два знаменитых закона Ньютона: общий закон движения ma — F, (1) связывающий вектор силы с вектором вызванного ею ускорения через коэф- фициент пропорциональности т — инертную массу тела3), и закон всемирного тяготения, позволяющий найти гравитационное воздей- Х)И. Ньютон (1642 — 1727) — английский физик, механик, астроном и математик, круп- нейший ученый, сформулировавший основные законы классической механики, открывший закон всемирного тяготения, разработавший (наряду с Лейбницем) основы дифференциаль- ного и интегрального исчисления. Оценен был уже современниками, которые на его могиле начертали: «Здесь покоится то, что было смертного у Ньютона». 2)И. Кеплер (1571 —1630) — знаменитый немецкий астроном, открывший законы движе- ния планет (законы Кеплера). з) Мы обозначили массу символом самого тела, но это не приведет к недоразумениям. Заметим также, что если т <С М, то выбранную систему координат можно считать инер- циальной.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 171 ствие тел тп и М друг на друга по формуле где г — вектор с началом в теле приложения силы и концом в другом теле, |г| — длина вектора г, или расстояние между т и М. Зная массы m, М, по формуле (2) без труда выражаем правую часть урав- нения (1) через координаты x(t), y(t) тела т в момент i, чем исчерпываем всю специфику данного движения. Чтобы получить теперь соотношения на «(t), j/(t), заключенные в урав- нении (1), необходимо научиться выражать левую часть уравнения (1) через функции x(t), y(t). Ускорение есть характеристика изменения скорости v(i), точнее, просто скорость изменения скорости; поэтому для решения задачи прежде всего не- обходимо научиться вычислять скорость v(i), которую имеет в момент t тело, движение которого задается радиус-вектором r(t) = (я (£),£/(£)). Итак, мы хотим определить и научиться вычислять ту мгновенную ско- рость тела, которую подразумевает закон движения (1). Измерить — значит сравнить с эталоном. Что же в нашем случае может служить эталоном для определения мгновенной скорости движения? Наиболее простым видом движения является такое, которое совершает по инерции свободное тело. Это движение, при котором за равные промежутки времени происходят равные (как векторы) перемещения тела в пространстве. Это так называемое равномерное (прямолинейное) движение. Если точка дви- жется равномерно, г(0) и г(1) — ее радиус-векторы относительно инерциаль- ной системы координат в моменты t = 0 и t = 1 соответственно, то в любой момент времени будем иметь г(«) - г(0) = v •«, (3) где v = г(1) — г(0). Таким образом, перемещение r(t) — г(0) оказывается в простейшем случае линейной функцией времени, причем роль множителя про- порциональности между перемещением r(t)—г(0) и временем t играет в данном случае вектор v перемещения за единицу времени. Этот вектор и называется скоростью равномерного движения. То, что движение прямолинейно, видно из параметрического уравнения его траектории: r(t) = r(0) + v • i, являющегося (см. курс аналитической геометрии) уравнением прямой. Мы знаем, таким образом, скорость v равномерного прямолинейного дви- жения, задаваемого формулой (3). По закону инерции, если на тело не дей- ствуют внешние силы, оно движется равномерно и прямолинейно. Значит, если в момент t экранировать действие тела М на тело т, то последнее Про- должит свое движение уже равномерно с некоторой определенной скоростью. Таким образом, естественно считать, что именно она является (мгновенной) скоростью нашего тела в момент t.
172 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Однако такое определение мгновенной скорости оставалось бы чистой аб- стракцией, не дающей никаких рекомендаций для конкретного вычисления этой величины, если бы не следующее обстоятельство первостепенной важно- сти, которое мы сейчас обсудим. Оставаясь в рамках того (как сказали бы логики, «порочного») круга, в который мы вошли, написав уравнение движения (1), а затем принявшись вы- яснять, что такое мгновенная скорость и ускорение, мы все же заметим, что при самом общем представлении об этих понятиях из уравнения (1) можно сде- лать следующие эвристические выводы. Если силы отсутствуют, т. е. F = О, то ускорение тоже равно нулю. Но если скорость a(i) изменения скорости v(t) равна нулю, то, по-видимому, сама скорость v(£) вообще не меняется со временем. И мы приходим к закону инерции, по которому свободное тело действительно движется в пространстве с постоянной во времени скоростью. Из того же уравнения (1) видно, что ограниченные по величине силы спо- собны создать только ограниченные по величине ускорения. Но если на отрез- ке времени [0,t] абсолютная величина скорости изменения некоторой величи- ны P(t) не превышала некоторой постоянной с, то, по нашим представлениям, изменение |P(t) — Р(0) | величины Р за время t не превышает с • t, т. е. в этой ситуации за малый промежуток времени величина мало меняется (во всяком случае, функция P(t) оказывается непрерывной). Значит, реальная механиче- ская система за малый промежуток времени мало меняет свои параметры. В частности, скорость v(t) тела т во все моменты времени t, близкие к некоторому моменту to, должна быть близка к значению v(io), которое мы желаем определить. Но в таком случае само движение в малой окрестности момента to должно мало отличаться от равномерного движения со скоро- стью у(to), причем тем меньше отличаться, чем меньше мы уходим от to- Если бы мы сфотографировали траекторию тела т через телескоп, то в зависимости от его силы мы получили бы примерно следующее: Рис. 14 Представленный на фотографии с участок траектории соответствует столь малому интервалу времени, что на нем уже трудно отличить истинную
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 173 траекторию от прямолинейной, так как она и в самом деле на этом участке похожа на прямолинейную, а движение — на равномерное прямолинейное. Из этого наблюдения, кстати, можно заключить, что, решив задачу об опреде- лении мгновенной скорости (а скорость — векторная величина), мы одновре- менно решим и чисто геометрический вопрос об определении и нахождении касательной к кривой (кривой в данном случае служит траектория движения). Итак, мы заметили, что в нашей задаче должно быть v(i) « v(io) при i, близких к to, т. е. v(i) —> v(io) при t —> to или, что то же самое, v(i) = = v(i0) + о(1) при t —> to. Тогда должно быть также r(i) - r(i0) « v(i0) • (t - t0) при t, близких к to, точнее, величина смещения r(t) — г (io) эквивалентна v(to)(t — to) при t —> to, или r(i) - r(i0) = v(t0)(t - t0) 4- o(v(to)(t - to)), (4) где o(v(io)(i — io)) есть поправочный вектор, величина которого при t —> to стремится к нулю быстрее, чем величина вектора v(io)(i — to). Тут следует, естественно, оговорить тот случай, когда v(io) = 0. Чтобы не исключать этот случай из общего рассмотрения, полезно заметить, что1) |v(t0)(t — i0)| = = |v(io)||i ~ io|- Таким образом, если |v(io)| / 0, то величина |v(io)(i — io)| того же порядка, что и |t — i0|, и поэтому o(y(to)(t — io)) = o(t — to). Значит, вместо (4) можно записать соотношение r(i) - r(i0) = v(i0) (i - i0) + o(i - io), (5) которое не исключает также случая v(io) = 0. Таким образом, от самых общих и, быть может, расплывчатых предста- влений о скорости мы пришли к соотношению (5), которому скорость должна удовлетворять. Но из (5) величина v(io) находится однозначно: v(«°) = 1™? r^t т.^. (6) поэтому как само фундаментальное соотношение (5), так и равносильное ему соотношение (6) можно теперь принять за определения величины v(io) — мгно- венной скорости тела в момент to. Мы не станем сейчас отвлекаться на подробное обсуждение вопроса о пре- деле векторнозначной функции и ограничимся сведением его к уже рассмо- тренному во всех подробностях случаю предела вещественнозначной функции. Поскольку вектор r(i) — r(io) имеет координаты (x(t) — x(tQ), y(t) — y(to)), то r(t) - r(t0) (x(t) - x(t0) y(t) - y(t0) \ "^3—~ ~ ' ) и, значит, если считать, что векторы t — to \ t — to t — to / Здесь |t — to| — модуль числа t — to, a |v| — модуль, или длина вектора v.
174 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ близки, если их координаты близки, то предел в (6) следует понимать так: v(to) = lim = / lim lim v(e>-y(t0) t—*to t — ig \ i—t — to t—^to t — ig a o(i — io) в (5) надо понимать как вектор, зависящий от i и такой, что вектор o(t — io) t - to стремится (покоординатно) к нулю при i —> io- Наконец, заметим, что если v(io) 0 0, то уравнение г - r(to) = v(«o) (i - to) (7) задает прямую, которая в силу указанных выше обстоятельств должна быть признана касательной к траектории в точке (x(to),t/(io))- Итак, эталоном для определения скорости движения служит скорость равномерного прямолинейного движения, задаваемого линейным соотноше- нием (7). Эталонное движение (7) подгоняется к исследуемому так, как этого требует соотношение (5). То значение v(to), при котором (5) вы- полнено, может быть найдено предельным переходом (6) и называется ско- ростью движения в момент to. Рассматриваемые в классической механике движения, описываемые законом (1), должны допускать сравнение с таким эталоном, т. е. должны допускать линейную аппроксимацию, указанную в (5). Если r(t) = (x(i),j/(t)) — радиус-вектор движущейся точки т в момент t, r(t) = (i(t),y(t)) = v(i) — вектор скорости изменения r(t) в момент t, a r(t) = = (x(t), y(t)) = a(t) — вектор скорости изменения v(t), или ускорение в момент i, то уравнение (1) можно записать в виде m r(i) = F(i), откуда для нашего движения в поле тяжести получаем в координатном В1|де ( i(t) = -GM - ^1А13/2. I [z2(t) + y2(t)]3/2 I y(t) = -GM ——^0——-, I [x2(t) +y2(t)]3/2 Это точная математическая запись нашей исходной задачи. Поскольку мы знаем, как по r(t) искать r(t) и далее r(t), то уже сейчас мы в состоянии отве- тить на вопрос, может ли какая-то пара функций (x(t),j/(i)) задавать движе- ние тела т вокруг М. Для этого надо найти x(t), y(t) и проверить, выполнены ли соотношения (8). Система (8) является примером системы так называемых дифференциальных уравнений. Пока что мы можем только проверять, явля- ется ли некоторый набор функций решением системы. Как искать решение или, лучше сказать, как исследовать свойства решений дифференциальных уравнений, изучается в специальном и, как уже сейчас можно понять, весьма ответственном отделе анализа — теории дифференциальных уравнений.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 175 Операция отыскания скорости изменения векторной величины, как было показано, сводится к отысканию скорости изменения нескольких числовых функций — координат вектора. Таким образом, эту операцию следует прежде всего научиться свободно выполнять в простейшем случае вещественнознач- ных функций вещественного аргумента, чем мы теперь и займемся. 2. Функция, дифференцируемая в точке. Начнем с двух предвари- тельных определений, которые мы чуть ниже несколько уточним. Определение 01. Функция /: Е —> 1R, определенная на множестве Е С С Ж, называется дифференцируемой в точке а 6 Е, предельной для множества Е, если существует такая линейная относительно приращения х — а аргумента функция А • (х — а), что приращение f(x) — f(a) функции f представляется в виде f(x) — f(d) = А (х — а) 4- о(х — а) при х —> а, х 6 Е. (9) Иными словами, функция дифференцируема в точке а, если изменение ее значений в окрестности исследуемой точки линейно с точностью до поправки, бесконечно малой по сравнению с величиной х — а смещения от точки а. Замечание. Как правило, дело приходится иметь с функциями, опреде- ленными в целой окрестности рассматриваемой точки, а не только на каком-то подмножестве этой окрестности. Определение Ог- Линейная функция А • (ж — а) из (9) называется диф- ференциалом функции f в точке а. Дифференциал функции в точке определен однозначно, ибо из (9) следует f(x)-f(a) .. ( . о(х - а)\ . hm ————— = hm I A -I— ----------- ) = А ЕЭх-ta X — а ЕЭх-^а \ X — Q J и в силу единственности предела число А определено однозначно. Определение 1. Величина -(о)= lim . (10) ЕЭх—X — а называется производной функции f в точке а. Соотношение (10) можно переписать в эквивалентной форме /(ж) - /(а) _ ~ f (а) "Ь х — а где а(х) —> 0 при х —> а, х Е Е, что в свою очередь равносильно соотношению f(x) — f(a) = f'(a)(x — а) -I- о(х — а) при х —> а, х 6 Е. (11) Таким образом, дифференцируемость функции равносильна наличию у нее производной в соответствующей точке.
176 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если сопоставить эти определения с тем, что было сказано в пункте 1, то можно заключить, что производная характеризует скорость изменения функ- ции в рассматриваемой точке, а дифференциал доставляет наилучшую линей- ную аппроксимацию приращения функции в окрестности рассматриваемой точки. Если функция f: Е —> 1R дифференцируема в различных точках множе- ства Е, то при переходе от одной точки к другой как величина А, так и функция о(х — а) в (9) могут меняться (к чему мы уже явно пришли в (11)). Указанное обстоятельство следует отметить уже в самом определении диф- ференцируемой функции, и мы приведем теперь это основное определение в его полной записи. Определение 2. Функция f: Е —> 1R, заданная на множестве Е С 1R, называется дифференцируемой в точке х Е Е, предельной для множества Е, если (12) f(x + h) — f(x) = A(x)h + a(x; E), где h A(x)h — линейная относительно h функция, a a(x',h) = о(Л) при h —0, х + h, Е Е. Величины Ax(h) := (х + h) — х = h, и А/(«; h) := f(x 4- h) - f(x) называют соответственно приращением аргумента и приращением функции (соответствующим этому приращению аргумента). Их часто (правда, не вполне законно) обозначают символами Дх и Д/(я) самих функций от h. Итак, функция дифференцируема в точке, если ее приращение в этой точке как функция приращения аргумента h является линейной с точностью до поправки, бесконечно малой при h —> 0 в сравнении с приращением аргу- мента. Определение 3. Линейная по h функция h м- A(x)h из определения 2 называется дифференциалом функции f:E-+ 1R в точке х Е Е и обозначается символом df(x) или Df(x). Таким образом, df(x)(h) = A(x)h. Из определений 2, 3 имеем Д/(«; Л) - df(x)(li) = а(х; Е), причем а(х", Л) = о(Л) при h —> 0, x + h Е Е, т. е. разность между приращением функции, вызванным приращением h ее аргумента, и значением при том же h
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 177 линейной по h функции df(x) оказывается бесконечно малой выше чем первого порядка по h. По этой причине говорят, что дифференциал есть (главная) линейная часть приращения функции. Как следует из соотношения (12) и определения 1, Л(х) = /'(*) = lim + h->o h x+h, Х&Е поэтому дифференциал можно записать в виде df(x)(h) = J'(x)h. (13) В частности, если f(x) = х, то, очевидно, f(x) = 1 и dx(h) = 1 • h = h, поэтому иногда говорят, что «дифференциал независимой переменной совпа- дает с ее приращением». Учитывая это равенство, из (13) получаем df(x)(h) = f\x)dx(h), (14) т. е. df(x) = f'(x)dx. Равенство (15) надо понимать как равенство функций от h. Из (14) получаем = Г(Х) dx(h) 1 1 ’’ (15) (16) т. е. функция (отношение функций df(x') и dx) постоянна и равна fix'). По этой причине, следуя Лейбницу, производную часто обозначают символом df(x) ——- наряду с предложенным впоследствии Лагранжем1) символом f(x). ах В механике, кроме указанных символов, для обозначения производной от функции <p(t) по времени t используется символ <p(t) (читается «ср с точкой от <»). 3. Касательная; геометрический смысл производной и диффе- ренциала. Пусть f: Е —> Ж — функция, определенная на множестве Е С 1R, и &о — фиксированная предельная точка множества Е. Мы хотим подобрать постоянную со так, чтобы она лучше всех остальных констант характеризо- вала поведение функции в окрестности точки ^о- Точнее, мы хотим, чтобы Х)Ж. Л. Лагранж (1736 — 1813) — знаменитый французский математик и механик.
178 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ разность /(х) — со при х —> xq, х 6 Е была бесконечно малой в сравнении уже с любой не нулевой постоянной, т. е. f(x) = Со + о(1) при X Xq, х G Е. (17) Последнее соотношение равносильно тому, что lim f(x) = со- Если, в ЕЗх— частности, функция непрерывна в точке хо, то lim f(x) = f(xo) и, есте- ЕЭх—>zo ственно, со = f(xo). Попробуем теперь подобрать функцию со + с\ (х — xq) так, чтобы иметь /(х) = Со + С\{Х - Xq) + О(х - Х0) При X -> Xq, X G Е. (18) Очевидно, это — обобщение предыдущей задачи, поскольку формулу (17) мож- но переписать в виде /(х) = со + о((х — х0)°) при х —> Хо, х G Е. Из (18) при х —> х0, х € Е немедленно следует, что со = lim f(x), и если ЕЭх—>zo функция непрерывна в точке, то со = /(хо). Если со найдено, то из (18) следует, что С1= lim ЕЭх—Hq X — Xq И вообще, если бы мы искали полином Рп (я?о; х) = со + Ci(x — хо) + ... + + сп(х — хо)п такой, что f(x) = Cq + Ci(x - Xq) + . . . + Cn(x - Х0)П + + o((x - х0)п) при X Xq,. X G E, (19) то мы последовательно и вполне однозначно нашли бы со = lim f(x), ЕЭх— С1= Иш fc, ЕЗх—>zq X — Xq /(я:) - [cq +...+ сп_!(я:-я:о)п г] cn = hm ---------------------—------------i, ЕЭх->2!0 (х — Я?о)п при условии, что все указанные пределы существуют; в противном случае условие (19) невыполнимо и задача решения не имеет. Если функция f непрерывна в точке хо, то из (18), как уже отмечалось, следует, что со = /(хо) и мы приходим к соотношению f(x) - f(xo) = Cl(х - я:0) + о(х - Хо) при х -> Хо, X G Е, равносильному условию дифференцируемости функции /(х) в точке xq.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 179 Отсюда находим CI= ]im - /W = f'(x„). ЕЭх—txo X — Xq Таким образом, доказано Утверждение 1. Функция f : Е —> R, непрерывная в точке xq Е Е, предельной для множества Е С R, допускает линейное приближение (18) в том и только в том случае, когда она дифференцируема в этой точке. Функция <р(х) = Со + Cl (х - Xq) (20) при со = f(xo) и ci = /'(яо) является единственной функцией вида (20), удо- влетворяющей соотношению (18). Итак, функция <р(х) = f(xQ) + f(xo)(x - Xq) (21) доставляет наилучшее линейное приближение функции f в окрестности точки Xq в том смысле, что для любой другой функции вида (20) f(x) — <р(х) о(х — Хо) при X —> Xq, X 6 Е. Графиком функции (21) является прямая У ~ f(xo) = f*(xo)(x - хо), (22) проходящая через точку (xq,/(xq)) и имеющая угловой коэффициент f'(xo). Поскольку прямая (22) доставляет наилучшее возможное линейное прибли- жение графика функции у = f(x) в окрестности точки (xo,f(xo)), то естест- венно принять Определение 4. Если функция f: Е —> R определена на множестве Е С R и дифференцируема в точке zo Е Е, то прямая, задаваемая уравнением (22), называется касательной к графику этой функции в точке (xq, f(xo)). Рисунок 15 иллюстрирует все основные понятия, связанные с дифферен- цируемостью функции в точке, которые мы к настоящему моменту ввели: приращение аргумента и соответствующие ему приращение функции и значе- ние дифференциала; на рисунке изображены график функции, касательная к графику в точке Pq = (xq,/(xq)) и, для сравнения, произвольная прямая (на- зываемая обычно секущей), проходящая через Pq и некоторую точку Р Pq графика функции. Развитием определения 4 является Определение 5. Если отображения f : Е —> R, g : Е —> R непрерывны в точке а?о G Е, предельной для множества Е С R, и f(x) — g(x) = о((х — хо)п) при х —> xq, х € Е, то говорят, что f и g имеют в точке xq касание порядка п (или, точнее, порядка не ниже п). При п = 1 говорят, что отображения fug касаются друг друга в точке xq. В соответствии с определением 5 отображение (21) касается в точке xq G Е отображения f: Е —> R, дифференцируемого в этой точке. 7 Зорич В. А.
180 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Теперь можно также сказать, что полином Рп(хо;х) = со + ci(x — х0) + + ... + сп(х — х0)п из соотношения (19) имеет с функцией f касание не ниже чем порядка п. Рис. 15 Число h = х — Xq, т. е. приращение аргумента, можно рассматривать как вектор, приложенный к точке xq и определяющий переход из xq в х = xq + h. Обозначим совокупность таких векторов через ТК(жо) или Анало- гично, обозначим через Т1К(2/о) или Т1йу0 совокупность векторов смещения от точки J/0 по оси у (см. рис. 15). Тогда из определения дифференциала видно, что отображение df(x0): TR(s0) -> TR(/(x0)), (23) задаваемое дифференциалом h f^xo'jh = df(xo)(h), касается отображения h f(x0 + h) - f(x0) = &f(xQ; h), (24) задаваемого приращением дифференцируемой функции. Заметим (см. рис. 15), что если отображение (24) есть приращение орди- наты графика функции у = f(x) при переходе аргумента из точки xq в точку хо + h, то дифференциал (23) дает приращение ординаты касательной к гра- фику функции при том же приращении h аргумента. 4. Роль системы координат. Аналитическое определение 4 касатель- ной может вызвать некоторую не вполне осознанную неудовлетворенность. Мы постараемся сформулировать, что именно может составить предмет этой неудовлетворенности. Однако прежде укажем одну более геометрическую конструкцию касательной к кривой в некоторой ее точке Pq (см. рис. 15). Это — небольшое отклонение от наиболее распространенного обозначения или Txo(R). •
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 181 Возьмем произвольную точку Р кривой, отличную от Pq. Прямая, опре- деляемая парой точек Pq, Р, как уже отмечалось, называется секущей по от- ношению к кривой. Заставим теперь точку Р вдоль кривой стремиться к точке Pq. Если при этом секущая будет стремиться к некоторому предель- ному положению, то это предельное положение секущей и есть касательная к кривой в точке Pq. Такое определение касательной при всей его наглядности в данный момент для нас неприемлемо потому, что мы не знаем, что такое кривая, что значит «точка стремится к другой точке вдоль кривой» и, наконец, в каком смысле надо понимать «предельное положение секущей». Вместо того чтобы уточнять сейчас все эти понятия, мы отметим основ- ную разницу между двумя рассмотренными определениями касательной. Вто- рое было чисто геометрическим, не связанным (во всяком случае, до уточне- ний) с какой бы то ни было системой координат. В первом же случае мы определили касательную к кривой, являющейся в некоторой системе коорди- нат графиком дифференцируемой функции. Естественно может возникнуть вопрос, не получится ли так, что если эту кривую записать в другой системе координат, то, например, соответствующая функция перестанет быть диф- ференцируемой или будет дифференцируемой, но в результате новых вычи- слений мы получим другую прямую в качестве касательной. Этот вопрос об инвариантности, т. е. независимости от системы коорди- нат, всегда возникает, когда понятие вводится с помощью некоторой системы координат. В равной степени этот вопрос относится и к понятию скорости, которое мы обсуждали в пункте 1 и которое, кстати, как это уже отмечалось, включает в себя понятие касательной. Точка, вектор, прямая и т. д. имеют в разных системах координат разные численные характеристики (координаты точки, координаты вектора, уравне- ние прямой). Однако, зная формулы, связывающие две системы координат, всегда можно по двум однотипным числовым представлениям выяснить, явля- ются ли они записью в разных системах координат одного и того же гео- метрического объекта или нет. Интуиция подсказывает нам, что процедура определения скорости, описанная в пункте 1, приводит к одному и тому же вектору независимо от системы координат, в которой проводились вычисле- ния. В свое время, при изучении функций многих переменных, мы подробно обсудим подобного рода вопросы. Инвариантность определения скорости от- носительно различных систем координат будет проверена уже в следующем параграфе. Прежде чем переходить к рассмотрению конкретных примеров, подведем некоторые итоги. Мы столкнулись с задачей математического описания мгновенной скоро- сти движущегося тела. Эта задача привела к задаче аппроксимации заданной функции в окрест- ности исследуемой точки линейной функцией, что в геометрическом плане -7*
182 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ привело к понятию касательной. Функции, описывающие движение реаль- ной механической системы, предполагаются допускающими такую линейную аппроксимацию. Тем самым среди всех функций естественно выделился класс дифференци- руемых функций. Было введено понятие дифференциала функции в точке как линейного ото- бражения, определенного на смещениях от рассматриваемой точки, которое с точностью до величины бесконечно малой по сравнению с величиной смещения описывает поведение приращения дифференцируемой функции в окрестности рассматриваемой точки. Дифференциал df(xo)h = f*(xo)h вполне определяется числом /'(ато) — производной функции f в точке ато, которое может быть найдено предельным переходом f'(x0) = lim /(д) ~ . ЕЭх—>го X — Xq Физический смысл производной — скорость изменения величины /(ат) в мо- мент хо; геометрический смысл производной — угловой коэффициент каса- тельной к графику функции у = f(x) в точке (xq,/(ато)). 5. Некоторые примеры Пример 1. Пусть f(x) = sin а:. Покажем, что /'(ат) = cos ат. sin (ат + /г) — sin ат S*n ( 2 ) COS + 2 lim ----------------= lim--------- ,— -------- л—>о п Л—>о /i h = lim cos (х Н— л.—>о \ 2 sin lim —т Л—►о । = cosx. ► Мы воспользовались теоремой о пределе произведения, непрерывностью функции cos ат, эквивалентностью sini ~ t при t —> 0 и теоремой о пределе композиции. Пример 2. Покажем, что cos' ат = — sin ат. cos (ar + h) — cos x 8*п(ж + о lim---------/----------= hm---------—-------------- h—>0 h h—>0 h h sm ( — ат -I— I • lim —7— 2/ h->o (n\ \2J
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 183 Пример 3. Покажем, что если f(t) = г cos cut, то /'(t) = — rcusincut. h п • /wh\ Л . г coscu(t 4- h) — г cos cut 2sin( 2 / Smt4,V 2/ lim -----------------------= т lim---------------— - — — = h—>0 ft h—>0 h (uh\ T) — —T U1L1 Sill w I t -r — I 1Ш1 ——ГХ— = — rcusincu t. ► h->0 \ 2/ h-*0 f шп\ \ 2 J Пример 4. Если f(t) = r sin cut, to /'(t) = raj coscut. Доказательство аналогично разобранным в примерах 1 и 3. ► Пример 5. Мгновенная скорость и ускорение материальной точки. Пусть материальная точка движется в плоскости и в фиксированной системе координат закон ее движения описывается дифференцируемыми функциями от времени х = *(t), у = y(t) или, что то же самое, вектором r(t) = (x(t),J/(t)). Как мы выяснили в пункте 1 настоящего параграфа, скорость точки в мо- мент t есть вектор v(t) =r(t) = (±(t),y(t)), где ±(t), y(t) — производные функций x(t), j/(t) по времени t. Ускорение a(t) есть скорость изменения вектора v(t), поэтому a(t) = v(t) = f(t) = (£(t), где z(t), y(t) — производные no t функций i(t), y(t), или так называемые вторые производные функций x(t), y(t). Таким образом, по смыслу физической задачи функции rr(t), y(t), описыва- ющие движение материальной точки, должны иметь и первые и вторые про- изводные. Рассмотрим, в частности, равномерное движение точки по окружности радиуса г. Пусть си — угловая скорость точки, т. е. величина центрального угла, на который перемещается точка за единицу времени. В декартовых координатах (в силу определений функций cos a:, sin х) это движение запишется в виде r(t) = (г cos (cut 4-а), г sin (cut 4- а)), а если г(0) = (г, 0), то в виде r(t) = (г cos cut, rsincut).
184 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Без ограничения общности дальнейших выводов и для сокращения записи будем считать, что г(0) = (г, 0). Тогда в силу результатов примеров 3 и 4 v(t) = r(t) = (—rtu sin cut, rcucoscut). Из подсчета скалярного произведения (v(t),r(t)) = — r2cu sin cut coswt + r2cu coscut sin cut = 0, как и следовало в этом случае ожидать, получаем, что вектор v(t) скорости ортогонален радиус-вектору r(t) и направлен по касательной к окружности. Далее, для ускорения имеем a(t) = v(t) = r(t) = (—rcu2 coscut, —rcu2sincut), t. e. a(t) = — cu2 • r(t) и ускорение, таким образом, действительно центро- стремительное, ибо имеет направление, противоположное направлению век- тора r(t). Далее, |a(t)| = cu2 |r(t)| = cu2r = ” где v = |v(t)|. ’ Подсчитаем, исходя из этих формул, например, величину скорости низкого спутника Земли. В этом случае г совпадает с радиусом Земли, т. е. г « ~ 6400 км, a |a(t)| ~ д, где д ~ 10 м/с2 — ускорение свободного падения у поверхности Земли. Таким образом, v2 = |a(t)| г « 10 м/с2 х 64-105 м = 64 • 106 (м/с)2 и v а 8 • 103 м/с. Пример 6. Оптическое свойство параболического зеркала. Рассмот- рим (рис. 16) параболу у = -£-х2 (р > 0) и построим касательную к ней в / 1 \ 2р точке (х0,у0) = \ х0, Поскольку f{x) = -z-x2 2р , то —X2 - — х% f(xQ) = lim —------—— = lim (х + х0) — ~ - ~ ~ 2р Х-¥Х0 р X — Xq X—>Zo Значит, искомая касательная имеет уравнение или 1 2 гДе I/о = 2^хо- 1 г 1 / х У- -Z-Xq = -Xq{x-Xq) 2р р - xq(x - яг0) - (у - 2/о) = о, (25)
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 185 Вектор п = ( —-а7о,1), как видно из последнего уравнения, ортогонален V р / прямой (25). Покажем, что векторы ev = (0,1) и е/ = Г—хо, |—уо) образуют с п равные углы. Вектор еу есть единичный вектор направления оси Оу, а е/ — вектор, направленный из точки касания (zo,?/o) = (О, ) — фокус параболы. Итак, \ * / 1 2А *о> тгх0) в ТОЧКУ 2р / cos еуп = cose/n = Таким образом, показано, что волновой источник, помещенный в точке (б, 2) ~ в ФокУсе параболического зеркала, даст пучок, параллельный оси Оу зеркала, а приходящий параллельно оси Оу пучок зеркало пропустит через фокус (см. рис. 16). Пример 7. Этим примером мы покажем, что касательная является всего- навсего лучшим линейным приближением графика функции в окрестности точки касания и вовсе не обязана иметь с ним единственную общую точку, как это было в случае окружности и как это вообще имеет место в случае выпуклых кривых. (О выпуклых кривых будет специальный разговор.) Пусть функция f(x) задана в виде №) = < я2sin-, если х / О, х О, если х = 0. График этой функции изображен на рис. 17.
186 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Найдем касательную к графику в точке (0,0). Поскольку х2 sin - — 0 I /'(0) = lim----------= lim х sin - = 0, J v 7 z-+O х - 0 z—^0 X то касательная имеет уравнение у - 0 = 0 • (х - 0), или просто У = о. Таким образом, в нашем примере касательная совпадает с осью Ох, с которой график имеет бесконечное количество точек пересечения в любой окрестности точки касания. В силу определения дифференцируемости функции f: Е —> R в точке то € 6 Е имеем У(яг) - /(хо) = А(яо)(я - Xq) + о(х - Яо) При X Xq, X Е Е. Поскольку правая часть этого равенства стремится к нулю при х —> xq, х Е Е, то lim f(x) = f(xo), так что дифференцируемая в точке функция обязана ЕЭх—¥ХО быть непрерывной в этой точке. Покажем, что обратное, конечно, не всегда имеет место. Пример 8. Пусть f(x) = |х| (рис. 18). Тогда в точке xq = 0 lim f(x)-f(XB) х-^хо-0 X — Xq lim /(*) - fw x-txo+0 X — Xq = lim — ^-1, х—¥ — 0 х = lim - = 1. Х-Ц-О X Следовательно, в этой точке функция не имеет производной, а значит, и не дифференцируема в этой точке. Пример 9. Покажем, что ex+h — ех = = exh + o(h) при h —> 0. Таким образом, функция ехр(т) = ех диф- ференцируема, причем dexp(x)h = exp (ж) h, или dex = exdx, и тем самым ехр' х = ехргг, dex х или -т— — е. ах ◄ ex+h — ех = ex(eh — 1) = ex(h + o(/i)) = = exh + o(h). Мы воспользовались полученной в примере 39, гл. III, § 2, п. 4 формулой eh — 1 = h + o(h) при h —> 0. ►
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 187 Пример 10. ax+h — ах — ах Inah + o(h) при h —> 0 и а > 0. Таким образом, dax = ах In a dx и = ах In а. I ax+h — ах = ax(ah - 1) = ax(ehina - 1) = = ax(h\na 4- o(hlna)) = ax Inah 4- o(h) при h —> 0. ► Пример 11. ln|rr 4- 7i| — ln|x| = -h 4- o(h) при h —> 0 и x 0 0. 37 Таким образом, din lx I = -dx и — 1 ' x dx x ◄ ln|z + h\ — In|x| = In 1 + - . 37 При |h| < Ы имеем 14- — = 14-—, поэтому для достаточно малых значений X X h можно написать h X 1п|х 4- h\ — In|х| = In fl 4- —) = —+ о(—) = — h 4- o(h) \ ху х \х у х при h —> 0. Мы воспользовались здесь тем, что, как показано в примере 38, гл. III, § 2, п. 4, 1п(1 4-t) = t 4- o(i) при t —> 0. ► Пример 12. log I я 4- h\ — log Ы = ——h 4- o(h) при h —> 0, x 0, x in a 0 < а ф 1. Таким образом, rfloga|xr| = -±— dx и = -±—. x m a ax x In a ◄ logjz 4- Л| - loga|x| = loga 14--= loga (1 4- -) = ~ 1 x у — 7— 1*11 x -r - I - -— I - 4- of-)) = + °(ty- ma \ x/ ma\a: \xJJ xma Мы воспользовались формулой перехода к другому основанию логарифмов и соображениями, изложенными при рассмотрении примера 10. ► h х Infl 4- - \ х Задачи и упражнения 1. Покажите, что а) касательная к эллипсу 2 2 ^- + ^ = 1 а2 Ъ2 в точке (®о,!/о) имеет уравнение ххр ууо _ а2 Ь2 5 Ь) световые лучи от источника, помещенного в одном из двух фокусов Fi = = (—\/а2 — Ь2, 0), Fz = (\/а2 — Ь2, 0) эллипса с полуосями а > b > 0, собираются эллиптическим зеркалом в другом фокусе.
188 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 2. Напишите формулы для приближенного вычисления значений a) sin + о) при значениях а, близких к нулю; b) sin(30°+ а0) при значениях а°, близких к нулю; с) + а) при значениях а, близких к нулю; d) cos(45° + а0) при значениях а0, близких к нулю. 3. Стакан с водой вращается вокруг своей оси с постоянной угловой скоростью а>. Пусть у = /(х) — уравнение кривой, получающейся в сечении поверхности жидкости плоскостью, проходящей через ось вращения. 2 а) Покажите, что f'(x) = —х, где д — ускорение свободного падения (см. при- мер 5). Ь) Подберите f(x) так, чтобы функция f(x) удовлетворяла условию, указанному в а) (см. пример 6). с) Изменится ли приведенное в а) условие на функцию /(х), если ось вращения не будет совпадать с осью стакана? 4. Тело, которое можно считать материальной точкой, под действием силы тяже- сти скатывается с гладкой горки, являющейся графиком дифференцируемой функ- ции у = /(х). а) Найдите горизонтальную и вертикальную компоненты вектора ускорения, ко- торое имеет тело в точке (xo,t/o)- Ь) В случае, когда /(х) = х2 и тело скатывается с большой высоты, найдите ту точку параболы у = х2, в которой горизонтальная составляющая ускорения макси- мальна. 5. Положим {п . 1 х, если 0 С х . 1 . 1 — х, если - х С 1» л» -л продолжим эту функцию на всю числовую прямую с периодом 1. Эту продолжен- ную функцию обозначим через у>о- Пусть, далее, у’п(х) = ^у?о(4пх). Функция 9?п имеет период 4-п и производную, равную 4-1 или —1 всюду, кроме точек х = » п Пусть f(x) = n=l Покажите, что функция f определена и непрерывна на R, но ни в одной точке не имеет производной. (Этот пример принадлежит известному современному голланд- скому математику Б. Л. Ван дер Вардену. Первые примеры непрерывных функций, не имеющих производной, были построены Больцано (1830 г.) и Вейерштрассом (1860 г.).)
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 189 § 2. Основные правила дифференцирования Построение дифференциала заданной функции или, что равносильно, отыс- кание ее производной называется операцией дифференцирования функции1). 1. Дифференцирование и арифметические операции Теорема 1. Если функции f: X —> К, g : X -4- К дифференцируемы в точке х Е X, то а) их сумма дифференцируема в х, причем (f + ffY(x) = (f'+g')(x); Ь) их произведение дифференцируемо в х, причем (f • P)'(z) = f(x) g(x) 4- f(x) • g'(z); с) их отношение дифференцируемо в х, если д(х) 0, причем (/V/ х _ f'(x)g(x) - f(x)g'(x) \д/ д2(х) ◄ В доказательстве мы будем опираться на определение дифференцируе- мой функции и свойства символа о(-), установленные в гл. III, § 2, п. 4. а) (/ + 9)<х + Л) - (/ 4- д)(х) = (f(x 4- Л) 4- д(х 4- Л)) - - (№) 4- д(х\) = (f(x 4- h) - /(z)) 4- (д(х + h) - д(х)) = = (f'(x)h 4- о(Л)) 4- (У(х)h 4- о(Л)) = (/'(^) + У(я))Л + o(h) = = (/'+У)(^)Л + о(Л). Ь) (/ • д)(х 4- h) - (/ • д)(х) = f(x 4- h)g(x + h) - f(x)g(x) - = (/(*) + f'(x)h 4- о(Л))(д(лт) 4- g'(x)h 4- о(Л)) - f(x)g(x) = = (/'(z)g(z) 4- f(x)g'(x))h 4- o(h). с) Поскольку функция, дифференцируемая в некоторой точке х Е X, непрерывна в этой точке, то, учитывая, что д(х) 0, на основании свойств непрерывных функций можем гарантировать, что при достаточно малых 1^ При математической равносильности задачи отыскания дифференциала и задачи отыскания производной, все же производная и дифференциал — не одно и то же, и поэто- му, например, во французском математическом языке имеются два термина: derivation — «деривация», нахождение производной (скорости), и differentiation — «дифференцирование», нахождение дифференциала.
190 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ значениях h также д(х + Л) 0. В следующих выкладках предполагается, что h мало: — 4- h) - 9 J f(x 4- h) _ f(x) g(x 4- h) g(x) g(x)^ + h)(/(l + h}^X} - /{Х}Я(Х + Л)) = -27TV + °(1))((/(a0 + f'(x)h + o(h))g(x) — f(x)(g(x) + д'(x)h + o(h))) = 9 \x) / = (^) + °(1)) ((/'(*)$(*) - f(x)g'(x))h 4- o(h)) = f'(x)g(x) ~ f(x)g'(x) 92(x) h 4- Мы воспользовались тем, что в силу непрерывности функции д в точке х и того, что д(х) 0, г 1 = 1 л-Зо д(х)д(х 4- Л) д2(х) ’ т. е. 1 _ 1 . д(х)д(х + h) ~ д2(х) + ° где о(1) есть бесконечно малая при Л —> 0, х + h, € X. ► Следствие 1. Производная от линейной комбинации дифференцируе- мых функций равна линейной комбинации производных этих функций. ◄ Поскольку постоянная функция, очевидно, дифференцируема и ее про- изводная всюду равна нулю, то, считая в утверждении Ь) теоремы 1, что f = const — с, имеем (сд)'(х) = сд'(х). Используя теперь утверждение а) теоремы 1, можем записать (ci/ 4- с2д)'(х) = 4- (с2д)'(х) = Ctf'^x) 4- с2д'(х). С учетом доказанного, по индукции проверяем, что (ci/i 4-... 4- CnfnYfx) = 4-... 4- cn/i(z). ► Следствие 2. Если функции fi, ..., fn дифференцируемы в точке х, то (/1 • • • = /1 (х) f2(x)... fn(x) 4- /1 (х) f^x) .. fn(x) 4-... ◄ Для n = 1 утверждение очевидно. Если оно справедливо для некоторого п Е N, то в силу утверждения Ь)
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 191 теоремы 1 оно справедливо также для (n 4-1) 6 N. В силу принципа индукции заключаем о верности приведенной формулы для любого п Е N. ► Следствие 3. Из взаимосвязи производной и дифференциала следует, что теорема 1 может быть записана также через дифференциалы. Именно: a) 4- д') (z) = df(x) 4- dg(x)- b) d(f • g)(x) = g(x)df(x) 4- f(x)dg(x); x >(f\, \ 9(x)df(x) — f(x)dg(x) , x c) d( (z) = 7 , если g(x) ± 0. \gy 9 (z) ◄ Проверим, например, а). Действительно, + 9)(x)h = (/ 4- g)'(x)h = (/' 4- g')(x)h = = (/'(z) 4- g' (x))h = f'(x)h + g'(x)h = = df(x)h + dg(x)h = (df(x) 4- dg(x))h, и совпадение функций d(f 4- g)(x), df(x) 4- dg(x) проверено. ► Пример 1. Инвариантность определения скорости. Теперь мы в со- стоянии проверить, что вектор мгновенной скорости материальной точки, который был определен в п. 1 § 1, не зависит от выбора системы декартовых координат. Мы проверим это даже для любой из аффинных систем координат. Пусть (ж1, х2) и (ж1, х2) — координаты одной и той же точки плоскости в двух различных системах координат, связанных между собой соотношениями х1 = aJz1 4- а\х2 4- Ь1, (1) х2 = а^х1 4- а%х2 4- Ъ2. Поскольку любой вектор (в аффинном пространстве) определяется парой точек, а его координаты суть разности координат начала и конца вектора, то координаты одного и того же вектора в этих двух системах должны быть связаны соотношениями v1 — ajv1 4- a\v2, (2) -9 9 1 9 9 \ / = afv1 + a^v Если закон движения точки в одной системе задается функциями x1(t), x2(t), то в другой — функциями х1^), x2(t), связанными с первыми посред- ством соотношений (1). Дифференцируя соотношения (1) по времени t, по правилам дифференци- рования находим х1 = a^i1 4- alx2 . (3) х2 = a2xl 4- а2х2.
192 pi. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, координаты (v1, v2) = (i1,^2) вектора скорости в первой системе и координаты (v1, и2) = (ж1, а;2) вектора скорости во второй системе оказались связанными соотношениями (2), говорящими нам о том, что мы имеем дело с двумя различными записями одного и того же вектора. Пример 2. Пусть f(x) = tgx. Покажем, что f'(x) = всюду, где СО8Х 0, т. е. в области определения функции tgz = В примерах 1 и 2 из § 1 было показано, что sin'а: = cos a;, cos' х = — sin а:, поэтому из утверждения с) теоремы 1 получаем при cos х 0: tg'a; = sin \' / \ sin' х cos х — sin х cos' х / V®/ о cos / COS2 X cos x cos a; + sin a: sin x _ 1 cos2 x cos2 x Пример 3. ctg'a: = —при sin a; 0, т. e. в области определения cos a: sin x функции ctga; = ——. sin X Действительно, ctg' x = cos' a; sin a; — cos x sin' x sin2 x — sin x sin x — cos x cos x _ 1 • 2 — —” 2 * sin X sin X Пример 4. Если P(x) = co + c^x + ... + cnxn — полином, то = Ci + 2c2X + ... + ncna?n-1. Действительно, поскольку — 1, то по следствию 2 = na:”-1 dx dx P\x) = и теперь утверждение вытекает из следствия 1. 2. Дифференцирование композиции функций Теорема (теорема о дифференциале композиции функций). Если функ- ция f: X —> Y С К дифференцируема в точке х 6 X, а функция g : Y -4 К 'дифференцируема в точке у = f(x) 6 Y, то композиция g о f : X —> К этих функций дифференцируема в тдчке х, причем дифференциал d(g of)(x): ТЩа;) —> TR(^(/(a;))) композиции равен композиции dg(у) odf(x) дифферен- циалов df(x): TR(x) -> TR(y = /(г)), dg(y = /(х)): TRfo) -> TK(g(y)). ◄ Условия дифференцируемости функций f и g имеют вид f(x + /г) - /(а;) = /'(a;)/i + o(h") при h -4 0, х + h С X, 9(У+ t) ~ g(y) = 9'(y)t + o(t) при t -4 0, y + teY.
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 193 Заметим, что в последнем равенстве функцию o(t) можно считать опреде- ленной и при t = 0, а в представлении o(t) = 7(t)t, где 0 при t -> О, у + t 6 У, можно считать 7(0) 0. Полагая f(x) = у, f(x + h) = у + i, в силу дифференцируемости, а значит, и непрерывности функции f в точке х заключаем, что при h —> 0 также £ —> 0, и если х + h, € X, то у -I-1 € Y. По теореме о пределе композиции теперь имеем 7(/(ж + h) — f(x)) = a(h) —> 0 при h 0, х + h € X, и, таким образом, если t = f(x + h) — f(x), то o(t) = 7(/(я + M - №)) + ty- f(x)) = = a(h)(f'(x)h + 0(h)) = a(/i)/'(z)/i + a(h)o(h) = = o(/i) + o(h) = o(h) при Л —> 0, x + h 6 X. Далее, (g 0 + h) - (g о f)(x) = g(f(x + h)) - g(f(x)) = = g(y + t)- g(y) = g'(y)t + o(t) = = $'(№)) (№ + h) - /(z)) + o(f(x + h) - f(x)) = = 0'(/(z))(/'(z)^ + o(^)) + o(f(x + h) - /(z)) = = g'(J(x))(f'(x)h) + 9'(f(x))(o(h)) + o(/(z + h) - /(x)). Поскольку величину р'(/(х))(//(х)Л), очевидно, можно интерпретировать как значение dg(f(x))cdf(x)h композиции h d9^od^.x\ g,(f(x))-f,(x)h отоб- „ , df(x) .., . . dg(y) tt \ ражении h 1-----> f (x)h, r •---> 9 \У)т на смещении n, то для завершения доказательства теоремы остается заметить, что сумма 9'(fW) (o(h)) + o(/(z + h) - /(®)) есть величина бесконечно малая в сравнении с h при h 0, х + h е X, ибо, как мы уже установили, o(f(x + h) - /(х)) = o(h) при h —> 0, х + h е X. Итак, показано, что (9°f)(x + h) ~ (9°f)(x) = = д'(f(ж))• f(х)ь + °(^) при /i-4-о, ж + лех. ► Следствие 4. Производная (до/УСг) композиции дифференцируемых вещественнозначных функций равна произведению g,(f(x))'f,(x) производных этих функций, вычисленных в соответствующих точках.
194 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Большим искушением к короткому доказательству последнего утвержде- ния являются содержательные обозначения Лейбница для производной, в ко- торых, если z — z(y), а у = у (я), имеем dz _ dz dy dx dy dx' dz dy что представляется вполне естественным, если символ — или -f- рассматри- ау dx вать не как единый, а как отношение dz к dy или, соответственно, dy к dx. Возникающая в связи с этим идея доказательства состоит в том, чтобы рассмотреть разностное отношение Sz _ Sz Sy Sx Sy Sx и затем перейти к пределу при Sx —> 0. Трудность, которая тут появляется (и с которой нам тоже отчасти пришлось считаться!), состоит в том, что Sy может быть нулем, даже если Sx 0. Следствие 5. Если имеется композиция (fn ° . • • ° fi)(х) дифференци- руемых функций уг = Л (я), ..., уп = fn{yn-i), то -° /l)'(z) = fn(yn-l) fn-l(yn-2) . . • ◄ При n = 1 утверждение очевидно. Если оно справедливо для некоторого п Е N, то из теоремы 2 следует, что оно справедливо также для n +1, т. е. по принципу индукции установлено, что оно справедливо для любого п Е N. ► dxa _i Пример 5. Покажем, что при а Е К в области х > 0 имеем = аха х, dx т. е. dxa = axa~1dx, и (х + h)a — xQ = axQ~1h + o(h) при h —> 0. ◄ Запишем ха = ea,ni и применим доказанную теорему с учетом резуль- татов примеров 9и11из§1и пункта Ь) теоремы 1. Пусть д(у) = еу и у = f(x) = a In я. Тогда ха = (д о f)(x) и (у°Л'(я) =9>(у) • /'(я) =еу • - = еа1па: • - = ха • - =аяа-1. ► X XX i Пример 6. Производная от логарифма модуля дифференцируемой функ- ции часто называется логарифмической производной. Поскольку F(x) = 1п|/(я)| = (1по| | о/)(#), то в силу результата примера 11 из § 1 У(х) = (ln|/|)'(z) =
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 195 Таким образом, d(ln\f\)(x) = ^dx = ^. J\x) J Xх) Пример 7. Абсолютная и относительная погрешности значения диф- ференцируемой функции, вызванные погрешностями в задании аргумента. Если функция f дифференцируема в точке х, то f (х + h) - f(x) = f(x)h + a(x; h), где a(x; h) = o(h) при h, —> 0. Таким образом, если при вычислении значения f(x) функции аргумент х определен с абсолютной погрешностью h, то вызванная этой погрешностью абсолютная погрешность \f(x + h) — f(x)\ в значении функции при достаточно малых h может быть заменена модулем значения дифференциала \df(x)h\ = = \f(x) h\ на смещении h. Тогда относительная погрешность может быть вычислена как отношение 1Г(*)л| = !®1 lf(*)l 1Я*)1 или как модуль произведения f(x) |/i| логарифмической производной функции на величину абсолютной погрешности аргумента. Заметим, кстати, что если f(x) = In яг, то dlnx = и абсолютная погреш- ность в определении значения логарифма равна относительной погрешности в определении аргумента. Это обстоятельство прекрасно используется, напри- мер, в логарифмической линейке (и многих других приборах с неравномерным масштабом шкал). А именно, представим себе, что с каждой точкой числовой оси, лежащей правее нуля, мы связали ее координату у и записали ее над точ- кой, а под этой точкой записали число х = еу. Тогда у = Inz. Одна и та же числовая полуось оказалась наделенной одной равномерной шкалой у и одной неравномерной (ее называют логарифмической) шкалой х. Чтобы найти Inz, надо установить визир на числе х и прочитать наверху соответствующее чи- сло у. Поскольку точность установки визира на какую-то точку не зависит от числа х или у, ей отвечающего, и измеряется некоторой величиной Ду (длиной отрезка возможного уклонения) в равномерной шкале, то при определении по числу х его логарифма у мы будем иметь примерно одну и ту же абсолют- ную погрешность, а при определении числа по его логарифму будем иметь примерно одинаковую относительную погрешность во всех частях шкалы. Пример 8. Продифференцируем функцию u(x)v^x\ где и(х) и v(x) — дифференцируемые функции и и(х) > 0. Запишем u(x)v^ = ev(a:)lntl(a:) и вос- пользуемся следствием 5. Тогда ^ev(x)lnu(x) dx = е”**’«<*> (v'(x) In и(х) + v(x) \ и(Х) = u(x)V(X) • i/(z) In и(х) 4- v(x)u(x)v^ 1 • и(х).
196 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 3. Дифференцирование обратной функции Теорема 2 (теорема о производной обратной функции). Пусть функ- ции f : X —> У, /-1 : Y —»• X взаимно обратны и непрерывны в точках xqE X и f(xo) = Уо € У соответственно. Если функция f дифференцируема в точке хо и /'(хо) / 0, то функция /-1 также дифференцируема в точке уо, причем (/-*)'(»<>) = ◄ Поскольку функции /: X —> У, /-1: У —> X взаимно обратны, то вели- чины /(z) — f(xo), f~r(y) — при у = f(x) не обращаются в нуль, если х хо. Из непрерывности f в хо и /-1 в уо можно, кроме того, заключить, что (X Э х хо) <=> (У Э j/ -> уо). Используя теперь теорему о пределе композиции функций и арифметические свойства предела, находим цю ГЧу)-ГЧуо) = lim = КЭу-»уо У ~Уо ХЭх->х0 f(x) - f(x0) ХЭх-^х0 ff(x)_-_f^o)\ /'(Zo) \ X — Xo J Таким образом, показано, что в точке уо функция /-1 : У -> X имеет производную и (Г^оН/Ъ))"1- ► Замечание 1. Если бы нам заранее было известно, что функция /-1 дифференцируема в точке уо, то из тождества (/-1 о f)(x) = х по теоре- ме о дифференцировании композиции функций мы сразу же нашли бы, что (/-‘)'(»о) f'(x0) = 1. Замечание 2. Условие f'(xo) 0, очевидно, равносильно тому, что отображение h /'(а:о)Л, осуществляемое дифференциалом df(xo): ТК(аго) —> —> ТЩуо), имеет обратное отображение [d/(zo)]-1: ТЩуо) —> ТЩхо), зада- ваемое формулой Т (/'(хо))~1т. Значит, в терминах дифференциалов вторую фразу формулировки теоре- мы 3 можно было бы записать следующим образом: Если функция f дифференцируема в точке хо и в этой точке ее диффе- ренциал df(xo): TK(zo) —> TK(j/o) обратим, то дифференциал функции /-1, обратной к f, существует в точке уо = /(^о) и является отображением ЛГЧуо) = [<//(хо)1-1 ТЩуо) -> TR(x0), обратным к отображению df(xo): TR(a:o) —>
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 197 Пр и мер 9. Покажем, что arcsin'y = . 1... = при |у| < 1. Функции v1 -у2 sin : [—тг/2,7г/2] —> [—1,1] и arcsin : [—1,1] -> [—7г/2,7г/2] взаимно обратны и непрерывны (см. гл. IV, § 2, пример 8), причем sin'а; = cos а; 0, если |ат| < 7г/2. При |ат| < 7г/2 для значений у = sin х имеем |у| < 1. Таким образом, по теореме 3 .,11 1 arcsin у = —— —-= - .. = sm х cos ж yi _ Sin2 х 1 V1 "У2 Знак перед радикалом выбран с учетом того, что cos а; > 0 при |ат| < тг/2. Пример 10. Рассуждая, как и в предыдущем примере, можно показать (с учетом примера 9 из § 2 гл. IV), что arccos'y =---= при |у| < 1. у/^-У Действительно, ,11 1 1 arccos у =----------—--------=-----===== =-------7- • =. cos' х sin а; VI - cos2 х у/1-у2 у е R. Знак перед радикалом выбран с учетом того, что sin х > 0, если 0 < х Пример 11. arctg'y = —г, 1 + у Действительно, . , 1 1 у = = 7ZE? \ COS2 Xt 7Г. 2 1 1 = cos X = ---------=— = --------. 1 + tg2 X 1 + у2 Пример 12. arcctg'j/ = Действительно, + , 1 1 arcctg у = —— = -----------—- ctg х ( 1 \ sin2 х 2 1 1 = - sinz X = ---------—у— = ------------. 1 + ctg2 X 1 + у2 Пример 13. Мы уже знаем (см. примеры 10, 12 из § 1), что функции у = /(а;) = ах и х = /-1(з/) = logaa; имеют производные /'(а;) = a1 In а и Проверим, как это согласуется с теоремой 3: = f'(x) = аЧпа = у\па’ f'(x) = ----7— = -------г- = win а = ах In а. (Г1) W (_1_'I \ylna /
198 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 14. Гиперболические, обратные гиперболические функции и их производные. Функции shx = |(ех - е-1), ch а: — | (е® + е~х) называются соответственно гиперболическим синусом и гиперболическим ко синусом1) от х. Эти в данный момент вводимые нами чисто формально функции, как вы- яснится, во многих вопросах появляются так же естественно, как появляются круговые функции sin я, cos я. Заметим, что sh(—х) — — shz, ch(—х) — ch я, т. е. гиперболический синус — нечетная функция, а гиперболический косинус — функция четная. Кроме того, очевидно следующее основное тож- дество: ch2 х — sh2 х = 1. Графики функций ?/ = shzH?/ = chx изображе- ны на рис. 19. Из определения функции shz и свойств функ- ции ех следует, что shz — непрерывная строго возрастающая функция, отображающая взаимно однозначно К на R. Обрат- ная функция к shz, таким образом, существует, определена на R, непрерывна и строго монотонно возрастает. Ее обозначают символом arshy (читается «ареа-синус2) от у»). Эту функцию легко выразить через уже из- вестные. Решая уравнение 1 (е‘ - е-) = у относительно х, найдем последовательно ех = у + \/1 4- j/2 (ех >0, поэтому ех 0 у — \/1 + у2) и я = ln(y + \/1 -I- у2). От лат. sinus hyperbolici, cosinus hyperbolici. 2) Полное название — area sinus hyperbolici (лет.); почему здесь используется термин «площадь» (area), а не «дуга» (arcus), как в круговых функциях, выяснится несколько позже.
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 199 Итак, arshy — 1п(у 4- \/1 4- У2), у € R. Аналогично, используя монотонность функции у — ch х на участках R_ = = {а: € R | а: 0}, = {а: 6 R | х 0}, можно построить функции arch_ у и arch+ у, определенные для у 1 и обратные к ограничению функции ch а: на и 1&+ соответственно. Они задаются формулами arch- у = In (у - \/у2 - 1), arch+ у = In (у 4- \/у2 - 1). Из приведенных определений находим sh' х = | (ех 4- е~х) — ch а:, ch' х — | (е1 — е-1) = sha:, Л! а на основе теоремы о производной обратной функции получаем v, 1 1 1 1 arsh у — - — —— = -.= = —=====, sh a: ch а: \/1 4- sh2 х \/1 4- у2 1 1 1 1 . arch_ у — —---;..— -, у > 1, ch a: sha: _у/ch2а: — 1 ^/у2 — 1 1 1 1 1 arch. у — -—г— — -— = —======= = ... _, у > 1. ch a: sha: ch2 д. _ j ^/j/2 — 1 Последние три соотношения можно проверить, используя явные выражения для обратных гиперболических функций arsh у и arch у. Например, arsh'у = —Г~/| ж " 2 (* + 5 (* + w2) 1/2 •2») = У 4- V14- У2 4 z 7 _ 1______У1 4- у2 4- 3/ _ 1 У 4- \/1 4-у2 \/1 4- у2 \/1 4-у2 Подобно tg х и ctg х можно рассмотреть функции ,, sha: ch а: th х = —— и cth х = ——, ch a: sh а: называемые гиперболическим тангенсом и гиперболическим котангенсом со- ответственно, а также обратные им функции ареа-тангенс: arthj/ = |1пу^, |1/| < 1,
200 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ и ареа-котангенс-. arcthj/ = |2/| >1. Решения элементарных уравнений, приводящие к этим формулам, мы опус- каем. По правилам дифференцирования имеем , sh' х ch х — sh х ch' x ch x ch x — sh x sh x _ 1 th X — о — о 12’ ch x ch a: ch x i ch' x sh x — ch x sh' x sh x sh x — ch x ch x 1 cth x =---------------------------------j---= —To— • sh x sh x sh x По теореме о производной обратной функции arth' х — —7— — —7—г- = ch2 х =--------тз- = 9 > |у| < 1, th a: f 1 A 1-th2 х 1 - У2 \ ch2 х / arcth' х = - —г- — — sh2 х = cth' х /____1\ \ sh2x/ = —тН------7 = “Лт> 1»1 > !• cth х - 1 у2 - 1 Две последние формулы можно проверить и непосредственным дифференци- рованием явных формул для функций arthу и arcthj/. 4. Таблица производных основных элементарных функций. Вы- пишем теперь (см. табл. 1) производные основных элементарных функций, подсчитанные в § 1 и 2 . 5. Дифференцирование простейшей неявно заданной функции. Пусть у — y(t) и х — x(t} — дифференцируемые функции, определенные в окрестности U(to) точки to € R. Предположим, что функция х — x(t) име- ет обратную функцию t — t(x), определенную в окрестности V(a?o) точки Xq = x(to). Тогда величину у = y(t), зависящую от t, можно рассматривать также как функцию, неявно зависящую от х, поскольку y(t) = y(t(x)). Най- дем производную этой функции по а? в точке xq, предполагая, что х1 (to) / 0. Используя теорему о дифференцировании композиции и теорему о дифферен- цировании обратной функции, получаем Ух |х_Хо dx dy(t) t=to dt(x) dx X—Xq dy(t) <^t t=t0 y't(M (Здесь использовано стандартное обозначение f(x)|х=х := /(^о)-)
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 201 Таблица 1 Функция f(x) Производная f'(x) Ограничения на область изменения аргумента х Е R 1. С (const) 2. ха 3. ах 4. loga |х| 5. sinx 6. cos X 7. tgx 8. ctgж 9. arcsin x 10. arccosz 11. arctgrr 12. arcctgx 13. shz 14. ch x 15. thrr 16. etho; 17. arshz = In (ж + \/l + x2) 18. arch я = In (ж ± \/x2 — 1) 19. arthx - 2 1 — x 20. arcth x = In д } 2 x - 1 0 az*-1 ax Ina 1 xlna cost — sinrr 1 COS2T 1 sin2 x 1 VI -x2 1 Vl — X2 1 1 + X2 1 1 4- x2 chx shrr 1 ch2 x 1 sh2 x 1 x/1 + x2 \/x2 — 1 1 1 — X2 1 1 — X2 х > 0 при a € R х € R при а € N х € R (а > 0, а / 1) х € R \ 0 (а > 0, а / 1) х / + irk, к GZ А х / лЛ, к € Z М<1 1*1 <1 г / 0 1*1 >1 1*1 < 1 1*1 > 1 Если одна и та же величина рассматривается как функция различных ар- гументов, то во избежание недоразумений при дифференцировании явно ука- зывают переменную, по которой это дифференцирование проводится, что мы и сделали.
202 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 15. Закон сложения скоростей. Движение точки вдоль пря- мой вполне определяется, если в каждый момент t выбранной нами системы отсчета времени мы знаем координату х точки в выбранной системе коорди- нат (числовой оси). Таким образом, пара чисел (x,t) определяет положение точки в пространстве и во времени. Закон движения точки запишется в виде некоторой функции х = x(t). Предположим, что движение этой же точки мы хотим описать в терминах другой системы координат (x,t). К примеру, новая числовая ось движется равномерно со скоростью — v относительно первой (вектор скорости в данном случае можно отождествить с задающим его одним числом). Будем для про- стоты считать, что координаты (0,0) и в той и в другой системе относятся к одной и той же точке или, точнее, что в момент t — 0 точка х = 0 совпадала с точкой х = 0, в которой часы показывали t = 0. Тогда один из возможных вариантов связи координат {x,t\ опи- сывающих движение одной и той же точки, наблюдаемое из разных систем координат, доставляют классические преобразования Галилея х = х 4- vt, t- t. Рассмотрим несколько более общую линейную связь х = ах 4- /3t, t = ух 4- 6t, (4) (5) разумеется, в предположении, что эта связь обратима, т. е. определитель ма- /а трицы ( \ ) отличен от нуля. \7 д / Пусть х — x(t) и х = x(t) — закон движения наблюдаемой точки, записан- ный в этих системах координат. Зная зависимость х = x(t), из формул (5) найдем i(t) = ax(t) 4- /ft, = 7z(£) 4- 6t, а в силу обратимости преобразований (5), записав х = ах 4- 3i, (7) t = ух 4- 6t, . зная х = x(i), можно найти x(t) = ax(t) 4- fit, t(t) = yx(t) 4- 6t. (8) Из соотношений (6) и (8) видно, что для данной точки существуют взаимно обратные зависимости i = t(t) и t — t(t).
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 203 Рассмотрим теперь вопрос о связи скоростей V(t) = ^ = it(t) И V(t) = ^ = *<(«) at at нашей точки, вычисленных в системах координат (х, t) и (i, t) соответственно. Используя правило дифференцирования неявной функции и формулы (6), имеем di dt + х dt 7 dt или V(t) = + 0 /д\ 7V(i)+<S’ W где t и t — координаты одного и того же момента времени в системах (x,t) и (x,i). Это всегда имеется в виду при сокращенной записи (Ю) формулы (9). В случае преобразований (4) Галилея из (10) получаем классический закон сложения скоростей V = V + v. (11) Экспериментально с достаточной степенью точности установлено (и это стало одним из постулатов специальной теории относительности), что в ва- кууме свет всегда распространяется с определенной скоростью с, не зависящей от состояния движения излучающего тела. Это означает, что если в момент t = t = 0 в точке х = х = 0 происходит вспышка, то через время t в систе- ме (x,t) свет достигнет точек с координатами х такими, что х2 = (ct)2, а в системе (x,t) этому событию будут отвечать время t и координаты х точек такие, что опять х2 = (с£)2. Таким образом, если х2 — c?t2 = 0, то и х2 — с2£2 = 0, и обратно. В силу некоторых дополнительных физических соображений следует считать, что вообще х2-c2t2 =х2-c2t\ (12) если (x,t) и (i,t) отвечают одному и тому же событию в различных систе- мах координат, связанных соотношением (5). Условия (12) дают следующие соотношения на коэффициенты а, /3, 7, 6 преобразования (5): 2 2 2 1 а — с 7 = 1, а/3 — с2уб = 0, £2 _ с262 = _с2 (13)
204 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если бы было с = 1, то вместо (13) мы имели бы а2 - 72 = 1, f = * (14) /З2 - <52 = -1, откуда легко следует, что общее (с точностью до перемен знака в парах (а, /3), (7,^)) решение Системы (14) может быть дано в виде а = ch 7 — sh /3 — ship, 6 — chip, где <р — некоторый параметр. Тогда общее решение системы (13) имеет вид ch 9? с ship sh <р ch ip и преобразования (5) конкретизируются: х — ch ip х 4- csh<£> t, t = - sh 92 x 4- ch 9? t, c Это — преобразования Лоренца. Чтобы уяснить себе, каким образом определяется свободный параметр 99, вспомним, что ось х движется со скоростью —V относительно оси х, т. е. точка х = 0 этой оси, наблюдаемая из системы (x,t), имеет скорость — v. Полагая в (15) х = 0, находим ее закон движения в системе (x,t): х = —cthip t. Таким образом, th 9? = —. (16) с Сопоставляя общий закон (10) преобразования скоростей с преобразованиями Лоренца (15), получаем ch ip V 4- с sh ip — 5 - sh ip V 4- ch ip или, с учетом (16), Формула (17) есть релятивистский закон сложения скоростей, который при |vV\ с2, т. е. при с —> оо, переходит в классический, выраженный форму- лой (11).
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 205 Сами преобразования Лоренца (15) с учетом соотношения (16) можно за- писать в следующей более естественной форме: (18) откуда видно, что при |v| с, т. е. при с —> оо, они превращаются в класси- ческие преобразования Галилея (4). 6. Производные высших порядков. Если функция f: Е R диффе- ренцируема в любой точке х € Е, то на множестве Е возникает новая функция f: Е —> JR, значение которой в точке х G Е равно производной f'(x) функции f в этой точке. Функция f : Е —> R сама может иметь производную (J1)’ : Е —> 1R на Е, которая по отношению к исходной функции f называется второй производной от f и обозначается одним из символов а если хотят явно указать переменную дифференцирования, то в первом слу- чае еще, например, пишут /'^(ж). Определение. По индукции, если определена производная f (п~1)(ж) по- рядка п — 1 от /, то производная порядка п определяется формулой /(П)И = (/<-1))'W. Для производной порядка п приняты обозначения Условились считать, что f(°\x) := f(x). Множество всех функций f: Е —> R, имеющих на Е непрерывные произ- водные до порядка п включительно, будем обозначать символом С<-п\Е, R), а когда это не ведет к недоразумению — более простыми символами (Е) или Сп(Е, R) и Сп(Е) соответственно. В частности, (Е) = С(Е) в силу принятого соглашения, что (ж) = = /(*)• Рассмотрим несколько примеров вычисления производных высших по- рядков.
206 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Примеры. /(*) /'(*) /пк) f^(x) 16. ах ах Ina a1 In2 a ах lnna 17. ех ех ех ех 18. sin а: COSX — sin х sin (я: 4- П7г/2) 19. COSX — sin а: — COS X cos (я: 4- птг/2) 20. (14-х)“ а(1 4- я:)"-1 а(а — 1)(1 4- х)а~2 ... а(а — 1)... (а — п 4-1) х 21. ха аха~1 а(а — 1) ха~2 х(14-я:)“~п а(а — 1)... (а — п 4- 1)х 22. loga k 1 т2-*-1 Ina -1 -2 , я та х ха~п (-!)"-!(»-1)! г-п Ina 23. In |гс| X-1 (—1)п-1(п — 1)!я?-п Пример 24. Формула Лейбница. Пусть и(х) и и(ят) — функции, имеющие на общем множестве Е производные до порядка п включительно. Тогда для n-й производной от их произведения справедлива следующая формула Лейб- ница: (uv)<n> = 52 (19) m=0 Формула Лейбница очень похожа на формулу бинома Ньютона и на самом деле с нею непосредственно связана. ◄ При п = 1 формула (19) совпадает с уже установленным правилом диф- ференцирования произведения. Если функции и, v имеют производные до порядка п 4-1 включительно, то, в предположении справедливости формулы (19) для порядка п, после диффе- ренцирования ее левой и правой частей получаем (uv)(n+1) = Cmu(n-m+l)v(m) + Сти(п-т)у(т+1) = т=0 т—0 = и("+%(0) + ^(Ci 4- С^_1)и((п+1)-л)1;(А:) 4- u(0)v(n+1) = л=1 n+l = V . Z Tl-Tl Jfc=0 Мы объединили слагаемые, содержащие одинаковые произведения произ- водных от функций u, v, и воспользовались тем, что С* 4- С*-1 = С*+1. Таким образом, по индукции установлена справедливость формулы Лейб- ница. ►
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 207 Пример 25. Если Рп (я) == со + Ci ж 4-... +с„2;п, то Рп(0) — Со, Рп(х) = Ci 4- 2с2х 4-... 4- пспхп~х и P^(0)=Ci, Р"(я) = 2с2 4-3 • 2с3Ё 4-•.. 4-n(n - l)cniEn~2 и Р"(0) = 2!с2, Р^(х) = 3 • 2с3 4-... 4-n(n - 1)(п — 2)спхп~3 и Р^3)(0) = З!с3, Р<п\х) = п(п- 1)(п — 2)... 2сп и Р^п)(0) = п!сп, Р^*) (ж) = 0 при к > п. Таким образом, полином Рп(х) можно записать в виде Р„(х) = Р^(0) + 1 Р^>(0) х + 1 Р«(0) х2 + ... + 1 Р^">(0) хп. Пример 26. Используя формулу Лейбница и то обстоятельство, что производные от полинома, имеющие порядок выше его степени, тождественно равны нулю, можно найти n-ю производную функции f(x) — х2 sin х: (х) = sin<n> х • х2 4- С„ sn?” х • 2х 4- (72 sin<n 2) х • 2 = о . ( 7Г = х smlz 4- п — \ Ju п(п — 1) sin la: 2 — п(п — 1)) sin (х 4- п Пр имер 27. Пусть/(а:) = arctgа:. Найдем значения/(п)(0) (п = 1,2,...). Поскольку f(x) — .„ , то (1 4- х2) f'(x) = 1. 1 + х Применяя формулу Лейбница к последнему равенству, находим рекуррент- ную формулу (1 + z2)/(n+1!|>) + 2nxf(n\x) + п(п - = О, из которой можно последовательно найти все производные функции /(а:). Полагая х = 0, получаем /<»+Ч(0) = -п(п - При n = 1 имеем /(2\0) = 0, поэтому вообще /^2п^(0) = 0. Для произвол- ных нечетного порядка имеем /(2m+i)(0) = -2т{2т -
208 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ и, поскольку /'(0) = 1, получаем Пример 28. Ускорение. Если х = x(t) — зависимость от времени коор- v и u dx(t'} . Z.\ динаты движущейся вдоль числовой оси материальной точки, то —= x(t) dx(t) d2x(t) ..,,ч есть скорость точки, а тогда - = , 2' = x(t) есть ее ускорение в мо- UL dv мент t. Если x(t) = at + 0, то x(t) = a, a x(t) = 0, т. е. ускорение в равномерном движении равно нулю. Вскоре мы проверим, что если вторая производная функции равна нулю, то сама функция имеет вид at + 0. Таким образом, в равномерных движениях и только в них ускорение равно нулю. Но в том случае, если мы желаем, чтобы наблюдаемое из двух систем коор- динат движущееся по инерции в пустом пространстве тело в обеих системах двигалось равномерно и прямолинейно, нужно, чтобы формулы перехода из одной инерциальной системы в другую были линейными. Именно по этой причине в примере 15 были выбраны линейные формулы (5) преобразования координат. Пример 29. Вторая производная простейшей неявно заданной функ- ции. Пусть у = y(t) и х = x(t) — дважды дифференцируемые функции. Пред- положим, что функция х = x(t) имеет дифференцируемую обратную функ- цию t = t(x), тогда величину y(t) можно считать зависящей неявно от х, ибо у = y(t) = y(t(xy). Найдем вторую производную у”х в предположении, что s'(t)/0. По правилу дифференцирования такой функции, рассмотренному в пунк- те 5, имеем у' =«L I xt поэтому у" У XX \ / И I ! И yt\ Vttxt ~Vtxtt , = x'Jt = (x'ty = xjy^ - хЪу{ x't x't x’t (xtf Заметим, что явные выражения всех участвующих здесь функций, в том числе и ухх, зависят от t, но они дают возможность получить значение у конкретной точке х после подстановки щего заданному значению х. Например, если у = е*, х = Ini, то = — =tel у" = Ух х[ 1/t ’ Ухх XX В вместо t значения t = t(x), отвечаю- Mt _ е4+te4 _ t = ~l/T ~t(t + 1}е • Мы специально взяли простой пример, в котором можно явно выразить t через ж, t = ех, и, подставив t = ех в y(t) — е1, найти явную зависимость
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 209 у = ее* от х. Дифференцируя последнюю функцию, можно проверить пра- вильность полученных выше результатов. Ясно, что так можно искать производные любого порядка, последователь- но применяя формулу Задачи и упражнения 1. Пусть ао, ai, ..., ап — заданные вещественные числа. Укажите многочлен Рп{х) степени п, который в фиксированной точке хо 6 R имеет производные Рпк\хо) = о*;, к = 0,1, ..., п. 2. Вычислите f'(x), если a) f(x) = < при х / 0, при х — 0; ( х2 sin - b) f(x) = < х 0 при х / 0, при х = 0. с) Проверьте, что функция из задачи а) бесконечно дифференцируема на R, причем = 0. d) Покажите, что производная функции из задачи Ь) определена на R, но не является непрерывной функцией на R. е) Покажите, что функция ех₽(-(гЬ)5- о при — 1 < х < 1, при 1 |ж| бесконечно дифференцируема на R. 3. Пусть / 6 C^°°\R). Покажите, что при х / 0 1 /(«) (2Д = (тп~х f( 1ЛА хп+! * \х) ' ' dxn\ J\x))' 4. Пусть f — дифференцируемая на R функция. Покажите, что: а) Если f — четная, то /' — нечетная функция. Ь) Если f — нечетная, то f — четная функция. с) {f нечетна) <=> (/ четна). 5. Покажите, что: а) Функция f{x) дифференцируема в точке хо в том и только в том случае, когда f{x) — f{xo) = <р{х){х — хо), где у>(х) — функция, непрерывная в хо (ив таком случае ^(жо) = /'(хо)). Ь) Если f{x)-f{xQ) = tp{x){x-xo) и ip € C^n~x}{U{xo)), где U{хо) — окрестность точки хо, то функция f{x) имеет в точке хо производную f^n\xo) порядка п.
210 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 6. Приведите пример, показывающий, что в теореме 3 условие непрерывности У"1 в точке у о не является излишним. 7. а) Два тела с массами тгц и тщ соответственно перемещаются в простран- стве только под действием сил взаимного притяжения. Используя законы Ньютона (формулы (1) и (2) из § 1), проверьте, что величина 2,1 2\ . ( п miVx + -7712^2 ) 4- ( - G & / \ 77117712 Т где ui и иг — скорости тел, аг — расстояние между ними, не меняется при таком движении. Ь) Дайте физическую интерпретацию величины Е = К + U и ее составляющих. с) Распространите результат на случай движения п тел. § 3. Основные теоремы дифференциального исчисления 1. Лемма Ферма и теорема Ролля Определение 1. Точка xq G Е С Ж называется точкой локального максимума (минимума), а значение функции в ней — локальным максимумом (минимумом) функции /: Е —> Ж, если существует окрестность Ue(xq) точки xq в множестве Е такая, что в любой точке х G Ue(xq) имеем f(x) f(xo) (соответственно, f(x) f(xo)). Определение 2. Если в любой точке х G Ue(xq)\xq = Ue(xq) имеет место строгое неравенство f(x) < f(xo) (f(x) > /(xq)), to точка xq € E называется точкой строгого локального максимума (минимума), а значение Рис. 20 функции в ней — строгим локальным максимумом (минимумом) функции f: Е -> R. Определение 3. Точки локального максиму- ма и минимума называются точками локального экс- тремума, а значения функции в них — локальными экстремумами функции. Пример 1. Пусть если — 1 х < 2, если 2 < х (рис. 20). Для этой функции: х = — 1 — точка строгого локального максимума; х = 0 — точка строгого локального минимума; х = 2 — точка локального максимума; х > 2 — точки экстремума, являющиеся одновременно точками и локаль- ного максимума, и локального минимума, поскольку здесь функция локально постоянна.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 211 Пример 2. Пусть f(x) = sin - на множестве Е = R \ 0. X /7Г \-1 Точки х = ( — + 2&7Г I , к € Z, являются точками строгого локального \ л» J / J,- \ ~1 максимума, а точки х = I — —+2&тг1 , к € Z, — точками строгого локального минимума для f(x) (см. рис. 12). Определение 4. Точку хо € Е экстремума функции f: Е —> R бу- дем называть точкой внутреннего экстремума, если xq является предельной точкой как для множества Е_ = {ж € /?|х < хо}, так и для множества Е+ = {х € Е |х > хо). В примере 2 все точки экстремума являются точками внутреннего экс- тремума, а в примере 1 точка х = —1 не является точкой внутреннего экстре- мума. Лемма 1 (Ферма). Если функция f: Е —> R дифференцируема в точке внутреннего экстремума xq € Е, то ее производная в этой точке равна нулю: f'(xo) = 0. ◄ По определению дифференцируемости функции в точке хо /(х0 + h) - /(х0) = f'(x0)h + а(х0; h)h, где а(хо; h) -> 0 при h 0, х0 + h € Е. Перепишем это соотношение в виде f(x0 + h) — f(x0) = [/'(хо) + а(х0; h)] h. (1) Поскольку хо — точка экстремума, то левая часть равенства (1) либо нео- трицательна, либо неположительна одновременно для всех достаточно близ- ких к нулю значений h таких, что х0 + h € Е. Если бы было /'(хо) 0, то при h достаточно близких к нулю величина /'(жо) + а(хо;Л) имела бы тот же знак, что и /'(хо), ибо a(xo;h) —> 0 при h —0, Хо 4- h G Е. Что же касается самого значения h, то оно может быть как положитель- ным, так и отрицательным, коль скоро хо — точка внутреннего экстремума. Таким образом, предположив, что /'(хо) / 0, мы получаем, что правая часть (1) меняет знак при изменении знака h (если h достаточно близко к ну- лю), в то время как левая часть (1) не может менять знака (если h достаточно близко к нулю). Это противоречие завершает доказательство. ► Замечания к лемме Ферма. 1 ° Лемма Ферма дает, таким образом, необходимое условие внутреннего экстремума дифференцируемой функции. Для невнутренних экстремумов (как точка х = — 1 в примере 1) утверждение о том, что /'(хо) = 0» вообще говоря, неверно. 2° Геометрически лемма вполне очевидна, ибо она утверждает, что в точке экстремума дифференцируемой функции касательная к ее графику горизон- тальна (ведь /'(^о) есть тангенс угла наклона касательной к оси Ох). 8 Зорич В. А.
212 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 3° Физически лемма означает, что при движении по прямой в момент на- чала возврата (экстремум!) скорость равна нулю. Из доказанной леммы и теоремы о максимуме (минимуме) функции, не- прерывной на отрезке, вытекает следующее Утверждение 1 (теорема Ролля1)). Если функция f: [а, 6] —> Ж непре- рывна на отрезке [а, 6], дифференцируема в интервале ]а, и f(a) = f(b), то найдется точка £ € ]а, 6[ такая, что У'(£) = 0. ◄ Поскольку функция f непрерывна на отрезке [а, 6], то найдутся точ- ки хт,хм € [а, 6], в которых она принимает соответственно минимальное и максимальное из своих значений на этом отрезке. Если f(xm) = /(яд/), то функция постоянна на [а, Ь], и поскольку в этом случае f'(x) = 0, то утвержде- ние, очевидно, выполнено. Если же f(xm) < /(хм), то, поскольку /(а) = /(6), одна из точек хт, хм обязана лежать в интервале ]а, Ь[. Ее мы и обозначим через £. По лемме Ферма /'(£) = 0. ► 2. Теоремы Лагранжа и Коши о конечном приращении. Следую- щее утверждение является одним из наиболее часто используемых и важных средств исследования числовых функций. Теорема 1 (теорема Лагранжа о конечном приращении). Если функция У: [а, Ь] -> R непрерывна, на отрезке [а, 6] и дифференцируема в интервале ]а, Ь[, то найдется точка ^]а, такая, что f(b)-f(a) = f'(()(b-a). (2) ◄ Для доказательства рассмотрим вспомогательную функцию F(x) = /(я) - f ® f (a} (х - а), о — а которая, очевидно, непрерывна на отрезке [а, &], дифференцируема в интервале ]а,6[ и на его концах принимает равные значе- ния: F(a) = F(b) = У (а). Применяя к F(x) теорему Ролля, найдем точку £ € ]а, Ь[, в которой F’(C) = f'(0- /(о) = о. ► о — а Замечания к теореме Лагранжа. 1° Геометрически теорема Лагранжа означает (рис. 21), что в некоторой точке (£, У(£)), где £ € ]а, Ь[, Х)М. Ролль (1652 — 1719) — французский математик.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 213 касательная к графику функции будет параллельна хорде, соединяющей точ- ки (а,/(а)), (b,/(b)), ибо угловой коэффициент последней равен 2° Если х интерпретировать как время, a f(b) — /(а) — как величину пе- ремещения за время b — а частицы, движущейся вдоль прямой, то теорема Лагранжа означает, что скорость f'(x) частицы в некоторый момент £ G ]а, Ь[ такова, что если бы в течение всего промежутка времени [а, Ь] частица двига- лась с постоянной скоростью /'(£), т0 она сместилась бы на ту же величину /(b) — /(а). Величину /'(£) естественно считать средней скоростью движения в промежутке [а, Ь]. 3° Отметим, однако, что при движении не по прямой средней скорости в смысле замечания 2° может не быть. Действительно, пусть, например, части- ца движется по окружности единичного радиуса с постоянной угловой скоро- стью ш = 1. Закон ее движения, как мы знаем, можно записать в виде r(t) = (cos t, sin t). Тогда r(t) = v(t) = (—sin t, cost) и |v| = \/sin21 + cos21 = 1. В моменты t = 0 и t = 2тг частица находится в одной и той же точке плоскости г(0) = г(2тг) = (1,0), и равенство г(2тг) — г(0) = v(£) (2тг — 0) означало бы, что v(£) =0, но это невозможно. Однако мы сознаем, что зависимость между перемещением за некоторый промежуток времени и скоростью движения все же имеется. Она состоит в том, что даже вся длина L пройденного пути не может превышать мак- симальной по величине скорости, умноженной на время в пути. Сказанное можно записать в следующей более точной форме: (3) |г(Ь) - г(а)| sup |r(t)| |b - а|. tG]a,b[ Как будет в свое время показано, это естественное неравенство действи- тельно всегда справедливо. Его тоже называют теоремой Лагранжа о конеч- ном приращении, а формулу (2), справедливую только для числовых функций, часто называют теоремой Лагранжа о среднем значении (роль среднего в дан- ном случае играет как величина /'(£) скорости, так и точка £, лежащая между а и Ь). 4° Теорема Лагранжа важна тем, что она связывает приращение функции на конечном отрезке с производной функции на этом отрезке. До сих пор мы не имели такой теоремы о конечном приращении и характеризовали только локальное (бесконечно малое) приращение функции через производную или дифференциал в фиксированной точке. я*
214 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Следствия теоремы Лагранжа Следствие 1 (признак монотонности функции). Если в любой точке некоторого интервала производная функции неотрицательна {положитель- на) , то функция не убывает {возрастает) на этом интервале. ◄ Действительно, если xi, х2 — две точки нашего интервала и Xi < х2, т. е. х2 — xi > 0, то по формуле (2) №2) - №1) =/'($)(я2-Z1), где Х!<^<х2, и, таким образом, знак разности, стоящей в левой части равенства, совпадает со знаком /'(£). ► Разумеется, аналогичное утверждение можно высказать о невозрастании (убывании) функции с неположительной (отрицательной) производной. Замечание. На основании теоремы об обратной функции и следствия 1, в частности, можно заключить, что если на каком-то промежутке I число- вая функция f{x) имеет положительную или отрицательную производную, то функция f непрерывна на I, монотонна на I, имеет обратную функцию /-1, определенную на промежутке I' = f{I) и дифференцируемую на нем. Следствие 2 (критерий постоянства функции). Непрерывная на от- резке [а, 6] функция постоянна на нем тогда и только тогда, когда ее про- изводная равна нулю в любой точке отрезка [а, 6] {или хотя бы интервала ]а,6[). ◄ Интерес представляет только доказательство того факта, что если /'(ж) = 0 на ]а, Ь[, то для любых х\,х2 € [а, 6] имеет место равенство f{xi) = = f{x2). Но это вытекает из теоремы Лагранжа, по которой f{x2) - f{xi) = /'(£) {х2 - а?1) = О, ибо £ лежит между xi и х2, т. е. £ 6 ]а, &[ и /'(£) = 0. ► Замечание. Отсюда, очевидно, можно сделать следующий (как мы уви- дим, очень важный для интегрального исчисления) вывод: если производные F[{x), F£{x) двух функций Fi{х), F2{x) совпадают на некотором промежут- ке, т. е. F[{x) = F^{x), то на этом промежутке разность Fi{x) —F2{x) есть постоянная функция. Полезным обобщением теоремы Лагранжа, которое тоже основано на те- ореме Ролля, является следующее Утверждение 2 (теорема Коши о конечном приращении). Пусть х = = x{t) и у = y{t) — функции, непрерывные на отрезке [а, Д] и дифференцируе- мые в интервале ]а, Д[. Тогда найдется точка г €]а, Д[ такая, что х'{т){у{/3) - у{а)) = у'{г){х{0) - х{а)).
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 215 Если к тому же ж'($) / 0 при любом t б]а, 0[, то х(а) / и справедливо равенство ~ У(а) = У'(т) ,4) х(/3) — х(а) я:'(т) ’ <4 Функция F(t) = x(t)(y(/3) —у(а)) - j/(t)(a:(/3) — s(a)) удовлетворяет усло- виям теоремы Ролля на отрезке [а,/3], поэтому найдется точка т €]«,/?[, в которой F'(r) = 0, что равносильно доказываемому равенству. Чтобы полу- чить из него соотношение (4), остается заметить, что если x'(t) / 0 на ]а,/?[, то по той же теореме Ролля х(а) / х(/3). ► Замечания к теореме Коши. 1° Если пару функций х(t), y(t) рас- сматривать как закон движения частицы, то (x'(t),y'(t)) есть вектор ее ско- рости в момент t, а (х(/3) — a?(a), у(/3) — у(а)) есть вектор ее смещения за промежуток времени [аг, /3], и теорема утверждает, что в некоторый момент т € [а, /3] эти векторы коллинеарны. Однако этот факт, относящийся к движе- нию в плоскости, является таким же приятным исключением, каким является' теорема о средней скорости в случае движения по прямой. В самом деле, представьте себе частицу, равномерно поднимающуюся по винтовой линии. Ее скорость составляет постоянный ненулевой угол с вертикалью, в то время как вектор смещения может быть и вертикальным (один виток). 2° Формулу Лагранжа можно получить из формулы Коши, если в последней положить х = x(t) = i, y(t) = у(х) = /(я), а = а, ft = Ь. 3. Формула Тейлора. Из той части дифференциального исчисления, которая уже изложена к настоящему моменту, могло возникнуть верное пред- ставление о том, что чем больше производных (включая производную нуле- вого порядка) совпадает у двух функций в некоторой точке, тем лучше эти функции аппроксимируют друг друга в окрестности этой точки. Мы в основ- ном интересовались и сейчас будем интересоваться приближением функции в окрестности некоторой точки с помощью многочлена Рп(х) = Рп(®о;®) = = со + ci(х — а?о) + • • • + сп(х — а?о)п- Нам известно (см. пример 25 из § 2, п. 6), что алгебраический полином можно представить в виде Р„(х) = Рп(х„) + Щ^(х -Хо) + ... + 1! П1 PW(xQ) т. е. Ck = —- (к = 0,1,..., п). В этом легко убедиться непосредственно, я! Таким образом, если нам будет дана функция /(ж), имеющая в точке хо все производные до порядка п включительно, то мы можем немедленно выписать полином Рп(х0-,х) = Рп(х) = /(хо) + - хо) + ... + f-^-(x - Хо)", (5) 1! П1 производные которого до порядка п включительно в точке Xq совпадают с производными соответствующего порядка функции f(x) в точке xq.
216 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Определение 5. Алгебраический полином, заданный соотношением (5), называется полиномом Тейлора1^ порядка п функции f(x) в точке xq. Нас будет интересовать величина f(x) - Рп(х0‘,х) = rn(xQ;x) (6) уклонения полинома Рп(х) от функции /(ж), называемая часто остатком, точнее, п-м остатком или п-м остаточным членом формулы Тейлора: f(x) = /(а?о) + - 4?°) (ж - ®о) + • • • + ~(я ~ s0)n + гп(х0;х). 1! П1 (7) Само по себе равенство (7), конечно, не представляет интереса, если о функции гп(хо;х) не известно ничего, кроме ее определения (6). Сейчас мы воспользуемся довольно искусственным приемом для получения информации об остаточном члене. Более естественный путь к этому даст интегральное исчисление. Теорема 2. Если на отрезке с концами xq, х функция f непрерывна вместе с первыми п своими производными, а во внутренних точках этого отрезка она имеет производную порядка п + 1, то при любой функции <р, непрерывной на этом отрезке и имеющей отличную от нуля производную в его внутренних точках, найдется точка %, лежащая между Xq и х, такая, что (8) ◄ На отрезке I с концами xq, х рассмотрим вспомогательную функцию F(t) = f(x) - Pn(t-,x) (9) от аргумента t. Запишем определение F(t) подробнее: F(i) = f(x) - (Ю) Из определения функции F(t) vl условий теоремы видно, что F непрерывна на отрезке I и дифференцируема в его внутренних точках, причем ^Б. Тейлор (1685 — 1731) — английский математик.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 217 Применяя к паре функций F(t), ip(t) на отрезке I теорему Коши (см. со- отношение (4)), находим точку £ между хо и ж, в которой F(x) — F(xq) = Г (О <?(*) - <рМ ?•(£)' Подставляя сюда выражение для F'(£) и замечая из сопоставления формул (6), (9) и (10), что F(x) - F(x0) = 0 - F(x0) = -гп(хо;х), получаем форму- лу (8). ► Полагая в (8) y?(i) = х — t, получаем Следствие 1 (формула Коши остаточного члена). гп(х0;х) = Д/(п+1)(£)(® -£)п(х -х0). П! Особенно изящная формула получается, если положить в соотношении (8) <p(t) = (х - t)n+1: Следствие 2 (формула Лагранжа остаточного члена). гп(х0-,х) - f{n+14t)(x Xo)n+1. {п 4- 1)! (12) Отметим, что формулу (7) Тейлора при xq = 0 часто называют формулой Маклорена1^. Рассмотрим примеры. Пример 3. Для функции f(x) = ех при х0 = 0 формула Тейлора имеет вид е’ = 1 + + г„(0;а:), (13) и на основании равенства (12) можно считать, что гп(0;а:)- е{ zn+1, где |£| < |®|. Таким образом, Но при любом фиксированном х € R, если п —> оо, величина ~как нам (п +1)! известно (см. пример 12 из гл. Ш, § 1, п. ЗЬ), стремится к нулю. Значит, из ^К. Маклорен (1698—1746) — английский математик.
218 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ оценки (14) и определения суммы ряда вытекает, что для х € R е1 = 1 + ^х + ;|гХ2 + ... + -^хп + ... (15) 1! 2! П! Пример 4. Аналогично получаем разложение функции ах для любого а, О < а, а / 1: Пример 5. Пусть /(х) = sin я. Нам известно (см. пример 18 из § 2, п. 6), что /<п\х) = sin(x + п € N, поэтому из формулы (12) Лагранжа при хо = 0 и любом х €. R находим гп(0; х) = sin (n + 1)) xn+1, (16) откуда следует, что для любого фиксированного значения х € R величина гп(0;х) стремится к нулю при п —> оо. Таким образом, при любом х Е R справедливо разложение Пример 6. Аналогично, для функции f(x) — cos х получаем Гп(°; = (п+1)!cos i (п+шП+1 (18) C0S;C = l-la? + la:<-...+ + (19) Пример 7. Поскольку sh' х = chх, ch' х — shх, для функции f (х) = shх при хо = 0 из формулы (12) получаем Гп(0;:С)= где — sh£, если п четно, и </?(£) = ch£, если п нечетно. В любом случае |</?(£)| шах{|shx|, |chx|), ибо |£| < |х|. Значит, для любого фиксирован- ного значения х € R выполняется гп(0;х) —> 0 при п —> оо, и мы получаем разложение shx^x + y + ^ + ... + ^-L^x^ + ..., (20) справедливое для любого х Е R.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 219 Пример 8. Аналогично получаем разложение с*1® ~ 1 + 2!®2 + 4|®4 + •••+ (2^)1 ®2П + •'* ’ (21) справедливое для любого значения х Е R. /_1/ ______ Пр имер 9. Для функции f(x) = 1п(14-я) имеем f(n\x) —-------тттЦ:—•» (i + i) поэтому формула Тейлора (7) при xq = 0 для этой функции имеет вид 1 1 (— 1п(1 + х) = х - - х2 + -х3 - ... + -----хп + гп(0;х). (22) 2 о п На сей раз представим гп(0; х) по формуле Коши (11): или r„(0;x) = (- 1)^)", (23) где точка £ лежит между 0 и (. Если |я| < 1, то из условия, что £ лежит между 0 и х, следует, что _ и - lei < и - id _ 1 _ i-и <, _ i-i*i _ 11 (241 i+e ii+ei " 1-KI _1 i-ier1 i-io|-|a!|- (24) Таким образом, при |ж| < 1 |гп(0;я)|^|я|п+1, (25) и, следовательно, при |я| < 1 справедливо разложение 1п(1 4-я) = х- ±х2 + |я3 - ... 4- —-----хп + ... (26) 2 о п Заметим, что вне отрезка |я| 1 ряд, стоящий справа в (26), всюду расхо- дится, так как его общий член не стремится к нулю, если |я| > 1. Пример 10. Если f(x) = (14- х)а, где а € R, то У^п\ж) = а(а — 1) х х ... х (а — п4-1)(1 4-х)а~п, поэтому формула Тейлора (7) при 2?о = 0 для этой функции имеет вид + а<а-Г 1). - (а - П + 1) ДП + г„(0;а;). (27)
220 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Используя формулу Коши (11), находим гп(0; ж) = а(а ~ 1} - (а ~ (1 + (28) где £ лежит между 0 и х. Если |ж| < 1, то, используя оценку (24), имеем |гп(0;®)| (29) При увеличении п на единицу правая часть неравенства (29) умножается на (1 - • Но поскольку |ж| < 1, то при достаточно больших значениях п, независимо от значения а, будем иметь а Отсюда следует, что при любом а € К и любом х из интервала |ш| < 1 вы- полнено гп(0;ж) 0, когда п оо; поэтому на интервале |ж| < 1 справедливо полученное Ньютоном разложение (бином Ньютона) /ч , а а(а — 1) 2 «(а - 1)... (а - п + 1) _ (1 4- х)а = 1 4--х 4- -Ц-—- х2 4-... 4- —----р------— хп 4-... (30) 1! 2! 71! Заметим, что, как следует из признака Даламбера (см. гл. Ill, § 1, п. 4Ь), при |ш| > 1 ряд (30) вообще расходится, если только а N. Рассмотрим теперь особо случай, когда а = п € N. В этом случае функция f(x) = (14- х)а = (14- х)п является полиномом степени п, и поэтому все ее производные порядка выше чем п равны нулю. Таким образом, формула Тейлора (7) и, например, формула Лагранжа (12) позволяют записать следующее равенство: (1 + х)п = 1 + 'х2 + ... + ------хп, (31) представляющее собой известную из школы формулу бинома Ньютона для натурального показателя: (1 + х)п = 1 + С£х + С2х2 + ... + С"х". Итак, мы определили формулу Тейлора (7) и получили вид (8), (11), (12) остаточного члена формулы Тейлора. Мы получили соотношения (14), (16), (18), (25), (29), позволяющие оценивать погрешность вычисления важных эле- ментарных функций по формуле Тейлора. Наконец, мы получили разложения этих функций в степенные ряды. Определение 6. Если функция f(x) имеет в точке х$ производные любого порядка n Е N, то ряд /(х0) 4- ~f(xo)(x - яо) + • • • + —.f{n\x0)(x - х0)п 4-... 1! 71! называется рядом Тейлора функции f в точке xq.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 221 Не следует думать, что ряд Тейлора каждой бесконечно дифференциру- емой функции сходится в некоторой окрестности точки xq, ибо для любой последовательности со, й, ..., Сп, ... чисел можно построить (это не совсем просто) функцию f(x) такую, что f^n\xo) = Сп, nEN. Не следует также думать, что если ряд Тейлора сходится, то он обязатель- но сходится к породившей его функции. Сходимость ряда Тейлора к поро- дившей его функции имеет место только для так называемых аналитических функций. Вот пример Коши неаналитической функции: если х / О, если х = 0. Исходя из определения производной и того, что хке~1^х2 0 при х 0 независимо от значения к (см. пример 30 из § 2 гл. III), можно проверить, что у(п)(0) = 0 для п = 0, 1, 2, ... Таким образом, ряд Тейлора в данном случае состоит только из нулевых членов и его сумма тождественно равна нулю, в то время как f(x) / 0 при х / 0. В заключение остановимся на локальном варианте формулы Тейлора. Вернемся снова к задаче о локальном приближении функции f : Е -> Ж. полиномом, которую мы начали обсуждать в § 1, п. 3. Мы хотим подобрать полином Рп(хо;х) = со + Ci(x — xq) 4-... + сп(х — хо)п так, чтобы иметь /(ш) = Рп(х0',х) 4- о((ш - 2?о)П) при X Xq, X G Е, или, подробнее, f(x) = Cq + С1(х - Xq) + . . . + Сп(х - Х0)П 4" 4- о((х — £о)п) при X Xq, XGE. (32) Сформулируем в явном виде по существу уже доказанное Утверждение 3. Если полином Рп(хо;х) — cq 4- Ci(x — xq) 4- ... 4- 4- сп(х -- xq)*1, удовлетворяющий условию (32), существует, то он единст- венный. ◄ Действительно, из условия (32) последовательно и вполне однозначно (в силу единственности предела) находятся коэффициенты полинома со = Иш f(x), 2ьЭх->хо С1= Um •ЕЭх—Но X — Xq Сп = lim f(x) - [со 4-... 4- Сп-1(х - Sp)w *] (х - х0)п
222 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Докажем теперь следующее Утверждение 4 (локальная формула Тейлора). Пусть Е — отрезок с концом 2?о Е IR. Если функция f: Е —> R имеет в точке xq все производные /'(шо), , f(n\xo) до порядка п включительно, то справедливо следующее представление: f(x) = f(x0) + - Хо) + . . . + - *о)" + 4- о([х — #о)п) при х -> хо, х Е Е. (33) Таким образом, задачу локального приближения дифференцируемой функ- ции решает полином Тейлора соответствующего порядка. Поскольку полином Тейлора Рп {хо; ж) строится из условия совпадения всех его производных до порядка п включительно с производными соответствую- щего порядка функции / в точке хо, то f^k\xo) — Pnk\xo; xq) = 0 (k = 0,1,... ..., n) и справедливость формулы (33) устанавливает следующая Лемма 2. Если функция <р: Е -+ R, определенная на отрезке Е с концом хо, такова, что она имеет в точке Хо все производные (р'(хо), ..., <р(п\хо) до порядка п включительно и <р(хо) = <р'(хо) — <р^п\хо) = 0, то </?(х) = = о((х - хо)п) при х -> хо, х Е Е. ◄ При п = 1 утверждение вытекает из определения дифференцируемости функции (р в точке xq, в силу которого <р(х) = <р(хо) 4- (p'fxo'lfx - аг0) 4- о(х - Xq) при х -> xq, х Е Е, и, поскольку <р(хо) — <р'(хо) = 0, имеем (р(х) — о(х — а?о) при х Xq, х Е Е. Предположим, что утверждение доказано для порядков п = к — 1 1. Покажем, что тогда оно справедливо также для порядка п = к 2. Заметим предварительно, что поскольку (к)/ ч / (k-1)\'/ ч г ^^(х) - ^^-1)(ж0) <р( ’(xq) = (<р( J (яо) = hm -------—— ---------— E3x—¥xq X — Xq то существование <р№ (#о) предполагает, что функция (р^к~^ (х) определена на Е хотя бы вблизи точки xq. Уменьшая, если нужно, отрезок Е, можно заранее считать, что функции <р(х), <р'(х), ..., ^л-1^(ж), где к 2, определены на всем отрезке Е с концом хо- Поскольку к 2, то функция (р(х) имеет на Е производную р' (ж) и по условию (¥>')'(хо) = ... = (¥’')(‘'1)^о) = 0. Таким образом, по предположению индукции <//(ж) = о((х — xq)*-1) при х —> хо, х Е Е.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 223 Тогда, используя теорему Лагранжа, получаем 9Р(т) = ¥>(я) - у?(ш0) = </(£)Сг - 2?о) = «(£)(£ - Xof-'tx - х0), где £ — точка, лежащая между xq и х, т. е. |£ — 2?о| < (ж — a?o|, а <*(£) О ПРИ £ Е, £ € Е. Значит, при х xq, х Е Е одновременно будем иметь £ -> Е, £ Е Е и а(£) -> 0, и поскольку |^(ш)| |а(£)||ш - zol*’1^ - ш0|, то проверено, что tp(x) = о((ш — х0)к) при х -> Xq, х Е Е. Таким образом, утверждение леммы 2 проверено принципом математиче- ской индукции, к Соотношение (33) называется локальной формулой Тейлора, поскольку ука- занный в нем вид остаточного члена (так называемая форма Пеано) гп(х0;х) = о((ш - ш0)п) (34) позволяет делать заключения только об асимптотическом характере связи по- линома Тейлора и функции при х —> xq, х Е Е. Формула (33) удобна, таким образом, при вычислении пределов и описании асимптотики функции при х -» хо, х Е Е, но она не может служить для при- ближенного вычисления значений функции до тех пор, пока нет фактической оценки величины гп(хо;х) = о((х — а?о)п)- Подведем итоги. Мы определили полином Тейлора = f(za) + ^^(х -х0) +...+ (» - *<>)", написали формулу Тейлора f(x) = f(xo) + - (х - 2?о) + ... + -—7^ (я - Яо)п 4- гп(х0-,х) 1! П! и получили следующие ее важнейшие конкретизации: Если f имеет производную порядка n + 1 в интервале с концами хо, х, то f(z) = + ^^(х - Хо) + • • • + /<П^0^ (* - *о)п + +^>(мог+1’ (35) где £ — точка, лежащая между xq и х.
224 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если f имеет в точке хо все производные до порядка п 1 включительно, то f(x) = /(Хо) + (X - Хо) + • • + (х - хо)" + о((Х - Хо)"). (36) 1! п! Соотношение (35), называемое формулой Тейлора с остаточным членом в форме Лагранжа, очевидно, является обобщением теоремы Лагранжа, в ко- торую оно превращается при п — 0. Соотношение (36), называемое формулой Тейлора с остаточным членом в форме Пеано, очевидно, является обобщением определения дифференцируе- мости функции в точке, в которое оно переходит при п = 1. Заметим, что формула (35) практически всегда более содержательна, ибо, с одной стороны, как мы видели, она позволяет оценивать абсолютную вели- чину остаточного члена, а с другой, например, при ограниченности f(n+1\x) в окрестности хо из нее вытекает также асимптотическая формула f(x) = /(хо) + 1^(х - хо) +... + /—^2(х - хо)" + О((х - хо)"+1). (37) Так что для бесконечно дифференцируемых функций, с которыми в пода- вляющем большинстве случаев имеет дело классический анализ, формула (35) содержит в себе локальную формулу (36). В частности, на основании формулы (37) и разобранных выше примеров 3 — 10 можно теперь выписать следующую таблицу асимптотических формул при х -> 0: е* = 1 + 77Я + ia:2 + ... + 4- О(яп+1), COSX = 1 - 1х2 + Ах4 - ... + bi^x2" + О(х2"+2), sin х = х-±х3 + ±х*-...+ (2^+^, *2n+1 + О(х2п+3), chx = 1 + 1х2 + 1х4 + ... + -^х2п + О(х2п+2), shx = х + lx2 + |х‘ + ... + ^-l-^x2"*1 + О(х2п+3), ln(l +х)=х— ix2+jX3 — ... + -——------х" + О(х"+1), 2 3 п (1 + х)а = 1 + ^х+а(а2~1) х2 + ...+ + а(а -1} • п!(а - ” + 9 х" + О(х"+‘).
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 225 Рассмотрим теперь еще некоторые примеры использования формулы Тей- лора. Пример 11. Напишем полином, позволяющий вычислять значения функ- ции sin# на отрезке — 1 х 1 с абсолютной погрешностью, не превышаю- щей 10-3. В качестве такого многочлена можно взять тейлоровский многочлен подхо- дящей степени, получаемый разложением функции sin х в окрестности точки Xq = 0. Поскольку sin® = X - ^®3 + ^®5 - ... 4- J •1тмД?2п+1 + 0 •х2п+2 + г2п+г(0;®), о! О! (2п +1)! где по формуле Лагранжа sinfe 4- х(2п 4- 3)) Г2п+2(0;х) = —--------------~х2п+3> (2п 4- о)! то при |®| 1 1г2п+2(0;®)| (2п4-3)!' Но + з)! < 10-3 при п 2. Таким образом, с нужной точностью на отрезке |®| 1 имеем sin® « х — ^т®3 4- тт®5- 3! о! Пример 12. Покажем, что tg® = ® 4-1®3 4- о(х3) при х 0. Имеем tg' X = cos-2 ®, tg" х — 2 cos"3 ® sin ®, tg'" х — 6 cos~4 ® sin2 x 4- 2 cos-2 ®. Таким образом, tgO = 0, tg'0 = 1, tg"O = 0, tg"'0 = 2 и написанное соотношение следует из локальной формулы Тейлора. 00 1 Пример 13. Пусть а > 0. Исследуем сходимость ряда У Ineos —. 'п=1 п<* При а > 0 — -» 0, когда п -> оо. Оценим порядок члена ряда 71» 1 1 1 (л 1 1 . ( 1 А 1 1 , / 1 \ Ineos —- = In II — — • —--h О — — —х—F 01 -X— . па \ 2! п2а \п2а) 2 п2а \п2а) Таким образом, мы имеем знакопостоянный ряд, члены которого эквива- 00 —1 лентны членам ряда £2 • Поскольку последний ряд сходится только при п=1 2п а а > 7, то в указанной области а > 0 исходный ряд сходится лишь при а > | Z 2 (см. задачу 16b)).
226 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 14. Покажем, что 1псозж = — |ж2 — ^ж4 — + О(х8) при х -> 0. На сей раз, вместо того чтобы вычислять подряд шесть производных, мы воспользуемся уже известными разложениями cos а: при х -> 0 и 1п(1 + и) при и -> 0: In cos ж = In fl — ^ж2 + -у? ж4 — 4- О(ж8) ) = 1п(1 + и) = \ 2! 4! о! / = u-|u2 + |u3 + O(u4) = (-^я2 + ^ж4--^ж6+О(ж8)) - ~ 2 ((2!)2 - 2 ’ 2!4!х<! + + 3 (2!)3 Х +О(Х )) = Пример 15. Найдем значения первых шести производных функции In cos ж при ж = 0. Имеем (1псоз)'ж = , и потому ясно, что в нуле данная функция име- ет производные любого порядка, ибо cos 0/0. Мы не станем искать функ- циональные выражения этих производных, а воспользуемся единственностью полинома Тейлора и результатом предыдущего примера. Если /(ж) = со + С1Ж + ... + спхп + о(жп) при ж 0, то . = и = k\ck. KI Таким образом, в нашем случае получаем (In cos)(0) = 0, (In cos)'(0) = 0, (In cos)"(0) = • 2!, (In cos) W(0) = 0, (lncos)(4\0) = --у? • 4!, X^ (Incos)^(O) = 0, (lncos)<6\0) = • 61. 45 Пример 16. Пусть /(ж) — бесконечно дифференцируемая в точке жо = 0 функция, и пусть известно разложение У'(ж) = Cq + с}ж + ... + с^жп 4- О(жп+1) ее производной в окрестности нуля. Тогда из единственности тейлоровского разложения имеем (/')«(0) = Mei,
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 227 поэтому Таким образом, для самой функции f(x) имеем разложение f(x) = /(0) + ^ + х2 + ...+ + О(г"+2), или, после упрощений, f(x) = /(0) + ^х + 4*2 + • • • + -4т*"+1 + O(z"+2). 1 2 71 + 1 Пример 17. Найдем тейлоровское разложение функции f(x) = arctgz в нуле. Поскольку (я) = ।'^д.2 — (14- я2)-1 — 1 — х2 + х4 — ... + (—1)пш2п 4- + О(х2п+2), то по соображениям, изложенным в предыдущем примере, f(x) = f(ff) + I® - {х3 + I®5 - ... + 5^-®2n+1 + О(х2п+3), 10 О a 71 “T" 1 arctgz = x - |a:3 + - ... + д--” у x2n+1 4- O(x2n+3). Пример 18. Аналогично, раскладывая функцию arcsin'a: = (1 — я2)-1/2 по формуле Тейлора в окрестности нуля, последовательно находим (1 4- u)~1/2 = 1 4- и 4- —и2 4-... 1/ 1 Л /1 „ , Л — о ( “о — 11...I— 7Г — П4-11 ... 4- — -- ---—------------- ип 4- O(un+1), п! (1-2)-1/2=1+^2+^+... •+13'2п(п2,п~1)^п + 0(^), , 1 з 1-3 5 arcsinz = х 4--х 4—=-------х 4-... 2-3 22-2!-5 + (2п -!)!!_ 2п+1 , • •• + (2п)!!(2п 4-1) + 1 Ь или, после элементарных преобразований, arcsinх = х + х3 + х3 + ...+ x2"+I + О(х2п+3). Здесь (2п - 1)!! := 1 3 ... • (2п - 1), (2п)!! := 2 • 4 -... (2п).
228 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 19. Воспользуемся результатами примеров 5,12,17,18 и найдем arctg х — sin х hm-------------:— tg х — arcsin х + О(х5) = lim --------------= -1. х~*° ±хэ + О(х5) о Задачи и упражнения 1. Подберите числа а и & так, чтобы функция f(x) = cos я; — была бесконечно малой возможно более высокого порядка. 1 + ах2 v п Т+ь? п₽и х 0 2. Найдите lim я;-( ——г ) . «-+оо Le + 1/ J 3. Напишите полином Тейлора функции е* в нуле, который позволял бы вычи- слять значения е* на отрезке — 1 х 2 с точностью до 10-3. 4. Пусть / — бесконечно дифференцируемая в нуле функция. Покажите, что а) если f четная, то ее ряд Тейлора в нуле содержит только четные степени х\ Ь) если f нечетная, то ее ряд Тейлора в нуле содержит только нечетные степени х. 5. Покажите, что если f € С^00^—1,1], /^п^(0) = 0 для п = 0,1,2, ... и существует число С такое, что sup |/^п^(я;) n!C, nGN, то / = 0 на [—1,1]. 6. Пусть f € С(п)(]-1,1[) и sup |/(я;)| 1. Пусть mk(7) = inf 1/^\я:)1, где I — промежуток, содержащийся в интервале ]—1,1[. Покажите, что а) если I разбит на три последовательных промежутка Л, /г, А и д — длина то тк(1) 7(тпк_1(11) + тпк-1(1з)); Ь) если I имеет длину А, то 2k(k+l)/2kk тк(1) ; с) существует такое число ап, зависящее только от п, что если |/z(0)| > ап, то уравнение f^n\x) = 0 имеет в ]—1,1[ по крайней мере п — 1 различных корней. Указание. ВЬ) используйте а) и принцип индукции; в с) используйте а) и по индукции докажите, что существует такая последовательность я?к1 < хк2 < ... < хкк точек интервала ]—1,1[, что f^k\xki) • < О ПРИ 1 fc — 1. 7. Покажите, что если функция f определена и дифференцируема на интервале I и [а, &] С I, то а) функция f(x) (даже не будучи непрерывной!) принимает на [а, &] все значения между f'(a) и f(b) (теорема Дарбу1^)-, Ь) если еще f"(x) существует в ]а, &[, то найдется точка £ € ]а, &[ такая, что f\b)-f\a) = f"(£)(b-a). 1)Г. Дарбу (1842—1917) — французский математик.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 229 8. Функция f(x) может быть дифференцируемой на всей числовой прямой, но при этом f'(x) может не быть непрерывной (см. пример 7 из § 1, п. 5). а) Покажите, что функция f'(x) может иметь разрывы только второго рода. Ь) Укажите ошибку в следующем «доказательстве» непрерывности f'(x). ◄ Пусть я?о — произвольная точка на R и ff(xo) — производная функции f в точке хо- По определению производной и теореме Лагранжа /'(*») = lim /(а;) ~ /(*о) = lim /'(«)= И™ /'(€), X-+XO X — Хо Х-»Хо С->ХО где £ — точка между xq и х, стремящаяся, таким образом, к гео при х —> xq. ► 9. Пусть f — дважды дифференцируемая функция на промежутке I. Пусть Mq = = sup |f(x)I, Mi = sup |/'(x)|, М2 = sup |/"(ж)|. Покажите, что х£/ ' х£/ х€/ а) если I = [—а, а], то I г/ / \| ✓** 1 ЯС “1“ ® м Ъ) С Ml 2у/МоМ2, если длина I не меньше 2у/Мо/М2, ( Mi у/2МоМ2> если I = R; с) в задаче Ь) числа 2 и у/2 не могут быть заменены меньшими; d) если f дифференцируема р раз в R и если величины Мо и Мр = sup |/^р\®)| x€R конечны, то при 1 к р конечны также величины Мк = sup и x€R Мк 2fc(p-fc)/2A/J_fc/₽A/p/p. Указание. Используйте задачи 6b), 9Ь) и принцип индукции. 10. Покажите, что если функция / имеет в точке гео все производные до порядка п 4-- 1 включительно и /^п+1\хо) / 0, то в остаточном члене формулы Тейлора, записанном в форме Лагранжа гп(я?0; х) = Л/(п)(я?о 4 0(х - .т0))(® - х0)п, ni где 0 < в < 1, величина 0 = 0(х) стремится к —у— при х —> хо. п 4 1 11. Пусть f — функция, п раз дифференцируемая на промежутке I. Покажите, что: а) Если / в (п 4 1) точках промежутка I обращается в нуль, то найдется точка £ € I такая, что /<”)(£) = 0. Ь) Если ®i, я?2, • • • , хр — точки промежутка I, то существует и притом един- ственный многочлен L(x) (интерполяционный полином Лагранжа) степени не выше (п — 1) такой, что f(x{) = L(xi), i = 1, ..., п. Кроме того, для х (Е I найдется точка £ € I такая, что f(x) - L(x) = /<">(£). П! с) Если xi < Х2 < - - < хр — точки промежутка I, щ (1 i р) — натуральные числа такие, что ni 4- П2 4- ... 4 пр = п и f^k\xi) = 0 при 0 к щ — 1, то в промежутке [xi,®p] найдется точка £, в которой = 0.
230 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ с!)-Существует и притом единственный многочлен Н{х) {интерполяционный по- лином Эрмита1^) степени n—1 такой, что /<*\х<) = Н^к\х{) приО к щ — 1. Кро- ме того, внутри наименьшего промежутка, содержащего течки х и х,, i — 1, ..., р, найдется точка £ такая, что f(x) = Н(х) + (х - Х1)"‘ ' - - fe -х-"-)- /<’>«). П! Эта формула называется интерполяционной формулой Эрмита. Точки х», i = = 1, ..., р, называются узлами интерполяции кратности П{ соответственно. Част- ными случаями формулы Эрмита являются интерполяционная формула Лагранжа (задача Ь)) при р = п и = 1 (i = 1, ..., п), а также формула Тейлора с остаточ- ным членом в форме Лагранжа, получающаяся при р = 1, т. е. при интерполировании с одним узлом кратности п. 12. Покажите, что а) между двумя вещественными корнями полинома Р(х) с вещественными коэф- фициентами имеется корень его производной Р'{х)\ Ь) если полином Р(х) имеет кратный корень, то полином Р'{х) имеет тот же корень, но на единицу меньшей кратности; с) если Q{x) — наибольший общий делитель полиномов Р(х) и Р'{х), где Р'{х) — г>/ \ Р(х) производная полинома Р{х), то полином имеет в качестве корней корни поли- нома Р(х), причем все они кратности 1. 13. Покажите, что а) любой полином Р(х) можно представить в виде co+ci(x — хо) + . . . + сп(х — хо)п; Ь) существует единственный полином степени п, для которого /(х) — Р(х) = = о((х — х0)п) при Е э х —> хо. Здесь / — функция, определенная на множестве Е, а хо — предельная точка Е. 14. С помощью индукции по h, 1 Л, определим конечные разности порядка к функции / в точке xqi ^/(хо; hi) := Д/(х0; hi) = /(х0 4- hi) - /(хо), Д2/(хо; hi, hi) := ДД/(хо; hi, Лг) = = (/(хо + hi + hi) — /(х0 + hi)) — (/(х0 + hi) — /(хо)) = = /(хо + hl + hi) - /(хо + hl) - /(хо + hi) + /(х0), Д*/(®о;hi, ..., hk) := Afc 1pfc(xo;hi, ..., hk-i), где pfc(x) = ^f{x-, hk) = /(x + hk) - /(x). а) Пусть / € C,^n-1^[a,6] и существует /^n\x) по крайней мере в интервале ]a,&[. Если все точки хо, хо + hi, хо + hi, хо + hi + /12, хо + hi + ... + hn лежат в [а,&], то внутри наименьшего отрезка, их содержащего, найдется точка £ такая, что Д”/(хо; h,,..., h„) = /<">(£) hi... h„. 1^Ш. Эрмит (1822 — 1901) — французский математик, занимавшийся воЦросами анализа; в частности, доказал трансцендентность числа е.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 231 b) (Продолжение.) Если существует /<п\я?о), то имеет место оценка |Дп/(х0; hi, ..., М “ /(п)(^о) fti... Лп| sup |/(п)(т) - /(п)(т0)| • |Ai |... |Л„|. х €]а,Ь[ с) (Продолжение.) Положим Дп/(хо; h, ..., h) =: Дп/(хо; hn). Покажите, что если существует /(п\я?о), то J v 7 h-Ю hn d) Покажите на примере, что предыдущий предел может существовать даже тогда, когда f^n\x) в точке я?о не существует. У казание. Рассмотрите, например, Д2/(0;/г2) для функции и покажите, что №) = з • 1 х sin -, X О, lim /i—>0 A2/(0;fe2) h? я; / О, х = О, = 0. 15. а) Применив теорему Лагранжа к функции где а > 0, покажите, что при X п 6 N и а > 0 имеет место неравенство 1 1. / 1________1\ п1+“ а\(п —1)“ па/ 00 1 Ь) Воспользуйтесь результатом задачи а) и покажите, что ряд ~ сходится при а > 1. n=1 П § 4. Исследование функций методами дифференциального исчисления 1. Условия монотонности функции Утверждение 1. Между характером монотонности дифференцируе- мой на интервале ]a, b[= Е функции f'.E-^Ru знаком (положительностью) ее производной /' на этом интервале имеется следующая взаимосвязь: Г(х) > 0 => f возрастает => /'(«)> 0, Г(х) 0 => / не убывает => f'(x) 0, f'(x) = 0 => f = const => f'(x) = 0, Ш < 0 => / не возрастает => f(x) 0, Г(х)<0 => / убывает Г(х) < 0. ◄ Левый столбец следствий нам уже знаком по обсуждению теоремы-Ла- гранжа, в силу которой f(x2) - /(xi) = /'(С)(^2 - xi), где «1, х2 6 ]а, Ь[ и £ — точка между xi и х2. Из этой формулы видно, что при rci < х2 положитель- ность разности f(x2) — f(xi) совпадает с положительностью /'(£).
232 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Правый столбец следствий получается непосредственно из определения производной. Покажем, например, что если дифференцируемая на ]а, функ- ция f возрастает, то f(x) 0 на ]а, д[. Действительно, /'(а;) = lim f(x + А) - f(x) h Если h > 0, то f(x + h)- f(x) > 0, а если h < 0, то f(x + h) - /(a;) < 0; поэтому дробь под знаком предела положительна. Следовательно, ее предел f'(x) неотрицателен, что и утверждалось. ► Замечание 1. На примере функции f(x) = а;3 видно, что возрастание дифференцируемой функции влечет только неотрицательность производной, а не ее положительность. В нашем примере = За?2|л=0 = 0- Замечание 2. В символе А => В, как мы уже в свое время отмечали, А — условие, достаточное для В, а В — условие, необходимое для того, чтобы было выполнено А. Значит, из утверждения 1, в частности, можно сделать следующие выводы: функция постоянна на интервале тогда и только тогда, когда ее произ- водная тождественно равна нулю на этом интервале; для того чтобы дифференцируемая на интервале функция убывала на нем, достаточно, чтобы ее производная была отрицательна в любой точке этого интервала; для того чтобы дифференцируемая на интервале функция убывала на нем, необходимо, чтобы ее производная была неположительна на этом интер- вале. Пример 1. Пусть/(а;) = х3 — Заг+2наК. Тогда/'(а:) = За;2 — 3 = 3(а;2 — 1) и, поскольку /'(а;) < 0 при |а;| < 1 и /'(а;) > 0 при |ат| > 1, можем сказать, что на интервале ]—оо, —1[ функция возрастает, на интервале ]—1,1[ убывает, а на интервале ]1, +оо[ вновь возрастает. 2. Условия внутреннего экстремума функции. Учитывая лемму Ферма (лемма 1, § 3), можно сформулировать следующее Утверждение 2 (необходимые условия внутреннего экстремума). Для того чтобы точка xq была точкой экстремума функции f: U(xq) -> R, опре- деленной в окрестности U(xq) этой точки, необходимо выполнение одного из двух условий: либо функция не дифференцируема в xq, либо /'(^о) = 0. Простые примеры показывают, что эти необходимые условия экстремума не являются достаточными. Пример 2. Пусть /(а;) = а;3 на R. Тогда /'(0) = 0, но в точке xq = 0 экстремума нет. Пример 3. Пусть х при х > 0, №) = о . 2а; при х < 0.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 233 Эта функция с изломом в нуле, очевидно, не имеет в нуле ни производной, ни экстремума. Пример 4. Найдем максимум функции f(x) = а;2 на отрезке [—2,1]. В данном случае очевидно, что он будет достигнут в конце —2 отрезка, но регулярный способ его отыскания таков. Находим /'(я) = 2х и все точки ин- тервала]—2,1[, где/'(я) = 0. В нашем случае это одна точка х = 0. Максимум f(x) должен быть либо среди этих точек, либо в одной из концевых точек, о которых утверждение 2 ничего не говорит. Таким образом, надо сравнить значения /(—2) = 4, /(0) = 0, /(1) = 1, откуда заключаем, что максимальное значение функции f(x) = х2 на отрезке [—2,1] равно 4 и принимается в точке —2, являющейся концом этого отрезка. Используя установленную в пункте 1 связь между знаком производной и ха- рактером монотонности функции, приходим к следующим достаточным усло- виям наличия или отсутствия локального экстремума в точке. Утверждение 3 (достаточные условия экстремума в терминах первой производной). Пусть f: U(xq) —> R — функция, определенная в окрестности U(xq) точки xq, непрерывная в самой этой точке и дифференцируемая в ее проколотой окрестности U(xq). Пусть U~(xq) = {х 6 U(xq)\x < яо) « U+(x0) = {х е U{x0) |я > я0}. Тогда справедливы следующие заключения'. а) (Уя G #-(я0) (/'(я) < 0)) А (Уя G ^+(я0) (/'(я) < 0)) => => (/ в я0 экстремума не имеет); ь) (Уя е а-(я0) (f(x) < о)) А (Уя е #+(я0) (Г(х) > 0)) => => (яо — точка строгого локального минимума f); с) (Уя 6 #-(яо) (f(x) > 0)) А (Уя е U+(xq) (/'(я) < 0)) => => (яо — точка строгого локального максимума f); d) (Уя G а-(я0) (f(x) > 0)) А (Уя G #+(я0) (f(x) > 0)) => => (/ в я© экстремума не имеет). Кратко, но менее точно, можно сказать, что если при переходе через точ- ку производная меняет знак, то экстремум есть, а если ее знак при этом не меняется, то экстремума нет. Заметим сразу же, что эти условия, являясь достаточными, не являются необходимыми для экстремума, в чем можно убедиться на следующем при- мере. Пример 5. Пусть /(*) = < к 2я2 + я2 sin - я 0 при я 7^ 0, при я = 0.
234 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Поскольку х2 f(x) 2х2, то ясно, что функция имеет строгий локальный минимум в точке xq = 0, однако ни в какой проколотой полуокрестности этой точки ее производная f'(x) — 4х + 2zsin - — cos не сохраняет знак. Этот же пример указывает на недоразумения, которые могут возникнуть в связи с приведенной выше сокращенной формулировкой утверждения 3. Теперь обратимся к доказательству утверждения 3. О а) Из утверждения 2 следует, что функция f строго убывает на U~(xq). Поскольку она непрерывна в xq, имеем 0 lim f(x) = J(xq) и, следова- и~(хо)Эх-^хо тельно, /(z) > f(xo) при х Е U~(xq). По тем же соображениям f(xo) > f(x) О при х G и+(хо)* Таким образом, функция строго убывает во всей окрестности Щх0) и xq не является точкой экстремума. О Ь) Сначала, как ива), заключаем, что ввиду убывания на U~(xq) и о непрерывности / в xq имеем /(ж) > f(x0) при х Е {/“(гго). Из возрастания f на о о С7+(а;о) и непрерывности f в х0 заключаем, что f(x0) < f(x) при х Е U+(xq). Таким образом, функция f имеет в а?0 строгий локальный минимум. Утверждения с) и d) доказываются аналогично. ► Утверждение 4 (достаточные условия экстремума в терминах высших производных). Пусть функция f: U(xq) —> R, определенная в окрестности U(xq) точки Xq, имеет в xq производные до порядка п включительно (n 1). Если /'(^о) = ... = /<п-1)(а;о) = 0 и ft”) 0 0, то при п нечетном в xq экстремума нет, а при п четном экстремум есть, причем это строгий локальный минимум, если /^(xq) > 0, и строгий локальный максимум, если /(в>(го) < 0. Используя локальную формулу Тейлора /(ж) - J(xq} = f{n\xo)(x - z0)n + а(х)(х - х0)п, (1) где а(х) —> 0 при х -> хо, будем рассуждать так же, как при доказательстве леммы Ферма. Перепишем (1) в виде f(x) - f(x0) = (f^(x0) 4- а(х))(х - XQ)n. (2) Поскольку f^(xo) 0 0, а а(х) -> 0 при х -> жо, то сумма f^(xo) + а(х) имеет знак f(n\xo), когда х достаточно близко к а?0. Если п нечетно, то при переходе через xq скобка (х — zo)n меняет знак и тогда изменится знак всей правой, а следовательно, и левой части равенства (2). Значит, при п = 2k 4-1 экстремума нет. Если п четно, то (х — хо)п > 0 при х 0 xq и, следовательно, в малой окрестности точки х0 знак разности f(x) — f(x0), как видно из равенства (2), совпадает со знаком f^n\x0). ►
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 235 Рассмотрим примеры. Пример 6. Закон преломления света в геометрической оптике {закон Снеллиуса1^}. Согласно принципу Ферма истинная траектория света между любыми двумя точками такова, что на ней реализуется минимум времени, которое необходимо свету, чтобы пройти из одной точки в другую по любому фиксированному пути, соединяющему эти точки. Из принципа Ферма и того, что кратчайшей линией между любыми двумя точками является отрезок прямой с концами в этих точках, следует, что в однородной изотропной среде (устроенной одинаково как в каждой точке, так и в каждом направлении) свет распространяется прямолинейно. Пусть теперь имеются две такие среды и свет распространяется из точки Ai к А2, как показано на рис. 22. Если ci, C2 — скорости света в этих сре- дах, то время прохождения указанного пути таково: t{x) = -±-\/h2 + х2 + ~x/h2 + (о — я)2- Рис. 22 Найдем экстремум функции t{x): 1 х 1 а — х С1 у/h2 + х2 с2 4- (а — х)2 что в соответствии с обозначениями рисунка дает с^1 sinai = с^1 sin аг- Из физических соображений или прямо из вида функции t{x), неограни- ченно растущей при х —> оо, ясно, что точка, где t'{x) = 0, является точкой абсолютного минимума непрерывной функции t{x). Таким образом, из прин- ципа Ферма следует закон преломления = —. Пример 7. Покажем, что при х > О ха — ах 4- а — 1 О, ха — ах + а — 1 О, когда 0 < а < 1, когда а < 0 или 1 < а. (3) (4) 4 Дифференцируя функцию f{x) = ха — ах 4- а — 1, находим f'{x) = = а{ха~1 — 1) и f'{x) = 0 при х = 1. При переходе через точку 1 производная переходит от положительных значений к отрицательным, если 0 < а < 1, и от отрицательных к положительным, если а < 0 или 1 < а. В первом случае в точке 1 строгий максимум, а во втором — строгий минимум (и не только локальный, что следует из соображений монотонности / на участках О < х < 1, 1 < х). Но /(1) = 0 и, таким образом, оба неравенства (3), (4) 1^В. Снеллиус (1580—1626) — нидерландский астроном и математик.
236 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ установлены. При этом показано даже, что оба неравенства строгие, если х 0 1. ► Заметим, что если заменить х на 1 + х, то мы обнаружим, что (3) и (4) — это развитие уже знакомого нам при натуральном показателе а неравенства Бернулли (гл. II, § 2, с. 64; см. также задачу 2 в конце настоящего параграфа). С помощью элементарных алгебраических преобразований из доказанных неравенств можно получить ряд классических и важных для анализа нера- венств. Приведем их вывод. а. Неравенства Юнга1). Если а> 0 и b> Q, а числа р, q таковы, что р И 0,1, q / 0,1 и ± | = 1, то а1/* Ь1/9 - а+-Ь, если р > 1, (5) р q а^^Ь1^9 ~а+ ~Ь, если р < 1, (6) причем знак равенства в (5) и (6) имеет место только при а = Ь. Для доказательства достаточно в (3) и (4) положить х = 7 и а = -, ° Р а также ввести обозначение - = 1-. ► Q Р Ь. Неравенства Гёльдера2). Пусть Xi 0, yi 0 (г = 1, ..., п) и - 4- - = 1. Тогда Р Q П / п \1/р / n \1/« (XX) (XX) при p>i (7) »=i к»=1 / \»=i / и п / " \г/р / п \i/« У* ) при р < 1, р / 0. (8) »=1 х»=1 / \*=1 / В случае р < 0 в (8) предполагается, что Xi > 0 (г = 1, ..., п). Знак равен- ства в (7) и (8) возможен только в случае пропорциональности векторов (®1, •••,*£), (1/1, •••,!/£)• п п Проверим неравенство (7). Пусть X — ^2 ®? > 0, Y = 12 у1 > о. t=l t=l аг? Полагая в (5) а — —, Ь = —, получаем г>В. Юнг (Янг) (1882-1946) — английский математик. 2>О. Гёльдер (1859-1937) — немецкий математик.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 237 Суммируя эти неравенства по i от 1 до п, получаем п Е xiVi »=1 что эквивалентно (7). Аналогично, из (6) получаем (8). Поскольку знак равенства в (5) и (6) возможен липп» при а = Ь, заключаем, что в (7) и (8) он возможен лишь при пропорциональности хр = Xyf или у? = Ххр. ► с. Неравенства Минковского1). Пусть а;, 0, j/i > О (г = 1, ...,п). Тогда п \ 1/р Yfri + у<)р) t=i / при р > 1 (9) и п \1/р / п \ 1/р / п \1/р + yi)p) +(£Х) при р<1, р/0. (10) *=1 / \»=i / \»=1 / Применим неравенства Гёльдера к членам правой части тождества +1/*)р = ^х^ + у^р 1 + ^2yi(xi + yi)p х. *=i *=i t=i Тогда левая часть будет оценена сверху или снизу в соответствии с нера- венствами (7), (8) величиной (П \ 1/р / n \ l/q / п \ 1/р / п \ 1/д XX) (+и)”) + (ХХ) () • 1=1 / \t=l / х»=1 / \»=1 / После деления полученных неравенств на и (10). п \1/<? Е (xi + yi)pJ приходим К (9) Зная условия равенства в неравенствах Гёльдера, проверяем, что знак ра- венства в неравенствах Минковского возможен лишь в случае коллинеарности векторов (a;i,..., zn), (i/i,..., i/n). ► При п = 3 и р = 2 неравенство Минковского (9), очевидно, является нера- венством треугольника в трехмерном евклидовом пространстве. 1^Г. Минковский (1864—1909) — немецкий математик, предложивший адекватную ма- тематическую модель (пространство с индефинитной метрикой) специальной теории отно- сительности.
238 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 8. Рассмотрим еще простейший пример использования высших производных при отыскании локальных экстремумов. Пусть f(x) = sin х. По- скольку f'(x) = cos я: и /"(я:) = — sin я:, то все точки, где f(x) = совят = О, являются локальными экстремумами функции sin яг, так как в них f"(x) = = — sin х / 0. При этом /"(ят) < 0, если sin я: > 0, и f"(x) > 0, если sin я; < 0. Таким образом, точки, где cos х = 0, a sin х > 0, являются локальными мак- симумами, а точки, где совят = 0, a sinх < 0, — локальными минимумами функции sin х (что, конечно, и так известно). 3. Условия выпуклости функции Определение 1. Функция /: ]а,Ь[ -> R, определенная на интервале ]а,Ь[ С R, называется выпуклой на нем, если для любых точек ЯТ1, ятг € ]а,&[ и любых чисел ai 0, а2 0 таких, что ai + а2 = 1, имеет место неравенство /(а1ЯТ1 + агятг) ai/fci) + а2/(ятг). (11) Если при я?1 / ятг и ai • а2 0 это неравенство является строгим, то функция называется строго выпуклой на интервале ]а, Ь[. Геометрически условие (11) выпуклости функции /: ]a,b[ -> R означает (рис. 23), что точки любой дуги графика функции лежат под хордой, стягивающей эту дугу. В самом деле, в левой части (11) стоит значение f(x) функции в точке х = а1ЯТ1 + + агятг 6 [я?1,я?г], а справа — значение в той же точке линейной функции, график которой (прямая) проходит через точки (®1,№1))> {x2,f(x2)). Соотношение (11) означает, что мно- жество Е — {(х,у) 6 R2 | ят 6 ]a, Ь[, f(x) < у} точек плоскости, лежащих над графиком функции, является выпуклым, откуда и сам термин «выпуклая» функция. Определение 2. Если для функции /: ]а,Ь[ —> R в (11) имеет место обратное неравенство, то говорят, что функция вогнута на интервале ]а, или, чаще, что она выпукла вверх на этом интервале, в отличие от выпуклой функции, которую тогда называют выпуклой вниз на интервале ]а,Ь[. Поскольку все дальнейшие построения проводятся одинаково для функций, выпуклых вниз или вверх, мы ограничимся рассмотрением выпуклых (вниз) функций. Сначала придадим неравенству (11) другой вид, более приспособленный для наших целей. Из соотношений х = оцх^ + а2х2, ai 4- а2 = 1 имеем IE 2 1 Q1 ---------, a2 ---------, Х2 — Я?1 Х2 — Я?1 х, х = х^ Рис. 23
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 239 поэтому (11) можно переписать в виде №) 37 ““ *271 Х2 “ f(x2). Учитывая, что я^ х ят2 и xi < Х2, после домножения на Х2 — х\ получаем (х2 - z)/(zi) + (ЯТ1 - x2)f(x) + (х- ЯТТ )/(яТ2) 0. Замечая, что ят2 — £i = (я:2 — х) + (х — х^), из последнего неравенства после элементарных преобразований находим, что < /(*2> - f(z) X ~ Xi Х2 — х при Xi < х < Х2 и любых ЯТ1, Х2 € ]а,Ь[. Неравенство (12) является иной формой записи определения выпуклости функции f(x) на интервале ]а, Ь[. Геометрически (12) означает (см. рис. 23), что угловой коэффициент хорды Z, соединяющей точки (xi,f(xi)), (х,/(я:)), не больше (а в случае строгой выпуклости — меньше) углового коэффициента хорды II, соединяющей точки (ят,/(я;)), (x2,f(x2Y). Предположим теперь, что функция /: ]а, &[ -> R дифференцируема на ]а, Ь[. Тогда, устремляя в (12) х поочередно к я?1 ия?2, получаем /(*х) ГМ, Х2 ~ Х1 что устанавливает монотонность производной функции /. Учитывая это, для строго выпуклой функции, пользуясь теоремой Лагран- жа, находим /'(хж) 55 /'(Cl) = -W _ №1) < /(Д2) S(x} = < /'(Ж2) X Uzj Х2 X при ЯТ1 < < х < f2 < Х2, т. е. строгая выпуклость влечет строгую монотон- ность производной. Итак, если дифференцируемая функция f выпукла на интервале ]а, &[, то f не убывает на ]а, 6[, а в случае строгой выпуклости f ее производная f возрастает на ]а, Ь[. Оказывается, это не только необходимые, но и достаточные условия вы- пуклости дифференцируемой функции. В самом деле, для а < я^ < х < ят2 < b по теореме Лагранжа /(*) - fM X X j = /-(&), Х2 — X где я?! < & < х < & < Х2, и если /'(&) /'(f2), то выполнено условие (12) выпуклости (или строгой выпуклости, если /'(Ci) < /Ч^г))- Таким образом, мы доказали следующее
240 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Утверждение 5. Для того чтобы дифференцируемая на интервале ]а,Ь[ функция f: ]а, -> R была выпуклой (вниз) на ]а, &[, необходимо и до- статочно, чтобы ее производная f не убывала на ]а, Ь[. При этом строгому возрастанию f соответствует строгая выпуклость f. Сопоставляя утверждение 5 и утверждение 3, получаем Следствие. Для того чтобы функция f: ]а, —> R, имеющая на интер- вале ]а, Ь[ вторую производную, была выпуклой (вниз) на этом интервале, необходимо и достаточно, чтобы на ]а,Ь[ было f"(x) 0. Если же f"(x) > 0 ка]а,Ь[, то этого достаточно, чтобы гарантировать строгую выпуклость функции f : ]а, —> R. Теперь мы в состоянии объяснить, например, почему графики простейших элементарных функций рисуют с тем или иным характером выпуклости. Пример 9. Исследуем выпуклость функции f(x) = xQ на множестве х > 0. Поскольку f"(x) = а(а — 1)ха~2, то f"(x) > 0 при а < 0 или при а > 1, т. е. при таких значениях показателя степени а степенная функция ха строго выпукла (вниз). При 0 < а < 1 имеем f"(x) < 0, поэтому для таких показателей степени она строго выпукла вверх. Например, параболу f(x) = я;2 мы всегда рисуем выпуклой вниз. Оставшиеся случаи а = 0 и а = 1 тривиальны: я:0 = 1, я:1 =-,х. И в том и в другом случае графиком функции является луч (см. рис. 30 на с. 247). Пример 10. Пусть f(x) = ах, 0 < а, а 0 1. Поскольку f"(x) = ах In2 а > > 0, показательная функция ах при любом допустимом основании а строго выпукла (вниз) на R (см. рис. 24 на с. 247). Пример 11. Для функции f(x) = logoх имеем f"(x) = — * ~, поэтому функция строго выпукла (вниз), если 0 < а < 1, и строго выпукла вверх, если 1 < а (см. рис. 25 на с. 247). Пример 12. Исследуем выпуклость функции f(x) = sin я: (см. рис. 26 на с. 247). Поскольку f"(x) = — sin я:, то f”(x) < 0 на интервалах л-2к < х < тг(2£ +1) и f"(x) > 0 на интервалах тг(2А: — 1) < х < тг • 2к, где к 6 Z. Отсюда, например, следует, что дуга графика функции sin я: на отрезке 0 х J лежит над 2 . .2 стягивающей ее хордой всюду, кроме концевых точек; поэтому sin я: > —х _ 7Г < я: < —. Ai Укажем теперь еще одну характеристику выпуклой функции, геометриче- ски эквивалентную тому, что выпуклая область на плоскости лежит по одну сторону от касательной к ее границе. Утверждение 6. Дифференцируемая на интервале ]а, Ь[ функция f: ]а, Ь[ —> 1R выпукла (вниз) на ]а, Ь[ тогда и только тогда, когда ее график всеми своими точками лежит не ниже любой проведенной к нему касатель- ной. При этом для строгой выпуклости функции необходимо и достаточно,
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 241 чтобы все точки графика, за исключением самой точки касания, лежали строго выше этой касательной. ◄ Необходимость. Пусть ято € ]а,Ь[. Уравнение касательной к графи- ку в точке (яо,/(яо)) имеет вид У = fM + - Xq), поэтому /(*) - у(х) = f(x) - f(x0) - f'(x0)(x - ЯТо) = (/'(С - - ®о), где £ — точка между х и ято- Так как f выпукла, то функция f'(x) не убывает на ]а, Ь[ и знак разности /'(£) — /'(гго) совпадает со знаком разности х — ято, поэтому f(x) — у(х) 0 в любой точке х € ]«,&[. Если f строго выпукла, то f строго возрастает на ]а, &[ и, значит, f(x) — у(х) > 0 при х 6 ]а, Ь[ и х xq. Достаточность. Если для любых точек х, xq € ]а,Ь[ f(x) - у(х) = f(x) - f(xQ) - f(x0)(x - я?0) 0, (13) то f(x) - /Ы ^ /// ч ——---------f (хо) при X < Хо, X — Хо f(x) - f(x0) , . j при < я** X Я?о Таким образом, для любой тройки точек :ci, х, х2 € ]а, Ь[ такой, что ятх < < х < х2, получаем /(д) -/(arj < f(x2) - f(x) X — Xi х2 — х ’ причем строгое неравенство в (13) влечет строгое неравенство в последнем соотношении, которое, как мы видим, совпадает с записью (12) определения выпуклой функции. ► Рассмотрим примеры. Пример 13. Функция f(x) = ех строго выпукла. Прямая у = х 4- 1 является касательной к графику этой функции в точке (0,1), так как /(0) = = е° = 1 и /'(0) = еж|а;=о = 1. В силу утверждения 6 заключаем, что для любого х € R ех > 1 + х, причем если х 0 0, то неравенство строгое. Пример 14. Аналогично, пользуясь строгой выпуклостью вверх функ- ции In х, можно проверить, что при х > 0 справедливо неравенство In х х — 1, причем это неравенство является строгим, если х / 1.
242 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ При построении графиков функций бывает полезно выделять точки пере- гиба графика. Определение 3. Пусть f : U(xq) -> R — функция, определенная и дифференцируемая в окрестности U(xq) точки хо € R. Если на множестве С7_(ято) = {я; е U(xq) | х < я?о} функция выпукла вниз (вверх), а на множе- стве (7+(я:о) = {х Е U(xq) |я: > ято} выпукла вверх (вниз), то точка (xo,f(xo)) графика называется его точкой перегиба. Таким образом, при переходе через точку перегиба меняется направление выпуклости графика, а это, в частности, означает, что в точке (xo,f(xo)) график функции переходит с одной стороны касательной к нему в этой точке на другую ее сторону. Аналитический признак абсциссы ято точки перегиба легко усмотреть, со- поставляя утверждение 5 и утверждение 3. А именно, можно сказать, что если f дважды дифференцируема в точке ято, то, поскольку f'(x) в точке ято имеет максимум или минимум, необходимо fN(xo) = 0. Если же вторая производная /"(ят) определена в U(xq) и всюду в U~(xq) О имеет один знак, а всюду в ?7+(я?о) — противоположный знак, то этого до- статочно для того, чтобы Г(х) в U~(xq) и в U+(xq) была монотонна, но имела разный характер монотонности. Тогда в силу утверждения 5 в точ- ке (xo,f(xo)) произойдет изменение направления выпуклости графика, т. е. (я?о,/(я?о)) будет точкой перегиба. Пример 15. В примере 12, рассматривая функцию f(x) = sin я:, мы нашли участки выпуклости и вогнутости ее графика. Покажем теперь, что точки графика с абсциссами х — як, k G Z, являются точками перегиба. Действительно, f”(x) = — sin о;; f"(x) = 0 при х = тгк, к 6 Z. Кроме того, при переходе через эти точки f"(x) меняет знак, что является достаточным признаком точки перегиба (см. рис. 26 на с. 247). Пример 16. Не следует думать, что переход кривой с одной стороны касательной на другую ее сторону в некоторой точке является достаточным признаком того, что эта точка является точкой перегиба. Ведь может так случиться, что ни в левой, ни в правой ее окрестности кривая не сохраняет определенный характер выпуклости. Пример легко построить, усовершен- ствовав пример 5, приведенный по схожему поводу. Пусть {2ж3 + х3 sin Дт при х / 0, 0 при х = 0. Тогда я;3 f{x) Зят3 при 0 х и Зя;3 /(я;) я;3 при х 0, поэто- му график этой функции касается оси абсцисс в точке х = 0 и переходит в этой точке из нижней полуплоскости в верхнюю. В то же время производная
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 243 функции /(я:): {бя:2 4- Зя:2 sin — 2 cos -Д- при х ± О, х х О при х = О, не монотонна ни в какой полуокрестности точки х = 0. В заключение вновь вернемся к определению (11) выпуклой функции и до- кажем следующее Утверждение 7 (неравенство Йенсена1)). Если /: ]а,Ь[ -> R — вы- пуклая функция, ЯТ1, ..., хп — точки интервала ]а, Ь[, ai, ..., ап — неотри- цательные числа такие, что оц + ... + ап = 1, то справедливо неравенство f(aiXi 4-... 4- апхп) aif(xi) + ...+ anf(xn). (14) ◄ При п = 2 условие (14) совпадает с определением (11) выпуклой функции. Покажем, что если (14) справедливо для n = т — 1, то оно справедливо и для п = т. Пусть, для определенности, в наборе ai, ..., ап имеем ап / 0. Тогда /3 = с*2 + • • • + с*п > 0 и 4-... 4- = 1. Используя выпуклость функции, находим /(ai2:i 4- ... 4- апхп) = f(aiX! + ^(~ТХ2 + ... + X X М М / / < + ... + ^хп\ X г"* Г"* / (а2 <*n \ 1 1 г — х2 4-... 4- — хп j € ]а, о[. Далее, по предположению индукции f\^p~x2 + ‘ - + —xnj -^- f{x2) 4-... 4- Следовательно, < ai/^i) 4- a2f(x2) 4-... 4- anf(xn). В силу принципа индукции заключаем, что (14) верно для любого п 6 N. (Для п = 1 (14) тривиально.) ► г)И. Л. Йенсен (1859—1925) — датский математик. 9 Зорич В. А.
244 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Заметим, что, как видно из доказательства, строгой выпуклости отвечает строгое неравенство Йенсена, т. е. если среди чисел ai, ..., ап по крайней мере два отличны от нуля, то знак равенства в (14) может иметь место тогда и только тогда, когда xi = ... = хп- Для функции, выпуклой вверх, разумеется, получается обратное по отно- шению к неравенству (14) неравенство /(«i^i + ... + апхп) otif(xi) + ...+ anf(xn). (15) Пример 17. Функция f(x) = In а; строго выпукла вверх на множестве положительных чисел, поэтому в силу (15) ailnzi + ... + ап1па;п ln(aiari + ... + апхп) или ®1 1 • “Ь • • • “Ь <%п%п (16) п при Хг 0, ai 0 (г = 1, ..., п) и = 1. г=1 г> 1 В частности, если ai = ... = ап = —, получаем классическое неравенство а?! + ... + атп п (17) между средним геометрическим и средним арифметическим п неотрицатель- ных чисел. Знак равенства в (17) возможен, как отмечалось выше, только при ЯТ1 = Х2 = • •. = хп. Если же в (16) положить п = 2, = -, «2 = ^1 = а, Р Q X2 = Ъ, то вновь получим уже известное нам неравенство (5). Пример 18. Пусть f(x) = хр, х 0, р > 1. Поскольку такая функция выпукла, имеем Полагая здесь q = ai = Ь* ( £ ЬЧЛ , Xi = 1/(р’ > £ 6?, вновь Р 1 \i=l / i=l получаем неравенство (7) Гёльдера 1.1 1 где " + Z = 1 и Р > 1- Р Q При р < 1 функция f(x) = хр выпукла вверх, поэтому аналогичными рас- суждениями можно получить и другое неравенство (8) Гёльдера.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 245 4. Правило Лопиталя. Остановимся теперь на одном частном, но ино- гда полезном приеме отыскания предела отношения функций, известном как правило Лопиталя1). Утверждение 8 (правило Лопиталя). Пусть функции f : ]а,—> Ж и д : ]а,Ь[ —> К дифференцируемы на интервале ]а, Ь[ (—оо а < b +оо), причем д'(х) ^0 на ]а, Ь[ и f'(x) . -> А при х -> а + 0 (—оо А +оо). 9 Ах) Тогда в каждом из двух следующих случаев: 1° -> 0) А (д(х) —> 0) при х -А а + О или 2° д(х) —> оо при х -> а 4- О будет f(x) —> А при х —> а -|- 0. Аналогичное утверждение справедливо и при х —> b — 0. Коротко, но не вполне точно правило Лопиталя формулируют так: предел отношения функций равен пределу отношения их производных, если послед- ний существует. ◄ Если д'(х) 0, то на основании теоремы Ролля заключаем, что д{х} строго монотонна на ]а, Ь[. Значит, уменьшив, если нужно, промежуток ]а, за счет сдвига в сторону конца а, можно считать, что д{х} 0 на ]а, Ь[. Для х, у G ]а, Ь[ по теореме Коши найдется точка £ 6 ]а, &[ такая, что /м - /(у) _ /че) - д(у) д'(() ’ Перепишем это равенство в удобном для нас сейчас виде №) = №) , m Л _ 9(у) ч д(х) д(х) д'(£) \ g(x)J При х а 4- 0 согласованно с изменением х будем стремить у к а 4- 0 так, чтобы при этом 1)Г. Ф. де Лопиталь (1661—1704) — французский математик, способный ученик Ио- ганна Бернулли, маркиз, для’которого последний в 1691 — 1692 гг. написал первый учебник анализа. Часть этого учебника, посвященная дифференциальному исчислению, в слегка из- мененном виде была опубликована Лопиталем под своим именем. Таким образом, «правилом Лопиталя» мы обязаны Иоганну Бернулли.
246 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В любом из данных нам двух вариантов 1° и 2° это, очевидно, можно сделать. Так как £ лежит между х и у, то вместе с х и у также £ —> а + 0. Значит, правая, а следовательно, и левая часть последнего равенства при этом стре- мятся к А. ► „ sins .. cos® 1 Пример 19. hm---------= hm —-— = 1. х—>0 X х—>0 1 Этот пример не следует рассматривать как новое, независимое доказатель- ство того, что —> 1 при х -> 0. Дело в том, что, например, при выводе X соотношения sin'® = cos ® мы уже использовали вычисленный здесь предел. В возможности применения правила Лопиталя всегда убеждаемся только после того, как найдем предел отношения производных. При этом не следует забывать о проверке условий 1° или 2°. Важность этих условий показывает следующий Пример 20. Пусть /(®) = cos®, д(х) = sin®. Тогда /'(®) = —sin®, f'(x) д'(х) = cos® и i-T-- -> +оо при ® +0, в то время как ' -> 0 при ® -> +0. 9W 9'(х) Пример 21. /1\ lim = lim ———г = lim —— = 0 при а > 0. х—>4-оо ха х—>+оо OtXa 1 х—>4-оо OtXa Пример 22. ха~п при а > 1, ибо при п > а и а > 1, очевидно,---> 0, если ® —> +оо. ах и Заметим, что вся цепочка последних равенств носила условный характер до тех пор, пока мы не пришли к выражению, предел которого смогли найти. 5. Построение графика функции. Для наглядного описания функции очень часто используют ее графическое представление. Как правило, такое представление бывает полезно для обсуждения качественных вопросов пове- дения исследуемой функции. Для точных расчетов графики используются реже. В связи с этим прак- тически важным оказывается не столько скрупулезное воспроизведение функ- ции в виде графика, сколько построение эскиза графика функции, правильно отражающего основные элементы ее поведения. Некоторые общие приемы, встречающиеся при построении эскизов графиков функций, мы и рассмотрим в этом пункте. а. Графики элементарных функций. Напомним прежде всего, как выглядят графики основных элементарных функций, свободное владение ко- торыми необходимо для дальнейшего (рис. 24—30).
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 247 Рис. 24 Рис. 25 Рис. 26 Рис. 27 Рис. 28 Рис. 29 Рис. 30
248 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ь. Примеры построения эскизов графиков функций (без привле- чения дифференциального исчисления). Рассмотрим теперь некоторые примеры, в которых эскиз графика функции может быть легко построен, если нам известны графики и свойства простейших элементарных функций. Пример 23. Построим эскиз графика функции У = 1°ёз;2—За:+2 2. Учитывая, что п 1 _ 1 У - log^-3z+22 - 1о&(а;2 _ Зх + 2) - log2(s _ 1)(а. _ 2) ’ строим последовательно график квадратного трехчлена yi = х2 — За;+ 2, затем У2 = log2 У1(х) и затем у = —(рис. 31). У2\х) «Угадать» такой вид графика можно было бы и иначе: выяснить область определения функции loga.2_3a._1_2 2 = (log2(a;2 — За; + 2))-1, найти поведение функции при приближении к граничным точкам области определения и на промежутках, концы которых являются граничными точками области опреде- ления, нарисовать «плавную кривую» с учетом найденного поведения функции у концов промежутка. Рис. 31
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 249 Пример 24. Построение эскиза графика функции • 2 у — Sin X видно из рис. 32. Мы построили этот график по некоторым характерным для данной функ- ции точкам — тем точкам, где sin я2 = —1, sin я2 = 0 или sin я2 = 1. Между двумя соседними точками такого типа функ- ция монотонна. Вид графика в окрестности точки х = 0, у = 0 определяется тем, что sin я2 ~ х2 при х —> 0. Кроме того, полезно заметить, что данная функция четна. Поскольку мы все время будем говорить только об эскизном, а не точном построении графика функции, то условимся ради крат- кости в дальнейшем считать, что требова- ние «построить график функции» для нас все- гда будет равносильно требованию «постро- ить эскиз графика функции». Пример 25. Построим график функ- ции у = х + arctg (х3 — 1) (рис. 33). При х —> — оо график хорошо при- ближается прямой у = х — —, а при х —> —> +оо — прямой у = х + —. Введем следующее полезное Определение 4. Прямая у = со + cix называется асимптотой графика функции у = /(ж) при х —> —оо (при х —> +оо), если f(x) — (со + cix) — о(1) при х —> —оо (при х —> +оо). Таким образом, в нашем случае при х —> —> — оо график имеет асимптоту у = х — —, к. 1^2 а при х —> +оо — асимптоту у = х + —. Если при х —> а — 0 (или при х —> а + 0) |У(я)| —> оо, то ясно, что график функции в этом случае будет по мере приближения х к а все теснее примыкать к вертикальной прямой х = а. Эту прямую называют вертикальной асимптотой графика, в отличие от введенной в определении 4 асимптоты, которая всегда наклонна. Так, график из примера 23 (см. рис. 31) имеет две вертикальные асимпто- ты и горизонтальную асимптоту (общую для х —> — оо и х —> +оо). Рис. 33
250 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Из определения 4, очевидно, вытекает, что С1= lim I-+-OO X Со = lim (/(а;) - С1,х). И вообще, если f(x) — (со + ci.r + ... + спхп) = о(1) при х —> —оо, то Нт №1, — ► — оо Хп fix') - спхп hm —------------, — оо Хп 1 Со = lim (/(ж) - fax + ... + СпХп)). X—► — оо Эти соотношения, выписанные нами для случая х —> — оо, разумеется, спра- ведливы также в случае х —> +оо и могут быть использованы для описания асимптотического поведения графика функции f(x) с помощью графика со- ответствующего алгебраического полинома со + cix + ... 4- СпХп. Пример 26. Пусть (р, <р) — полярные координаты на плоскости, и пусть точка движется по плоскости так, что в момент времени t (t 0) р = p(t) = 1 — е-< cos f, < р ~ <p(t) = 1 — e-f sin t. At Требуется нарисовать траекторию точки. Нарисуем для этого сначала графики функций р{€) и <p(t) (рис. 34а, 34&). 1 2 3 t Ъ Рис. 34 Теперь, глядя одновременно на оба построенных графика, можем нарисо- вать общий вид траектории точки (рис. 34с).
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 251 с. Использование дифференциального исчисления при построе- нии графика функции. Как мы видели, графики многих функций можно в общих чертах нарисовать, не выходя за пределы самых простых соображе- ний. Однако если мы желаем уточнить эскиз, то в случае, когда производная исследуемой функции не слишком сложная, можно привлечь аппарат диффе- ренциального исчисления. Продемонстрируем это на примерах. Пример 27. Построить график функции у = f(x) в случае у = |ат + 2| е-1/®. Функция f(x) определена при х 6 К \ 0. Поскольку е-1/1 —> 1 при х —> оо, то — (х + 2) (х + 2) |х 4- 2| е ~ < при х —> —оо, при х —> 4-оо. Далее, при х —> —0, очевидно, имеем |ге 4- 2|е 1/1 —> Ч-оо, а при х —> +0 |гг + 2| е-1/1 —> +0. Наконец, видно, что f(x) 0 и /(-2) = 0. На основании этих наблюдений уже можно сделать первый набросок графика (рис. 35 а). Выясним теперь основательно, действительно ли данная функция монотон- на на промежутках ]—оо, —2], [—2,0[, ]0, Ч-оо[, действительно ли она имеет указанные асимптоты и правильно ли изображен характер выпуклости гра- фика функции. Поскольку х2 + х + 2 —1/х . о --------------х---е L/x, если х < —2, f(x) = 2 х ——-у—— в-1/*, если — 2 < а: и х О, и f'(x) / 0, то можно составить следующую таблицу: Промежуток ]-оо,-2[ ]-2,0[ ]0,4-оо[ Знак f'(x) — + 4- Поведение f(x) Ч-оо \ 0 0 /* Ч-оо 0 /* 4-оо
252 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ На участках постоянства знака производной функция, как мы знаем, имеет соответствующий характер монотонности. В нижней строке таблицы символ +оо \ 0 означает монотонное убывание от +оо до 0, а символ 0 +оо — монотонное возрастание значений функции от 0 до +оо. Заметим, что f'(x) —> — 4е-1/2 при х —> — 2 — 0 и /'(я) —> 4е-1/2 при х —> —> —2 + 0, поэтому точка (—2,0) должна быть угловой точкой графика (излом типа излома у графика функции |ж|), а не обычной точкой, как это у нас изо- бражено на рис. 35 а. Далее, f'(x) —> 0 при х —> + 0, поэтому график должен выходить из начала координат, касаясь оси абсцисс (вспомните геометриче- ский смысл /'(я;)!). Уточним теперь асимптотику функции при х —> — оо и х —>+оо. Поскольку е-1/1 = 1 — х~г + о(гг-1) при х —> оо, то |гг + 2| е ~ ' —х — 1 + о(1) < k х + 1 + о(1) при х —> —оо, при х —> +оо, значит, на самом деле наклонные асимптоты графика суть у = —х — 1 при х —> —оо и у = х + 1 при х —> 4-оо. По этим данным уже можно построить достаточно надежный эскиз гра- фика, но мы пойдем дальше и, вычислив /"(г) = 4 - ОЖ _цх п -----т— е 1/1, если х < —2, х* ---j— е-1/®, если — 2 < х и х О, найдем участки выпуклости графика. Поскольку f"(x) = 0 лишь при х = 2/3, то имеем следующую таблицу: Промежуток ]-оо,-2[ ]-2,0[ ]0,2/3[ ]2/3,+оо[ Знак f'(x) — 4- + — Выпуклость /(ж) Вверх Вниз Вниз Вверх Поскольку при х = 2/3 наша функция дифференцируема, а при переходе через эту точку /"(я) меняет знак, то точка (2/3,/(2/3)) является точкой перегиба графика. Между прочим, если бы производная /'(я) обращалась в нуль, то из табли- цы знаков /'(я) можно было бы судить о наличии или отсутствии экстремума в соответствующей точке. В нашем случае /'(я) нигде не обращается в нуль, но в точке х = — 2 функция имеет локальный минимум: она непрерывна в этой точке и при переходе через нее f'(x) меняет знак с — на +. Впрочем, то, что при х = — 2 наша функция имеет минимум, видно уже из приведенного в таблице описания изменения значений функции /(я) на соответствующих промежутках, если, конечно, учесть еще, что /(—2) = 0.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 253 Теперь можно нарисовать более точный эскиз графика данной функции (см. рис. 35&). В заключение рассмотрим еще один Пример 28. Пусть (ж, у) — декартовы координаты на плоскости, и пусть движущаяся точка в каждый момент t (i 0) имеет координаты t t — 2t3 х ~ 1 -t2 ’ у~ 1 -12 Требуется изобразить траекторию движения точки. Нарисуем сначала эскизы графиков каждой из данных координатных функций х = x(t) и у = y(t) (рис. 36а, 36&). Рис. 36
254 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Второй из этих графиков несколько интереснее, поэтому поясним его по- строение. Поведение функции у = y(t) при t —>4-0, t -4 1-0, t —> 1 + 0 и асим- птотику y(t) = 2t + о(1) при t —> Ч-оо усматриваем непосредственно из вида аналитического выражения для y(t). Вычислив производную .... _ 1 — 5t2 + 2t4 (1 -t2)2 ’ находим ее нули: ti « 0,5 и £2 ~ 1,5 в области t 0. Составив таблицу: Промежуток 10,ti[ ]t2)4-oo[ Знак y{t) 4- — — 4- Поведение y(t) 0 / »(«•) у(М \ -оо 4-oo \ y{t2) S/(*2) / +00 находим участки монотонности и локальные экстремумы y(ti) « | (max) и 2/(f2) ~ 4 (min). Теперь, глядя одновременно на оба графика х = x(t) и у = y(t), строим эскиз траектории движения точки по плоскости (см. рис. 36с). Этот эскиз можно уточнять. Например, можно выяснить асимптотику траектории. Поскольку lim = —1 и lim (y(t) 4- x(t)) = 2, то прямая у = —х 4- 2 является асимптотой для обоих концов траектории, отвечающих стремлению t к 1. Ясно также, что прямая х = 0 есть вертикальная асимптота для участ- ка траектории, отвечающего t —> 4-оо. Найдем далее , _ lit _ 1 - 5t2 + 2t4 Vx it 1 +12 ’ 1 —5u4-2u2 , - Функция-----------, как легко выяснить, монотонно убывает от 1 до —1 1 4- и при возрастании и от 0 до 1 и возрастает от —1 до 4-оо при возрастании и от 1 до 4-оо. Из характера монотонности у'х можно сделать заключение о характере вы- пуклости траектории на соответствующем участке. С учетом сказанного те- перь можно построить следующий, более точный эскиз траектории движения точки (см. рис. 36d). Если бы мы рассматривали траекторию также для t < 0, то, как следует из нечетности функций z(t), у(<), к Уже построенным на плоскости (я, у) линиям добавились бы еще центрально симметричные им кривые.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 255 Подведем некоторые итоги в виде самых общих рекомендаций относитель- но порядка построения графика заданной аналитически функции. Вот эти рекомендации. 1° Указать область определения функции. 2° Отметить специфические особенности функции, если они очевидны (например, четность, нечетность, периодичность, совпадение с точностью до простейших преобразований координат с графиками уже известных функ- ций). 3° Выяснить асимптотическое поведение функции при подходе к гранич- ным точкам области определения и, в частности, найти асимптоты, если они существуют. 4° Найти промежутки монотонности функции и указать ее локальные экс- тремумы. 5° Уточнить характер выпуклости графика и указать точки перегиба. 6° Отметить характерные точки графика, в частности точки пересечения с осями координат, если таковые имеются и доступны вычислению. Задачи и упражнения 1. Пусть х — (т1, ..., хп), а — («1,..., ап), причем Xi 0, а; > 0 при i = 1, ..., п п я 52 °ч — 1- любого числа t / 0 рассмотрим среднее порядка t чисел xi, ..., хп «=1 с весами а»: (п \ 1/t ) г=1 / В частности, при ац = ... = ап = ± и t = —1,1,2 получаем соответственно среднее гармоническое, среднее арифметическое и среднее квадратическое. Покажите, что a) lim Mt(x,a) = 1... т. е. в пределе можно получить среднее геометри- ческое; b) lim Mt(x, а) = max хг. t->+oo l^i^n c) lim Mt(x,a)= min a;,; t—> —oo d) Mt (z, a) — неубывающая функция от t на Rv причем она строго возрастает, если п > 1 и все числа т, отличны от нуля. 2. Покажите, что |1 + z|p 1 + рх + Ср<рр(х), где ср — постоянная, зависящая только от р, а ( |т|2 при |т| 1, 4>р\х) — < если 1 < р 2, I |т|р при |т| > 1, и у>р(х) — |z|₽ на R, если 2 < р.
256 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 3. Проверьте, что cosx < | При 0 < Ы < 4. Исследуйте функцию f(x) и постройте ее график, если a) f(x) — arctg log2 cos (тгя 4- b) f(x) — arccos — sinaj); c) f(x) = y/x(x 4- 3)2. d) Постройте кривую, заданную в полярных координатах уравнением <р = *, р 0, и укажите ее асимптоту. е) Укажите, как, зная график функции у = f(x), получить графики функций f(x) + B; Af(x); f(x + b)-, f(ax) и, в частности, —f(x) и /(—х). 5. Покажите, что если f G С(]а,Ь[) и для любых точек Xi,X2 € ]а,Ь[ выполнено неравенство у (xi +Ж2) < f(xi)+f(x2) то функция f выпуклая на ]а,Ь[. 6. Покажите, что: а) Если выпуклая функция f: R —> R ограничена, то она постоянна. Ь) Если для выпуклой функции f: R —> R lim = lim = 0, x—oo x x—>4-oo X to f — постоянная. с) Для любой выпуклой функции /, определенной на промежутке а < х < +оо ( \ Лх) « (или —оо < х < а), отношение ——- стремится к конечному пределу или к бесконеч- х ности при стремлении х к бесконечности по области определения функции. 7. Покажите, что если f: ]а, Ь[ —> R — выпуклая функция, то а) в любой точке х € ]а,Ь[ она имеет левую /1 и правую производные: /(») = ton причем fL(x) f+ (s); Ь) при a?i, х2 € ]а,Ь[ и a?i < Х2 имеет место неравенство f+(xi) f'_(яг); с) множество угловых точек графика f(x) (для которых fL(x) / f+(x)) не более чем счетно. 8. Преобразованием Лежандра1^ функции /: I —> R, определенной в промежутке I с R, называется функция /*(t) =sup(t® -/(®)). ПА. М. Лежандр (1752—1833) — известный французский математик.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 257 Покажите, что: а) Множество 7* тех значений t € R, для которых /*(£) 6 R (т. е. f*(t) оо), либо пусто, либо состоит из одной точки, либо является числовым промежутком, причем в последнем случае функция f*(t) выпукла на /*. Ь) Если f — выпуклая функция, то I* 0 и при /* 6 С{1*) (/’)*(«) = sup (st - /*(t)) = f(x) , tei* для любого x 6 I. Таким образом, преобразование Лежандра выпуклой функции инволютивно (квадрат его есть тождественное преобразование). с) Имеет место неравенство st /(s) 4- f*(t) при х Е. I и tel*. d) В случае, когда f — выпуклая дифференцируемая функция, /*(t) = tst —/(st), где xt определяется из уравнения t = /'(s); получите отсюда геометрическую ин- терпретацию преобразования Лежандра /* и его аргумента t, показывающую, что преобразование Лежандра есть функция, определенная на множестве касательных к графику функции f. е) Преобразованием Лежандра функции /(s) = — ха при а > 1 и s О является функция /*(t) = jjt0, где t > знакомое неравенство Юнга О и —F- — = 1; получите отсюда, с учетом с), уже < х 1 ot.l в xt < — S + —X. а (3 f) Преобразованием Лежандра функции /(s) = ех является функция /*(t) = = t In t > 0, и справедливо неравенство xt ех 4-1 In - е при х € R и t > 0. 9. Кривизна, радиус и центр кривизны кривой в точке. Пусть некоторая точка движется в плоскости по закону, задаваемому парой дважды дифференцируемых координатных функций x = s(t), у = j/(t) от времени. При этом она описывает некоторую кривую, про которую говорят, что кривая задана в параметрическом виде х = s(t), у = y(t). Частным случаем такого задания является случай графика функции у — f(x), где можно считать, что x = t и у = /(t). Мы хотим указать число, характеризующее кривизну кривой в некоторой точке, подобно тому как ве- личина, обратная радиусу окружности, может служить показателем искривленности окружности. Этим сравнением мы и воспользуемся. а) Найдите тангенциальную at и нормальную ап составляющие вектора а = = (s(t), y(t)) ускорения точки, т. е. представьте а в виде суммы at 4- ап, где вектор at коллинеарен вектору v(t) = (x(t),y(t)) скорости, т. е. направлен по касательной к траектории, а вектор ап направлен по нормали к траектории. Ь) Покажите, что при движении по окружности радиуса г имеет место соотно- шение г |у(<)1 |а»(«)Г
258 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ с) При движении по любой кривой, учитывая Ь), величину г(е)=Ж естественно назвать радиусом кривизны кривой в точке (a?(t), y(t)). Покажите, что радиус кривизны вычисляется по формуле d) Величину, обратную радиусу кривизны, называют абсолютной кривизной плоской кривой в данной точке (я(<), j/(t)). Наряду с абсолютной кривизной рас- сматривается величина k(t) = ху - ху (i2 4- й2)3/2 ’ называемая кривизной. Покажите, что знак кривизны характеризует направление поворота кривой по отношению к касательной. Выясните, какова размерность кривизны. е) Покажите, что кривизну графика функции у = f(x) в точке (х, /(х)) можно вычислить по формуле у"(х [1+<1/-)2]3/2 Сопоставьте знаки к(х) и у"(х) с направлением выпуклости графика. f) Подберите константы а, 6, R так, чтобы окружность (х — а)2 4- (у — 6)2 = R2 имела с данной параметрически заданной кривой х = x(t), у = y(t) в точке то = = x(io), уо = у(1о) касание возможно более высокого порядка. Предполагается, что x(t)y y(t) дважды дифференцируемы и (i(t0), Й(*о)) # (0,0). Указанная окружность называется соприкасающейся окружностью кривой в точке (а?о, 2/о) - Ее центр называется центром кривизны кривой в точке (яо, Уо)- Про- верьте, что ее радиус совпадает с определенным в Ь) радиусом кривизны кривой в этой точке. g) Частица без предварительного разгона под действием силы тяжести начинает скатываться с вершины ледяной горки параболического профиля. Уравнение про- филя х 4- у2 = 1, где х 0, у 0. Рассчитайте траекторию движения частицы до ее приземления. § 5. Комплексные числа и взаимосвязь элементарных функций 1. Комплексные числа. Подобно тому, как в области Q рациональных чисел алгебраическое уравнение х2 = 2 не имело решений, уравнение х2 = — 1 не имеет решений в области действительных чисел R, и подобно тому, как, вводя внешний по отношению к Q символ \/2 в качестве решения уравнения х2 = 2, мы увязываем его с операциями в Q и получаем новые числа вида ri 4- гг, где ri, гг G Q, можно ввести символ i в качестве решения уравнения х2 = — 1 и связать это внешнее по отношению к R число i с действительными числами и арифметическими операциями в R.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 259 Замечательной особенностью указанного расширения поля R действитель- ных чисел, кроме многого другого, является то, что в получающемся при этом поле С комплексных чисел уже любое алгебраическое уравнение с дей- ствительными или комплексными коэффициентами будет иметь решение. Реализуем теперь намеченную программу. а. Алгебраическое расширение поля R. Итак, вводим (следуя обо- значению Эйлера) новое число i — мнимую единицу, такое, что г2 = —1. Взаимодействие г с действительными числами должно состоять в том, что можно умножать г на числа у 6 К, т. е. необходимо появляются числа вида гу, и складывать такие числа с вещественными, т. е. появляются числа вида х -I- гу, где х, у G К. Если мы хотим, чтобы на множестве объектов вида х -I- iy, которые мы вслед за Гауссом назовем комплексными числами, были определены привычные операции коммутативного сложения и коммутативного умножения, дистрибу- тивного относительно сложения, то необходимо положить по определению, что (zi + г^1) + (х2 -I- iy2) := (m -I- х2) + i(yi + у2) (1) и (zi -I- iyi) • (x2 -I- iy2) := (xix2 - У1У2) +i(x1y2 -I- x2уг). (2) Два комплексных числа xi +iyi, x2 +iy2 считаются равными в том и только в том случае, когда х\ = х2 и yi = у2. Отождествим числа х 6 R с числами вида гг Ч- г - 0, а г — с числом О -I- г • 1. Роль нуля в множестве комплексных чисел, как видно из (1), играет число О + г- О = Ое1К, роль единицы, как видно из (2), — число 1 -I- г • 0 = 1 € R. Из свойств вещественных чисел и определений (1), (2) следует, что множе- ство комплексных чисел является полем, содержащим R в качестве подполя. Поле комплексных чисел будем обозначать символом С, а его элементы — чаще всего буквами z и w. Единственный не очевидный момент в утверждении о том, что С — поле, который нуждается в проверке, состоит в том, что любое отличное от нуля комплексное число z = x + iy имеет обратное z-1 по отношению к умножению, т. е. z • z-1 = 1. Проверим это. Число х — гу назовем сопряженным к числу z = х + iy и обозначим симво- лом z. Заметим, что z • z = (х2 + у2) + г • 0 = х2 + у2 О, если z 0. Таким -1 1 - X у образом, в качестве z 1 следует взять —---- • z = -=-г — г ». ж2 + у2 X2 + у2 X2 + у2 Ь. Геометрическая интерпретация поля С. Заметим, что после то- го, как алгебраические операции (1), (2) над комплексными числами введены, символ i, который привел нас к этим определениям, перестает быть необхо- димым.
260 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Комплексное число z — х + iy мы можем отождествить с упорядоченной парой (х, у) действительных чисел, называемых соответственно действитель- ной частью и мнимой частью комплексного числа z (обозначения: х = Rez, у — Imz1^). Но тогда, считая пару (х, у) декартовыми координатами точки плоскости R2 = Rx R, можно отождествить комплексные числа с точками этой плоскости или с двумерными векторами с координатами (х, у). В такой векторной интерпретации покоординатное сложение (1) комплекс- ных чисел соответствует правилу сложения векторов. Кроме того, такая ин- терпретация естественно приводит также к понятию модуля |z| комплексного числа z как модуля или длины соответствующего ему вектора (я, у), т. е. |z| = \Jx2 4- j/2, если z = х 4- iy, (3) а также к способу измерения расстояния между комплексными числами zi, z2 как расстояния между соответствующими им точками плоскости, т. е. с помощью величины 1*1 - 22| = у/(х! - х2)2 4- (У1 - 1/2)2. (4) Множество комплексных чисел, интерпретируемое как множество точек плоскости, называется комплексной плоскостью и также обозначается сим- волом С, подобно тому, как множество вещественных чисел и числовая прямая обозначаются одним символом R. Поскольку точку плоскости можно задать также полярными координатами (г, <р), связанными с декартовыми координатами формулами перехода х = г cos <р, . (5) у = г sm <р, комплексное число z = х 4- iy (6) можно также представить в виде z = г (cos 4- г sin 9?). (7) Записи (6) и (7) называют соответственно алгебраической и тригономе- трической формами комплексного числа. В записи (7) число г 0 называется модулем комплексного числа z (ибо, как видно из(5),г = |г|), а9? — аргументом числа z. Аргумент имеет смысл только при z 0. В силу периодичности функций cos ip и sin 9? аргумент ком- плексного числа определен с точностью до величины, кратной 2тг, и символом Argz обозначают множество углов вида 9?4-2тг&, k G Z, где <р — какой-то угол, удовлетворяющий соотношению (7). Если желают, чтобы комплексное число От лат. realis (вещественный) и imaginarius (мнимый).
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 261 однозначно определяло некоторый угол <р G Arg z, то договариваются заранее о диапазоне, в котором его выбирают. Чаще всего это бывает полуинтервал О <р < 2тг или полуинтервал — тг < тг. Если такой выбор сделан, то гово- рят, что выбрана ветвь (или главная ветвь) аргумента. Значения аргумента в пределах выбранного диапазона обычно обозначают символом argz. Тригонометрическая форма (7) записи комплексных чисел удобна при вы- полнении операции умножения комплексных чисел. В самом деле, если zi = ri(cos9?i + isin<£>i), 22 = r2 (cos <p2 ’+ i sin <p2), TO 21-22 = (ri COS(£>1 +1Г1 sin9?i)(r2 COS (£2 + ir2 sin <p2) = = (Г1Г2 cos </?i cos <p2 — Г1Г2 sin sin ip2) + + i(Г1Г2 sin </?i cos ip2 -I- иr2 cos ipi sin p2), или 21 -22 = rir2(cos(<^i 4- tp2) +isin(<£i + ip2)). (8) Таким образом, при умножении комплексных чисел их модули перемножа- ются, а аргументы складываются. Заметим, что мы на самом деле показали, что если <р\ € Arg21 и р2 G Argz2, то (<£>1 4- <р2) G Arg (21 -22). Но, поскольку аргумент определен с точностью до 2тгА;, можно записать, что Arg (21 • 22) = Arg 2i 4- Arg 22, (9) понимая это равенство как равенство множеств, правое из которых есть сово- купность чисел вида 9?i Ч- </?2, где 9?i € Arg2i, a <р2 6 Arg22. Таким образом, сумму аргументов полезно понимать в смысле равенства (9). При таком понимании равенства аргументов можно, например, утверж- дать, что два комплексных числа равны тогда и только тогда, когда соответ- ственно равны их модули и аргументы. Из формулы (8) по индукции вытекает следующая формула Муавра1); если 2 = г (cos <p + i sin 9?), то zn = rn (cos nip 4- i sin nip). (10) С учетом разъяснений по поводу аргумента комплексного числа формулу Муавра можно использовать, чтобы в явном виде выписать все комплексные решения уравнения zn = а. Действительно, если а = p(cos ‘ф + i sin ф) и в силу формулы (10) zn = rn (cos п <р -I- i sin п <р), А. Муавр (1667—1754) — английский математик.
262 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ то г = ц/р и п(р = -0 4- 2тг&, к 6 Z, откуда <рк = + — &• Различные ком- плексные числа получаются, очевидно, только при к = О,1, ..., n — 1. Итак, мы находим п различных корней из а: zk = fcosf— 4- —fc) + г sin(— + — (к = 0,1,..., n - 1). В частности, если о = 1, т. е. р = 1 и ф = 0, имеем zk = Vfc? = cosf— 4- г sinf—(к = 0,1,..., n — 1). Эти точки находятся на единичной окружности в вершинах правильного п-угольника. В связи с геометрической интерпретацией самих комплексных чисел по- лезно упомянуть о геометрической интерпретации арифметических действий над ними. При фиксированном b (Е С сумму z + Ь можно интерпретировать как ото- бражение С в себя, задаваемой формулой z z 4- Ь. Это сдвиг плоскости на вектор Ь. При фиксированном а = |а| (cos 4- i sin ip) 0 произведение az можно ин- терпретировать как отображение z az Св себя, являющееся композицией растяжения в |а| раз и поворота на угол ip G Arg а. Это видно из формулы (8). 2. Сходимость в С и ряды с комплексными членами. Расстояние (4) между комплексными числами позволяет определить s-окрестность числа zq G С как множество {z G С | |z — zq| < е) — это круг (без граничной окруж- ности) радиуса е с центром в точке (а?о, уо), если zq = а?о 4- iyo- Будем говорить, что последовательность {zn} комплексных чисел сходит- ся к числу zq 6 С, если lim \zn — zq\ — 0. п—>оо Из неравенств max{|a:n - z0|, |Уп - 2/о|} \zn ~ z0\ |жп - *о| 4- |jzn - Уо| (11) видно, что последовательность комплексных чисел сходится тогда и только тогда, когда сходятся последовательности действительных и мнимых частей членов этой последовательности. По аналогии с последовательностями вещественных чисел последователь- ность комплексных чисел {zn} называют фундаментальной или последова- тельностью Коши, если для любого е > 0 найдется номер N е N такой, что при п, т > N выполнено \zn — zm| < е. Из неравенств (11) видно, что последовательность комплексных чисел фун- даментальна тогда и только тогда, когда фундаментальны последовательно- сти действительных и мнимых частей членов данной последовательности. Учитывая критерий Коши для вещественных последовательностей, мы, таким образом, на основании неравенств (11) заключаем, что справедливо следующее
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 263 Утверждение 1 (критерий Коши). Последовательность комплексных чисел сходится тогда и только тогда, когда она фундаментальна. Если сумму ряда Z\ + Z2 4- •.. + zn 4- . . . (12) комплексных чисел понимать как предел его частичных сумм sn = z\ +... + zn при п —> оо, то получаем также критерий Коши сходимости ряда\(12). Утверждение 2. Ряд (12) сходится тогда и только тогда, когда для любого £ > 0 найдется число N 6 N такое, что при любых натуральных п т > N имеем \zm + • • • + zn\ < Е' (13) Отсюда, как, впрочем, и из самого определения сходимости ряда (12), вид- но, что для сходимости ряда необходимо, чтобы zn -> 0 при п -4 оо. Как и в вещественном случае, ряд (12) называется абсолютно сходящимся, если сходится ряд |zi| 4- |z2| 4-... 4- |zn| -I-... (14) Из критерия Коши и неравенства \zm 4-... 4- zn\ |zm| 4-... 4- |zn| следует, что если ряд (12) сходится абсолютно, то он сходится. Примеры. Ряды 1) 1 + yZ 4- yZ 4-...4-^j2 4-..., 2) 2-з!г3+5!г5_-"’ 3) сходятся абсолютно при любом z 6 С, ибо ряды 1') 1 + Yj|z| + ^|z|2 + • ••, 2' ) |z| + |f|z|3 + |i|.z|5 + ..., 3' ) l + ^|z|2 + ^|zr + ... , как мы знаем, сходятся при любом значении |z| € R. Заметим, что здесь мы воспользовались равенством \zn| = |z|n. Пример 4. Ряд 1 4- z 4- z2 4-..• сходится абсолютно при |z| < 1, и его сумма равна s = —-—. При |z| 1 он не сходится, так как в этом случае общий член ряда не стремится к нулю.
264 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ряды вида Со 4- Cl (z “ Zo) + ... + cn(z - z0)n + ... называют степенными рядами. Применяя признак Коши (см. гл. Ill, § 1, п. 4) к ряду |со| 4- |ci(z - z0)| 4-... 4- |cn(z — z0)n| 4- • • • , заключаем, что он сходится, если /____________________________________ ,----\~1 lz - z01 < ( lim Vlcnl ) , \n—>oo / (15) (16) / —_ , - — \ — 1 и его общий член не стремится к нулю, если lz — zq\ > I lim 4/|cnI I . \n—>oo / Отсюда получаем следующее Утверждение 3 (формула Коши — Адамара1^). Степенной ряд (15) сходится в круге |z — zq\ < R с центром в точке zo, радиус R которого определяется по формуле Коши — Адамара lim П-+ОО (17) В любой точке, внешней по отношению к этому кругу, степенной ряд расходится. В любой точке этого круга степенной ряд сходится абсолютно. Замечание. По поводу сходимости на граничной окружности |z — zo| = = R в утверждении 3 ничего не говорится, поскольку здесь возможны все логически допустимые варианты. Примеры. Ряды оо 5) 5>", П=1 сходятся в единичном круге |z| < 1, но ряд 5) расходится всюду при |z| = 1; ряд 6) расходится при z = 1 и, как можно показать, сходится при z = — 1; ряд 7) сходится абсолютно при |z| = 1, так как 1 п2 Адамар (1865 — 1963) — известный французский математик.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 265 Следует иметь в виду не учтенный в формулировке утверждения 3, но возможный вырожденный случай, когда в формуле (17) R — 0. В этом слу- чае, разумеется, весь круг сходимости вырождается в единственную точку zq сходимости ряда (15). Из утверждения 3, очевидно, вытекает Следствие (первая теорема Абеля о степенных рядах). Если степен- ной ряд (15) сходится при некотором значении z*, то он сходится и даже абсолютно при любом z, удовлетворяющем неравенству \z — zo| < |з* — ^о|- Те утверждения, которые пока были получены, можно рассматривать как простое развитие уже известных нам фактов. Теперь докажем два общих утверждения о рядах, которые мы раньше не доказывали ни в каком виде, хотя частично обсуждали затрагиваемые в них вопросы. Утверждение 4. Если ряд zi 4- Z2 4-... 4- zn 4- ... комплексных чисел сходится абсолютно, то ряд zni 4- zn2 4-... 4- znif 4- • • •, полученный переста- новкой1^ его членов, также абсолютно сходится и к той же сумме. оо ◄ Учитывая сходимость ряда 22 \zn |> п0 числу е > 0 найдем номер N € N ОО П=1 так, что 12п| < £• n=W+l Далее найдем номер К G N так, что среди слагаемых суммы s* = zni 4- -I-... 4- znh при к > К содержатся все слагаемые суммы s# = zj 4-... 4- zjv. оо Если з = 22 zn, т° мы получаем, что при к > К п=1 оо оо |s - sfc| |з - sjv| + |здг - sfc| 12п| + 52 W < 2е‘ n=W+l n=W+l Таким образом, показано, что з* —> з при к -4 оо. Если применить уже доказанное к рядам |zi| 4- |z2| 4-... 4- |zn| 4-... и |zni | 4- \zn31 + ... 4- \гПк | 4-..., получим, что последний ряд сходится. Тем самым утверждение 4 доказано полностью. ► Следующее утверждение будет относиться к произведению (ai 4- 02 4-... 4- оп + • • •) * (^1 4- Ь2 4- • • 4- Ъп 4-...) рядов. Вопрос состоит в том, что если мы раскроем скобки и запишем все- возможные попарные произведения Oibj, то в них нет естественного порядка суммирования, ибо есть два индекса суммирования. Множество пар (г, j), где г, > G N, как нам известно, счетно, поэтому можно написать ряд с членами Oibj, взятыми в некотором порядке. От того, в каком порядке эти члены Членом с номером к (fc-м членом) второго ряда является член znk с номером njt ис- ходного ряда. Отображение N Э к ।—► п* € N предполагается биективным отображением множества натуральных чисел N.
266 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ брать, может зависеть сумма такого ряда. Но, как мы только что видели, в абсолютно сходящихся рядах сумма не зависит от перестановки слагаемых. Таким образом, желательно выяснить, когда ряд с членами aibj сходится аб- солютно. Утверждение 5. Произведение абсолютно сходящихся рядов являет- ся абсолютно сходящимся рядом, сумма которого равна произведению сумм перемножаемых рядов. ◄ Заметим сначала, что, какую бы конечную сумму y^aibj членов вида aibj мы ни взяли, всегда можно указать N так, что произведение сумм Aw = = oi + ... + ajv и Вх = di + ... + будет содержать все слагаемые исходной суммы. Поэтому . N N N оо оо 52 ал 52 = 52 n -52im ^52n -52М’ t,j=l i=l j—1 i=l j—1 oo откуда вытекает абсолютная сходимость ряда 52 сумма которого, та- *J=i ким образом, однозначно определена независимо от порядка слагаемых. В таком случае ее можно получить, например, как предел произведения сумм Ап = ai +... + оп, Вп = 61 +... + 6П при п -> оо. Но АпВп -> АВ при п -> оо, оо оо где А = 52 ап и В — 52 Ъп, что и завершает доказательство высказанного п=1 п= 1 утверждения 5. ► Рассмотрим важный Пример 8. Ряды 52 —ian> 52 —ibm сходятся абсолютно. В произ- n=0 п‘ т=0 т ведении этих рядов будем группировать мономы апЬт с одинаковой суммой п + т = k показателей степени. Тогда получим ряд 00 / 1 1 \ 521 52 АаПА*т)- ' I п! ml I к—0 \п+т=к / Но k 12 -1ЦопЬ"* = А У2 ./?! = (а + д)*, , n!m! fc! nl(k — п)! klv } m+n—k n=0 4 7 поэтому мы получаем, что оо оо оо n=0 m=0 fc=O
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 267 3. Формула Эйлера и взаимосвязь элементарных функций. В при- мерах 1) —3) мы установили абсолютную сходимость в С рядов, полученных распространением в комплексную область тейлоровских разложений функций ех, sin®, cos®, определенных на К. По этой причине естественны следующие определения функций е2, cosz, sinz в С: ez =expz := 1 + ^z + ^z2 + |jZ3 + ... , (19) cosz:=l-^z2 + ^z4-... , (20) sin z := z - z3 + z5 - ... (21) Подставим, следуя Эйлеру1), в (19) z = iy. Группируя соответствующим обра- зом слагаемые частичных сумм получающегося при этом ряда, найдем, что 1 + у, (*у) + J; («у)2 + |i (>у)3 + («у)4 + («у)5 + • • • = = (1 - ^У2 + ^У4 - •••)+« (^У - |i»3 + - •• •), т. е. (22) е'у = cosy + г sin у. Это и есть знаменитая формула Эйлера. При ее выводе мы пользовались тем, что г2 = —1, г3 = —г, г4 — 1, г5 = i и т. д. Число у в формуле (22) может быть как действительным, так и про- извольным комплексным. Из определений (20), (21) видно, что cos(—z) = cosz, sin(—z) = — sinz, t. e. cosz — четная функция, a sinz — нечетная функция. Таким образом, e~ty = cosy — i sin у. Сравнивая последнее равенство с формулой (22), получаем cosy = \(е'у + e-tw), л» sin у = ^4(e*w — e-*w). ^Л. Эйлер (1707 — 1783) — выдающийся математик и механик, швейцарец по происхо- ждению, большую часть жизни проживший в Петербурге. По выражению Лапласа, «Эйлер — общий учитель всех математиков второй половины XVIII века».
268 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Поскольку у — любое комплексное число, то эти равенства лучше перепи- сать в обозначениях, не вызывающих недоразумений: cosz = x(etz + e~tz), 2 (23) sinz = 7T7(eiZ — e iZ). 2гv ' Таким образом, если принять, что expz задается соотношением (19), то формулы (23) (равносильные разложениям (20), (21)), как и формулы chz = |(е* + е-2), ? (24) shz = |(е* - е *), можно принять в качестве определений соответствующих круговых и гипер- болических функций. Забыв все наводящие и подчас не вполне строго обосно- ванные соображения, относившиеся к тригонометрическим функциям (кото- рые, однако, привели нас к формуле Эйлера), можно было бы теперь проделать типичный математический трюк, приняв формулы (23), (24) за определения и получить из них уже совсем формально свойства круговых и гиперболических функций. Например, основные тождества cos2 z + sin2 z = 1, ch2 z — sh2 z = 1, как и свойства четности, проверяются непосредственно. Более глубокие свойства, как, например, формулы для косинуса или синуса суммы, вытекают из характеристического свойства показательной функции: exp(zi + Z2) = exp(zi) • ехр(гг), (25) которое, очевидно, следует из определения (19) и формулы (18). Выведем формулы для косинуса и синуса суммы. С одной стороны, по формуле Эйлера et(zi+z2) _ cos(21 + Z2) +isin(zi + Z2). (26) С другой стороны, по свойству показательной функции и формуле Эйлера et(z!+z2) =etZ!etZ2 _ (COSZ1 _|_ isin Zi)(cos Z2 + isinZ2) = = (cos zi cos Z2 — sin zi sin Z2) + i (sin zi cos Z2 + cos zi sin Z2). (27) Если бы zi и Z2 были действительными числами, то, приравнивая действи- тельные и мнимые части чисел из формул (26) и (27), мы уже получили бы ис- комые формулы. Поскольку мы собираемся доказать их для любых zi, Z2 Е С,
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 269 то, пользуясь четностью cosz и нечетностью sinz, запишем еще одно равен- ство: е *(Z1+Z2) = (cos zi cos Z2 — sin zi sinZ2) — i(sin zi cos Z2 + coszi sin Z2). (28) Сравнивая (27) и (28), находим cos(zi + z2) = -{el(Z1+Z2} + e~'(zi+z2^ = coszi C0SZ2 — sinzi sinz2, 2 sin(zi'+ ^2) = -^(e*<Z1+z2) — e~*(zl+z2A = sinzi COSZ2 + coszi sinz2- 2i ' ' Совершенно аналогично можно было бы получить соответствующие фор- мулы для гиперболических функций chz и shz, которые, кстати, как видно из формул (23), (24), связаны с функциями cosz, sinz простыми соотношениями ch z = cos iz, sh z = — i sin iz. Однако получить такие геометрические очевидности, как sin7r = 0 или cos(z 4-2тг) = cosz, из определений (23), (24) уже очень трудно. Значит, стре- мясь к точности, не следует забывать те задачи, где соответствующие функ- ции естественным образом возникают. По этой причине мы не станем здесь преодолевать возможные затруднения в описании свойств тригонометриче- ских функций, связанные с определениями (23), (24), а еще раз вернемся к этим функциям после теории интеграла. Наша цель сейчас состояла только в том, чтобы продемонстрировать замечательное единство, казалось бы, совер- шенно различных функций, которое невозможно было обнаружить без выхода в область комплексных чисел. Если считать известным, что для х G R cos (х + 2тг) = cos х, sin (х + 2тг) = sin х, cos 0 = 1, sin 0 = О, то из формулы Эйлера (22) получаем соотношение (29) в котором представлены важнейшие постоянные различных областей матема- тики (1 — арифметика, тг — геометрия, е — анализ, i — алгебра). Из (25) и (29), как и из формулы (22), видно, что exp (z + г2тг) = exp z, т. е. экспонента оказывается периодической функцией на С с чисто мнимым периодом Т = г2тг.
270 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Учитывая формулу Эйлера, тригонометрическую запись (7) комплексного числа теперь можно представить в виде z — где г — модуль числа z, a — его аргумент. Формула Муавра теперь становится совсем простой: zn = rneinifi (30) 4. Представление функции степенным рядом, аналитичность. Функция w = f(z) комплексного переменного z с комплексными значени- ями w, определенная на некотором множестве Е С С, есть отображение f:E-+C. График такой функции есть подмножество вСхС = R2 xR2 = К4 и поэтому традиционной наглядности не имеет. Чтобы как-то компенсиро- вать эту потерю, обычно берут два экземпляра комплексной плоскости С и в одном отмечают точки области определения, а в другом — точки области значений. В рассмотренных ниже примерах указаны область Е и ее образ при соот- ветствующем отображении. Пример 9. Пример 10. Рис. 37 Рис. 38
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 271 Пример 11. Рис. 39 Это следует из того, что i = е**/2, произошел поворот на угол А z — reitfi и iz = ге*^+п^2\ т. е. Пример 12. Рис. 40 Ибо если z = re**, то г2 = r2e*2v. Пример 13. Рис. 41
272 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 14. Рис. 42 Из примеров 12, 13 понятно, что в данном случае образом единичного круга снова будет единичный круг, но только накрытый в два слоя. Пример 15. Рис. 43 Если z — гегч\ то в силу (30) zn = гпегп<р, поэтому в нашем случае образом круга радиуса г будет круг радиуса гп и каждая точка последнего является образом п точек исходного круга (расположенных, кстати, в вершинах пра- вильного п-угольника). Исключение в этом смысле составляет только точка w = 0, прообраз ко- торой есть точка z = 0. Однако при z —> 0 функция zn есть бесконечно малая порядка п, поэтому говорят, что при z — 0 функция имеет нуль порядка n. С учетом такой кратности нуля можно теперь говорить, что число прообразов любой точки w при отображении z i-> zn = w равно n. В частности, уравнение zn = 0 имеет п совпадающих корней z\ - ... = zn = 0. В соответствии с общим определением непрерывности, функция f(z) ком- плексного переменного называется непрерывной в точке zq G С, если для лю- бой окрестности V(/(z0)) ее значения /(zo) найдется окрестность U(z0) такая, что при любом z е U(zq) будет /(z) G V(/(z0)). Короче говоря, lim /(г) = /(z0). Z~4-Z0 Производной функции f(z) в точке zo, как и для вещественного случая, назовем величину /'(zo) = Um йг°), (31) Z-^ZQ Z — Zo если этот предел существует.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 273 Равенство (31) эквивалентно равенству /(z) - /(z0) = /'(z0)(z - Zo) + o(z - Zo) (32) при z -> zo, соответствующему определению дифференцируемости функции в точке zo- Поскольку определение дифференцируемости в комплексном случае совпа- дает с соответствующим определением для вещественных функций, а ариф- метические свойства поля С и поля R одинаковы, то можно сказать, что все общие правила дифференцирования справедливы и в комплексном случае. Пример 16. (/+рш = г«+т (/ • Р)'(^) = W№) = pW))-m поэтому если /(z) = z2, то /'(z) = 1 • z + z • 1 = 2z, или если /(z) = z”, то /'(z) = nzn-1, а если Pn{z) = co + ci(z - zo) + • • • + cn(z - z0)n, TO P„(z) = Cl + 2c2(z - Zo) + • . • + nCn(z - Zo)n-1. oo Теорема 1. Сумма f(z) = cn(z — степенного ряда — бесконечно n=0 дифференцируемая функция во всем круге сходимости ряда. При этом °° /<Ч(*) = Етт(с„(*-*о)п), * = 0,1,..., л—/ dZK п=0 U Cn=—.f{n4z0), п = 0,1, ... п\ ◄ Выражения для коэффициентов сп очевидным образом получаются из выражений для /^(z) при к = п и z = zq. В свою очередь, формулы для f^k\z) достаточно проверить только при к = 1, ибо тогда f*(z) снова окажется суммой степенного ряда. оо Итак, проверим, что функция y?(z) = ncn(^ ~ ^о)п-1 действительно п=1 является производной для f(z). Прежде всего заметим, что в силу формулы Коши —Адамара (17) радиус сходимости последнего рдда совпадает с радиусом сходимости R исходного степенного ряда для f^z).
274 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В дальнейшем для упрощения записи будем считать, что Zo = 0, т. е. что оо оо f(z) — 12 cnZn, y>(z) = 22 TlCnZ^1 и ряды сходятся при |z| < R. п=0 п=1 Поскольку внутри круга сходимости степенной ряд сходится абсолютно, можно заметить, и это существенно, что при |z| т < R справедлива оценка оо |ncnzn-1| = п|сп||лг]п—1 п|сп|гп-1, а ряд 22 п1сп|гП-1 сходится. Значит, для п=1 любого е > 0 найдется номер N такой, что при |z| г У пспгп 1 п=^+1 оо 12 пс-гП-1 =? 5- п=Лг+1 Таким образом, с точностью до | функция ip(z) в любой точке круга |z| < г совпадает с N-й частичной суммой определяющего ее ряда. Пусть теперь £ и z — произвольные точки этого круга. Преобразование /(<)-/(*) Сп-гп_ С-г С-2 - оо = 12 «»(<"" * + <”"2г + • • + Сг”"2 + г"-1) и оценка |сп (£” 1 +...+zn х)| |сп|пгп 1 позволяют, как и выше, заключить, что интересующее нас разностное отношение при |£| < г и |z| < г совпадает, с точностью до е 3’ с N-й частичной суммой определяющего его ряда. Значит, при |£| < г и \z\ < г ~ /(*) " Гп_7п N 12с„-Yncnzn 1 П=1 ’ П=1 £ 3' Если теперь, фиксировав z, устремить £ к z, то, переходя к пределу в ко- нечной сумме, видим, что при £ достаточно близких к z правая часть послед- него неравенства, а с нею и левая становятся меньше е. Таким образом, для любой точки z в круге \z\ < г < R, а ввиду произволь- ности г, и для любой точки круга |z| < R проверено, что f'(z) = <p(z). ► Эта теорема позволяет точно указать тот класс функций, для которых их ряды Тейлора сходятся к ним. Говорят, что функция аналитична в точке Zq G С, если в некоторой окрестности этой точки ее можно представить в следующем («аналитиче- ском») виде: оо /(*) = - zo)n, п-0 т. е. как сумму степенного ряда по степеням z — z0.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 275 Нетрудно проверить (см. задачу 7), что сумма степенного ряда аналитична в любой внутренней точке круга сходимости этого ряда. С учетом определения аналитичности функции, из доказанной теоремы получаем Следствие, а) Если функция аналитична в точке, то она бесконечно дифференцируема в этой точке и ее ряд Тейлора сходится к ней в окрест- ности этой точки. Ь) Ряд Тейлора функции, определенной в окрестности точки и бесконечно дифференцируемой в точке, сходится к функции в некоторой окрестности точки тогда и только тогда, когда функция аналитична в этой точке. В теории функции комплексного переменного доказывается замечатель- ный факт, не имеющий аналогов для вещественных функций. А именно, ока- зывается, что если функция f(z) дифференцируема в окрестности точки zo 6 С, то она аналитична в этой точке. Это и в самом деле удивительно, поскольку в силу доказанной выше теоремы отсюда следует, что если функция f(z) имеет одну производную /'(z) в окрестности точки, то в этой окрестно- сти она имеет также производные всех порядков. На первый взгляд это так же неожиданно, как то, что, присоединив к R корень i одного конкретного уравнения z2 = —1, мы получаем поле С, в ко- тором любой алгебраический многочлен P(z) имеет корень. Факт разреши- мости в С алгебраического уравнения P(z) = 0 мы собираемся использовать и поэтому докажем его в качестве хорошей иллюстрации к введенным в этом параграфе начальным представлениям о комплексных числах и функциях ком- плексного переменного. 5. Алгебраическая замкнутость поля С комплексных чисел. Если мы докажем, что любой полином P(z) = cq + ciz + ... + CnZn, n > 1, с ком- плексными коэффициентами имеет корень в С, то уже не возникнет надоб- ности в расширении поля С, вызванной неразрешимостью в С некоторого алгебраического уравнения. В этом смысле утверждение о наличии корня у любого многочлена P(z) устанавливает алгебраическую замкнутость поля С. Чтобы получить вполне наглядное представление о том, почему в С любой полином имеет корень, в то время как в R его могло не быть, воспользуемся геометрической интерпретацией комплексного числа и функции комплексного переменного. Заметим, что ту, \ п/°о , С1 । , сп-1 . \ P(z) = Zn[ — + —т + ... + ---- + Сп ) \Zn Zn 1 Z / и, следовательно, P(z) = cnzn 4- o(zn) при |z\ -> оо. Поскольку нас интересует корень уравнения P(z) = 0, то, поделив-обе части уравнения на сп, можно считать, что коэффициент Сп многочлена P(z) равен 1 и потому P(z) = zn + o(zn) при [z| -> оо. (33) 10 Зорич В. А.
276 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если вспомнить (см. пример 15), что при отображении z zn окружность радиуса г переходит в окружность радиуса гп с центром в точке 0, то при достаточно больших значениях г, в силу (33), с малой относительной погреш- ностью образ окружности |z| = г будет совпадать с окружностью |w| = гп плоскости w (рис. 44). Во всяком случае, важно, что образом будет кривая, охватывающая точку w = 0. Если круг |z| г рассматривать как пленку, натянутую на окружность |z| = г, то при непрерывном отображении, осуществляемом полиномом w = = P(z), эта пленка перейдет в пленку, натянутую на образ окружности. Но поскольку последний охватывает точ- ку w = 0, то некоторая точка этой пленки обязана совпадать с w = 0 и, значит, в круге |z| < г найдется точка Zo, которая при отображении w = P(z) перешла именно в w = 0, т. е. P(z0) = 0. Это наглядное рассуждение при- водит к ряду очень важных и полез- ных понятий топологии (индекс пути относительно точки, степень отображения) и с помощью этих понятий мо- жет быть доведено до полного доказательства, справедливого, как можно понять, не только для полиномов. Однако эти рассмотрения, к сожалению, отвлекли бы нас от основного предмета, которым мы сейчас занимаемся; по- этому мы проведем другое доказательство, лежащее в русле тех идей, с кото- рыми мы уже достаточно освоились. Теорема 2. Каждый полином Рис. 44 P(z) = Со + C1Z + . . . -ь CnZn степени п 1 с комплексными коэффициентами имеет в С корень. ◄ Без ограничения общности утверждения теоремы, очевидно, можно счи- тать, что сп = 1. Пусть д = inf |P(z)|. Поскольку P(z) = zn(l + 4-... 4- —), то |Р(*)1 кГ 1- |Cn— 11 |z| |со| \ |z|n/’ и, очевидно, |P(z)| > тах{1,2д} при |z| > R, если R достаточно велико. Сле- довательно, точки последовательности {zk}, в которых 0 < |Р(<г*)| — д < р лежат в круге |z| R. Проверим, что в С (и даже в этом круге) есть точка zq, в которой |P(zq)| = = д. Для этого заметим, что если Zk = х* 4- то тах{|ж*|, \yk|} |z*| R
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 277 и, таким образом, последовательности действительных чисел {ar*}, {у*} ока- зываются ограниченными. Извлекая сначала сходящуюся подпоследователь- ность {ж*,} из {х*}, а затем сходящуюся подпоследовательность {yklm} из {у*,}, получим подпоследовательность zklm = xkim+ ^Ук1т последовательности {г*}, которая имеет предел lim z*. = lim xkl + i lim yk. =xo + iyo = zo, m—>oo m m—>oo m m-юо m и поскольку |z*| -> |z0| при к -> оо, то |zo| R- Чтобы избежать громоздких обозначений и не переходить к подпоследовательностям, будем считать, что уже сама последовательность {z*} сходится. Из непрерывности P(z) в zo € С следует, что lim P(zk) = P(zq). Но тогда1) |P(zo)| = lim |P(z*)| = Д- к—too к—too Теперь предположим, что р, > 0, и приведем это предположение к про- тиворечию. Если P(z0) 0 0, то рассмотрим полином Q(z) = построению, Q(0) = 1 и |Q(z)| = |P(g-bzo)l |P(*o)| P(z 4- zo) P(zo) 1. Поскольку Q(0) = 1, полином Q(z) имеет вид Q(z) = 1 + qkzk + Qk+izk+1 + ... + qnzn, где I?* I / 0 и 1 к n. Если qk = pe1^, то при <p = ~~j~~ будем иметь Як • (e1*’)* = рег^ег^~^ = регп = —р = — |g*|. Таким образом, при z = те**’ получим IQ(re^)| 11 4- qkzk\ + (|gA+1 z*+1| + ... + |g„z~|) = = |1 ~ rk |зд|| + г*+1(|д*+1| + ... + |gn|rn~*_1) = = 1 - rk(\qk| - r|g*+i| - ... - rn-*|gn|) < 1, если г достаточно близко к нулю. Но |Q(z)| 1 при z € С. Полученное противоречие показывает, что P(zo) = 0. ► Замечание 1. Первое доказательство теоремы о разрешимости в С лю- бого алгебраического уравнения с комплексными коэффициентами (которую по традиции часто называют основной теоремой алгебры) было дано Гауссом, который вообще вдохнул вполне реальную жизнь в так называемые «мнимые» числа, найдя им разнообразные и глубокие приложения. Замечание 2. Многочлен с вещественными коэффициентами P(z) = = а0 + • • • + anZn, как мы знаем, не всегда имеет вещественные корни. Однако по отношению к произвольному многочлену с комплексными коэффициентами • Обратите внимание — мы, с одной стороны, показали, что из любой ограниченной по модулю последовательности комплексных чисел можно извлечь сходящуюся подпоследова- тельность, а с другой стороны, продемонстрировали еще одно из возможных доказательств теоремы о минимуме непрерывной функции на отрезке, как в данном случае это было сде- лано в круге |z| R.
278 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ он обладает той особенностью, что если P(zq) = 0, то и P(zq) = 0. Действи- тельно, из определения сопряженного числа и правил сложения комплексных чисел следует, что (zi + z2)= zi + z2. Из тригонометрической формы записи комплексного числа и правил умножения комплексных чисел видно, что (^1 • z2) = (rje*^1 -г2е'^) = r1r2e*<*’1+*’2) = = • г2е~^2 = • z2. Таким образом, P(zq) = Оо + • • • + fln-Zo = «о + • • • + Оп^о = Оо + • • • + anZq - P(zo), и если P(zq) = 0, то P(z0) — P{zq) — 0. Следствие 1. Любой многочлен P(z) = со + ... + cnzn степени п ^>1 с комплексными коэффициентами допускает, и притом единственное с точ- ностью до порядка сомножителей, представление в виде P(z) - Cn(z - zi)... (z - zn), (34) где Zi, ..., zn 6 С (и, может быть, не все числа zi,..., zn различны между собой). ◄ Из алгоритма деления («уголком») многочлена P(z) на многочлен Q(z) степени т п находим, что P(z) = q(z) Q(z)+r(z), где q(z) и r(z) — некоторые многочлены, причем степень r(z) меньше степени Q(z), т. е. меньше т. Таким образом, если т = 1, то r(z) = г — просто постоянная. Пусть zi — корень многочлена P(z). Тогда P(z) = q(z)(z — Zi) + г, и поскольку P(zi) = г, то г = 0. Значит, если Zi — корень многочлена P(z), то справедливо представление P(z) = (z — zi)q(z). Степень многочлена q(z) равна п — 1, и с ним можно повторить то же самое рассуждение. По индукции получаем, что P(z) = c(z — zi)... (z — zn). Поскольку должно быть czn = CnZn, то с = cn. ► Следствие 2. Любой многочлен P(z) = oq + ... + anzn с действи- тельными коэффициентами можно разложить в произведение линейных и квадратичных многочленов с действительными коэффициентами. ◄ Это вытекает из предыдущего следствия 1 и замечания 2, в силу ко- торого вместе с Zk корнем P(z) является также число z*. Тогда, перемно- жив в разложении (34) многочлена скобки (z — Zk)(z — Zk), получим многочлен z2 — (zfc + zk)z -b |z*;|2 второго порядка с действительными коэффициентами. Число сп, в нашем случае равное ап, вещественное, и его можно внести в одну из скобок разложения, не меняя ее степени. ► Перемножив одинаковые скобки в разложении (34), это разложение можно переписать в виде Р(г) = сп(г-г1)‘>...(г-2р)‘-. (35)
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 279 Число kj называется кратностью корня Zj. Поскольку P(z) = (z — zj)*> Q(z), где Q(zj) / 0, то Р'(г) = kj(z - z^Q^z) + (z - z^Q'iz-) =(z- Zj)t‘~1R(z), где R(zj) = kjQ(zj) / 0. Таким образом, мы приходим к следующему заклю- чению. Следствие 3. Каждый корень Zj многочлена P(z) кратности kj > 1 является корнем кратности kj — 1 многочлена P'(z) — производной P(z). Не будучи пока в состоянии найти корни многочлена P(z), мы на основании последнего утверждения и разложения (35) можем найти многочлен p(z) = = (z — zi)... (z — zp), корни Zi, ..., Zp которого совпадают с корнями P(z), но все они уже кратности 1. Действительно, по алгоритму Евклида сначала найдем многочлен q(z) — наибольший общий делитель P(z) и P'fz). В силу следствия 3, разложения (35) и теоремы 2, многочлен q(z) с точностью до постоянного множителя равен произведению (z — Zi)kl~1... (z — zp)kp~\ поэтому, поделив P(z) наq(z), с точностью до постоянного множителя (от которого можно затем избавиться дополнительным делением на коэффициент при zp) получим многочлен p(z) = = (z - zr) ...(z - zp). Рассмотрим теперь отношение R(x) = Р(х) Q(x) двух многочленов, где Q(x) ф £ const. Если степень Р(х) больше степени Q(x), то, применив алгоритм деления многочленов, представим Р(х) в виде Р(х) — p(x)Q(x) + г(х), где р(х) и г(х) — некоторые многочлены, причем степень г(х) уже меньше, чем степень Q(x). Таким образом, получаем представление R(x) в виде R(x) = = р(*) + ё«’гдедробьОЙ меньше степени Q{x). уже правильная в том смысле, что степень т(х) Следствие, которое мы сейчас сформулируем, относится к представлению правильной дроби в виде суммы дробей, называемых простейшими. P(z) Следствие 4. а) Если Q(z) = (z—Zi)kl... (z—zp)kp и / — правильная дробь, то существует и притом единственное представление дроби ) ; в _ Q\z) виде (36) Ь) Если Р(х) и Q(x) — многочлены с действительными коэффициентами w Q(x) — (х — Xi)*1... (ж - xi)kt (х2 4- ргх + qi)mi... (х2 + рпх + qn)mn, т0
280 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ существует и притом единственное представление правильной дроби в виде Р& <?(*) QW (*-*>)* J=1 \fc=l bjkX ~Ь Сук | (x2 +pjx + qj)k I' где ajk, bjk, Cjk — действительные числа. Заметим, что универсальным, хотя и не всегда самым коротким способом фактического отыскания разложений (36) или (37) является метод неопре- деленных коэффициентов, состоящий в том, что сумма в правой части (36) или (37) приводится к общему знаменателю Q(x), после чего приравнивают- ся коэффициенты полученного числителя и соответствующие коэффициенты многочлена Р(х). Система линейных уравнений, к которой мы при этом при- ходим, в силу следствия 4 всегда однозначно разрешима. Поскольку нас, как правило, будет интересовать разложение конкретной дроби, которое мы получим методом неопределенных коэффициентов, то кро- ме уверенности, что это всегда можно сделать, нам от следствйя 4 пока ничего больше не требуется. По этой причине мы не станем проводить его доказа- тельство. Оно обычно излагается на алгебраическом языке в курсе высшей алгебры, а на аналитическом языке — в курсе теории функций комплексного переменного. Рассмотрим специально подобранный пример, на котором можно проил- люстрировать изложенное. Пример 17. Пусть Р(х) = 2з:6 + Зя5 + 6ж4 + 6ж3 +.10х2 + Зх 4- 2, Q(x) — х7 + Зх6 4- Зх5 4- 7х4 4- 7х3 4- 5ж2 4- Зх 4-1; требуется найти разложение (37) дроби 5W. Q{x) Прежде всего, задача осложнена тем, что мы не знаем разложения мно- гочлена Q(x). Попробуем упростить ситуацию, избавившись от кратности корней Q(x), если таковая имеет место. Находим Q'(x) = 7х6 4* 18я5 4- 25я4 4- 28я3 4- 2Lr2 4- 10я 4- 3. Довольно утомительным, но выполнимым счетом по алгоритму Евклида находим наибольший общий делитель d(x) = х4 + 2х3 4- 2х2 4- 2х 4-1 многочленов Q(x) и Q’(x). Мы выписали наибольший общий делитель с еди- ничным коэффициентом при старшей степени х. Разделив Q(x) на d(x), получаем многочлен q(x) — х3 4- х2 4- х 4-1,
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 281 имеющий те же корни, что и многочлен Q(x), но единичной кратности. Ко- рень — 1 многочлена q(x) легко угадывается. После деления q(x) на х 4- 1 получаем х2 4-1. Таким образом, q(x) = (я'4- 1)(я2 4-1), после чего последовательным делением d(x) на х2 4-1 и х + 1 находим разло- жение d(z): d(x) = (х 4- 1)2(я2 4-1), а вслед за этим и разложение Q(x) = (х 4- 1)3(х2 + I)2. Таким образом, в силу следствия 4Ь) ищем разложение дроби А ~ в виде Р(х) _ an ап а13 Q(x) х + 1 (я + I)2 (х 4-1)3 Ьцж 4- сц &12Д: + С12 (х2 + I)2 Приводя правую часть к общему знаменателю и приравнивая коэффици- енты полученного в числителе многочлена и соответствующие коэффициенты многочлена Р(х), приходим к системе семи уравнений с семью неизвестными, решая которую, окончательно получаем Р(з:) __ 1 2 1 х — 1 з:4-1 Q(x) х 4-1 (х 4-1)2 (х + I)3 + х2 + 1 + (х2 4-1)2 Задачи и упражнения 1. Используя геометрическую интерпретацию комплексного числа: а) поясните неравенства |zi 4- Z2I |«i| 4- |^г| и |zi 4-... 4- zn| |zi| 4-... 4- |zn|; b) укажите геометрическое место точек на плоскости С, удовлетворяющих со- отношению |г — 1| 4- \z 4-1| 3; с) изобразите все корни степени п из 1 и найдите их сумму; d) поясните действие преобразования плоскости С, задаваемого формулой z н I 2. Найдите суммы: а) 1 4-g4-... 4-gn; b) 1 4- q 4- • • • 4- qn 4- . . . при |g| < 1; с) 1 4-е**’4-... 4-е*п*’; d) 1 4-re**’4-... 4-rne*n*’; е) 1 4- re’*’ 4- • • 4- rne,n*’ 4- •. • при |r | < 1; f) 1 4- rcosip 4-... 4- rncog nip-, g) 1 4- rcos ip 4- ... 4- rncosnip 4- • при |r| < 1;
282 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ h) 1 4- г sin 4-... 4- rn sin i) 1 4- г sin у? 4- •. • 4- rnsinny> 4-... при |r| < 1. (z\n 1 4- - ) и убедитесь, n / что это число есть ег. 4. а) Покажите, что уравнение ew = z относительно w имеет решение w = In |z| 4- 4-i Arg z. Естественно считать w натуральным логарифмом числа z. Таким образом, w = Ln z не есть функциональное соотношение, поскольку Arg z многозначен. b) Найдите Ln 1 и Ln i. с) Положим za = eaLne. Найдите 1" и г*. d) Используя представление w = sinz = — (е,г — е-,г), получите выражение для z = arcsin z. е) Есть ли в С точки, где |sinz| — 2? 5. а) Исследуйте, во всех ли точках плоскости С функция /(z) = 1 непре- 1 4* z1 рывна. Ь) Разложите функцию 1 в степенной ряд при zo = 0 и найдите его радиус 1 + z* сходимости. с) Решите задачи а) и Ь) для функции * ^2 2, где A G R — параметр. Не возникает ли у вас гипотезы относительно того, взаимным расположением каких точек на плоскости С определяется радиус сходимости? Можно ли было понять это, оставаясь на вещественной оси, т. е. раскладывая функцию -—74-7, где A G R и 1 4- A^z^ х € R? 6. а) Исследуйте, является ли непрерывной функция Коши /(*) = О, z / О, z = О в точке z = 0. Ь) Будет ли непрерывно ограничение /|к функции / из задачи а) на веществен- ную ось? с) Существует ли ряд Тейлора функции f из а) в точке zo = 0? d) Бывают ли аналитические в zq Е С функции, ряд Тейлора которых сходится только в точке zo? ОО е) Придумайте степенной ряд 22 сп (z—zo)n, который сходится только в точке zq. п=0 оо 7. а) Выполнив в степенном ряде ^2An(z — а)п формально подстановку z — а = П=0 ОО = (z — zo) 4- (zq — а) и приведя подобные члены, получите ряд J2 Сп(г — zo)n и п=0 выражения его коэффициентов через величины Ak, (zq — а)к, к = 0,1,... Ь) Проверьте, что если исходный ряд сходится в круге |z — а| < Я, a |zo — а| = = г < R, то ряды, определяющие Сп, п = 0,1,..., сходятся абсолютно и ряд ОО 22 Cn(z — z0)n сходится при |z — Zo| < R — г. n=0
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 283 оо с) Покажите, что если /(z) = Е An(z — а)п в круге \z — а| < R, a |zo — а| < п=0 < R, то в круге \z — zo| < 'R - |zo — а] функция f допускает представление /(z) = ОО = ECn(2-zo)n. n=0 8. Проверьте, что а) когда точка z € С пробегает окружность |z| = г > 1, точка w = z + z-1 пробегает эллипс с центром 0 и фокусами в точках ±2; Ь) при возведении комплексных чисел в квадрат, точнее, при отображении w ь-> w2 такой эллипс переходит в дважды пробегаемый эллипс с фокусом в нуле; с) при возведении комплексных чисел в квадрат любой эллипс с центром в нуле переходит в эллипс с фокусом в нуле. § 6. Некоторые примеры использования дифференциального исчисления в задачах естествознания В этом параграфе мы разберем несколько довольно далеких друг от друга по постановке задач естествознания, которые, однако, как выяснится, име- ют довольно близкие математические модели. Модель эта — не что иное, как простейшее дифференциальное уравнение для интересующей нас в зада- че функции. С разбора одного такого примера — задачи двух тел — мы, кстати, вообще начинали построение дифференциального исчисления. Иссле- дование той системы уравнений, которую мы при этом получили, пока нам недоступно. Здесь же будут рассмотрены вопросы, которые можно до конца решить уже на нашем нынешнем уровне. Кроме удовольствия увидеть мате- матический аппарат в конкретной работе, из ряда примеров этого параграфа мы, в частности, извлечем также дополнительную убежденность как в есте- ственности возникновения показательной функции ехраг, так и в пользе ее распространения в комплексную область. 1. Движение тела переменной массы. Рассмотрим ракету, переме- щающуюся прямолинейно в открытом космосе далеко от притягивающих масс (рис. 45). Рис. 45 Пусть M(t) — масса ракеты (с топливом) в момент t; V(t) — ее скорость в момент t; ы — скорость (относительно ракеты) истечения топлива из сопла ракеты при его сгорании. Мы хотим установить взаимосвязь между этими величинами.
284 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В силу сделанных предположений, ракету с топливом можно рассматри- вать как замкнутую систему, импульс (или количество движения) которой поэтому остается постоянным во времени. В момент t импульс системы равен В момент t 4- h импульс ракеты с оставшимся в ней топливом равен M(t 4- h)V(t 4- Л), а импульс Д/ выброшенной за это время массы |ДМ| = = 4- h) — М(t)| = — (M(t 4- h) — M(t)) топлива заключен в пределах (V(t) - ы)|ДМ| < Д/ < (V(t + h) - ш)|ДМ|, т. е. Д/ = (V(t) — о>)|ДМ| 4-а(/г)|ДМ|, причем из непрерывности V(t) следует, что а (Л) —> О при h —> 0. Приравнивая импульсы системы в моменты t и t + h, имеем M(t) V(t) = M(t + h) V(t 4- h) + (V(t) - w) |ДМ| 4- a(h) |ДМ|, или, после подстановки |ДМ| = — (M(t + h) — M(t)) и упрощений, М(* + Л)(У(*4-Л)-У(*)) = = 4- h) - M(t)) + a(h)(M(t + h) - Деля последнее равенство на А и переходя к пределу при h -» 0, получаем = -uM'(t). (1) Это и есть искомое соотношение между интересующими нас функциями V(t), M(t) и их производными. Теперь надо найти связь между самими функциями V(i), M(t), исходя из соотношения между их производными. Вообще говоря, такого рода задачи много труднее задач нахождения соотношений между производными при из- вестных соотношениях между функциями. Однако в нашем случае вопрос решается вполне элементарно. Действительно, после деления на M(t) равенство (1) можно переписать в виде V'(t) = (2) Но если производные двух функций совпадают на некотором промежутке, то на этом промежутке сами функции отличаются разве что на некоторую постоянную. Итак, из (2) следует, что V(t) = -ш InM(t) 4- с. (3) Если известно, например, что V(0) = Vb, то это начальное условие вполне определит константу с. Действительно, из (3) находим с = Vb 4- cdlnM(O),
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 285 а затем находим искомую формулу1) V(t) = V0 + win (4) Полезно заметить, что если тк — масса корпуса ракеты, гпТ — масса топ- лива, а V — конечная скорость, которую приобретает ракета после полной отработки топлива, то, подставляя в (4) М(0) = тк + тТ и M(t) = тк, нахо- дим V = Vo + winfl+ —Y \ тк/ Последняя формула особенно ясно показывает, что на конечной скорости сказывается не столько отношение тТ/тк, стоящее под знаком логарифма, сколько скорость истечения а>, связанная с видом топлива. Из этой формулы, в частности, следует, что если Vb = 0, то, чтобы придать скорость V ракете, собственная масса которой тк, необходимо иметь следующий начальный запас топлива: mT = тк (е — 1). 2. Барометрическая формула. Так называется формула, указываю- щая зависимость атмосферного давления от высоты над уровнем моря. Пусть p(/i) — давление на высоте h. Поскольку p(h) есть вес столба воздуха над площадкой в 1 см2, расположенной на высоте h, то p(h + Д) отличается от p(h) весом порции газа, попавшей в параллелепипед с основаниями в виде исходной площадки в 1 см2, расположенной на высоте h, и такой же площадки на высоте h 4- Д. Пусть р(Л) — плотность воздуха на высоте h. Поскольку p(h) непрерывно зависит от h, то можно считать, что масса указанной порции воздуха может быть вычислена по формуле р(£) г/см3 • 1 см2 • Д см = р(С) Д г, где £ — некоторый уровень высоты в промежутке от h до h 4- Д. Значит, вес этой массы3) есть д Таким образом, р(Л4-Д)-р(Л) =-рр(£)Д. Поделив это равенство на Д и перейдя к пределу при Д —> 0 с учетом того, что тогда и £ —> Л, получаем = ~9p{h). (5) 9 Эта формула иногда связывается с именем К. Э. Циолковского (1857—1935) — рус- ского ученого, основоположника теории космических полетов. Но, по-видимому, впервые она была получена русским механиком И. В. Мещерским (1859 — 1935) в его труде 1897 г., посвященном динамике точки переменной массы. 2) В пределах наличия заметной атмосферы величину д можно считать постоянной.
286 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, скорость изменения давления естественно оказалась про- порциональной плотности воздуха на соответствующей высоте. Чтобы получить уравнение для функции p(h), исключим из (5) функцию p(h). В силу закона Клапейрона1) давление р, молярный объем V и темпера- тура Кельвина2) Т газа связаны соотношением (6) где R — так называемая универсальная газовая постоянная. Если М — масса одного моля воздуха, а V — его объем, то р = поэтому из (6) находим R Полагая А — — Т, таким образом, имеем м р = Х(Т)р. (7) Если теперь принять, что температура описываемых нами слоев воздуха по- стоянна, то из (5) и (7) окончательно находим p'W = -tpW- (8) А » Это дифференциальное уравнение можно переписать в виде PW = _9_ p(h) А или (1пр)'(Л)= (-fh)', откуда In p(h) = - j h + с’ или p(h) = ec-e~(9/x)h. Множитель ес определяется из известного начального условия р(0) = ро, в силу которого ес = ро- Итак, мы нашли следующую зависимость давления от высоты: р = Рое~(р/А)л. (9) Для воздуха при комнатной температуре (порядка 300 К = 27 ° С) известно значение А « 7,7 • 108 (см/с)2. Известно также, что д « 103 см/с2. Таким 1)Б. П. Э. Клапейрон (1799 — 1864) — французский физик, занимавшийся термодина- микой. 2)у. Томсон (лорд Кельвин) (1824—1907) — известный английский физик.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 287 образом, формула (9) приобретает вполне законченный вид после подстановки этих числовых значении д и А. В частности, из (9) видно, что давление упадет в е (~ 3) раз на высоте h = = 7,7 • 10б см = 7,7 км. Оно возрастет во столько же раз, если опуститься в шахту на глубину порядка 7,7 км. 3. Радиоактивный распад, цепная реакция и атомный котел. Известно, что ядра тяжелых элементов подвержены самопроизвольному (спон- танному) распаду. Это так называемая естественная радиоактивность. Основной статистический закон радиоактивности (справедливый, следова- тельно, для не слишком малых количеств и концентраций вещества) состоит в том, что количество распадов за малый промежуток времени h, прошедший от момента пропорционально h и количеству N(t) не распавшихся к моменту t атомов вещества, т. е. N(t + h) - N(t) к —XN(t)h, где А > 0 — числовой коэффициент, характерный для данного химического элемента. Таким образом, функция N(t) удовлетворяет уже знакомому дифференци- альному уравнению N'(t) = -AAT(t), (10) из которого следует, что N(t) = №е-д‘, где Nq = N(0) начальное количество атомов вещества. Время Т, за которое происходит распад половины из начального количе- ства атомов, называют периодом полураспада. Величина Т находится, таким образом, из уравнения е~хт — т. е. Т = ~ л л Например, для полония Ро210 Т « 138 суток, для радия Ra226 Т « 1600 лет, для урана U235 Т « 7,1 • 108 лет, а для его изотопа U238 Т & 4,5 • 109 лет. Ядернал реакция — это взаимодействие ядер или взаимодействие ядра с элементарными частицами, в результате которого появляются ядра нового типа. Это может быть ядерный синтез, когда слияние ядер более легких эле- ментов приводит к образованию ядер более тяжелого элемента (например, два ядра тяжелого водорода дают, с потерей массы и выделением энергии, ядро гелия); это может быть распад ядра и образование ядра (ядер) более лег- ких элементов. В частности, такой распад происходит примерно в половине случаев столкновения нейтрона с ядром урана U235. При делении ядра урана образуется 2—3 новых нейтрона, которые могут участвовать в дальнейшем взаимодействии с ядрами, вызывая их деление и тем самым размножение ней- тронов. Ядерная реакция такого типа называется цепной реакцией. Опишем принципиальную математическую модель цепной реакции в неко- тором радиоактивном веществе и получим закон изменения количества ,У(£) нейтронов в зависимости от времени.
288 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Возьмем вещество в виде шара радиуса г. Если г не слишком мало, то за малый промежуток времени h, отсчитываемый от момента t, с одной стороны, произойдет рождение новых нейтронов в количестве, пропорциональном h и 7V(t), а с другой — потеря части нейтронов за счет их выхода за пределы шара. Если v — скорость нейтрона, то за время h покинуть шар могут только те из них, которые удалены от границы не более чем на расстояние vh, да и то если их скорость направлена примерно по радиусу. Считая, что такие нейтро- ны составляют неизменную долю от попавших в рассматриваемую зону и что нейтроны в шаре распределены примерно равномерно, можно сказать, что ко- личество теряемых за время h нейтронов пропорционально N(t) и отношению объема указанной приграничной области к объему шара. Сказанное приводит к равенству N(t + h) - N(t) « aN(t)h - -@-N(t)h (11) r (ибо объем рассматриваемой зоны равен примерно 4irr2vh, а объем шара |тгг3). Коэффициенты а и зависят только от рассматриваемого радио- активного вещества. Из соотношения (11) после деления на h и перехода к пределу при h —> О получаем 7V'(t) = (a- (12) \ г / откуда N(t) = No exp {(а - t}. Из полученной формулы видно, что при fa — — >0 количество нейтронов \ г / будет экспоненциально во времени расти. Характер этого роста, независимо от начального условия No, таков, что за очень короткое время происходит практически полный распад вещества с выделением колоссальной энергии — это и есть взрыв. Если (а — —< 0, то очень скоро реакция прекращается ввиду того, что \ т / теряется больше нейтронов, чем рождается. Если же выполнено пограничное между рассмотренными случаями условие а — — = 0, то устанавливается равновесие между рождением нейтронов и г их выходом из реакции, в результате чего их количество остается примерно постоянным. Величина г, при которой a — — = 0, называется критическим радиусом, а г масса вещества в шаре такого объема называется критической массой веще- ства.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 289 Для урана U235 критический радиус равен примерно 8,5 см, а критическая масса около 50 кг. В котлах, где подогрев пара происходит за счет цепной реакции в радио- активном веществе, имеется искусственный источник нейтронов, который до- ставляет в делящуюся массу определенное количество п нейтронов в единицу времени. Таким образом, для атомного реактора уравнение (12) немного ви- доизменяется: N'(t) = (а-£\ N(t) + п. (13) \ г / Это уравнение решается тем же приемом, что и уравнение (12), ибо есть пР0изв°Дная О’ Функции In [(а - £)lV(t) + п], если а — 0. Следовательно, решение уравнения (13) имеет вид (Nqc^ --------п--- [1 —е(а при а — — 0, Nq 4- nt при а — — = 0. Г Из этого решения видно, что если а — ~ > 0 (сверхкритическая масса), то произойдет взрыв. Если же масса докритическая, т. е. а — — < 0, то очень скоро будем иметь — — а г Таким образом, если поддерживать массу радиоактивного вещества в до- критическом состоянии, но близком к критическому, то независимо от мощ- ности дополнительного источника нейтронов, т. е. независимо от величины п, можно получить большие значения 7V(t), а значит, и большую мощность реактора. Удерживание процесса в прикритической зоне — дело деликатное и осуществляется довольно сложной системой автоматического регулирования. 4. Падение тел в атмосфере. Сейчас нас будет интересовать скорость v(t) тела, падающего на Землю под действием силы тяжести. Если бы не было сопротивления воздуха, то при падении с относительно небольших высот имело бы место соотношение v(t) = д, (14) вытекающее из второго закона Ньютона та = F и закона всемирного тяго- тения, в силу которого при h R (R — радиус Земли) F(t) = G Мт (R + h(t))2 Мт R2 = дт.
290 ГЛ. V- ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Движущееся в атмосфере тело испытывает сопротивление, зависящее от скорости движения, в результате чего скорость свободного падения тяжелого тела в атмосфере не растет неограниченно, а устанавливается на некотором уровне. Например, при затяжном прыжке скорость парашютиста в нижних слоях атмосферы устанавливается в пределах 50—60 м/с. Для диапазона скоростей от 0 до 80 м/с будем считать силу сопротивления пропорциональной скорости тела. Коэффициент пропорциональности, разу- меется, зависит от формы тела, которую в одних случаях стремятся сделать хорошо обтекаемой (бомба), а в других случаях (парашют) имеют прямо про- тивоположную цель. Приравнивая действующие на тело силы, приходим к следующему уравнению, которому должна удовлетворять скорость тела, па- дающего в атмосфере: mv(t) = mg — av. (15) Разделив это уравнение на m и обозначив — через /3, окончательно полу- т чаем v(*) = -0v + £. (13') Мы пришли к уравнению, которое только обозначениями отличается от уравнения (13). Заметим, что если положить — /3v(t) + д = f(t), то, поскольку f'(t) = из (13') можно получить равносильное уравнение /'(*) = -/?/(<), которое с точностью до обозначений совпадает с уравнением (8) или уравне- нием (10). Таким образом, мы вновь пришли к уравнению, решением которого является экспоненциальная функция /(«) = /(0)е_<5‘. Отсюда следует, что решение уравнения (13') имеет вид = |р+ (vo - |)е“А г* V. г* / а решение основного уравнения (15) имеет вид v(t) = ~ 9 + («о - - s) (16) а \ a J где vo = v(0) — начальная вертикальная скорость тела. Из (16) видно, что при а > 0 падающее в атмосфере тело выходит на ста- ционарный режим движения, причем v(t) « — д. Таким образом, в отличие от падения в безвоздушном пространстве, скорость падения в атмосфере зависит не только от формы тела, но и от его массы. При а —> 0 правая часть равен- ства (16) стремится к ио + т. е. к решению уравнения (14), получающегося из (15) при а = 0.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 291 Используя формулу (16), можно составить представление о том, как бы- стро происходит выход на предельную скорость падения в атмосфере. Например, если парашют рассчитан на то, что человек средней комплек- ции приземляется при раскрытом парашюте со скоростью порядка 10 м/с, то, раскрыв парашют после затяжного свободного падения, когда скорость паде- ния составляет примерно 50 м/с, он уже через 3 секунды будет иметь скорость около 12 м/с. Действительно, из приведенных данных и соотношения (16) находим —д « «10, “ » 1, vo = 50 м/с, поэтому соотношение (16) приобретает вид v(t) = 10 + 40еЛ Поскольку е3 « 20, то при t = 3 получим v « 12 м/с. 5. Еще раз о числе е и. функции ехрх. На примерах мы убедились (см. также задачи 3, 4 в конце параграфа), что целый ряд явлений природы описывается с математической точки зрения одним и тем же дифференциаль- ным уравнением f{x) = af(x), (17) решение которого /(а;) однозначно определяется, если указано «начальное условие» /(0). Тогда №) = /(0)е“«. Число е и функцию ех = ехра; мы в свое время ввели довольно формаль- но, сославшись на то, что это действительно важное число и действительно важная функция. Теперь нам ясно, что даже если бы мы не вводили раньше эту функцию, то ее, несомненно, пришлось бы ввести как решение важного, хотя и очень простого уравнения (17). Точнее, достаточно было бы ввести функцию, являющуюся решением уравнения (17) при некотором конкретном значении а, например при а = 1, ибо общее уравнение (17) приводится к это- му случаю после перехода к новой переменной t, связанной с х соотношением а: = 1 (о 0 0). Действительно, тогда dF(t) = /(£) = F(t), ^ = -^ = aF'(t) dt и вместо уравнения f'(x) — af(x) имеем теперь aF'(t} = aF(t), или F'(t) = = F(t). Итак, рассмотрим уравнение /'(®У = /(х) (18) и обозначим через ехра; то его решение, для которого /(0) = 1.
292 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Прикинем, согласуется ли это определение с прежним определением функ- ции ехрж. Попробуем вычислить значение /(ж), исходя из того, что /(0) = 1 и f удо- влетворяет уравнению (18). Поскольку f — дифференцируемая функция, то f непрерывна, но тогда в силу (18) непрерывна и функция f'(x). Более того, из (18) следует, что f имеет также вторую производную /"(ж) = и в0" обще из (18) следует, что f — бесконечно дифференцируемая функция. Так как скорость f(x) изменения функции /(ж) непрерывна, то на малом проме- жутке h изменения аргумента функция /' меняется мало, поэтому /(жо 4- Л) = = /(жо) + /'(С)^1 « /(жо) + f'(xo)h. Воспользуемся этой приближенной фор- мулой и пройдем отрезок от 0 до ж с малым шагом h = —, где п € N. Если п жо = 0, ж*+1 = Xk + Л, то мы будем иметь /(жЛ+1) « /(жЛ) + f’(xk)h. Учитывая (18) и условие /(0) = 1, имеем /(ж) = /(жп) « /(жп-1) 4- /'(Яп-1)Л = /(жп-1)(1 + Л) « « (/(жп_2) + f'(xn_2)h)(l + Л) = /(жп_2)(1 + Л)2 « ... ( \ п 1+ -) • П/ Представляется естественным (и это можно доказать), что чем мельче шаг h = тем точнее приближенная формула /(ж) « 11 + — \ . Таким образом, мы приходим к тому, что /(ж) = lim fl 4- . п—>оо \ П / / х\п В частности, если величину /(1) = lim (1-1—) обозначить через е и п—>оо \ 71/ показать, что е 0 1, то получаем, что /(ж) = lim fl + —^ = lim (1 4- t)x^ — lim (14-i)1^ = еж, (19) ' n->oo \ nJ t-*o t->oLv 7 J v ибо мы знаем, что иа —> va, если и —> у. Метод численного решения дифференциального уравнения (18), позволив- ший нам получить формулу (19), был предложен еще Эйлером и называется методом ломаных Эйлера. Такое название связано с тем, что проведенные выкладки геометрически означают замену решения /(ж), точнее, его графи- ка, некоторой аппроксимирующей график ломаной, звенья которой на соот- ветствующих участках [ж*, ж*+1 ] (к = 0, ..., п — 1) задаются уравнениями У = f(xk) + f'(xk)(x ~ xk) (рис. 46).
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 293 Нам встречалось также определение функции ехрж как суммы степенно- 00 1 го ряда V хп. К нему тоже можно прийти из уравнения (18), если вос- п=0 п! пользоваться следующим часто применяемым приемом, называемым методом неопределен- ных коэффициентов. Будем искать решение уравнения (18) в виде суммы степенного ряда /(ж) = со + cix + ... + спхп + ... , (20) коэффициенты которого подлежат определе- нию. Как мы видели (см. § 5, теорема 1), из (20) следует, что сп = -—^2. Но в силу (18) /(0) = /'(0) = ... = f^(0) = ... П! и, поскольку /(0) = 1, имеем сп = т. е. если решение имеет вид (20) и /(0) = 1, то обязательно /м = 1 + ^ + ^2 + --+^п + --- Можно было бы независимо проверить, что функция, определяемая этим рядом, действительно дифференцируема (и не только при х = 0) и что она удовлетворяет уравнению (18) и начальному условию /(0) = 1. Однако мы не будем на этом останавливаться, ибо наша цель состояла только в том, что- бы понять, согласуется ли введение экспоненциальной функции как решения уравнения (18) при начальном условии /(0) = 1 с тем, что мы раньше подра- зумевали под функцией expz. Заметим, что уравнение (18) можно было бы рассматривать в комплексной области, т. е. считать х произвольным комплексным числом. При этом все проведенные рассуждения останутся в силе, быть может, только частично потеряется геометрическая наглядность метода Эйлера. Таким образом, естественно ожидать, что функция ez = 1+^z+llz2+-+^zn+-- является и притом единственным решением уравнения /'(*) = удовлетворяющим условию /(0) = 1. 6. Колебания. Если тело, подвешенное на пружине, отклонить от поло- жения равновесия, например, приподняв, а затем отпустив его, то оно будет совершать колебания около положения равновесия. Опишем этот процесс в общем виде.
294 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пусть известно, что на материальную точку массы т, способную переме- щаться вдоль числовой оси Ох, действует сила F — —кх, пропорциональная1^ отклонению точки от начала координат. Пусть нам известны также началь- ное положение xq = я(0) нашей точки и ее начальная скорость vq = ±(0). Требуется найти зависимость х = x(t) положения точки от времени. В силу закона Ньютона, эту задачу можно переписать в следующем чисто математическом виде: решить уравнение mx(t) = — kx(t) (21) при начальных условиях Xq = я(0), i(0) = vq. Перепишем уравнение (21) в виде i(t) + = 0 (22) т и попробуем вновь воспользоваться экспонентой, а именно попробуем подо- брать число Л так, чтобы функция x(t) = ext удовлетворяла уравнению (22). Подставляя x(t) = ext в (22), получаем или А2 + - = 0, т (23) / к I к т. е. Л1 = — а/--, \2 — \---- Поскольку т > 0, то при к > 0 мы имеем два V тп V тп чисто мнимых числа: Лх = — i и А2 = г J~^. у тп На это мы не рассчитывали, но тем не менее продолжим рассмотрение. По формуле Эйлера Поскольку при дифференцировании по действительному времени t происхо- дит отдельно дифференцирование действительной и мнимой частей функции еА<, то уравнению (22) должны удовлетворять порознь и функция cos J— t, и V тп функция sin \/ — t. И это действительно так, в чем легко убедиться прямой В случае пружины коэффициент k > 0, характеризующий ее жесткость, называют коэффициентом жесткости пружины.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 295 проверкой. Итак, комплексная экспонента помогла нам угадать два решения уравнения (22), линейная комбинация которых очевидно, также является решением уравнения (22). Коэффициенты ci, с2 в (24) подберем из условий х0 = z(0) = ci, vo = ±(0) = (-ci sin t + с2 cos t\ у у m у m у m ymy Таким образом, функция x(t) = Xq COS t + Vo sin t (25) является искомым решением. Делая стандартные преобразования, (25) можно переписать в виде x(t) = \/xo + vo? sin (\[~1 + ’ (26) V л XV тп j где Хо а = arcsin —г =. / 2 < 2 m Таким образом, при к > 0 точка будет совершать периодические коле- бания с периодом Т = 2л4/^, т. е. с частотой = ~х/~, и амплитудой у к Т 2тг у нг Jxq + Vq?- Мы утверждаем это потому, что из физических соображений у Л ясно, что решение (25) поставленной задачи единственно. (См. задачу 5 в конце параграфа.) Движение, описываемое функцией (26), называют простыми гармониче- скими колебаниями, а уравнение (22) — уравнением гармонических колебаний. Вернемся теперь к случаю, когда в уравнении (23) к < 0. Тогда две функ- ции еА1< = ехр(—</— — t), eAat = ехр(\/— — t) будут вещественными реше- \ у mJ у у т ) ниями уравнения (22) и функция x(t) = C1eAlt + с2еА2< (27) также будет решением. Постоянные ci и с2 подберем из условий so = ж(0) = Ci + с2, vo = i(0) = cMi +с2Л2.
296 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Полученная система всегда однозначно разрешима, ибо ее определитель А2 - Лх 0 0. Поскольку числа Ах и А2 противоположного знака, то из (27) видно, что при к < 0 сила F = — кх не только не стремится вернуть точку в положение равновесия х = 0, но со временем неограниченно уводит ее от этого положе- ния, если xq или vq отлично от нуля. То есть в этом случае х = 0 — точка неустойчивого равновесия. В заключение рассмотрим одну вполне естественную модификацию урав- нения (21), на которой еще ярче видна польза показательной функции и фор- мулы Эйлера, связывающей основные элементарные функции. Предположим, что рассматриваемая нами частица движется в среде (воз- духе или жидкости), сопротивлением которой пренебречь нельзя. Пусть сила сопротивления среды пропорциональна скорости точки. Тогда вместо урав- нения (21) мы должны написать уравнение mx(t) — —ax(t) — kx(t), которое перепишем в виде f(t) + — i(t) + = 0. тп тп (28) Если вновь искать решение в виде x(t) — ext, то мы придем к квадратному уравнению А2 + — А+- = 0, m m „ х а . Vet2 — 4mk корни которого Ах 2 = — й— ± ~—п---• 2in 2тп Случай, когда а2 — 4тк > 0, приводит к двум вещественным корням Ах, А2, и решение может быть найдено в виде (27). Мы рассмотрим подробнее более интересный для нас случай, когда а2 — — 4т к < 0. Тогда оба корня Ах, А2 комплексные (но не чисто мнимые!): х — _ а _ • ~ а2 1 2m г 2т ’ . _ a V4mk — а2 2 2т Ъ 2т Формула Эйлера в этом случае дает eAlt = exp^—(cosojf — isino>£), еA2t _ ехр (cog + i sin u>t), V4mk - a2 m e где (л) = —— --. Таким образом, мы находим два вещественных решения 2т exp^— cosojf, exp^—sintvt уравнения (28), угадать которые было
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 297 бы уже довольно трудно. Затем ищем решение исходной задачи в виде их линейной комбинации x(t) = exp t) (ci COSUt + C2 sin tut), 2m ✓ (29) подбирая Ci и C2 так, чтобы удовлетворить начальным условиям ж(0) = Xq, ж(0) = VQ. Получающаяся при этом система уравнений, как можно проверить, всегда однозначно разрешима. Таким образом, после преобразований из (29) полу- чаем решение задачи в виде x(t) = Aexpy——tj sin (tut + a), (30) где Айа — константы, определяемые начальными условиями. Из этой формулы видно, что благодаря множителю ехр (— -- t], где a > 0, т > 0, в рассматриваемом случае колебания будут затухающими, причем ско- рость затухания амплитуды зависит от отношения —. Частота колебаний ______________________ т 1 1 / к ( Ct \ — си = — \/----I -— ) меняться во времени не будет. Величина си тоже за- 2?Г 27Г у 771 \ 2771 / висит только от отношений —, —, что, впрочем, можно было предвидеть на т т основании записи (28) исходного уравнения. При а = 0 мы вновь возвраща- емся к незатухающим гармоническим колебаниям (26) и уравнению1 (22). Задачи и упражнения 1. Коэффициент полезного действия реактивного движения. а) Пусть Q — наюлзтескгя энергия единицы массы топлива ракеты, ш — скорость истечения топлива. Тогда ^<и2 есть кинетическая энергия выброшенной единицы массы топлива. Коэффициент а в равенстве i tu2 = a Q есть коэффициент полезного действия процессов горения и истечения топлива. Для твердого топлива (бездым- ный порох) си = 2 км/с, Q = 1000 ккал/кг, а для жидкого (бензин с кислородом) си = 3 км/с, Q — 2500 ккал/кг. Определите в этих случаях коэффициент а. Ь) Коэффициент полезного действия (к. п. д.) ракеты определяется как отно- 2 шение ее конечной кинетической энергии шк — к химической энергии сгоревшего Л/ топлива mTQ. Пользуясь формулой (4), получите формулу для к. п. д. ракеты через 'тк, пгт, Q и а (см. а)). с) Оцените к. п. д. автомобиля с жидкостным реактивным двигателем, если ав- томобиль разгоняется до установленной в городе скорости 60 км/час. d) Оцените к. п. д. ракеты на жидком топливе, выводящей спутник на низкую околоземную орбиту.
298 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ е) Оцените, для какой конечной скорости реактивное движение на жидком топ- ливе имеет наибольший к. п. д. f) Укажите, при каком отношении масс тт/тк топлива и корпуса к. п. д. ракеты с любым видом топлива становится максимально возможным. 2. Барометрическая формула. а) Используя данные п. 2 настоящего параграфа, получите формулу поправочно- го члена для учета зависимости давления от температуры столба воздуха, если эта температура подвержена изменениям (например, сезонным) в пределах ±40 0 С. Ь) Найдите по формуле (9) зависимость давления от высоты при температурах —40 ° С, 0 ° С, 40 °C и сравните эти результаты с результатами, которые дает ваша приближенная формула из а). с) Пусть температура воздуха в столбе меняется с высотой по закону T'(h) = = —аТо, где То — температура воздуха на поверхности Земли, а а » 7 10‘“7 см Х. Выведите при этих условиях формулу зависимости давления от высоты. d) Найдите давление в шахте на глубинах 1 км, 3 км, 9 км по формуле (9) и по формуле, которую вы получили в с). е) Воздух независимо от высоты примерно на 1/5 часть состоит из кислорода. Парциальное давление кислорода составляет также примерно 1/5 часть давления воздуха. Определенный вид рыб может жить при парциальном давлении кислорода не ниже 0,15 атмосфер. Можно ли ожидать, что этот вид встретится в реке на уровне моря? Может ли он встретиться в речке, впадающей в озеро Титикака на высоте 3,81 км? 3. Радиоактивный распад. а) Измеряя количество радиоактивного вещества и продуктов его распада в про- бах пород Земли и считая, что сначала продукта распада вообще не было, можно примерно оценить возраст Земли (во всяком случае, с того момента, когда это ве- щество уже возникло). Пусть в породе имеется т г радиоактивного вещества и г г продукта его распада. Зная период Т полураспада вещества, найдите время, про- шедшее с момента начала распада, и количество радиоактивного вещества в пробе того же объема в начальный момент. Ь) Атомы радия в породе составляют примерно 10~12 часть всех атомов. Каково было содержания радия 105, 106 и 5 • 109 лет тому назад? (5 • 109 лет ориентировочно считается возрастом Земли.) с) В диагностике заболеваний почек часто определяют способность почек вы- водить из крови различные специально вводимые в организм вещества, например креатин («клиренс тест»). Примером, иллюстрирующим обратный процесс того же типа, может служить восстановление концентрации гемоглобина в крови у донора или у больного, внезапно потерявшего много крови. Во всех этих случаях уменьше- ние количества введенного вещества (или, наоборот, восстановление недостающего количества) подчиняется закону N = где N — количество (или, иными сло- вами, число молекул) вещества, еще оставшегося в организме по прошествии вре- мени t после введения количества Ао, ат — так называемая постоянная времени'. это время, по прошествии которого в организме остается 1/е часть первоначально введенного количества вещества. Постоянная времени, как легко проверить, в 1,44 раза больше времени полу жизни (или времени полураспада), по истечении которого в организме остается половина первоначального количества вещества.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 299 Пусть радиоактивное вещество выводится из организма со скоростью, характе- ризуемой постоянной времени то, и в то же время спонтанно распадается с постоян- ной времени тр. Покажите, что в этом случае постоянная времени г, характеризую- щая длительность сохранения вещества в организме, определяется из соотношения г"1 =т0-1 +Т-1. d) У донора было взято некоторое количество крови, содержащее 201 мг железа; для того чтобы компенсировать потерю железа, ему было велено принимать три- жды в день в течение недели таблетки сернокислого железа, содержащие каждая 67 мг железа. Количество железа в крови донора восстанавливается до нормы по экспоненциальному закону с постоянной времени, равной примерно семи суткам. Полагая, что с наибольшей скоростью железо из таблеток включается в кровь сразу же после взятия крови, определите, какая примерно часть железа, содержащегося в таблетках, включится в кровь за все время восстановления нормального содержания железа в крови. е) Больному со злокачественной опухолью было введено с диагностическими це- лями некоторое количество радиоактивного фосфора Р32, после чего через равные промежутки времени измерялась радиоактивность кожи бедра. Уменьшение радио- активности подчинялось экспоненциальному закону. Так как период полураспада фосфора известен — он составляет 14,3 суток, — по полученным данным можно бы- ло определить постоянную времени процесса уменьшения радиоактивности за счет биологических причин. Найдите эту постоянную, если наблюдениями установлено, что постоянная времени процесса уменьшения радиоактивности в целом составляет 9,4 суток (см. выше задачу с)). 4. Поглощение излучения. Прохождение излучения через среду сопровождается частичным поглощением излучения этой средой. Во многих случаях (линейная теория) можно считать, что, проходя через слой толщиной 2 единицы, излучение ослабляется так же, как при последовательном прохождении через два слоя толщиной 1 каждый. а) Покажите, что при указанном условии поглощение излучения подчиняется за- кону I = Ioe~kl, где /о — интенсивность излучения, падающего на поглощающее вещество, I — интенсивность после прохождения слоя толщиной /, а к — коэффици- ент, имеющий размерность, обратную размерности длины. Ь) Коэффициент к в случае поглощения света водой в зависимости от длины волны падающего света, например, таков: ультрафиолет, к = 1,4 • 10-2; синий, к = = 4,6 • 10~4; зеленый, к — 4,4 • 10~4; красный, к — 2,9 • 10~3. Солнечный свет падает вертикально на поверхность чистого озера глубиной 10 м. Сравните интенсивности каждой из перечисленных выше компонент солнечного света над поверхностью озера и на дне. 5. Покажите, что если закон движения точки х — x(t) удовлетворяет уравнению тх + кх = 0 гармонических колебаний, то: х „ mx2(t) , kx2(t) , тт а) величина Е = —4- —постоянна (Е = К 4- и — сумма кинетической тпх (t) v тт kx2(t) у .х К = ——— и потенциальной и =-------— энергии точки в момент t)\ 2 2 Ь) если х(0) = 0 и i(0) = 0, то x(t) = 0; с) существует и притом единственное движение х — x(t) с начальными условиями х(0) = го и х(0) = vq-
300 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ d) Проверьте, что если точка движется в среде с трением их = x(t) удовлетво- ряет уравнению тх 4- ах 4- кх = 0, а > 0, то величина Е (см. а)) убывает. Найдите скорость этого убывания и объясните физический смысл полученного результата, учитывая физический смысл величины Е. 6. Движение под действием гуковской1^ центральной силы (плоский осцилля- тор). В развитие рассмотренного в п. 6 и задаче 5 уравнения (21) линейного осцилля- тора рассмотрим уравнение mr(t) = —fcr(t), которому удовлетворяет радиус-вектор r(i) точки массы т, движущейся в пространстве под действием притягивающей цен- тральной силы, пропорциональной (с коэффициентом пропорциональности к > 0) расстоянию |r(i) | от центра. Такая сила возникает, если точка соединена с центром гуковской упругой связью, например пружиной с коэффициентом жесткости к. а) Продифференцировав векторное произведение r(t) х r(t), покажите, что все движение будет происходить в плоскости, проходящей через центр и содержащей векторы го = r(to), i*o = r(to) начального положения и начальной скорости точки (плоский осциллятор). Если векторы го — г(<о), го — г($о) коллинеарны, то движение будет происходить на прямой, содержащей центр и вектор го (линейный осциллятор, рассмотренный в п. 6). Ь) Проверьте, что орбитой плоского осциллятора является эллипс и движение по нему периодично. Найдите период обращения. с) Покажите, что величина Е = 4- fcr2(t) сохраняется во времени. d) Покажите, что начальные данные го = г(^о), го = г(<о) вполне определяют дальнейшее движение точки. 7. Эллиптичность планетных орбит. Предыдущая задача позволяет рассматривать движение точки под действием центральной гуковской силы происходящим в плоскости. Пусть это плоскость ком- плексной переменной z — х 4- iy. Движение определяется двумя вещественными функциями х = «(<), у = y(t) или, что то же самое, одной комплекснозначной функ- цией z — z(t) времени t. Полагая для простоты в задаче 6 т = 1, к = 1, рассмотрим простейший вид уравнения такого движения z(t) = —z(t). а) Зная из задачи 6, что решение этого уравнения, отвечающее конкретным на- чальным данным zq = z(to), zo — i(to)> единственно, найдите его в виде z(t) = = cietf 4- сзе-1* и, используя формулу Эйлера, проверьте еще раз, что траекторией движения является эллипс с центром в нуле (в определенных случаях он может пре- вратиться в окружность или выродиться в отрезок — выясните когда). Ь) Учитывая, что величина |i(t)|2 4- |z(i)|2 не меняется в процессе движения точ- ки z(t), подчиненного уравнению z(t) = —z(t), проверьте, что точка w(t) = z2(t) по отношению к новому параметру (времени) т, связанному с t соотношением г = r(t) dr . ,.XI2 d2w w таким, что — = |z(c)| , движется при этом, подчиняясь уравнению -j-z- = — с:—гг, dt dr* l^i где с — постоянная, a w = w(t(r)). Таким образом, движения в центральном поле гуковских сил и движения в ньютоновском гравитационном поле оказались взаимо- связаны. Х)Р. Гук (1635—1703) — английский естествоиспытатель, разносторонний ученый и экс- периментатор. Открыл клеточное строение тканей и ввел сам термин <клетка». Стоял у истоков математической теории упругости и волновой теории света, высказал гипотезу тяготения и закон обратных квадратов для гравитационного взаимодействия.
§ 7. ПЕРВООБРАЗНАЯ 301 с) Сопоставьте это с результатом задачи 8 из § 5 и докажите теперь эллиптич- ность планетных орбит. d) Если вам доступен компьютер, то, взглянув еще раз на изложенный в п. 5 метод ломаных Эйлера, для начала подсчитайте этим методом несколько значений ех. (Заметьте, что кроме определения дифференциала, точнее, формулы f(xn) а й У(жп-1) + f'(xn-i)h, где h = хп — хп-1, метод ничего не использует.) Пусть теперь r(t) = (x(0,j/(0), го = г(О) = (1,0), го = г(0)=(0,1) иг(0 = -|^р-. Опираясь на формулы г(£п) W r(tn-l) + v(tn-l)ft, v(tn) « v(tn-i) + a(tn-i)h, где v(0 = r(0, a(0 = v(0 = г(0, методом Эйлера рассчитайте траекторию движе- ния точки, посмотрите, какой она формы и как она проходится точкой с течением времени. § 7. Первообразная В дифференциальном исчислении, как мы убедились на примерах предыдуще- го параграфа, наряду с умением дифференцировать функции и записывать соотношения между их производными весьма ценным является умение нахо- дить функции по соотношениям, которым удовлетворяют их производные. Простейшей, но, как будет видно из дальнейшего, весьма важной задачей та- кого типа является вопрос об отыскании функции F(x) по известной ее про- изводной F'(x) = f(x). Начальному обсуждению этого вопроса и посвящен настоящий параграф. 1. Первообразная и неопределенный интеграл Определение 1. Функция F(x) называется первообразной функцией или первообразной по отношению к функции f(x) на некотором промежут- ке, если на этом промежутке функция F дифференцируема и удовлетворяет уравнению F‘(x) = f(x) или, что то же самое, соотношению dF{x) — f(x)dx. Пример 1. Функция F(x) = arctgx является первообразной для f(x) = = . * 2 на всей числовой прямой, поскольку arctg'x = 1 "Т* X 1 -f- Пример 2. Функция F(x) = arcctg - является первообразной для функ- 1 х ции f(x) = ———- как на промежутке всех положительных чисел, так и на 1 -г X полуоси отрицательных чисел, ибо при х 0 F'(x}=—Ь? • Н)=пЬ= 1 | I ) \ •*' / А ' •*' \х/ Как обстоит дело с существованием первообразной и каково множество первообразных данной функции?
302 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В интегральном исчислении будет доказан фундаментальный факт о том, что любая непрерывная на промежутке функция имеет на этом промежутке первообразную. Мы приводим этот факт для информации читателя, а в этом параграфе используется, по существу, лишь следующая, уже известная нам (см. гл. V, § 3, п. 1) характеристика множества первообразных данной функции на чи- словом промежутке, полученная из теоремы Лагранжа. Утверждение 1. Если Fi(х) и (х) — две первообразные функции f(х) на одном и том же промежутке, то их разность Fi(x) — Fa (ж) постоянна на этом промежутке. Условие, что сравнение Fi и F2 ведется на связном промежутке, как от- мечалось при доказательстве этого утверждения, весьма существенно. Это можно заметить также из сопоставления примеров 1 и 2, в которых производ- ные функций Fi (х) = arctg х и F2 (х) = arcctg совпадают в области R \ 0 их совместного определения. Однако Fi(x) — F2(x) = arctg х — arcctg - = arctg x — arctg x = 0, если x > 0, в то время как Fi(x) — F2(x) = — тг при x < 0, ибо при x < 0 имеем arcctg = тг 4- arctg x. Как и операция взятия дифференциала, имеющая свое название «диффе- ренцирование» и свой математический символ dF(x) = F'(x) dx, операция пере- хода к первообразной имеет свое название «неопределенное интегрирование» и свой математический символ У f(x) dx, (1) называемый неопределенным интегралом от функции f(x) на заданном про- межутке. Таким образом, символ (1) мы будем понимать как обозначение любой из первообразных функции f на рассматриваемом промежутке. В символе (1) знак f называется знаком неопределенного интеграла, f — подынтегральная функция, a f(x)dx — подынтегральное выражение. Из утверждения 1 следует, что если F(x) — какая-то конкретная перво- образная функции У(х) на промежутке, то на этом промежутке dx = F(z) 4- С, (2) т. е. любая другая первообразная может быть получена из конкретной F(x) добавлением некоторой постоянной.
§ 7. ПЕРВООБРАЗНАЯ 303 Если F'(x) = /(ж), т. е. F — первообразная для / на некотором проме- жутке, то из (2) имеем (3) Кроме того, в соответствии с понятием неопределенного интеграла как любой из первообразных, из (2) следует также, что (4) Формулы (3) и (4) устанавливают взаимность операций дифференциро- вания и неопределенного интегрирования. Эти операции взаимно обратны с точностью до появляющейся в формуле (4) неопределенной постоянной С. До сих пор мы обсуждали лишь математическую природу постоянной С в формуле (2). Укажем теперь ее физический смысл на простейшем приме- ре. Пусть точка движется по прямой так, что ее скорость v(t) известна как функция времени (например, v(t) = v). Если x(t) — координата точки в мо- мент t, то функция x(t) удовлетворяет уравнению x(t) = v(t), т. е. является первообразной для v(t). Можно ли по скорости v(t) в каком-то интервале вре- мени восстановить положение точки на оси? Ясно, что нет. По скорости и промежутку времени можно определить величину пройденного за это время пути s, но не положение на оси. Однако это положение также будет полно- стью определено, если указать его хотя бы в какой-то момент, например при t = 0, т. е. задать начальное условие я(0) = xq. До задания начального усло- вия закон движения x(f) мог быть любым среди законов вида x(t) = x(t) 4- с, где x(t) — любая конкретная первообразная функции v(t), а с — произвольная постоянная. Но после задания начального условия я(0) = хо вся неопределен- ность исчезает, ибо мы должны иметь s(0) = s(0) 4- с = хо, т. е. с = xq — я(0), и х(1) = хо 4- [i(t) — х(0)]. Последняя формула вполне физична, поскольку произвольная первообразная х участвует в формуле только в виде разности, определяя пройденный путь или величину смещения от известной начальной метки я(0) = so- 2. Основные общие приемы отыскания первообразной. В соответ- ствии с определением символа (1) неопределенного интеграла, он обозначает функцию, производная которой равна подынтегральной функции. Исходя из этого определения, с учетом соотношения (2) и законов дифференцирования можно утверждать, что справедливы следующие соотношения: а. (5) (6) Ь.
304 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ с. Если на некотором промежутке 1Х j f(x) dx — F(x) 4- с, а : It —> 1Х — гладкое (т. е. непрерывно дифференцируемое) отображение промежутка It в 1Х, то j(fo<p)(tW(t)dt = (FoV)(t)+c. (7) Равенства (5), (6), (7) проверяются прямым дифференцированием их левой и правой частей с использованием в (5) линейности дифференцирования, в (6) правила дифференцирования произведения и в (7) правила дифференцирова- ния композиции функций. Подобно правилам дифференцирования, позволяющим дифференцировать линейные комбинации, произведения и композиции уже известных функций, соотношения (5), (6), (7), как мы увидим, позволяют в ряде случаев сводить отыскание первообразной данной функции либо к построению первообразных более простых функций, либо вообще к уже известным первообразным. На- бор таких известных первообразных может составить, например, следующая краткая таблица неопределенных интегралов, полученная переписыванием та- блицы производных основных элементарных функций (см. § 2, п. 3): J ха dx = । ж<а+1 + с (а / 1), / — dx = In|х| 4- с, х [ ах dx = аХ + с (0 < а / 1)» J In а j exdx = ех + с, У sin х dx = — cos х 4- с, J cos x dx = sin x 4- c, —dx = tg x 4- c, cos2 a: /-г-V dx = — ctg x 4- c, smz /1 arcsin x 4- c, • dx — — x2 — axccos x 4- c,
§ 7. ПЕРВООБРАЗНАЯ 305 dx = < arctg a^4- с, — arcctg х 4- 2, J shx dx = ch x + с, ch x dx = sh x 4- c, = ths 4- c, — cth x 4- c, 1 1 — x Каждая из этих формул рассматривается на тех промежутках веществен- ной оси 1R, на которых определена соответствующая подынтегральная функ- ция. Если таких промежутков несколько, то постоянная с в правой части может меняться от промежутка к промежутку. Рассмотрим теперь некоторые примеры, показывающие соотношения (5), (6) и (7) в работе. Сделаем предварительно следующее общее замечание. Поскольку, найдя одну какую-нибудь первообразную заданной на проме- жутке функции, остальные можно получить добавлением постоянных, то усло- вимся для сокращения записи всюду в дальнейшем произвольную постоянную добавлять только к окончательному результату, представляющему из себя конкретную первообразную данной функции. а. Линейность неопределенного интеграла. Этот заголовок должен означать, что в силу соотношения (5) первообразную от линейной комбина- ции функций можно искать как линейную комбинацию первообразных этих функций. Пример 3. J(а0 4- #12 4-... 4- апхп) dx = = с 4- аох 4- | aix2 4-... 4-- апхп+1. L п 4-1
306 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 4. 13-3,4 3/2 3 +3 Пример 5. cos2 dx Z cosx 1 4- cos х) dx = 2 2 ~ x 4- - sin x 4- c. Z z b. Интегрирование по частям. Формулу (6) можно переписать в виде u(x)v(x) = / u{x)dv{x) 4- I v(x)du(x) 4- с или, что то же самое, в виде Ju(x)dv(x) = u(x)v(x) — У v(x) du(x) 4- с. (6') Это означает, что при отыскании первообразной функции u(x)v'(x) де- ло можно свести к отысканию первообразной функции v(x)u>(x), перебро- сив дифференцирование на другой сомножитель и частично проинтегрировав функцию, как показано в (6'), выделив при этом член u(x)v(x). Формулу (6') называют формулой интегрирования по частям. Пример 6. /Inxdz = zlnz — [ xdlnx = xlnx — [ x-— dx— J J x = xlnz — fl dx = x\nx — x + c. Пример 7. J x2ex dx = J x2 dex = x2ex — f exdx2 = x2ex — 2 f xexdx = = x2ex — 2^ x dex = x2ex — 2 — J ex dx^ — = x2ex — 2xex 4- 2ex 4- c = (x2 — 2x 4- 2)ex 4- c.
§ 7. ПЕРВООБРАЗНАЯ 307 с. Замена переменной в неопределенном интеграле. Формула (7) показывает, что при отыскании первообразной функции (/o^)(t) можно поступать следующим образом: с = 4- с, т. е. сначала произвести замену ) = т под знаком интеграла и перейти к но- вой переменной т, а затем, найдя первообразную как функцию от т, вернуться к старой переменной t заменой т = Пример 8. tdt _ 1 = 11п|т| 4- с = | ln(t2 4-1) 4- с. Пример 9. dx dx sin т J 2 sin тг cos J tg cos2 | — [ du — f J tgu COS2U J t = ln|v| 4- c = ln|tgu| 4- c dv v Мы рассмотрели несколько примеров, в которых использовались порознь свойства а, Ь, с неопределенного интеграла. На самом деле в большинстве случаев эти свойства используются совместно. Пример 10. cos sin 5т — sin x) dx = COST cost = — — cosт 4- ~ cosт 4- с = Av £ = - cost - — cos 5т 4- с. лл Av 11 Зорич В. A.
308 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 11. arcsinz dx — х arcsinz arcsinz — = zarcsinz 5.. . dx = rrarcsinz 4- -x2 ^1 = -t2 — x arcsine 4* x arcsine + u1/2 + c = = x arcsine 4- yl — x2 + c. Пример 12. J eax cos bx dx = J cos bx deax = = - eax cos bx — - [eax dcos bx — - eax cos bx 4- - [eax sin bxdx — a a J a a J = - eax cos bx + ~ f sin bx deax = - eax cos bx 4- eax sin bx - a a2 J a a2 b f ax j • l a cos bx + b sin bx ax b2 f ax , , ----о / e d sin tor =----z-------eax---~ I eax cos hr dx. a2 J a2 a2 J Из полученного равенства заключаем, что /о, , , а cos bx 4- b sin bx ax , e cos bx dx =-------z—rx------e 4- c. a2 4- b2 К этому результату можно было бы прийти, воспользовавшись форму- лой Эйлера и тем обстоятельством, что первообразной функции е(°+«6)« = = еах cos bx 4- ieax sin bx является функция 1 (а-Нй)а; _ а ib (a+ib)x _ а + ib а2 4- b2 a cos bx 4- b sin bx ax . .a sin bx — b cos bx ax e 4-1---------------------------z--гт;----e a2 + b2 a2 4- b2 Это полезно иметь в виду и в будущем. При вещественном х это легко прове- рить непосредственно, продифференцировав действительную и мнимую части функции e(a+ib)x В частности, отсюда получаем также, что ах - г j a sin bx — b cos bx ax eax sin bx dx =-----------—-z------eax а2 4- Ь2 Уже этот небольшой набор разобранных примеров показывает, что при отыскании первообразных даже элементарных функций часто приходится прибегать к дополнительным преобразованиям и ухищрениям, чего совсем
§ 7. ПЕРВООБРАЗНАЯ 309 не было при отыскании производных композиции тех функций, производные которых нам были известны. Оказывается, это не случайная трудность. На- пример, в отличие от дифференцирования, переход к первообразной элемен- тарной функции может привести к функции, которая уже не является ком- позицией элементарных. Поэтому не следует отождествлять фразу «найти первообразную» с невыполнимым порой заданием «выразить первообразную данной элементарной функции через элементарные функции». Вообще, класс элементарных функций — вещь очень условная. Имеется еще много важных для приложений специальных функций, которые изучены и затабулированы ничуть не хуже, чем, скажем, sin# или ех. Например, интегральный синус Si я есть та первообразная / ^-^-dx функ- J х ции которая стремится к нулю при х —> 0. Такая первообразная суще- с. -г sin х ствует, но, как и любая другая первообразная функции --, она не является X композицией элементарных функций. Аналогично, функция r,. f cos х , Ci х = / ---dx, J х выделяемая условием Ci я -> 0 при х -> оо, не является элементарной. Функ- ция Ci я называется интегральным косинусом. Первообразная J* функции также неэлементарна. Одна из перво- образных этой функции обозначается символом li х и называется интеграль- ным логарифмом. Она удовлетворяет условию li х -> 0 при х -> 4-0. (Подробнее о специальных функциях Six, Cix, li х будет сказано в гл. VI, § 5.) Учитывая эти трудности отыскания первообразных, составлены довольно обширные таблицы неопределенных интегралов. Однако, чтобы успешно ими воспользоваться или чтобы не прибегать к ним, если вопрос совсем прост, необходимо иметь некоторые навыки обращения с неопределенными интегра- лами. Дальнейшая часть этого параграфа посвящена интегрированию функций из некоторых специальных классов, первообразные которых выражаются в виде композиции элементарных функций. 3. Первообразные рациональных функций. Рассмотрим вопрос об интегралах вида f R(x)dx, где R(x) = J Q(x) есть отношение полиномов. 'Если действовать в области вещественных чисел, то, не выходя за пределы поля вещественных чисел, любую такую дробь, как известно из алгебры (см. формулу (37) из § 5, п. 4), можно разложить в сумму п* Л») <Э(х) =р(«)+52 >=i ajk (X - Xj)fc n / j=l \fc=l bjkx 4* Cjk (x2 + pjx + qj)k (8)
310 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ где р(х) — многочлен (он появляется при делении Р(х) на Q(x), только если степень Р(х) не меньше степени Q(x)), а^, bjk, Cjk — однозначно определяе- мые действительные числа, a Q(x) = (x — x\)kl... (x — xi)kt (х2 +pix + qi)mi... ... (ж2 +pnx-^qn)mn. О том, как строить разложение (8), мы уже говорили в § 5. После то- го как разложение (8) построено, интегрирование функции R(x) сводится к интегрированию отдельных слагаемых. Многочлен мы уже интегрировали в примере 1, поэтому остается рассмо- треть только интегрирование дробей вида 1 Ьх + С > TXT ----й и 7ТТ-----------где — а)к (х2 + рх + q)K Вопрос о первой из этих дробей решается сразу, ибо -^—dx=l + А — /Т Iя I ' I In |rr — а| + с (х — а) *+1 + с при к 1, (9) при к = 1. С интегралом поступим следующим / 1 / 1 (х+зР) вещественных корней. /Ьх + с , -----------г dx (ж2 +рх + q)k образом. Представим многочлен х2 + рх + q в виде где q — >0, так как многочлен х2 +рх + q не имеет Полагая х + ^р = и и q — |р2 = о2, получаем Ьх + с (х2 + рх + q)k аи + Д J ---------г du. (и2 + а2)к где а = Ь, /3 = с - ~Ър. Далее, и_____ +- а2)* d(u2 1 2(1 - к) | Ь(и2 н А при к 1, при к = 1, (10) и остается разобраться с интегралом du
$ 7. ПЕРВООБРАЗНАЯ 311 Интегрируя по частям и делая элементарные преобразования, имеем т — f _ и__________. «г [ Ц2 ди _ к J (и2 + а2)к (и2 + а2)к J (и2 4- а2)*+1 14 , п j f (^ 4* ® ) ~~ ® 1 W । л t т о 1» 2 г — 'i------/ 2\*+1 ~ ( 2 2\к + 2&I*: — 2/га Д+1, (и2 + а2)* J (и2 + а2)*+1 (и2 4- а2)* откуда следует рекуррентное соотношение т _ 1________________________________и______1 2к — 1 , / *+1 2ка2 (и2 4- а2)к 2ка2 к’ k позволяющее понижать степень к в интеграле (11). Но Д легко вычислить: du и2 4- а2 (13) таким образом, используя (12) и (13), можно вычислить также первообраз- ную (11). Итак, мы доказали следующее Утверждение 2. Первообразная любой рациональной функции R{x) = Р(а?) ж л = > ' выражается через рациональные функции, а также трансцендент- ^б\х) ные функции In и ar ctg. Рациональная часть первообразной, будучи приведе- на к общему знаменателю, должна в качестве такового иметь произведение всех сомножителей, на которые раскладывается многочлен Q(x), только с кратностями на единицу меньшими, чем кратность их вхождения в разло- жение Q(x). гг 1 о п f 2а;2 4- 5х 4- 5 , Пример 13. Вычислим / 7—х—-гт--------—- dx. J (х2 - 1)(х 4- 2) Поскольку подынтегральная функция является правильной дробью и, раз- ложение знаменателя в произведение (х — 1)(х 4- 1)(х 4- 2) тоже известно, то сразу ищем разложение 2а;2 4- 5х 4- 5 = А В С (х — 1)(аг 4- 1)(а; 4-2) ж — 1 х4-1 ж4-2 нашей дроби в сумму простейших дробей. Приведя правую часть равенства (14) к общему знаменателю, имеем 2а;2 4- 5а; 4- 5 = (А 4- В 4- С)х2 4- (ЗА 4- B)z 4- (2А - 2В - С) (ar. - 1)(а; 4- 1)(а; 4-2) (а; - 1)(а; 4- 1)(а; 4- 2)
312 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Приравнивая соответствующие коэффициенты числителей, получаем систему (А 4- В 4- С — 2, ЗА 4- В =5, 2А - 2В - С = 5, из которой находим (А, В, С) — (2, —1,1). Заметим, что в данном случае эти числа можно было бы найти и в уме. Действительно, домножая (14) на х—1 и полагая затем в полученном равенстве х = 1, справа получим А, а слева — значение при х = 1 дроби, полученной из " 1 л 2 4-54-5 л нашей вычеркиванием в знаменателе сомножителя х—1, т. е. А = —— = 2. Аналогично можно было бы найти В и С. Итак, 2х2 4- 5х 4- 5 , — о / _ f ^х . [ (х2 — 1)(х 4-2) J х — 1 J х 4-1 J х 4- 2 = 21п|ат — 1| — In|х 4-1| 4- 1п|х 4- 2| 4- с = In Пример 14. Вычислим первообразную функции ад = х7 - 2х6 4- 4х5 — 5х4 4- 4х3 — 5х2 — х (х — 1)2(х2 4-1)2 Прежде всего заметим, что дробь не является правильной, поэтому, рас- крыв скобки и найдя знаменатель дроби Q(x) = х6—2х54-3х4—4х34-Зх2 —2x4-1, делим на него числитель, после чего получаем х5 - х4 4- х3 - Зх2 - 2х х (х-1)2(х2 4-1)2 ’ а затем уже ищем разложение правильной дроби х5 — х4 4- х3 — Зх2 — 2х _ А В Сх 4- D Ех 4- F . (х — 1)2(х2 4-1)2 (х — 1) х — 1 (х2 4-1)2 х2 4-1 Конечно, разложение можно найти каноническим путем, выписав систему шести уравнений с шестью неизвестными. Однако вместо этого мы проде- монстрируем иные, иногда используемые, технические возможности. Коэффициент А находим, домножив равенство (15) на (х — I)2 и положив затем х = 1: А = —1. Перенесем дробь с уже известным значением А = — 1 в левую часть равенства (15). Тогда получим х4 4- х3 4- 2х2 4- х — 1 _ В Сх 4- D Ех 4- F (х — 1)(х2 4-1)2 х — 1 (х2 4-1)2 х2 4« 1 ’
§ 7. ПЕРВООБРАЗНАЯ 313 откуда, домножая (16) на х — 1 и полагая затем х = 1, находим В = 1. Перенося теперь дробь —~ в левую часть равенства (16), получим а;2 4- а; + 2 _ Сх 4- D . Ех 4- F (х2 4-1)2 (х2 4-1)2 х2 4-1 Приводя правую часть равенства (17) к общему знаменателю, приравни- ваем числители х2 4- х 4- 2 = Ех3 4- Fx2 4- (С 4- Е)х + {Р + F), откуда следует, что Е = О, F = 1, С + Е=1, k D 4- F = 2, или (С, D, Е, F) = (1,1,0,1). Теперь нам известны все коэффициенты в равенстве (15). Первые две дро- би при интегрировании дают соответственно —и In|z — 1|. Далее, ОС X Г Сх + D , Г ж 4-1 , J (г2 +1)2 dxJ +1)2 fa ~ _ 1 f d(x2 4-1) f dx _ —1 - “ 2 J (x2 + I)2 J (x2 4-1)2 “ 2(x2 4-1) + 2’ где T _ [ dx 1 x t 1 , 2 /(r2 + l)2 2 (X2 + I)2 + 2 6®’ что следует из (12) и (13). Наконец, Г Ех 4- F . Г 1 , / —5—— ах — —т—- dx — arctg х. J xz 4-1 J х2 4-1 Собирая все интегралы, окончательно имеем Уя(Ж) dx = | х* + -L- + .^х+ 1)2 + Ы» - 1| + | arctg! + е. Рассмотрим теперь некрторые часто встречающиеся неопределенные инте- гралы, вычисление которых может быть сведено к отысканию первообразной рациональной функции.
316 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 5. Первообразные вида J R(x, !/(®)) dx. Пусть, как и в пункте 4, R(x, у) — рациональная функция. Рассмотрим некоторые специальные перво- образные вида JR(x, у(х)) dx, где у = у(х) — функция от х. Прежде всего, ясно, что если удастся сделать замену х = x(t) так, что обе функции х — x(t) и у = y(x(ty$ окажутся рациональными функциями от t, то x'(t) — тоже рациональная функция и УR(x, у(х)) dx j 7?(®(t),!/(!(«))) r'(t) dt, т. e. дело сведется к интегрированию рациональной функции. Мы рассмотрим следующие специальные случаи задания функции у = у(х). а. Если у = V----з, где п G N, то, полагая tn =-получаем V СХ + а СХ + а и подынтегральное выражение рационализируется. Пример • 19. Х-^з + з111!1 *1 3ln.G+2) + 4 2 х 2 Л 1\ , з/ж-1 vrrctgлV + 2) +с’ где
§ 7. ПЕРВООБРАЗНАЯ 315 Пример 15. = \/2 arctg = + с — у/2 arctg - Здесь мы воспользовались универсальной заменой t = tg г 2' Пример 16. Пример 17. _________dx___________ Г_______________dx______________ 2 sin2 Зх - 3 cos2 Зх + 1 J cos2 Зх (2 tg2 Зх - 3 + (1 + tg2 Зя)) _ 1 f dt&3x ~ 1 Г dt = 1 /2 /* _ ЗУ 3tg23z- 2 3/ 3t2 — 2 ~ 3• 2 у 3 / 3^2_1 “ 2 _ 1 f du _ 1 . и - 1 _ " Зх/6 J и2 - 1 ~ б>/б u + 1 Пример 18. cos3 х . Г cos2 х d sin х .-7 dx = I ----------=----- sin'# / sin'# f (1 -t2)dt J t7 = I (Г7 - t"5) dt = -|re + If4 + c = 1 4 sin4 x 1 6 sin6 a;
314 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 4. Первообразные вида JR(cosж, sinx)dx. Пусть R(u,v) — рацио- Р(и, г>) нальная функция от и и и, т. е. отношение ~ полиномов, являющихся линейными комбинациями мономов umvn, где т = 0,1, ..., п — 0,1, ... Для вычисления первообразной fR(cosx, sin a;) da; существует несколько приемов, из которых один — вполне универсальный, хотя и не всегда самый экономный. а. Сделаем замену t = tg Поскольку i-tg2? cos х —----------------—-, 1 -htg 2f м=-^, 2 cos2 х sin X = 2tgf то т. е. dx — I-*2 l + tg2f At 2dt l + tg2f ’ 2i ^dt, и дело свелось к интегрированию рациональной функции. Однако такой путь часто приводит к очень громоздкой рациональной функции, поэтому следует иметь в виду, что в ряде случаев существуют и другие возможности рационализации интеграла. Ь. В случае интегралов вида fR(cos2x, sin2 ж) da; или Jr(tgx)dx, где г(и) — рациональная функция, удобна подстановка t = tg х, ибо . 2 tg2z Sin Z = —2—=—, 1 + tg2X J dt dx = ----5—. 1 + tg2 X cos2 X = 1 + tg2 х ’ dx т. е. •2 dt= , cos2 a; Выполнив указанную подстановку, получим соответственно t2 \ dt о . 2 X, sin X dt 1-it2’ с. В случае интегралов вида х, sin2 х) sin х dx лиан x, sin a;) cos x dx можно внести функции sin x, cos x под знак дифференциала и сделать замену t = cos а; или t = sin а; соответственно. После замены эти интегралы будут иметь вид JR(t, 1 - t2) dt или / Я(1 -12, t) dt.
§ 7. ПЕРВООБРАЗНАЯ 317 Ь. Рассмотрим теперь случай, когда у — \/а,х2 + Ьх + с, т. е. речь идет об интегралах вида х, ч/az2 + bx + с) dx. Выделяя полный квадрат в трехчлене ах2+Ъх+с и делая соответствующую линейную замену переменной, сводим общий случай к одному из следующих трех простейших: (18) Для ветственно хЛ2 4-1 = tu 4-1, хА2- 1 = u(t - 1), х/1 — t2 = w(l — t), рационализации этих интегралов теперь достаточно положить соот или xA2 4-1 = tu — 1, или хА2 — 1 = u(t 4-1), или x/1 — t2 = w(l 4-t), или xA2 4-1 = t — u\ или xA2 — 1 — t — u; или x/1 — t2 = tu ± 1. Эти подстановки были предложены еще Эйлером (см. задачу 3 в конце параграфа). Проверим, например, что после первой подстановки мы сведем первый ин- теграл к интегралу от рациональной функции. В самом деле, если хА2 4-1 = tu 4-1, то t2 4-1 = t2u2 4- 2 tu 4-1, откуда l^2 и, в свою очередь, 1 — и£ Таким образом, t и хА2 4-1 выразились рационально через и, а следова- тельно, интеграл привелся к интегралу от рациональной функции. Интегралы (18) подстановками t = sh р, t = ch p, t = sin p (или t = cos 9?) соответственно приводятся также к тригонометрической форме У Л (sh р, ch р) ch р dp, J Л (ch p, sh p) sh p dp и У Л (sin p, cos 9?) cos p dp или — JR(cos p, sin p) sin p dp. Пример 20. _______dx__________ f_________dx_______ f dt x 4- x/ж2 4- 2a; 4- 2 J x 4- y/(x 4-1)2 4-1 J t - 1 4- Vt2 4-1
318 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ^2 _ । Полагая V72 4-1 = и — t, имеем 1 = и2 — 2 tu, откуда t = —-—. Поэтому 2и dt = 1 f 1 t - 14- Vt2 4-1 ~ 2 J и - 1 1 f du 2 J u2(u — 1) hi ,! /“/ 1 1 Ил = - In u - 1+ - /I-------------2----I du = 2 2 J \u — 1 и2 и J 1 i I I . 11 и 1 1 = -ln|u-l| + 5ta— +- + e. Теперь остается проделать обратный путь замен: и = 14-у^2 4-1 и t = z4-1. с. Эллиптические интегралы. Очень важными являются также пер- вообразные вида У R(x, у/Р(х)) dx, где Р(х) — многочлен степени п > 2. Такой интеграл, как было показано Абелем и Лиувиллем, вообще говоря, уже не выражается через элементарные функции. При п = 3 и п = 4 интеграл (19) называется эллиптическим, а при п > 4 — гиперэллиптическим. Можно показать, что общий эллиптический интеграл элементарными под- становками с точностью до слагаемых, выражающихся через элементарные функции, приводится к следующим трем стандартным эллиптическим инте- гралам: / /(1 - ж2)(1 - Fz2) ’ f х2^х (21) J ./(l-a^Xl-fc2!2)’ 1 ’ [___________ (22) J (1 + Ла:2)л/(1 - а:2)(1 - Jt2z2) ’ ' где h и к — параметры, причем во всех трех случаях параметр к лежит в интервале ] 0,1[. Подстановкой х = cos 99 эти интегралы можно свести к следующим кано- ническим интегралам или их комбинациям: / А 2 ’ (23) J V1 ~ к2 sin tp J \/1 — к2 sin299 dtp, (24) dtp (1 — h sin2 tp) \/l — k2 sin2 99 (25)
§ 7. ПЕРВООБРАЗНАЯ 319 Интегралы (23), (24), (25) называются соответственно эллиптическими ин- тегралами первого, второго и третьего рода (в форме Лежандра). Через F(k, 99) и Е(к, <р) обозначают эллиптические интегралы (23) и (24) первого и второго рода соответственно, выделяемые условиями F(k, 0) = 0 и Е(к, 0) = 0. Функции F(k, </>), Е(к, </>) часто используются, и потому составлены доста- точно подробные таблицы их значений для 0<&<1 и 0 <р тг/2. Эллиптические интегралы, как показал Абель, естественно рассматривать в комплексной области, в неразрывной связи с так называемыми эллиптиче- скими функциями, которые соотносятся с эллиптическими интегралами так , [ d<p же, как, например, функция sin <р с интегралом / = arcsm (р. J у/1 — <р2 Задачи и упражнения 1. Метод Остроградского1^ выделения рациональной части интеграла от пра- вильной рациональной дроби. Пусть 777—7 — правильная рациональная дробь; q(x) — многочлен, имеющий те же корни, что и Q(x), но кратности 1; Qi(x) — . Ф) Покажите, что а) Имеет место следующая формула Остроградского: Q(x) “ Qi(x) dx, (26) Pl (ж) p(x) - /* p(x) . где Q(®) ’ q(x) ~ пРавильные рациональные дроби, причем j dx — трансцен- дентная функция. (В силу этого результата дробь интеграла J -^-^dx.) в (26) называется рациональной частью Ь) В формуле Р(х) = /Р1(х)У р(х) QW \01(х)Л q(x)' полученной дифференцированием формулы Остроградского, дробь ( ] после надлежащих сокращений приводится к знаменателю Q(x). с) Многочлены q(x), Qi(x), а затем и многочлены р(х), Pi (я) можно найти ал- гебраическим путем, даже не зная корней многочлена Q(x). Таким образом, ра- циональную часть интеграла (26) можно полностью найти, даже не вычислив всей первообразной. М. В. Остроградский (1801—1861) — выдающийся русский механик и математик, один из инициаторов прикладного направления исследований в Петербургской математической школе.
320 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ d) Выделите рациональную часть интеграла (26), если Р(х) = 2х6 4- За:8 4- 6а:4 4- 6а:3 4- 10а:2 4- За: 4- 2, Q(x) = х7 4- За:6 4- 5а:8 4- 7х4 4- 7а:3 4- 5а:2 4- За: 4- 1 (см. пример 17 в § 5 этой главы). 2. Пусть ищется первообразная JK(cos х, sin a:) dx, (27) ч P{u,v) , где R{u, v) = — рациональная функция. Покажите, что а) если R(—u, v) = R{u, v), то R(u, v) имеет вид Ki(u2, v); b) если R{—u,v) = —R{u,v), to R(u,v) = u-R2(u2, v) и подстановка t = sin a: рационализирует интеграл (27); с) если R(—и, — v) = R{u, v), то R{u, v) = R^(^, v2^ и подстановка t = tga: рацио- нализирует интеграл (27). 3. Интегралы вида JR(x, \/ax2 + bx 4- c)dx. (28) а) Проверьте, что интеграл (28) приводится к интегралу от рациональной функ- ции следующими подстановками Эйлера: t = >/ах2 + Ьх + с ± у/ах, если а > 0, . 1х — XI и 2 > t = /------, если xi, Х2 — действительные корни трехчлена ах +Ьх + с. у X — Х2 Ь) Пусть («о, !/о) — точка кривой у2 = ах2 + Ъх + с, a t — угловой коэффициент прямой, проходящей через точку (хо,уо) и пересекающей кривую в некоторой точ- ке (х,у). Выразите координаты (х,у) через (а:о,!/о) и t и свяжите эти формулы с подстановками Эйлера. с) Кривая, задаваемая алгебраическим уравнением Р{х, у) = 0, называется уни- курсалъной, если она допускает параметрическую запись х = x{t), у = y(t) при помощи рациональных функций x{t), y(t). Покажите, что интеграл JR(x,y(x))dx, где R{u, v) — рациональная функция, а у{х) — алгебраическая функция, удовлетво- ряющая уравнению Р(х,у) = 0, задающему уникурсальную кривую, приводится к интегралу от рациональной функции. d) Покажите, что интеграл (28) всегда можно свести к вычислению интегралов следующих трех типов: [, J \/ах2 + Ъх + с J (х — хо)к \/ах2 4r Ьх 4- с f {Ах 4- В) dx J {х2 4- рх 4- q)m у/ах2+Ьх 4- с
§ 7. ПЕРВООБРАЗНАЯ 321 4. а) Покажите, что интеграл от дифференциального бинома, где т, п, р — рациональные числа, приводится к интегралу (29) где р, q — рациональные числа. Ь) Интеграл (29) выражается через элементарные функции, если одно из трех чисел р, q, р + q — целое. (П. Л. Чебышев показал, что других случаев, при которых бы интеграл (29) выражался в элементарных функциях, не существует.) 5. Эллиптические интегралы. а) Любой многочлен третьей степени с действительными коэффициентами име- ет вещественный корень «о и заменой х — xq = t2 приводится к многочлену вида t2 (at4 4- bt3 4- ct2 + dt + e), где a / 0. b) Функция R(x, y/P(x)), где R(u,v) — рациональная функция, a P — полином степени 3 или 4, приводится к виду R\(t, у/at4 + bt3 + ... + е), где а / 0. с) Многочлен четвертой степени ах4 4- Ьх3 + ... 4- е представляется в виде про- изведения а(х2 4- pix 4- gi)(х2 + ргх + qs) и заменой х = всегда может быть (Mi + Nit2)(M2 + N2t2) приведен к виду ------’ (7< + I)2 d) Функция R(x, у/ах4 4- Ьх3 4-... 4- е ) заменой х = может быть приведена t + 1 К виду Ri(t, + niit2)(l 4- m2t2)). е) Функция R(x, y/у) может быть представлена в виде суммы Ri(x, у) + } \/у где Ri и Ri — рациональные функции. f) Любая рациональная функция может быть представлена как сумма четной и нечетной рациональных функций. g) Если рациональная функция R(x) четна, то она имеет вид г(х2), а если нечетна, то вид хг(х2), где г(х) — рациональная функция. Ь) Любая функция R(x, y/у) приводится к виду Ri(x, у) 4- + ^£^2 Vv х/У X. i) Любой интеграл вида JR(x, у/Р(х)} dx, где Р(х) — многочлен четвертой сте- пени, с точностью до элементарных слагаемых приводится к интегралу где r(t) — рациональная функция, А = ±1.
322 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ j)____Если |тП11 > |тп2| > 0, то одной из замен вида y/mit — х, y/m\t = \/1 -- ж2, _______ х ,_________ 1 /* r(t2)dt ИВТеГ₽аЛ J П₽т°Да™ К dx v ' —> где 0 < к < 1, а г — рациональная функция. \/(1 - х2)(1 “ к2х2) к) Выведите формулы понижения показателей 2п, т для интегралов Г х2п dx Г______________dx______________ J д/(1 — х2)(1 — к2х2) ’ J (х2 — а)т • — х2)(1 — к2х2) 1) Любой эллиптический интеграл JR(x, у/Р(х)) dx, где Р — полином четвертой степени, с точностью до слагаемых, представляющихся в виде элементарных функций, приводится к одному из трех канонических интегралов (20), (21), (22). т) Интеграл / выразите через канонические эллиптические интегралы. J х/1 + х3 п) Выразите через эллиптические интегралы первообразные функций .-1 _ и усов 2т 1 y'cos а — cos х 6. Используя вводимые ниже обозначения, найдите с точностью до линейной функции Ах + В первообразные следующих неэлементарных специальных функций: — dx (интегральная экспонента); b) Si(x) = Jdx (интегральный синус); с) Ci (х) = j -°* 6 7 8- dx (интегральный косинус); d) Shi(x) = Jdx (интегральный гиперболический синус); е) Chi (ж) = J dx (интегральный гиперболический косинус); f) S(x) = [ sin. x2dx ) > (интегралы Френеля); g) С(х) — I cosx2dxl h) ф(т) = Je~x2dx (интеграл Эйлера—Пуассона); i) li(x) = / (интегральный логарифм). J In я 7. Проверьте, что с точностью до постоянной справедливы следующие равенства: a) Ei(x) = li(ex); b) Chi(x) = l[Ei(x) + Ei(-x)];
§ 7. ПЕРВООБРАЗНАЯ 323 с) Shi (х) = | (Ei(«) - Ei(—®)]; d) Ei(tx) = Ci(x) + i Si(x); e) ei,r/4(xe-<*/4) = C(x) + iS(x). 8. Дифференциальное уравнение вида dy _ /(x) dx g(y) называют уравнением с разделяющимися переменными, поскольку его можно пере- писать в виде 9(y)dy = f(x)dx, в котором переменные х и у разделены. После этого уравнение можно решить: Jd(y)dy = Jf(x)dx + c, вычислив соответствующие первообразные. Решите уравнения: а) 2х3уу'+у* = 2; Ь) хуу = >/1 4- х2; с) у' — cos (у 4- х), положив и(х) = у(х) 4- х; d) х2у' — cos 2у = 1 и выделите то решение, которое удовлетворяет условию у(х) —> 0 при х —> 4-ос. е) -;!/'(*)= Si (х); х f) »W = c(x). COSX 9. Парашютист прыгнул с высоты 1,5 км, а раскрыл парашют на высоте 0,5 км. Сколько времени он падал до раскрытия парашюта? Предельную скорость падения человека в воздухе нормальной плотности принять равной 50 м/с. Решите задачу в предположении, что сопротивление воздуха пропорционально а) скорости; Ъ) квадрату скорости. Изменением давления с высотой пренебречь. 10. Известно, что скорость истечения воды из небольшого отверстия в дне сосуда достаточно точно может быть вычислена по формуле 0,6 где g — ускорение силы тяжести, а Н — высота уровня воды над отверстием. Цилиндрический бак поставлен вертикально и имеет отверстие в дне. Половина воды из полного бака вытекает за 5 мин. За какое время вытечет вся вода? 11. Какую форму должен иметь сосуд, являющийся телом вращения, чтобы при истечении из него воды уровень воды понижался равномерно? (Исходные данные см. в задаче 10.) 12. В рабочее помещение вместимостью 104 м3 через вентиляторы в 1 минуту по- дается 103м3 свежего воздуха, содержащего 0,04% СОг, и одновременно такое *же количество смеси выводится из помещения. В 9 часов утра в помещение входят слу- жащие, и через полчаса содержание СОг в воздухе повышается до 0,12%. Оцените содержание углекислого газа в помещении к 2 часам дня.
ГЛАВА VI ИНТЕГРАЛ § 1. Определение интеграла и описание множества интегрируемых функций 1. Задача и наводящие соображения. Пусть точка движется вдоль числовой оси, s(t) — ее координата в момент t, a v(t) — sz(t) — ее скорость в тот же момент t. Предположим, что мы знаем положение s(to) точки в момент to и к нам поступают данные о ее скорости. Располагая ими, мы хотим вычислить s(t) для любого фиксированного значения t > to. Если считать скорость v(t) меняющейся непрерывно, то смещение точки за малый промежуток времени приближенно можно вычислить как произведение и (г) At скорости в произвольный момент т, относящийся к этому промежут- ку времени, на величину At самого промежутка. Учитывая это замечание, разобьем отрезок [to,t], отметив некоторые моменты t, (г = 0, ...,п), так, что to < ti < ... < tn = t, и так, что промежутки [t«—i,t«] малы. Пусть Ati — ti — ti-\ и Ti € [ti-i,ti], тогда имеем приближенное равенство s(t) - s(t0) и ^V(T^ti. i=l По нашим представлениям, это приближенное равенство будет уточняться, если переходить к разбиениям отрезка [to, t] на всё более мелкие промежутки. Таким образом, надо полагать, что в пределе, когда величина Л наибольшего из промежутков разбиения стремится к нулю, получим точное равенство п lim bti = s(t) - s(t0). (1) i=l Это равенство есть не что иное, как фундаментальная для всего анализа формула Ньютона—Лейбница. Она позволяет, с одной стороны, численно
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 325 находить первообразную s(t) по ее производной v(t), а с другой стороны, по найденной каким-либо способом первообразной s(t) функции v(t) найти п стоящий слева предел сумм ^2 v(Ti)Adi. t=i Такие суммы, называемые интегральными суммами, встречаются в самых разнообразных случаях. Попробуем, например, следуя Архимеду, найти площадь под параболой у = х2 над отрезком [0,1] (рис. 47). Не останавливаясь здесь на подробном обсуждении понятия площади фигуры, о котором речь будет идти несколько позже, мы, как и Архимед, будем действовать мето- дом исчерпания фигуры посредством простейших фигур — прямоугольников, площади которых мы вычислять умеем. Разбив отрезок [0,1] точками О = xq < Xi < ... < хп = 1 на мелкие отрезки я?<], мы, очевидно, можем приближенно вычи- слить искомую площадь ст как сумму площадей изо- браженных на рисунке прямоугольников: п ст « Дж<; i=l здесь A®j = Xi — ®i-i. Полагая f(x) = x2 и & = Xi-i, мы перепишем получен- ную формулу в виде п i=l В этих обозначениях в пределе будем иметь п А—>0 г=1 (2) где, как и выше, А — длина наибольшего из отрезков разбиения. Формула (2) только обозначениями отличается от формулы (1). Забыв на миг о геометрическом смысле f(&), &Xi и считая х временем, a f(x) ско- ростью, найдем первообразную F(x) функции f(x) и тогда по формуле (1) получим, что ст = F(l) — F(0). В нашем случае f(x) = х2, поэтому F(x) = |я3 + с и ст = F(l) - F(0) = |. о 3 Это и есть результат Архимеда, который он получил прямым вычислением предела в (2). Предел интегральных сумм называется интегралом. Таким образом, фор- мула (1) Ньютона—Лейбница связывает интеграл и первообразную. Перейдем теперь к точным формулировкам и проверке того, что на эври- стическом уровне было получено выше из общих соображений.
326 ГЛ. VI. ИНТЕГРАЛ 2. Определение интеграла Римана а. Разбиения Определение 1. Разбиением Р отрезка [а,6], а < Ъ, называется конеч- ная система точек xq, ..., хп этого отрезка такая, что а = xq < xi < ... < < хп — Ь. Отрезки [ж,-1, я:,] (г = 1, ..., п) называются отрезками разбиения Р. Максимум А(Р) из длин отрезков разбиения называется параметром раз- биения Р. Определение 2. Говорят, что имеется разбиение (Р,£) с отмеченными точками отрезка [а, 6], если имеется разбиение Р отрезка [а, b ив каждом из отрезков [я»-1, Zj] разбиения Р выбрано по точке & € [zi-i, яч] (г — 1,..., п). Набор (&,..., £п) обозначается одним символом %. Ь. База в множестве разбиений. В множестве Р разбиений с отмечен- ными точками данного отрезка [а, 6] рассмотрим следующую базу В = {В^}. Элемент В^, d > 0, базы В есть совокупность всех тех разбиений (В, С) с отмеченными точками отрезка [а, 6], для которых А(Р) < d. Проверим, что {Ва}, d > 0, — действительно база в Р. Во-первых, Bd / 0. В самом деле, каким бы ни было число d > 0, очевид- но, существует разбиение Р отрезка [а, Ь] с параметром А(Р) < d (например, разбиение на п конгруэнтных отрезков). Но тогда существует и разбиение (Р, £) с отмеченными точками, для которого А(Р) < d. Во-вторых, если di > 0, d2 > 0 и d = min{di,d2}, то, очевидно, В^ПВ^ = = Bd € В. Итак, В = {Bd} — действительно база в Р. с. Интегральная сумма Определение 3. Если функция f определена на отрезке [а,Ь], а (Р,£) — разбиение с отмеченными точками этого отрезка, то сумма п (3) »=1 где Да;» = Xi — Xi-i, называется интегральной суммой функции /, соответ- ствующей разбиению (Р, £) с отмеченными точками отрезка [а, 6]. Таким образом, при фиксированной функции f интегральная сумма о’СЛ’В, £) оказывается функцией Ф(р) = <т(/;р) на множестве Р разбиений р = (Р, £) с отмеченными точками отрезка [а, Ь]. Поскольку в Р имеется база В, то можно ставить вопрос о пределе функции Ф(р) по этой базе. d. Интеграл Римана. Пусть f — функция, заданная на отрезке [а, Ь]. Определение 4. Говорят, что число I является интегралом Римана от функции f на отрезке [а, Ь], если для любого е > 0 найдется число <5 > О
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 327 такое, что для любого разбиения (Р,С) с отмеченными точками отрезка [а, Ь], параметр которого А(Р) < б, имеет место соотношение п i=l Е. Поскольку разбиения р = (Р, £), для которых А(Р) < <5, составляют элемент В$ введенной выше базы В в множестве Р разбиений с отмеченными точками, то определение 4 равносильно тому, что I = lim$(p), т. е. интеграл I есть предел по базе В значений интегральных сумм функции /, отвечающих разбиению с отмеченными точками отрезка [а, 6]. Базу В естественно обозначить символом А(Р) —> 0, и тогда определение интеграла можно переписать в виде z=A(y^of>(^- (4) Интеграл от функции f(x) по отрезку [а, &] обозначается символом ъ J f(x)dx, а в котором числа а, Ь называются нижним и верхним пределом интегрирования соответственно; / — подынтегральная функция, f(x)dx — подынтегральное выражение, х *- переменная интегрирования. Итак, (5) Определение 5. Функция / называется интегрируемой по Риману на отрезке [а, Ь], если для нее существует указанный в (5) предел интегральных сумм при А(Р) —> 0 (т. е. если для нее определен интеграл Римана). Множество всех функций, интегрируемых по Риману на отрезке [а, Ь], бу- дет обозначаться через 7£[а, Ь]. Поскольку пока мы не будем рассматривать другого интеграла, кроме ин- теграла Римана, условимся для краткости вместо терминов «интеграл Рима- на» и «функция, интегрируемая по Риману» говорить соответственно «инте- грал» и «интегрируемая функция».
328 ГЛ. VI. ИНТЕГРАЛ 3. Множество интегрируемых функций. В силу определения инте- грала (определение 4) и его переформулировок в виде (4) и (5), интеграл есть предел некоторой специальной функции Ф(р) = a(f;P,Z) — интегральной сум- мы, определенной на множестве Р разбиений р = (Р, £) с отмеченными точка- ми отрезка [а, ft]. Предел этот берется по базе В и Р, которую мы обозначили как А(Р) —> 0. Таким образом, интегрируемость функции / на [а, ft] зависит от наличия указанного предела. В силу критерия Коши этот предел существует тогда и только тогда, когда для любого числа е > 0 найдется элемент В базы, в любых точках р', р" которого выполнено соотношение |Ф(р') - Ф(р")| < е. В более подробной записи сказанное означает, что для любого е > 0 най- дется 6 > 0 такое, что для любых разбиений (Р', £'), (Р" £/z) с отмеченными точками отрезка [a, ft], для которых А(Р') < <5 и А(Р") < 5, выполнено нера- венство илй, что то же самое, неравенство t П П (6) Мы воспользуемся сформулированным критерием Коши для того, чтобы получить сначала простое необходимое, а затем и достаточное условие инте- грируемости функции по Риману. а. Необходимое условие интегрируемости Утверждение 1. Для того чтобы функция f, определенная на отрезке [a, ft], была интегрируема на нем по Риману, необходимо, чтобы она была ограничена на этом отрезке. Короче, (/ € Р[а, ft]) => (/ ограничена на [a, ft]). ◄ Если f не ограничена на [a,ft], то при любом разбиении Р отрезка [a,ft] функция / окажется неограниченной по крайней мере на одном из отрезков , а;,] разбиения Р. Это означает, что, выбирая различным образом точку Zi € [я?<_ 1, яг<], можно сделать величину |/(&) Дж, | сколь угодно большой. Но п тогда и интегральную сумму а(/;Р,£) = £ можно сделать по моду- г=1 лю сколь угодно большой за счет изменений только точки Zi в этом отрезке. Ясно, что в таком случае не может быть и речи о конечном пределе инте- гральных сумм, что, впрочем, видно и из критерия Коши, ибо соотношение
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 329 (6) в этом случае, очевидно, не имеет места даже для сколь угодно мелких разбиений. ► Как мы увидим, полученное необходимое условие еще очень далеко от необ- ходимого и достаточного условия интегрируемости, однако оно уже позволяет нам в дальнейшем исследовать только ограниченные функции. Ь. Достаточное условие интегрируемости и важнейшие классы интегрируемых функций. Начнем с нескольких обозначений и замечаний, которые используются в дальнейшем изложении. Условимся, когда задано разбиение Р CL — Xq < ... < £п —— отрезка [а, 6], наряду с символом Дж,, обозначающим разность Xi — Xj-i, упо- треблять символ Д$ для обозначения отрезка Если разбиение Р отрезка [а, 6] получено из разбиения Р только добавле- нием к Р некоторых новых точек, то условимся называть разбиение Р про- должением разбиения Р. При построении продолжения Р разбиения Р некоторые (быть может, и все) отрезки Д$ = [ж»_1, Xj] разбиения Р сами подвергаются разбиению xi-\ = = XiQ < ... < Xini = Xi. В связи с этим нам будет удобно нумеровать точки разбиения Р двумя индексами. В записи Xij первый индекс означает, что Xij G Д$, а второй индекс есть порядковый номер точки на отрезке Дг. Теперь естественно положить Даг^ := х^ — Xij_i и Д^ := [ж^_1,а:^]. Таким образом, Дат* = Джп + ... + Axini. Примером разбиения, являющегося продолжением как разбиения Р1, так и разбиения Р", может служить разбиение Р = Р' U Р", полученное объедине- нием точек разбиений Р' и Р". Напомним, наконец, что, как и прежде, символ о>(/; Е) будет обозначать колебание функции f на множестве Е, т. е. u/(/;Е):= sup \f(x') - f(x")\. х',х"еЕ В частности, о/(7; Д^) есть колебание функции f на отрезке Дг- Это коле- бание заведомо конечно, если f — ограниченная функция. Теперь сформулируем и докажем следующее Утверждение 2. Для того чтобы ограниченная на отрезке [а,6] функ- ция f была интегрируема на нем, достаточно, чтобы для любого числа е > О нашлось число д > 0 такое, что при любом разбиении Р отрезка [а, 6] с па- раметром Х(Р) < 5 выполнялось соотношение п 52^(7; Д*) Дж, < е. i=i
330 ГЛ. VI. ИНТЕГРАЛ ◄ Пусть Р — разбиение отрезка [а, 6] и Р — продолжение разбиения Р. Оценим разность интегральных сумм a(f; Р,£)~ <r(f\ Р,£)- Используя введен- ные выше обозначения, можем написать Н/;Лё)-а(/;Ле)| = п ni п ЕЕ^адд^-Е^)^ г=1 j=l г=1 < ЕЕ 1№>) - №)|д*ч ЁЁ^; Д<)Д1« = Ё<х/; д<)д*<- г=1 j=l i=l j=l i=l В этих выкладках мы использовали то, что Да;, = Ахц, а также то, что j=i <*>(/’> А»), поскольку & е &ij С Дг и & G Д<. Из полученной оценки разности интегральных сумм следует, что если функция / удовлетворяет достаточному условию, сформулированному в утверждении 2, то по любому числу е > 0 можно найти 6 > 0 так, что для любого разбиения Р отрезка [а, 6] с параметром А(Р) < 6 и его продолжения Р при любом выборе отмеченных точек £ и £ будем иметь И/; А О - <т(/;Л€)| < t At Если теперь (Р',£') и (Р", £") — произвольные разбиения с отмеченными точками отрезка [а, 6], параметры которых удовлетворяют условиям А(Р') < 5, А(Р") < <5, то, рассмотрев разбиение Р = P'UP", являющееся продолжением обоих разбиений Р', Р", по доказанному будем иметь At At Отсюда следует, что как только А(Р') < 5, А(Р") < 5. Таким образом, в силу критерия Коши существует предел л(^0 Ё №)д*< 1=1 интегральных сумм, т. е. f G И[а, д]. ►
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 331 Следствие 1. (/ G С[а,6]) => (/ € Р[а, Ь]), тп. е. любая непрерывная на отрезке функция интегрируема на этом отрезке. ◄ Если функция непрерывна на отрезке, то она ограничена на нем, так что необходимое условие интегрируемости в этом случае, очевидно, выполнено. Однако непрерывная на отрезке функция еще и равномерно непрерывна на нем, поэтому для любого е > 0 можно найти <5 > 0 так, что на любом отрезке А С [а, 6] длины меньше 6 будем иметь а>(/;Д) < разбиения Р с параметром А(Р) < 5 будем иметь Тогда для любого п п 52 52 = (ь~а) = £ о — а о — а г=1 г=1 В силу утверждения 2 теперь можно заключить, что f G 7£[а, 6]. ► Следствие 2. Если ограниченная на отрезке [а,&] функция f непре- рывна на этом отрезке всюду, кроме, быть может, конечного множества точек, то f G 1Z[a, 6]. ◄ Пусть [а, 6]) С < оо и / имеет к точек разрыва на отрезке [а, 6]. Проверим выполнимость достаточного условия интегрируемости функции /. При заданном е > 0 возьмем число <51 = и построим <51 -окрестности 8С • к каждой из к точек разрыва функции f на [о, 6]. Дополнительное к объедине- нию этих окрестностей множество точек отрезка [а, 6] состоит из конечного числа отрезков, на каждом из которых f непрерывна и, значит, равномерно непрерывна. Поскольку таких отрезков конечное число, по € > 0 можно ука- зать ($2 > 0 так, что на любом отрезке Д, длина которого меньше 62 и который полностью содержится в одном из указанных выше отрезков непрерывности /, будем иметь о?(/; Д) < —г. Возьмем теперь число <5 = min{(5i, Пусть Р — произвольное разбиение отрезка [а, 6], для которого А(Р) < <5. п Сумму £ <*>(/; Д») Дх», отвечающую разбиению Р, разобьем на две части: г=1 п 52 <*>(/; Д<) Дач = £>(/; Д») Дач + Д<) Дж<. г=1 В сумму включим те слагаемые, которые отвечают отрезкам раз- биения Р, не имеющим общих точек с построенными ^-окрестностями точек разрыва. Для таких отрезков Д, имеем о?(/; AJ < —г, поэтому 2(о — а) w(/;Д()Дх< < 2(гДа) 12 < 2(6-а)(Ь~ о) = ?
332 ГЛ. VI. ИНТЕГРАЛ Сумма длин оставшихся отрезков разбиения Р, как легко видеть, меньше (<5 4- 4- 6)k < 4 —I— -к — поэтому ОС/ • к ли вл а 1 р £ £ и>(/;Д<)Д^с£ Дх4<С= £ Таким образом, мы получаем, что при А(Р) < 5 п ^а?(/; Дг)Д^г < £, г=1 т. е. выполнено достаточное условие интегрируемости и f G 7?.[а, 6]. ► Следствие 3. Монотонная на отрезке функция интегрируема на этом отрезке. ◄ Из монотонности функции / на отрезке [а, 6] следует, что cv(/;[a, 6]) = = |/(6) — /(а)|. Пусть задано е > 0. Положим <5 — г Мы считаем, что f(b) — /(а) ф 0, поскольку в противном случае / постоянна и интегриру- емость / не вызывает сомнений. Пусть Р — произвольное разбиение отрезка [а, 6] с параметром А(Р) < 6. Тогда для него с учетом монотонности / имеем п п п £>(/;Д()Д*.- < «5>(/;Д<) = б£|/(г4) - /(г4-1)| = г=1 г=1 t=l £} (/(**) - /(^г-1)) г=1 = <J|/(fe) - /(а)| = е. Таким образом, / удовлетворяет достаточному условию интегрируемости, т. е. / G 7?.[а, 6]. ► Монотонная функция может иметь уже бесконечно много точек разрыва на отрезке (счетное множество). Например, функция, определяемая соотно- шениями /(*) = при 1 - х < 2^Т, п е N, при X = 1 на отрезке [0,1], не убывает и в каждой точке вида ~, п € N, имеет разрыв. £ Замечание. Отметим, что хотя мы сейчас имеем дело с вещественны- ми функциями на отрезке, однако ни в определении интеграла, ни в дока- занных выше утверждениях, за исключением следствия 3, мы по существу не использовали то, что рассматриваемые функции вещественнозначные, а не комплексно- или, например, векторнозначные функции точки отрезка [а, 6].
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 333 Понятия верхней и нижней интегральной суммы, к которым мы переходим, напротив, специфичны только для функций с действительными значениями. Определение 6. Пусть f: [о, 6] -> К — действительнозначная функция, определенная и ограниченная на отрезке [а, &]; Р — разбиение отрезка [а, 6]; A, (i = 1,..., п) — отрезки разбиения Р. Пусть m, = inf /(ar), Mi — sup /(ж) (г = 1, Суммы s(f‘P) := ^тгцАхг г=1 И п 1=1 называются соответственно нижней и верхней интегральной суммой функции f на отрезке [а,6], соответствующей разбиению Р этого отрезка1). Суммы s(f;P) и S(f;P) называют также нижней и верхней суммой Дарбу, соответ- ствующей разбиению Р отрезка [а, 6]. Если (Р,£) — произвольное разбиение с отмеченными точками отрезка [а, &], то, очевидно, s(/;P)$a(/;P,€)^S(/;P). (7) Лемма 1. s(/;P) = infa(/;P,£), S(/;P) = supa(/;P,£). € ◄ Проверим, например, что верхняя сумма Дарбу, отвечающая разбиению Р отрезка [а, д], является верхней гранью значений интегральных сумм, соот- ветствующих разбиению с отмеченными точками (Р,£) отрезка [а, 6], причем верхняя грань берется по всевозможным наборам £ = (£i, •. •, £п) отмеченных точек. Ввиду (7), для доказательства достаточно, чтобы при любом £ > 0 нашелся такой набор £ отмеченных точек, что имеет место неравенство S(/;P)<a(/;P,£) + e. (8) По определению чисел Mi, при каждом г G {1, ..., п} найдется точка £{ 6 g в которой Mi < f((i) + Пусть £ = (€1, •.., £„). Тогда 1>ДЖ< <£(/&) +- г=1 £=1 Термин «интегральная сумма» здесь формально не вполне законен, так как не всегда ттц и М, являются значениями функции f в некоторой точке Ci € Aj.
334 ГЛ. VI. ИНТЕГРАЛ что и завершает доказательство второго утверждения леммы. Первое утвер- ждение проверяется аналогично. ► Из доказанной леммы и неравенства (7) с учетом определения интеграла Римана заключаем, что справедливо следующее Утверждение 3. Ограниченная вещественнозначная функция f: [а,6] —> —> R интегрируема по Риману на отрезке [а, Ь] тогда и только тогда, когда существуют и равны между собой пределы / = Пт s(/; Р), I = Нт S(/; Р). (9) Х(Р)-И) Х(Р)—>0 При этом их общее значение 1 = 1 = 1 совпадает с интегралом ъ J f(x) dx. а ◄ Действительно, если пределы (9) существуют и равны между собой, то по свойствам предела из (7) заключаем о существовании предела интеграль- ных сумм, причем 1= lim a(/;P,e) = Z. Х(Р)—>0 С другой стороны, если f G Р.[а, 6], т. е. существует предел lim Х(Р)-Ю а(/;Р,е)=7, то из (7) и (8) заключаем, что существует предел lim S(f;P) = I, причем Л(Р)—>0 1 = 1. Аналогично проверяется, что lim s(/; Р) = I = I. ► Л(Р)-+0 В качестве следствия утверждения 3 получаем следующее уточнение утвер- ждения 2. Утверждение 2'. Для того чтобы функция f: [а,6] —> R, заданная на отрезке [а, &], была интегрируема по Риману, необходимо и достаточно выполнение соотношения п n ZL А*) Дл,- = 0. (10) А(Р)-Ю ' t=l ◄ Учитывая утверждение 2, нам остается лишь убедиться в необходимости соотношения (10) для интегрируемости f. Заметим, что о>(/; Д*) = Mi — гщ, поэтому п п 52 “(f' At) As, = 52 (Mi - ™t) Ал* = S(f; P) - s(f; P), t=l i=l и теперь (10) следует из утвержденшГЗ, коль скоро f € Р.[а, Ь]. ►
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 335 с. Векторное пространство ТС[а,Ь]. Над интегрируемыми функциями можно выполнять ряд операций, не выходя за пределы множества 7£[а, 6]. Утверждение 4. Если f, д € 7£[а,6], то a) (J + 9) € 7г[а, 6]; Ь) (а/) G 7£[а, 6], где а — числовой множитель; с) |/| етг[а,д]; d) /|[М] € если [с, d] С [а, Ь]; е) (/-р) G ?г[а,6]. Мы сейчас рассматриваем только вещественнозначные функции, но полез- но отметить, что свойства a), b), с), d) окажутся справедливыми и для ком- плекснозначных и векторнозначных функций. Для векторнозначных функций, вообще говоря, не определено произведение f • д, поэтому свойство е) для них не рассматривается. Однако это свойство остается в силе для функций с ком- плексными значениями. Перейдем теперь к доказательству утверждения 4. ◄ а) Это утверждение очевидно, поскольку п п п i=l i=l i=l Ь) Это утверждение очевидно, поскольку п п 52 (af№№xi = а 52 /(&)Дя*- г=1 г=1 с) Поскольку Е) w(f;E), то можно написать, что п п 52^(171; Д») 52^;Д<)Дя:<’ г=1 i=l и на основании утверждения 2 заключить, что (/ € 7£[а, &]) => (|/| G 7£[c,d]). d) Мы хотим проверить, что ограничение интегрируемой на отрезке [а, &] функции на любой отрезок [с, d] С [а, 6] является функцией, интегрируе- мой на [с, d]. Пусть тг — разбиение отрезка [c,d]. Добавив к тг некоторые точ- ки, достроим л до разбиения Р отрезка [а, Ь], но так, чтобы иметь А(Р) А(тг). Ясно, что это всегда можно сделать. Теперь можно написать, что 52 д &i) &xi 52р^(/;Д,)ДХй где — сумма по всем отрезкам разбиения тг, а — сумма по всем отрез- кам разбиения Р.
336 ГЛ. VI. ИНТЕГРАЛ При А(л-) —> 0 по построению также А(Р) 0, и на основании утверждения 2' из полученного неравенства заключаем, что (/ € И[а,Ь]) => (|/| G P[c,d]), если [с, d] С [а, Ь]. е) Проверим сначала, что если f G 7Z[a, Ь], то /2 € 7£[а, Ь]. Если f G Р[а, 6], то f ограничена на [а, Ь]. Пусть |/(я)| С < оо на [а, &]. Тогда |/2(*1) - /2(12)| = + f(x2)) (/(«,) - /(i2))| < 2<7|/(®1) - /(х2)|, поэтому o>(/2; Е) 2Со>(/;Е), если Е С [а,Ь]. Значит, п п £ w(/2; 2С £ w(/; Д<) Доч, г=1 г=1 откуда на основании утверждения 2' заключаем, что (/ е К[о,6]) => (/2 6 R[M]). Теперь перейдем к общему случаю. Запишем тождество (/ • s)W = | [(/+s)2to -(f- s)2(*)] • Из этого тождества с учетом только что доказанного утверждения и прове- ренных пунктов а) и Ь) утверждения 4 заключаем, что (/ е К[а, Ь]) A (д G Ща, 6]) => (/ • д G Н[а, Ь]). ► Из курса алгебры вам уже известно понятие векторного пространства. Вещественнозначные функции, определенные на некотором множестве, мож- но поточечно складывать и умножать на действительное число, получая при этом снова функцию с вещественными значениями на том же множестве. Если функции рассматривать как векторы, то можно проверить, что при этом вы- полнены все аксиомы векторного пространства над полем действительных чи- сел и указанное множество действительных функций является векторным про- странством относительно операций поточечного сложения функций и умноже- ния функций на действительные числа. В пунктах а), Ь) утверждения 4 сказано, что сложение интегрируемых функций и умножение интегрируемой функции на число не выводит за пре- делы множества 7£[а, 6] интегрируемых функций. Таким образом, 7?.[а, 6] само является линейным векторным пространством — подпространством вектор- ного пространства вещественнозначных функций, определенных на отрезке [а, 6].
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 337 d. Критерий Лебега интегрируемости функции по Риману. В за- ключение приведем пока без Доказательства теорему Лебега, дающую вну- треннее описание интегрируемой по Риману функции. Для этого введем следующее полезное само по себе понятие. Определение 7. Говорят, что множество Е С К имеет меру нуль или является множеством меры нуль (в смысле Лебега), если для любого числа е > 0 существует такое покрытие множества Е не более чем счетной системой оо {Ik} интервалов, сумма 52 |Л>| длин которых не превышает е. k-i оо Поскольку ряд 52 141 сходится абсолютно, порядок суммирования длин к=1 промежутков покрытия не влияет на сумму (см. утверждение 4 из гл. V, § 5, п. 2), поэтому данное определение корректно. Лемма 2. а) Точка и конечное число точек суть множества меры нуль. Ь) Объединение конечного или счетного числа множеств меры нуль есть множество меры нуль. с) Подмножество множества меры нуль само есть множество меры нуль. d) Отрезок [а, &] при а < b не является множеством меры нуль. ◄ а) Точку можно покрыть одним интервалом длины меньшей, чем любое наперед заданное число е > 0, поэтому точка является множеством меры нуль. В остальном а) вытекает из Ь). Ь) Пусть Е = (J Еп — не более чем счетное объединение множеств Еп меры п нуль. По г > 0 для каждого Еп строим покрытие {!£} множества Еп такое, что 52|1£| < к 2 Поскольку объединение не более чем счетного числа не более чем счетных множеств само не более чем счетно, промежутки 1%, к, п € N, образуют не более чем счетное покрытие множества Е, причем Порядок суммирования 52 I4N по индексам п и к безразличен, ибо ряд сходит- п,к ся к одной и той же сумме при любом порядке суммирования, если он сходится для какого-то порядка суммирования. Последнее в нашем случае имеет место, ибо любые частичные суммы нашего ряда ограничены сверху числом е. Итак, Е есть множество меры нуль в смысле Лебега. с) Это утверждение, очевидно, непосредственно следует из определения множества меры нуль и определения покрытия. d) Поскольку для любого покрытия отрезка интервалами можно выделить' конечное покрытие, сумма длин промежутков которого, очевидно, не пре- восходит суммы длин промежутков исходного покрытия, то нам достаточно
338 ГЛ. VI. ИНТЕГРАЛ проверить, что сумма длин интервалов, образующих конечное покрытие от- резка [а, Ь], не меньше длины b — а этого отрезка. Проведем индукцию по количеству интервалов покрытия. При п = 1, т. е. когда отрезок [а,6] содержится в одном интервале (а,/?), очевидно, имеем а < а < b < /3 и /3 — а> Ь — а. Пусть утверждение доказано до индекса к € N включительно. Рассмотрим покрытие, состоящее из к 4-1 интервалов. Возьмем интервал («1,012), покры- вающий точку а. Если Ъ, то «2 — ai > b — а и все доказано. Если же а < «2 < Ь, то отрезок [аг, 6] покрыт системой, состоящей уже не более чем из к интервалов, сумма длин которых по предположению индукции не меньше чем b — аг- Но Ъ - а = (Ь - о2) 4- (а2 - а) < (Ь - аг) 4- (аг - ai) и, таким образом, сумма длин интервалов исходного покрытия отрезка [а, 6] больше, чем его длина b — а. ► Интересно отметить, что в силу пунктов а) и Ь) леммы 2 множество Q всех рациональных точек числовой прямой R является множеством меры нуль, что на первый взгляд выглядит несколько неожиданным при сопоставлении с пунктом d) той же леммы. Определение 8. Если некоторое свойство выполнено в любой точке множества X, кроме, быть может, точек множества меры нуль, то говорят, что это свойство имеет место почти всюду на множестве X или почти во всех точках множества X. Теперь сформулируем критерий Лебега. Теорема. Функция, определенная на отрезке, интегрируема по Риману на этом отрезке в том и только в том случае, когда она ограничена на этом отрезке и непрерывна почти во всех его точках. Итак, (/ € 7£[а, &]) <=> (/ ограничена на [а, &]) Л Л (/ непрерывна почти всюду на [а, &]). Из критерия Лебега и свойств множеств меры нуль, изложенных в лемме 2, очевидно, легко можно получить как следствия 1, 2, 3 утверждения 2, так и утверждение 4. Мы не станем сейчас доказывать критерий Лебега, поскольку при рабо- те с достаточно регулярными функциями, с которыми нам предстоит иметь дело, он нам пока не нужен. Однако идейную сторону критерия Лебега вполне можно объяснить уже сейчас. Утверждение 2' содержало критерий интегрируемости, выраженный соот- п ношением (10). Сумма <*>(/> А*) Дт< может быть мала, прежде всего, за счет »=1
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 339 множителей u(f; Д<), которые малы в малых окрестностях точек непрерыв- ности функции. Если же некоторые из отрезков Дж, содержат точки разрыва функции, то для них w(f; Д,) не стремится к нулю, сколь мелким бы ни было разбиение Р отрезка [а, Ь]. Однако о>(/; Д,) о>(/; [а, Ь]) < оо в силу ограни- ченности f на [а, Ь], поэтому сумма тех слагаемых, которые содержат точки разрыва, тоже может оказаться маленькой, если только мала сумма длин от- резков разбиения, покрывающих множество точек разрыва, или, точнее, если рост колебания функции на некоторых отрезках разбиения компенсируется малостью длин этих отрезков. Точной реализацией и формулировкой этого наблюдения и является кри- терий Лебега. Приведем теперь два классических примера, поясняющих свойство функ- ции быть интегрируемой по Риману. Пример 1. Функция Дирихле 1 О Р(х) = < при х € Q, при х G R \ Q, рассматриваемая на отрезке [0,1], не интегрируема на нем, поскольку для любого разбиения Р отрезка [0,1] в каждом отрезке Д, разбиения Р можно отметить как рациональную точку так и иррациональную точку Тогда »(/;Р,?) = £1Дх( = 1, *=1 в то время как <г(/;Р,П = £оД*« = 0. *=1 Таким образом, интегральные суммы функции Р(х) не могут иметь предел при А(Р) -> 0. С точки зрения критерия Лебега неинтегрируемость функции Дирихле тоже очевидца, поскольку функция Р(х) разрывна в каждой точке отрезка [0,1], который, как было показано в лемме 2, не есть множество меры нуль. Пример 2. Рассмотрим функцию Римана если х Е Q и х =-----несократимая дробь, если х € R \ Q. Мы уже рассматривали эту функцию в гл. IV, § 2, п. 2, и знаем, что функ- ция И,(х) непрерывна во всех иррациональных точках и разрывна во всех ра- циональных точках. Таким образом, множество точек разрыва функции 7£(я) счетно и потому имеет меру нуль. В силу критерия Лебега можно заключить, 12 Зорич В. А.
340 ГЛ. VI. ИНТЕГРАЛ что функция Щх) интегрируема на любом отрезке [а, &] С R, несмотря на то, что точки разрыва этой функции попадают в любой отрезок любого разбие- ния отрезка интегрирования. Пример 3. Рассмотрим теперь еще один, менее классический вопрос и пример. Пусть f: [а, Ь] -> R — интегрируемая на [а, 6] функция, принимающая зна- чения на отрезке [c,d], на котором непрерывна функция д : [c,d] -> R. Тогда композиция д о f: [а, &] -> R, очевидно, определена и непрерывна во всех точ- ках отрезка [а, &], в которых непрерывна функция /. В силу критерия Лебега отсюда следует, что (дof) € 7£[а, Ь]. Покажем теперь на примере, что композиция произвольных интегрируе- мых функций — уже не всегда интегрируемая функция. Рассмотрим функцию д(х) = |sgn|(z). Эта функция равна единице при х / 0 и нулю при х = 0. Непосредственной проверкой убеждаемся, что если, например, на отрезке [1,2] рассмотреть в качестве f функцию Римана 7£(z), то на этом отрезке композиция (gof)(x) есть не что иное, как функция Дирихле Р(х). Таким образом, наличие даже одной точки разрыва у д(х) привело к неинтегрируемости композиции gof. Задачи и упражнения 1. Теорема Дарбу. а) Пусть s(/; Р) и S(/; Р) — нижняя и верхняя суммы Дарбу вещественнозначной функции /, определенной и ограниченной на отрезке [а, 6], отвечающие разбиению Р этого отрезка. Покажите, что для любых двух разбиений Pi, Р2 отрезка [а,6] справедливо неравенство я(/;Р1К$(/;Р2). b) Пусть разбиение Р является продолжением разбиения Р отрезка [а, Ь] и пусть Д*х, ..., Д<й — те отрезки разбиения Р, которые содержат точки разбиения Р, не входящие в разбиение Р. Покажите, что справедливы оценки 0 S(/; Р) - $(/; Р) [а, 6]) • (Дхй + ... + Дх<(к), О < «(/; Р) - »(/; Р) «(/; [а, 6]) • (Дх(1 +... + Дх,.). с) Величины I = supe(/; Р), I = inf S(/; Р) называются соответственно нижним р р и верхним интегралом Дарбу функции f на отрезке [а, 6]. Покажите, что I I. d) Докажите теорему Дарбу: 1= lim з(/;Р), Т= lim S(/;P). e) Покажите, что (/ 6 7£[a, &]) <=> (I = I). f) Покажите, что f € Ща, &] тогда и только тогда, когда для любого е > 0 най- дется такое разбиение Р отрезка [а, 6], что S(f\ Р) — «(/; Р) < е.
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 341 2. Канторово множество лебеговой меры нуль. а) Канторово множество, описанное в задаче 7 § 4 гл. II, несчетно. Проверьте, что оно тем не менее есть множество меры нуль в смысле Лебега. Укажите, как следует видоизменить конструкцию канторова множества, чтобы получить анало- гичное всюду «дырявое» множество, не являющееся множеством меры нуль. (Его тоже называют канторовым.) Ь) Покажите, что заданная на отрезке [0,1] функция, равная нулю вне канторова множества и единице в точках канторова множества, интегрируема по Риману на этом отрезке, если и только если канторово множество имеет меру нуль. с) Постройте неубывающую, непрерывную и не постоянную на отрезке [0,1] функцию, которая имеет нулевую производную всюду, кроме, быть может, точек канторова множества меры нуль. 3. Критерий Лебега. а) Проверьте непосредственно (без ссылки на критерии Лебега) интегрируе- мость функции Римана из примера 2 настоящего параграфа. Ь) Покажите, что ограниченная функция f G 7?.[а, Ь] тогда и только тогда, когда для любых двух чисел е > 0 и 6 > 0 найдется разбиение Р отрезка [а, Ь] такое, что сумма длин тех отрезков разбиения, на которых колебание функции больше е, не превосходит <5. с) Покажите, что f G 77-[а, Ь] тогда и только тогда, когда f ограничена на [а, Ь] и для любых чисел е > 0 и <5 > 0 множество точек отрезка [а, Ь], в которых f имеет колебание больше чем е, можно покрыть конечным число интервалов, сумма длин которых меньше <5 (критерий Дюбуа-Реймана1^). d) Используя предыдущую задачу, докажите критерий Лебега интегрируемости функции по Риману. 4. Покажите, что если f,g G 7?.[а,Ь] и /, g действительны, то max{/,p} G 7?.[а,Ь] и min{/,p} G 7Z.[a,b]. 5. Покажите, что ь ь а) если /, g G 7£[а, Ь] и f(x) = g(x) почти всюду на [а, Ь], то Jf(x) dx = Jg(x) dx\ a a b) если f G 7?.[а, Ь] и f(x) — g(x) почти всюду на [а, Ь], то g может не быть интег- рируемой по Риману на [а,Ь], даже если g определена и ограничена на [а,Ь]. 6. Интеграл от векторнозначной функции. а) Пусть r(t) — радиус-вектор точки, движущейся в пространстве; го = г(0) — начальное положение точки; v(t) — вектор скорости как функция времени. Восста- новите r(t) по го и функции v(t). b) Сводится ли интегрирование векторнозначной функции к интегрированию вещественнозначных функций? с) Верен ли для векторнозначных функций критерий интегрируемости, выра- женный в утверждении 2'? d) Верен ли критерий Лебега для векторнозначных функций? е) Какие из понятий и фактов этого параграфа переносятся на функции с ком- плексными значениями? ^П. Дюбуа-Реймон (1831 — 1889) — немецкий математик. 12*
342 ГЛ. VI. ИНТЕГРАЛ § 2. Линейность, аддитивность и монотонность интеграла 1. Интеграл как линейная функция на пространстве Я.[а,Ь] Теорема 1. Если fug — интегрируемые на отрезке [о, функции, то их линейная комбинация otf + /Зд также является интегрируемой на [а, 6] функцией, причем ь ь ь У (а/ + /Зд)(х) dx = а J f(x) dx + /3^ д{х) dx. (1) а а а ◄ Рассмотрим интегральную сумму для интеграла, стоящего в левой части соотношения (1), и преобразуем ее: п п п £ (а/ + №)(6)Д®4 = №)ДЖ( + /?£5(6)4^. (2) *=1 *=1 *=1 Поскольку правая часть последнего равенства стремится к линейной ком- бинации интегралов, стоящих в правой части равенства (1), если параметр А(Р) разбиения стремится к нулю, то левая часть равенства (2) тоже имеет предел при А(Р) —> 0 и этот предел совпадает с пределом правой части. Таким образом, (af 4- /Зд) G И[а, Ь] и выполнено равенство (1). ► Если множество 7£[а, &] рассматривать как векторное пространство над ь полем действительных чисел, а интеграл J f(x) dx — как действительнознач- ен ную функцию, определенную на векторах пространства 'Ща, Ь], то теорема 1 утверждает, что интеграл есть линейная функция на векторном пространстве 7£[о, Ь]. Во избежание возможной путаницы, функции, определенные на функциях, называют обычно функционалами. Таким образом, мы доказали, что инте- грал есть линейный функционал на векторном пространстве интегрируемых функций. 2. Интеграл как аддитивная функция отрезка интегрирования. ь Значение интеграла J f(x) dx = I(f; [а, 6]) зависит как от подынтегральной а функции, так и от отрезка, по которому ведется интегрирование. Например, если f Е 7£[а, Ь], то, как мы уже знаем, /|[a,/j] € /3], если [а, /?] С [а, д], т. е. б определен интеграл f f(x) dx, который мы можем исследовать с точки зрения а его зависимости от отрезка [а, /3] интегрирования.
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 343 Лемма 1. Если а <Ь < с и f € 7£[а, с], то /|[о,б] € Ч> с] и имеет место равенство1^ с Ь с jf(x)dx = jf(x)dx + У f(x)dx. (3) а а Ь ◄ Отметим прежде всего, что интегрируемость ограничений функции f на отрезки [а, 6] и [6, с] гарантируется утверждением 4 из предыдущего пара- графа. с Далее, поскольку f € 7£[а, с], то при вычислении интеграла J f(x)dx как а предела интегральных сумм мы вправе выбирать любые удобные нам разбие- ния отрезка [а, с]. В качестве таковых будем сейчас рассматривать только те разбиения Р отрезка [а, с], которые содержат точку Ь. Каждое такое разби- ение с отмеченными точками (Р, £), очевидно, порождает разбиения (Р', £') и (Р", £") отрезков [а, Ч и [6, с] соответственно, причем Р = P'UP" и £ = £'U£". Но тогда имеет место следующее равенство между соответствующими ин- тегральными суммами: <r(/; Р,4) = <r(/; Р1, (') + *(/; Р", £")• Поскольку А(Р') А(Р) и А(Р") А(Р), то при достаточно малом А(Р) каждая из написанных интегральных сумм близка к соответствующему инте- гралу из (3). Таким образом, равенство (3) действительно имеет место. ► Чтобы несколько расширить применимость полученного результата, вер- немся временно вновь к определению интеграла. Мы определили интеграл как предел интегральных сумм п <т(/;Р,е) = £/(6)Дг<, (4) г-1 отвечающих разбиениям с отмеченными точками (Р, £) отрезка интегрирова- ния [а, Ч- Разбиение Р составляла монотонная конечная последовательность точек xq, Xi, ..., хп, причем точка х0 совпадала с нижним пределом интегри- рования а, а последняя точка хп совпадала с верхним пределом интегриро- вания Ь. Эта конструкция проводилась в предположении, что а < Ь. Если теперь взять произвольно два числа а и Ъ, не требуя, чтобы обязательно было а < Ь, и, считая а нижним пределом интегрирования, а b верхним, провести указанную конструкцию, то мы вновь получим сумму вида (4), в которой на сей раз будет Дж, >0 (г = 1,..., п), если а < Ь, и Дж* <0 (i == 1,..,, п) Напомним, что символ /)д обозначает сужение функции f на множество Е, лежащее в области определения функции /. В правой части равенства (3) формально полагалось бы написать не /, а сужения f на соответствующие отрезки.
344 ГЛ. VI. ИНТЕГРАЛ при а > Ъ, ибо Дж* = Xi- Xi~i. Таким образом, сумма (4) при а > Ъ будет от- личаться от интегральной суммы соответствующего разбиения отрезка (&, а] (Ъ < а) только знаком. По этим соображениям принимается следующее соглашение: если а > Ь, то У f(x) dx := — J f(x) dx. (5) a b В связи с этим естественно также положить, что (6) a У/(ж) dx := 0. a После этих соглашений с учетом леммы 1 приходим к следующему важному свойству интеграла. Теорема 2. Пусть a,b, с € R и пусть f — функция, интегрируемая на наибольшем из отрезков с концами в указанных точках. Тогда сужение f на каждый из двух других отрезков также интегрируемо на соответствующем отрезке и имеет место равенство J f(x) dx + У f(x) dx + J f(x) dx = 0. (7) a b c ◄ В силу симметрии равенства (7) относительно a, b, с, мы без ограничения общности можем считать, что а = min {а, Ь, с}. Если max {а, Ь, с} = с и а < Ъ < с, то по лемме 1 J f(x) dx 4- у f(x) dx — J f(x) dx = 0, aba что с учетом соглашения (5) дает равенство (7). Если max {a, b,c} = b и a < c < b, то по лемме 1 c b b dx = 0, a c a что с учетом (5) вновь дает (7). Наконец, если какие-то две из точек а, Ь, с или все три совпадают, то (7) следует из соглашений (5) и (6). ► Определение 1. Пусть каждой упорядоченной паре (а,/3) точек а, (3 отрезка [а, Ь] поставлено в соответствие число 1(а,/3), причем так, что для любой тройки точек а, /3, у € [а, Ь] выполнено равенство Да,7)== Да,/?)+ /(/?, 7)-
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 345 Тогда функция /(а,/?) называется аддитивной функцией ориентированно- го промежутка, определенной н<1 промежутках, лежащих в отрезке [а, Ь]. ь Если f G И\А, В] и a, b, с G [Л, В], тб, полагая 1(а, 6) = J f(x) dx, из (7) за- а ключаем, что (8) т. е. интеграл есть аддитивная функция промежутка интегрирования. Ори- ентированность промежутка состоит в данном случае в том, что мы упорядо- чиваем пару концов отрезка интегрирования, указывая, какой из них первый (являющийся нижним пределом интегрирования) и какой второй (являющийся верхним пределом интегрирования). 3. Оценка интеграла, монотонность интеграла, теоремы о среднем а. Одна общая оценка интеграла. Начнем с одной общей оценки инте- грала, которая, как потом выяснится, справедлива не только для интегралов от действительнозначных функций. Теорема 3. Если а^Ъи f G И[а, Ь], то |/| € 7£[а, 6] и справедливо не- равенство ь ь Jf(x)dx J |/|(ж)сЬг. (9) а а Если при этом |/|(ж) С на [а, Ь], то ь [ |/|(г) dx < C(b - а). (10) а ◄ При а = b утверждение тривиально, поэтому будем считать, что а < Ь. Для доказательства теоремы достаточно вспомнить теперь, что |/| € 7£[а, Ь] (см. утверждение 4 из § 1), и написать следующую оценку интегральной суммы п п п п 'Е /(6) Дх, $ £ |/(6)| |Дж,I = У 17(6)1 Дх, < С V Д®, = С(Ь - а). *=1 *=1 *=1 г=1 Переходя к пределу при А(Р) -> 0, получаем
346 ГЛ. VI. ИНТЕГРАЛ Ь. Монотонность интеграла и первая теорема о среднем. Все даль- нейшее специфично для интегралов от действительнозначных функций. Теорема 4. Если а b, fi, /2 € Ща, &] и fi(x) /г(^) в любой точке х € [а, Ь], то ь ь Jfi(x)dx У f2(x)dx. (11) а а ◄ При а = Ъ утверждение тривиально. Если же а < Ь, то достаточно записать для интегральных сумм неравенство i=l i=l справедливое, поскольку Дж* > 0 (г = 1, и затем перейти в нем к пределу при А(Р) -> 0. ► Теорему 4 можно трактовать как утверждение о монотонности зависимо- сти интеграла от подынтегральной функции. Из теоремы 4 получается ряд полезных следствий. Следствие 1. Если а b, f Е"Л[а,Ь] и т f(x) М на х Е [а,Ь], то ь — Jf(x)dx М• (Ь — а), (12) а и, в частности, если 0 /(ж) на [а, 6], то ◄ Соотношение (12) получается, если проинтегрировать каждый член не- равенств т У (ж) М и воспользоваться теоремой 4. ► Следствие 2. Если f € Я[а,6], т = inf /(ж), М = sup /(ж), то «€[а,Ь] х€[а,6] найдется число д £ [т, М] такое, что ь J f(x)dx = ц-(Ь — а). (13) а ◄ Если а = Ь, то утверждение тривиально. Если а / Ъ, то положим д = 1 ъ — f f(x)dx- Тогда из (12) следует, что т д М, если а < Ь. Но а обе части (13) меняют знак при перестановке местами а и Ь, поэтому (13) справедливо и при b < а. ►
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 347 Следствие 3. Если f G С[а,Ь], то найдется точка £ € [а, 6] такая, что ь f f(x)dx = f(O(b-a). (14) а ◄ По теореме о промежуточном значении для непрерывной функции, на отрезке [а, 6] найдется точка £, в которой /(£) = д, если только т = min /(ж) д max /(ж) = М. х€[а,Ь] ®е[а,Ь] Таким образом, (14) следует из (13). ► Равенство (14) часто называют первой теоремой о среднем для интеграла. Мы же зарезервируем это название для следующего, несколько более общего утверждения. Теорема 5 (первая теорема о среднем для интеграла). Пусть f,g€ G 7£[а, Ь], т = inf У (ж), М = sup /(ж). Если функция д неотрицательна ®€[а,6] х€[а,6] (или неположительна) На отрезке [а, 6], то где д G [тп, М]. Если, кроме того, известно, что f Е С[а, Ь], то найдется точка f G [а, Ь] такая, что ъ ь f (f-9)(x)dx = f(£)f 9(х) dx. (16) р а ◄ Поскольку перестановка пределов интегрирования приводит к измене- нию знака одновременно в обеих частях равенства (15), то достаточно про- верить это равенство в случае а < Ь. Изменение знака функции д(х) тоже одновременно меняет знак обеих частей равенства (15), поэтому можно без ограничения общности доказательства считать, что д(х) 0 на [а, 6]. Поскольку т = inf /(ж) и М = sup /(ж), то при д(х) О тд(х) f(x)g(x) Мд(х). Поскольку т • д € 7£[а, Ь], f • д G 1Ца, 5] и М • д € 7£[а, 5], то, применяя тео- рему 4 и теорему 1, получаем
348 ГЛ. VI. ИНТЕГРАЛ Ь Если Jд(х) dx = 0, то, как видно из этих неравенств, соотношение (15) а выполнено. Если же ь J д(х) dx^Q, а то, полагая из (17) находим, что т д М, но это равносильно соотношению (15). Равенство (16) теперь следует из (15) и теоремы о промежуточном значе- нии для функции f € С[а, 5], с учетом того, что в случае f е С[а, 6] т = min f(x) и М — max fix}. х€[а,6] ' ' х€[а,6] Заметим, что равенство (13) получается из (15), если д(х) = 1 на [а, 5]. с. Вторая теорема о среднем для интеграла. Значительно более специальной и деликатной в рамках теории интеграла Римана является так называемая вторая теорема о среднем1 * *^. Чтобы не осложнять доказательство этой теоремы, сделаем несколько по- лезных заготовок, представляющих и самостоятельный интерес. Преобразование Абеля. Так называется следующее преобразование п к суммы 2 aibi- Пусть А* = 52 а»; положим также Ао = 0. Тогда i=i i=i п п п п =Е А‘ь' - Е4»-*6» = 1=1 1=1 1=1 1=1 п п—1 п—1 = £ Atbi - Aibi+1 = Anba -Aoh + Y, Mbi - bi+i). i=l i=0 i=l Итак, n n—1 = (Anbn — Aq 5i) + A, (bi — 5»+i), (18) i=l i=l 1^При некотором дополнительном и часто вполне приемлемом условии на функции основную теорему 6 этого раздела можно легко получить из первой теоремы о среднем. См. по этому поводу задачу 3 к следующему параграфу.
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 349 или, поскольку Ао = О, п п—1 £аЛ = ЛпЬп + 52Л(6,-г><+1). (19) »=1 »=1 На основе преобразования Абеля легко проверяется следующая к Лемма 2. Если числа Ak = ^'Oi (к — 1,..., п) удовлетворяют нера- »=1 венствам т М, а числа bi (i = 1,..., п) неотрицательны и bi при i = 1,..., п — 1, то п mbi ^^aibi МЬ\. i=l (20) ◄ Используя то, что Ьп 0 и bi — 6»+i 0 при г = 1, ..., п - 1, из (19) получаем п п—1 52 ^Mbn + "£ M(bi - bi+l) = Mbn + M(bi - 6n) = Mbi. i=l i=l Аналогично проверяется и левое неравенство в соотношении (20). ► Лемма 3. Если f € 7?.[а,&], то при любом х € [а,&] определена функция X F(x) = у/(*) dt (21) u F(x) e С[а, Ь]. ◄ Существование интеграла (21) при любом х G [а, Ь] нам уже извест- но из утверждения 4 § 1, поэтому остается проверить непрерывность функ- ции F(x). Поскольку f G 7£[а, 6], имеем |/| С < оо на [а, 6]. Пусть х € [а, 6] и х + h G [а, Ь]. Тогда в силу аддитивности интеграла и неравенств (9), (10) получаем \F(x + h) — F(x)\ = х + h х У /(«)dt-у/(t)dt a a x + h f \ftf)\dt $ C|A|. Мы воспользовались неравенством (10) с учетом того, что при h < 0 имеем х + h х 4- Л х = У |/(*)|<й. х + Л
350 ГЛ. VI. ИНТЕГРАЛ Итак, мы показали, что если х, х + h € [а, 6], то \F(x + h)-F(x)\^C\h\, (22) откуда, очевидно, следует непрерывность функции F в любой точке отрезка [а, Ъ]. ► Теперь докажем лемму, которая уже является вариантом второй теоремы о среднем. Лемма 4. Если f, д € Н[а,Ь] и д — неотрицательная и невозрастающая на отрезке [а, Ь] функция, то найдется точка £ G [а, 6] такая, что ь е f • д)(х) dx = д(а) J/(х) dx. (23) а а Прежде чем переходить к доказательству, отметим, что, в отличие от со- отношения (16) первой теоремы о среднем, в (23) под знаком интеграла оста- лась функция /, а не монотонная функция д. << Для доказательства формулы (23), как и в уже рассмотренных выше случаях, постараемся оценить соответствующую интегральную сумму. Пусть Р — разбиение отрезка [а, 6]. Запишем сначала тождество Ь п Xi f g)(x)dx = ^ J(f-9№)dx = a t=l Xi-i n *» n Xi = 52$(«i-i) J f(x)dx + ^ у [g(x) - g(xi-i)]f(x)dx t=l ®»-l *=1 Zt-l и покажем, что при А(Р) —> 0 последняя сумма стремится к нулю. Поскольку / G R[a, Ь], то |/(х)| С < оо на [а, Ь]. Тогда, используя уже доказанные свойства интеграла, получаем п 52 / [$(*) ~9(xi-i)]f(x)dx *=1 Xi — l п ^52 f \9(x)~9^i-i)\\f(x)\dx 1=1 Xi-l n Xi n <?52 J |p(^) -p(^i-i)l^ C J2a>(p; AJAxi -> 0 t=l x,_i i=l при A(P) —> 0, ввиду того, что g G 7£[a, 6] (см. утверждение 2 из § 1). Значит, ь f (f'9)(x)dx = a n 0 t=l Xi-t (24)
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 351 Оценим теперь сумму, стоящую в правой части равенства (24). Положив X F(x) = У/(t) dt, а по лемме 3 получаем функцию, непрерывную на отрезке [а, Ь]. Пусть т = min F(x) и М = max F(x). х€(а,Ь] х€[а,Ь] ЯЧ Поскольку [ f(x)dx = F(xi) — F(xi-i), то P(*i-i) f dx = (F(xi) - F{xi^)) (25) »=i xi-i *=i Учитывая неотрицательность и невозрастание функции д на [а, Ь] и полагая = F(xi) - F(«t-i), bi = g(ii-i), по лемме 2 находим, что mg(a) “ ^i-i))p(^i-i) Mg(a), (26) i=l поскольку к At = = F(xt) - F(x0) = F(xt) - F(a) = F(xt). i=l Мы показали, что суммы (25) удовлетворяют неравенствам (26). Вспоми- ная соотношение (24), теперь имеем ь тд(а) J(/ • g)(x)dx Мд(а). (27) а Если д(а) = 0, то, как показывают неравенства (27), доказываемое соот- ношение (23), очевидно, справедливо. Если же д(а) > 0, то положим ь f-g)(x)dx. Из (27) следует, что т /х М, а из непрерывности функции F(x) = х = J f(t)dt на [а, 6] следует, что найдется точка £ G [а,5], в которой F(£) = /х. а Но именно это и утверждает формула (23). ►
352 ГЛ. VI. ИНТЕГРАЛ Теорема 6 (вторая теорема о среднем для интеграла). Если /,дЕН[а,Ь] ид— монотонная на [а, Ь] функция, то найдется точка £ € [а, Ь] такая, что ь £ ь f (f • P)(*) = Р(а) f №) dx + g(b) J f(x) dx. (28) а а £ Равенство (28) (как, впрочем, и равенство (23)) часто называют формулой Бонне1^. << Пусть д — неубывающая на [а, 6] функция. Тогда G(x) — д(Ь) — д(х) — неотрицательная, невозрастающая, интегрируемая на [а, Ь] функция. Приме- няя формулу (23), находим ь [ (J G)(x) dx = G(d) J f(x) a a dx. (29) Ho b b b a dx. Учитывая эти соотношения и свойство аддитивности интеграла, из (29) полу- чаем доказываемое равенство (28). Если д — невозрастающая функция, то, полагая G(x) = д(х) — д(Ь), полу- чим, что G(x) — неотрицательная, невозрастающая, интегрируемая на [а, Ь] функция. Далее вновь получаем формулу (29), а за ней и формулу (28). ► Задачи и упражнения 1. Покажите, что если f € 7£[а, 6] и f(x) 0 на [а, Ь], то а) при условии, что в некоторой точке хо € [а, 6] непрерывности функция /(ж) принимает положительное значение /(хо) > 0, имеет место строгое неравенство ь ъ Ь) из условия J f(x) dx = 0 следует, что f{x) — 0 почти во всех точках отрезка [а, 6]. П. О. Бонне (1819—1892) — французский математик и астроном. Наиболее значитель- ные математические работы Бонне связаны с дифференциальной геометрией.
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 353 2. Покажите, что если f € 7£[а,^1, т = inf /(ж), М = sup/(ж), то 1*.Ч ]а,Ь[ Ь a) f f(x) dx = д (6 - а), где // е [тп, Af] (см. задачу 5а) предыдущего параграфа); а Ь) при условии непрерывности f на [а, 6] найдется такая точка £ Е ]а,Ь[, что ь 3. Покажите, что если f € С7[а, 6], /(ж) 0 на [а, 6] и М = max/(ж), то [“•Ч ( г \1/п lim I / fn(x)dx ) = М. l->0° \ J 1 ' а ' 4. а) Покажите, что если / Е 7£[а, Ь], то |/|р Е 7£[а, 6] при р 0. Ь) Исходя из неравенства Гёльдера для сумм, получите неравенство Гёльдера для интегралов1^: ь J (f • <?)(®) dx а если f,gE 7£[а, 6] и р > 1, g > 1, с) Исходя из неравенства Минковского для сумм, получите неравенство Минков- ского для интегралов: \ 1/р |/ 4-д|р(ж) </ж ) |/|р(ж)йж |д|р(ж) dx если f,gE 7£[а, 6] и р 1. Покажите, что это неравенство меняется на противопо- ложное, если 0 < р < 1. d) Проверьте, что если / — непрерывная, выпуклая на R функция, а — произ- вольная непрерывная на R функция, то при с / 0 справедливо неравенство Йенсена: С //(»>(<))<»• О Алгебраическое неравенство Гёльдера при р = q = 2 впервые было получено в 1821 г. Коши и носит его имя. Неравенство Гёльдера для интегралов при р = q = 2 впервые нашел в 1859 г. русский математик Ви Я. Буняковский (1804 — 1889). Это важное интегральное неравенство (в случае р = q — 2) называют неравенством Бунлковского или неравенством Коши — Бунлковского. Встречается иногда и менее точное его название «неравенство Швар- ца» — по имени немецкого математика Г. К. А. Шварца (1843 — 1921), в работах которого оно появилось в 1884 г.
354 ГЛ. VI. ИНТЕГРАЛ § 3. Интеграл и производная 1. Интеграл и первообразная. Пусть f — интегрируемая по Риману на отрезке [а, 6] функция. Рассмотрим на этом же отрезке функцию X F(x) = у /(«) dt, (1) а часто называемую интегралом с переменным верхним пределом. Поскольку f Е 7£[а, Ь], то /|[а>а:] Е 7£[а, ж], если [а, я] С [а, 6]; поэтому функ- ция х н» F(x) корректно определена для х Е [а, Ь]. Если |/(t)l < +оо на [а, Ь] (а /, как интегрируемая функция, ограни- чена на [а, Ь]), то из аддитивности интеграла и простейшей оценки интеграла следует, что \F(x + h) - F(a;)| C|/i|, (2) если х, х + h Е [а, 6]. Об этом мы, кстати, уже говорили, доказывая лемму 3 предыдущего пара- графа. Из неравенства (2), в частности, следует непрерывность функции F на [а, Ь]. Итак, F Е С[а, 6]. Теперь мы исследуем функцию F более тщательно. Имеет место следующая основная для всего дальнейшего Лемма 1. Если f Е 7£[а,6] и функция f непрерывна в некоторой точке х Е [а, 6], то функция F, определяемая на [а, &] формулой (1), дифференциру- ема в этой точке х, причем имеет место равенство F\x) = f(x). ◄ Пусть х, х + h Е [а, 6]. Оценим разность F(x + h) — F(x). Из непрерыв- ности / в точке х следует, что f(t) = f(x) + A(t), где A(t) -> 0 при t -> х, t Е [а, 6]. Функция A(f) = f(t) — f(x) интегрируема на [а, 6], как разность интегрируемой функции f н /(f) и постоянной /(«), если х — фиксирован- ная точка. Обозначим через M(h) величину sup |A(t)|, где 1(h) — отрезок с te/(4) концами х, х + h Е [а, 6]. По условию, M(h) —> 0 при h —> 0. Теперь запишем F(x 4- h) - F(x) = У f(t) dt- J f(t) dt = У f(t) dt = a a x (f(x) 4- A(t)) dt = J f(x)dt 4- J &(t)dt — f(x)h 4- a(h)h, X XX
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 355 где положено A(t) dt = a(h)h. х + h Поскольку X то |a(h)| M(h) и. потому a(h) —> 0, когда h —> 0 (но так, что х + h G [а, Ь]). Таким образом, показано, что если функция / непрерывна в точке х G [а, Ь], то при смещениях h от точки х таких, что x + h € [а, Ь], имеет место равенство F(x + h) — F(x) = f(x)h + a(h)h, (3) где a(h) —> 0 при h -> 0. Но это и означает, что функция F(x) дифференцируема на [а, Ь] в точке х Е [а, 5] и что F'(x) = /(a;). ► Важнейшим непосредственным следствием леммы 1 является следующая Теорема 1. Каждая непрерывная на отрезке [а,Ь] функция f: [а, Ь] —> R имеет на этом отрезке первообразную, причем любая первообразная функции f на [а, Ь] имеет вид X F(x) = j f(t) dt + с, (4) а где с — некоторая постоянная. << (/ € С[а, Ь]) => (/ G 7£[а, 6]), поэтому на основании леммы 1 функция (1) является первообразной для f на [а, Ь]. Но две первообразные F(x) и F(x) одной и той же функции на отрезке могут отличаться на этом отрезке только на постоянную, поэтому F(x) — F(x) + с. ► Для дальнейших приложений удобно несколько расширить понятие перво- образной и принять Определение 1. Непрерывная на числовом промежутке функция х >-> н» F(x) называется первообразной (обобщенной первообразной) функции х i-> »-> f(x), определенной на том же промежутке, если во всех точках промежутка, за исключением, быть может, конечного их числа, имеет место соотношение ;P(z) = f(x). Учитывая это определение, можно утверждать, что справедлива следующая Теорема 1'. Каждая определенная и ограниченная на отрезке [а, 5] функ- ция f : [а, 5] -> R с конечным множеством точек разрыва имеет на этом отрезке (обобщенную) первообразную, причем любая первообразная функции f на [а, Ь] имеет вид (4).
356 ГЛ. VI. ИНТЕГРАЛ ◄ Поскольку f имеет конечное множество точек разрыва, то f € 7?.[а, 6] и по лемме 1 функция (1) является обобщенной первообразной для f на [а, 6]. При этом мы учли, что, как уже отмечалось, в силу (2) функция (1) не- прерывна на [а, Ь]. Если F(x) — другая первообразная функции f на [а, &], то Л(т) — F(x) — непрерывная функция, постоянная на каждом из конеч- ного числа промежутков, на которые точки разрыва функции f разбивают отрезок [а, Ь]. Из непрерывности F(x) — F(x) на [а, 6] тогда следует, что F(x) - F(x) = const на [а, Ь]. ► 2. Формула Ньютона—Лейбница Теорема 2. Если f: [а,Ь] —> R — ограниченная функция с конечным числом точек разрыва, то f € 7?.[а, 6] и ь [ f(x)dx = f(b)-f(a), а (5) где F[а, Ь] —> R — любая из первообразных функции f на отрезке [а, Ь]. << Интегрируемость ограниченной на отрезке функции с конечным числом точек разрыва нам уже известна (см. § 1, следствие 2 утверждения 2). На- личие обобщенной первообразной F(x) функции f на [а, Ь] гарантирует тео- рема 1', в силу которой F(x) имеет вид (4). Полагая в (4) х = а, получим, что F(d) = с, откуда Л®) = f f(t) dt + Z(a). a В частности, ь I f(t)dt = ^(b)-r(.a), a что с точностью до обозначения переменной интегрирования совпадает с до- казываемой формулой (5). ► Фундаментальное для всего анализа соотношение (5) называется формулой Ньютона — Лейбница. Разность F(b) — F(a) значений любой функции часто записывают симво- лом ^(ж)|д. В этих обозначениях формула Ньютона—Лейбница приобретает вид ___________________ ь J f(x)dx = F(x)\ba. а Поскольку обе части этой формулы одновременно меняют знак при переста- новке а и Ь, то формула справедлива при любом соотношении величин а и 6, т. е. как при а Ь, так и при а Ь.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 357 На упражнениях по анализу формула Ньютона—Лейбница большей частью используется только для вычисления стоящего слева интеграла, и это может породить несколько искаженное представление об ее использовании. На са- мом деле положение вещей таково, что конкретные интегралы редко находят через первообразную, а чаще прибегают к прямому счету на ЭВМ с помощью хорошо разработанных численных методов. Формула Ньютона—Лейбница занимает ключевую, связывающую интегрирование и дифференцирование, позицию в самой теории математического анализа, в которой она, в частно- сти, получает далеко идущее развитие в виде так называемой общей формулы Стокса1). Примером того, как формула Ньютона—Лейбница используется в самом анализе, может служить уже материал следующего пункта настоящего пара- графа. 3. Интегрирование по частям в определенном интеграле и формула Тейлора Утверждение 1. Если функции и(х) и v(x) непрерывно дифференциру- емы на отрезке с концами а и Ь, то справедливо соотношение ъ ь J (и • vz)(a:) dx — (и- v)(x) |* — J (v • и')(х) dx. (6) а а Эту формулу принято записывать в сокращенном виде ь ь и называть формулой интегрирования по частям в определенном интеграле. >4 По правилу дифференцирования произведения функций имеем (и • v)'(x) = (и' • v)(x) + (и • v')(x). По условию все функции в этом равенстве непрерывны, а значит, и интегри- руемы на отрезке с концами а и Ь. Используя линейность интеграла и формулу Ньютона—Лейбница, получаем ь ь (н • v)(x)|*= J(и1 • v)(x) dx + j\u • v')(x)dx. ► a a В качестве следствия получим теперь формулу Тейлора с интегральным остаточным членом. ^Д. Г. Стокс (1819-1903) — английский физик и математик.
358 ГЛ. VI. ИНТЕГРАЛ Пусть на отрезке с концами а и х функция t f(t) имеет п непрерывных производных. Используя формулу Ньютона—Лейбница и формулу (6), проде- лаем следующую цепочку преобразовании, в которых все дифференцирования и подстановки производятся по переменной t: X X f(x) - f(a) = У f'(t)dt = -f t)’dt = a a x =~f(t)(x - 01:+/ гы* -t)dt= a x = /'(a) (x - a) - | /f"(t) {(x - tpfdt = a x = - a) - j f"(t)(x - t)2|: + A [f"'(t)(x - tfdt = u J a = 7'(a)(x — a) + A/"(a)(x — a)2 — X -A- /7"'(t)((x-t)3)'dt = ...= z • О J a = - a) + | f"(a)(x - a)2 4-... 4- z + ---4^—к/(п 1}(aHx-a)n 1 +rn_i(a;z), где X r„-i(o;x) = //(n) a (7) Итак, доказано следующее Утверждение 2. Если функция t н» /(£) имеет на отрезке с концами а и х непрерывные производные до порядка п включительно, то справедлива формула Тейлора №) = /(а) 4- у, f'(a)(x - а) 4-... + /(п-1)(а)(ж - а)”-1 4- гп-г(а;х) с остатком rn_i(a;z), представленным в интегральной форме (7). Отметим, что функция (х — t)n-1 не меняет знак на отрезке с концами а и х, и поскольку функция t *-> (t) непрерывна на этом отрезке, то по первой
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 359 теореме о среднем на нем найдется такая точка что X rn-i(a;x) = (л-”jj| /f{n)(№ - t)n-xdt = а х а = 7^-ni /'"'«) (~^х " Q") Х = S - “)"• (П — 1)! \ П / а П! Мы вновь получили знакомую форму Лагранжа остаточного члена фор- мулы Тейлора. (На основании задачи 2Ь) из предыдущего параграфа, можно считать, что £ лежит в интервале с концами а, х.) Это рассуждение можно было бы повторить, вынося из-под знака интегра- ла (7) f(n\£)(x — £)п~к, где к € [1,п]. Значениям к = 1 и к = п отвечают получаемые при этом соответственно формулы Коши и Лагранжа остаточно- го члена. 4. Замена переменной в интеграле. Одной из основных формул ин- тегрального исчисления является формула замены переменной в определенном интеграле. Эта формула в теории интеграла столь же важна, как в диффе- ренциальном исчислении формула дифференцирования композиции функций, с которой она может быть при определенных условиях связана посредством формулы Ньютона—Лейбница. Утверждение 3. Если [а,/?] -> [а,Ь] — непрерывно дифференциру- емое отображение отрезка а t /3 в отрезок а х b такое, что </?(а) = а и <р(/3) = Ь, то при любой непрерывной на [а, Ь] функции f(x) функ- ция f <р' (t) непрерывна на отрезке [а, /3] и справедливо равенство ъ б (8) а а ◄ Пусть F(x) — первообразная функции f(x) на [а, 6]. Тогда, по теореме о дифференцировании композиции функций, функция является пер- вообразной для функции /(</?(£))<//(£), непрерывной, как композиция и про- изведение непрерывных функций на отрезке [а,/?]. По формуле Ньютона— ь 0 Лейбница J f(x)dx = Т’(Ь) - Т’(ц) и f tp'(t) dt = Р(<р(/ЗУ) - ^(«^(a)). a a Но, по условию, <XQ) = a и = Ь; таким образом, равенство (8) действи- тельно имеет место. ► Из формулы (8) видно, насколько удобно иметь под интегралом не просто знак функции, а дифференциальное выражение f(x)dx, позволяющее после
360 ГЛ. VI. ИНТЕГРАЛ подстановки х = <p(t) автоматически получать правильное подынтегральное выражение в интеграле по новой переменной. Для того чтобы не осложнять дела громоздким доказательством, мы в утверждении 3 умышленно сузили истинную область применимости форму- лы (8) и получили (8) из формулы Ньютона—Лейбница. Теперь перейдем к основной теореме о замене переменной, условия которой несколько отличают- ся от условий утверждения 3. Доказательство этой теоремы будет опираться непосредственно на определение интеграла как предела интегральных сумм. Теорема 3. Пусть (р : [ск,/3] —> [а, Ь] — непрерывно дифференцируемое, строго монотонное отображение отрезка a 0 в отрезок а х b с соответствием концов <p(pi) = а, <р(Д) = b или <р(а) = Ь, <р(/3) = а. Тогда при любой функции f(x), интегрируемой на отрезке [а, 6], функция х х интегрируема на отрезке [а,/?] и справедливо равенство б f f(x)dx = J а (9) ◄ Поскольку <р — строго монотонное отображение отрезка [а,/?] на от- резок [а, &] с соответствием концов, то любое разбиение Pt (а = to < ... < < tn = /?) отрезка [а, /?] посредством образов Xi = </?(£<) (г = 0,1,..., п) точек разбиения Pt порождает соответствующее разбиение Рх отрезка [а, 6], кото- рое можно условно обозначить как </?(Р*). При этом xq = а, если <р(а) = а, и xq — b, если </?(а) = Ь. Из равномерной непрерывности <р на [а, /3] следует, что если A(Pt) -> 0, то величина Х(Рх) = A(v?(Pt)) тоже стремится к нулю. Используя теорему Лагранжа, преобразуем интегральную сумму ст(/; Рх, £) следующим образом: = £/(&)(*< - ач-0 = i=l 1=1 п п = - ti-1) = *=1 *=1 Здесь Xi = & лежит на отрезке с концами Xi-i, Xi, а точки Ti, Ti лежат на отрезке с концами ti-i, ti (г = 1,..., n). Далее, п п i=l i=l n + sti. t=l
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 361 Оценим последнюю сумму. Поскольку f € 7£[а, 6], функция f ограничена на [а, 6]. Пусть |/(ж)| С на [а, Ц. Тогда 22 №(п)) (^(^) “ </(т0) Ati »=1 »=1 где А, — отрезок с концами t<-i, Последняя сумма стремится к нулю при X(Pt) -> 0, поскольку tp' — непре- рывная на отрезке [а, /3] функция. Таким образом, мы показали, что п п 22 №) = 22 fMri) ли+а, i=l i=l где а -> 0 при A(Pt) -> 0. Как уже отмечалось, если A(Pt) -> 0, то и Х(Рх) -> -> 0. Но f Е 7£[а, 6], поэтому при А(РЖ) -> 0 сумма в левой части последнего равенства стремится к интегралу j f(x) dx. Значит, при A(Pt) —> 0 и сумма V?(a) в правой части этого равенства имеет и притом тот же предел, п Но сумму $2 можно считать совершенно произвольной »=i интегральной суммой функции /(</?(£))</?'(£), соответствующей разбиению Pt с отмеченными точками т = (п,...,тп), поскольку, ввиду строгой монотон- ности </?, любой набор точек т можно получить из некоторого соответству- ющего ему набора £ = 6») точек, отмеченных в отрезках разбиения Р® = ^(Р<)* Таким образом, предел этой суммы есть, по определению, интеграл от функции f(<p(t))<p'(t) по отрезку [а, /?], и мы доказали одновременно как ин- тегрируемость функции /(^(0) на отрезке [а, /3], так и формулу (9). ► 5. Некоторые примеры. Рассмотрим теперь некоторые примеры ис- пользования полученных формул и доказанных в последних двух параграфах теорем о свойствах интеграла. Пример 1. 2 2 Sin2f 4- cos 2t) dt = jt/2 —*1'2,
362 ГЛ. VI. ИНТЕГРАЛ Для вычисления интеграла мы сделали замену переменной х = sin t, а за- тем, найдя первообразную получившейся после этой замены подынтегральной функции, воспользовались формулой Ньютона—Лейбница. Конечно, можно было бы поступить и иначе: найти довольно громоздкую первообразную | х — х2 4- arcsin х функции а/1 — х2 и затем воспользо- ваться формулой Ньютона—Лейбница. Пример показывает > что при вычисле- нии определенного интеграла, к счастью, иногда удается избежать отыскания первообразной подынтегральной функции. При мер 2. Покажем, что ТГ тг тг a) J sin ma: cosnx dx = 0, b) J sin2 тх dx — тг, с) J cos2 пх dx = тг — тг —тг — тг при т, п G N. тг a) J sin тх cos nxdx — — 7Г ТГ J(sin(n 4- т)х — sin(n — т)х) dx = если п — т 0 0. Случай, когда п — т = 0, можно рассмотреть отдельно, и в этом случае, очевидно, вновь приходим к тому же результату. тг тг с) [ cos2 пх dx = 1 J (1 4- cos 2пх) dx = 1 4- ~ sin 2пх —тг тг = ТГ. —тг —тг Пример 3. Пусть f G 7£[—а, а]. Покажем, что 2 j f(x) dx, о 0, если f — четная функция, если f — нечетная функция. Если /(—ж) = /(я), то dx.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 363 Если же f{—x) — то, как видно из тех же выкладок, получим J f(x)dx = j\f(—x) 4- f(x)) dx = J Odx = 0. —a 0 0 Пример 4. Пусть f — определенная на всей числовой прямой К перио- дическая функция с периодом Т, т. е. f(x 4- Г) = f(x) при х € R. Если f — интегрируемая на каждом конечном отрезке функция, то при любом a 6 К имеет место равенство а + Т Т J f(x) dx — J f(x) dx, a 0 т. e. интеграл от периодической функции по отрезку длины периода Т этой функции не зависит от положения отрезка интегрирования на числовой пря- мой: Мы сделали замену х = t 4- Т и воспользовались периодичностью функ- ции f(x). 1 Пример 5. Пусть нам нужно вычислить интеграл J sin х2 dx, например, о с точностью до 10-2. Мы знаем, что первообразная J sin x2dx (интеграл Френеля) не выража- ется в элементарных функциях, поэтому использовать формулу Ньютона— Лейбница здесь в традиционном смысле нельзя. Поступим иначе. Исследуя в дифференциальном исчислении формулу Тей- лора, мы в качестве примера (см. гл. V, § 3, пример 11) нашли, что на отрезке [—1,1] с точностью до 10-3 имеет место равенство sin® « х - ^j®3 4- Аж5 =: Р(х). Но если |sin® - Р(®)| < 10 3 на отрезке [-1,1], то верно также, что [sin®2 — Р(®2)| < 10 3 при 0 х 1.
364 ГЛ. VI. ИНТЕГРАЛ Следовательно, 1 J sin х2 dx о 1 1 J |sinх2 — P(a;2)|dx < J 10“3 dx < 10-3. о о 1 Таким образом, для вычисления интеграла J sin a;2 da; с нужной точностью 1 0 достаточно вычислить интеграл JР(а;2) dx. Но о УР(х2) dx — j(а;2 - ^а;6 + ^^10) dx = о о 1жз - -1-х7 4- -J—*11 3 3’7 +5!11 о 3 3!7 + 5! 11 °’310 ± 10 3’ поэтому 1 J sin a;2 da; = 0,310 ± 2 10-3 = 0,31 ± 10“2. о Пример 6. Величина д = & д / /(ж) называется интегральным сред- а ним значений функции на отрезке [а, 6]. Пусть f — определенная на R и интегрируемая на любом отрезке функция. Построим по f новую функцию = [ /<№ 2d J х — 6 значение которой в точке х есть интегральное среднее значений f в 6-окрест- ности точки х. Покажем, что функция Fg(x) (называемая усреднением f) более регулярна по сравнению с /. Точнее, если f интегрируема на любом отрезке [а, Ь], то Fg(x) непрерывна на R, а если f G C(R), то Fg(x) G (R). Проверим сначала непрерывность функции Fg(x): |fi(* + Л) - F4(X)| = 4 <4(С|л| + с|л|) = £|л|, 2d о
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 365 если |/(t)| С, например, в 2<5-окрестности точки х и |/i| < 6. Из этой оценки, очевидно, следует непрерывность функции Fg(x). Если же /€<7(И), то по правилу дифференцирования сложной функции <р(ж) <р = -£ / % = dx J dtp J dx a a поэтому из записи x+6 x—6 ZO J Zo J a a получаем, что _ftx + S)-f(x -S) F‘(X} =--------26--------• Функцию Fg(x) после замены t = x 4-u переменной интегрирования можно записать в виде б Fs(x) = Z7 [ f(x+u)du. ZO J -<5 Если f 6 C(R), то, применяя первую теорему о среднем, находим, что Fs(x) = ±f(x + r)-26 = f(x + т), zo где |т| 6. Отсюда следует, что lim Л(ж) =/(ж), 5-Ц-О что вполне естественно. Задачи и упражнения 1. Используя интеграл, найдите а) [(п + 1)2 + ‘ ' + (2п)2]’ b) lim 1 2 ” , если а 0. п—>оо П°'+1 2. а) Покажите, что любая непрерывная на интервале функция имеет на нем первообразную. Ь) Покажите, что если f € [о, Ь], то f может быть представлена как разность двух неубывающих на отрезке [а, Ь] функций (см. задачу 4 из § 1). 3. Покажите, что в предположении гладкости функции д вторая теорема о сред- нем (теорема 6 из § 2) интегрированием по частям непосредственно сводится к пер- вой теореме о среднем.
366 ГЛ. VI. ИНТЕГРАЛ 4. Покажите, что если f € C(R), то для любого фиксированного отрезка [а, 6] по заданному £ > 0 можно так подобрать 6 > 0, что на [а, д] будет выполнено неравен- ство |F<5(z) — /(а;)| < £, где F$ — осреднение функции, рассмотренное в примере 6. 5. Покажите, что /ее 1 2 — dt ~ —^ех при х —> +оо. t х2 1 х+1 6. а) Проверьте, что функция f(x) — J sin t2 dt при x —> оо имеет следующее X представление: ,, ч cosa;2 cos(a; + l)2 , 1 \ -----2(ГмГ+ОЬ/ b) Найдите lim xf(x) и lim xf(x). X-4OO *->00 7. Покажите, что если f: R —> R — периодическая, интегрируемая на каждом отрезке [а, 6] С R функция, то функция X F(x) — J f(t) dt а может быть представлена в виде суммы линейной и периодической функций. 8. а) Проверьте, что при х > 1 и п € N функция % Рп(х) — — J (х + у/х2 — 1 cos <р)п d<p о есть полином степени, п (п-й полином Лежандра). Ь) Покажите, что Р (я) = — [_______ ___________ тг J (а; — \Лг2 — 1 cos^)n 9. Пусть f — вещественнозначная функция, определенная на отрезке [а, Ь] С R, £1 > • • • > различные точки этого отрезка. Значения интерполяционного поли- нома Лагранжа степени т — 1 т :=£/(&) J=1 ijtj w ** совпадают в точках ,..., £т (узлах интерполяции) со значениями функции /, при- чем если / 6 С^[а, 6], то Л») - Lm-i(x) = ±?т\<(х))Шт(х), mi где шт(х) — П (х ~ С*)» а С(®) € ]о, (см. задачу 11 в § 3 гл. V). i=i
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 367 Пусть & = - Oil тогда Oi € [-1,1], t = 1, ..., m. А л» а) Покажите, что f л — J Lm-i(x)dx - где В частности, ь он) Lo{x)dx = (b — a) f^a если т = 1, ffi = 0; а Ь аг) fIn (х) dx — [/(а) + /(b)], если т — 2, 0i = -1, 02 = 1; «/ а ь аз) fЬ2(ж) dx = - - ° [/(а) + 4/(° y-J + /(6)j , если т = 3, 0i = —1, 02 = 0, а 03 = 1. Ь) Считая, что / G С^т)[а,Ь] и полагая Мт = max |/^т)(х)|, оцените величину х€[а,Ь] Rm абсолютной погрешности в формуле 6 ь j f{x)dx- jLm-l(x)dx + Rm (♦) a a м b и. покажите, что |7lm| / |wm(a;)| dx. mi J a с) В случаях ai), a2), аз) формула (*) называется соответственно формулой пря- моугольников, трапеций и парабол. В последнем случае ее называют также фор- мулой Симпсона1^. Покажите, что в случаях ai), a2), аз) имеют место следующие формулы: Ri = (6 - а)2, Я2 = -^1^(1>-а)3, Яз = -^^(Ь-а)6, где fi, &, Сз € [а,Ь], а функция / принадлежит соответствующему классу C^fc)[a,Ь]. d) Пусть / есть полином Р. Какова наивысшая степень полиномов Р, для кото- рых точны формулы прямоугольников, трапеций и парабол соответственно? ^Т. Симпсон (1710 — 1761) — английский математик.
368 ГЛ. VI. ИНТЕГРАЛ Пусть h = -—Xk=a + hk, к = 0,1, ..., n; уь = п е) Покажите, что в следующей формуле прямоугольников ь f(x) dx — h(yo + yi+ + 1/n-i) + Ri f'fg) остаток имеет вид Ri — ' (b — a)h, где £ € [a, 6]. A f) Покажите, что в следующей формуле трапеций ь f(x) dx = ~ [(2/о + Уп) + 2(j/i + 1/2 + .. • + уп-1)] + Яг * остаток имеет вид Яг = — (6 — а) Л2, где £ 6 [а, Ь]. Л X g) Покажите, что в следующей формуле Симпсона (формуле парабол) ь f(x) dx = ~ [(уо + Уп) + 4(i/i + уз + ... + уп-1) + + 2(i/2 + 1/4 + • • + 1/п-г)] + Яз, которая пишется при четных значениях п, остаток Яз имеет вид Яз = -^^(6-«)Л4, где £ € [а, 6]. h) Исходя из соотношения о вычислите тг с точностью до 10-3, пользуясь формулами прямоугольников, трапеций и парабол. Обратите внимание на эффективность формулы Симпсона, которая по этой причине является наиболее распространенной квадратурной формулой (так называют формулы численного интегрирования в одномерном случае, отождествляя интеграл с площадью соответствующей криволинейной трапеции). 10. Преобразуя формулу (7), получите следующие виды записи остаточного члена формулы Тейлора, где положено h — х — а: 1 а) + “ r)n’1 dT> О 1
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 369 § 4. Некоторые приложения интеграла Использование интеграла в приложениях часто происходит по одной и той же схеме, которую по этой причине полезно изложить один раз в чистом виде. Этому посвящен первый пункт настоящего параграфа. 1. Аддитивная функция ориентированного промежутка и инте- грал. Обсуждая в § 2 свойство аддитивности интеграла, мы ввели поня- тие аддитивной функции ориентированного промежутка. Напомним, что это функция (а,/3) которая каждой упорядоченной паре (ct,/?) точек а, /3 6 [а, 6] фиксированного отрезка [а, 6] ставит в соответствие число 1(а, /3), причем так, что для любой тройки точек а, /3, у Е [а, 6] выполнено равенство Z(a,7) = Z(a^) +1(^,7). (1) Из (1) при а = (3 = 7 следует, что 1(а, а) = 0, а при а = 7 получаем, что 1(а,/3) + 1(/3,а) — 0, т. е. 1(а,/3) = —/(/?,а). В этом сказывается влияние порядка точек а, /3. Полагая Т’(х) = 1(а,х), в силу аддитивности функции I имеем 1(а, т = 1(а, 0) - 1(а, а) = - Я«)- Таким образом, каждая аддитивная функция ориентированного проме- жутка имеет вид Ца,0) = Я/?) - Я<*). (2) где х !F(x) — функция точки отрезка [а, 6]. Легко проверить, что верно и обратное, т. е. что любая функция х ^(т), определенная на отрезке [а, 6], порождает по формуле (2) аддитивную функ- цию ориентированного промежутка. Приведем два типичных примера. X Пример 1. Если / € 7£[а,6], то функция F(x) = Jf(t)dt порождает, в а • силу формулы (2), аддитивную функцию 0 а Заметим, что в данном случае функция непрерывна на отрезке [а, 6]. « Пример 2. Пусть отрезок [0,1] есть невесомая струна с бусинкой еди- ничной массы, прикрепленной к струне в точке х = 1/2.
370 ГЛ. VI. ИНТЕГРАЛ Пусть Р{х) есть масса, находящаяся на отрезке [0, ж] струны. Тогда по условию ' 0 . 1 при х < 1/2, при 1/2 х 1. Физический смысл аддитивной функции /(а,Д)=Р(Д)-Р(а) при /3 > а — масса, попавшая в полуинтервал ]а, /3]. Поскольку функция Р разрывна, аддитивная функция /(а, (3) в рассматри- ваемом случае не может быть представлена как интеграл Римана от некоторой функции — плотности массы. (Эта плотность, т. е. предел отношения массы промежутка к его длине, должна была бы равняться нулю в любой точке от- резка [а, 6], кроме точки х = 1/2, где она должна была бы быть бесконечной.) Теперь докажем полезное для дальнейшего достаточное условие того, что аддитивная функция порождается интегралом. Утверждение 1. Пусть аддитивная функция 1(а,(3), определенная для точек а, /3 отрезка [а, 6], такова, что существует функция f 6 7£[а, 6], связанная с I следующим образом: для любого отрезка [а, {3} такого, что а а < (3 Ь, выполняется соотношение inf /(я) (J3 - а) 1(а, 0) sup f(x) (/3 - а). a:G[a,0] z€[a,0] Тогда ь I(a,b) = J f(x)dx. а ◄ Пусть Р — произвольное разбиение а = хо < ... < хп = b отрезка [а, &]; mi = inf f(x), Mi = sup f(x). z€[zi-i,Zil Для каждого отрезка разбиения Р имеем по условию miAxi I(xi-i, Xi) Mi&Xi. Суммируя эти неравенства и пользуясь аддитивностью функции 1(а,(3), получаем п п mi &Xi I (а, Ь) ^^Mi^Xi. t=l i=l Крайние члены в последнем соотношении суть знакомые нам нижняя и верхняя суммы Дарбу функции /, соответствующие разбиению Р отрезка а, 6]. При А(Р) —> 0 обе они имеют своим пределом интеграл от f по отрезку а, Ь]. Таким образом, переходя к пределу при А(Р) -» 0, получаем, что ъ 1(а,Ь) = У*f(x)dx. ►
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 371 Продемонстрируем теперь утверждение 1 в работе. 2. Длина пути. Пусть частица движется в пространстве R3, и пусть известен закон ее движения r(t) = (x(t),y(t),z(t)), где x(t), y(t), z(t) — пря- моугольные декартовы координаты точки в момент времени t. Мы хотим определить длину I [а, Ь] пути, пройденного точкой за промежу- ток времени а t Ь. Уточним некоторые понятия. Определение 1. Путем в пространстве R3 называется отображение t (x(t),y(t), z(t)) числового промежутка в пространство R3, задаваемое не- прерывными на этом промежутке функциями x(t), y(t), z(t). Определение 2. Если t •-> (x(t),y(t),z(t)) есть путь, для которого об- ластью изменения параметра t является отрезок [а, Ь], то точки А = (аг(а),з/(а),г(а)), В = (x(b),y(b),z(b)) пространства R3 называются соответственно началом и концом пути. Определение 3. Путь называется замкнутым, если он имеет и начало, и конец и эти точки совпадают. Определение 4. Если Г: I -> R3 — путь, то образ Г(/) промежутка I в пространстве R3 называется носителем пути. Носитель абстрактного пути может оказаться вовсе не тем, что мы хоте- ли бы назвать линией. Существуют примеры путей, носители которых, на- пример, содержат целый трехмерный куб (так называемые «кривые» Пеано). Однако если функции x(t), y(t), z(t) достаточно регулярны (как, например, в случае механического движения, когда они дифференцируемы), то ничего противоречащего нашей интуиции, как можно строго проверить, заведомо не произойдет. Определение 5. Путь Г: I -> R3, для которого отображение I —> Г(7) взаимно однозначно, называется простым путем или параметризованной кривой, а его носитель — кривой в R3. Определение 6. Замкнутый путь Г: [a,b] -> R3 называется простым замкнутым путем или простой замкнутой кривой, если путь Г : [a, b] —> R3 является простым. Значит, простой путь отличается от произвольного пути тем, что при движении по его носителю мы не возвращаемся в прежние точки, т. е. не пе- ресекаем свою траекторию нигде, кроме, быть может, ее конца, если простой путь замкнут. Определение 7. Путь Г: I —> R3 называется путем данного класса гладкости, если задающие его функции x(t), y(t), z(t) принадлежат указан- ному классу. (Например, классу С[а,b], C^fa,Ь]. или Ь].) 13 Зорич В. А.
372 ГЛ. VI. ИНТЕГРАЛ Определение 8. Путь Г: [а,6] —> R3 называется кусочно гладким, если отрезок [а, 6] можно разбить на конечное число отрезков, на каждом из кото- рых соответствующее ограничение отображения Г задается непрерывно диф- ференцируемыми функциями. Именно гладкие пути, т. е. пути класса , и кусочно гладкие пути мы и будем сейчас рассматривать. Вернемся к исходной задаче, которую теперь можно сформулировать как задачу определения длины гладкого пути Г: [а, b] -> R3. Наши исходные представления о длине I [а, (3\ пути, пройденного в проме- жуток времени а t (3, таковы: во-первых, если а < /? < 7, то /[а, 7] = /[а,/?] + ЧД7], и? во-вторых, если v(t) = (x(t),y(t),z(t)) есть скорость точки в момент t, то inf |v(t)|(0-a) sup |v(f)| (/3 - а). Таким образом, если функции x(t), y(t), z(t) непрерывно дифференцируе- мы на [а, 6], то в силу утверждения 1 мы однозначно приходим к формуле ь ь /[а,6] = f\v(t)\dt = Уy/x2(t) + y2(t) + z2(t) dt, (3) a a которую и принимаем теперь как определение длины гладкого пути Г: [а, 6] —> -> R3. Если z(t) = 0, то носитель пути лежит в плоскости и формула (3) приобре- тает вид ь I [а, b\= [y/i2(t) + y2(t) dt. (4) Пример 3. Опробуем формулу (4) на знакомом объекте. Пусть точка движется в плоскости по закону х = jRcos2tt£, у = jRsin2Trt. (5) За промежуток времени [0,1] точка один раз пробежит окружность ради- уса R, т. е. пройдет путь длины 2тгЯ, если длина окружности вычисляется по этой формуле. Проведем расчет по формуле (4): 1 «[0,1] = [/(—2KRsin2Kt)2 + (27rjRcos27rt)2 dt = 2kR.
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 373 Несмотря на ободряющее совпадение результатов, проведенное рассужде- ние содержит некоторые логические пробелы, на которые стоит обратить вни- мание. Функции cos а и sin а, если принять их школьное определение, суть декар- товы координаты образа р точки ро = (1,0) при повороте на угол а. Величина а с точностью до знака измеряется длиной дуги окружности х2 + у2 — 1, заключенной между ро и р. Таким образом, при этом подходе к тригонометрическим функциям их определение опирается на понятие длины дуги окружности и, значит, вычисляя выше длину окружности, мы совершили в известном смысле логический круг, задав параметризацию окружности в виде (5). 1 Однако эта трудность, как мы сейчас увидим, не принципиальная, ибо параметризацию окружности можно задать, вовсе не прибегая к тригономе- трическим функциям. Рассмотрим задачу о вычислении длины графика функции у = /(я), опре- деленной на некотором отрезке [а, 6] С К. Имеется в виду вычисление длины пути Г : [а, 6] -> R2, имеющего специальный вид параметризации х (ж,/(т)), из которого можно заключить, что отображение Г: [а, 6] —> R2 взаимно одно- значно. Значит, по определению 5 график функции есть кривая в R2. Формула (4) в данном случае упрощается, поскольку, полагая в ней х — t, У = /(*)> получаем = У У1 + [/'(я)]2 dt. В частности, если рассмотреть полуокружность у = \/1 — х2, -1 х 1, окружности х2 + у2 = 1, то для нее получим х/1 — я2 (6) (7) Но под знаком последнего интеграла стоит неограниченная функция и, значит, он не существует в традиционном, изученном нами смысле. Означает ли это, что полуокружность не имеет длины? Пока это только означает, что указанная параметризация полуокружности не удовлетворяет условиям непрерывности функций х, у, при которых была выписана формула (4), а значит, и формула (6). Поэтому нам следует либо подумать о расширении пщ^ятия интеграла, с тем чтобы интеграл в (7) получил определенный смысл, либо перейти к параметризации, удовлетворяющей условиям применимости формулы (6).
374 ГЛ. VI. ИНТЕГРАЛ Заметим, что если взятую параметризацию рассматривать на любом от- резке вида [—1 + <5,1 — J], где — 1 < — 14-<5 < 1 — < 1, то на нем формула (6) применима и по ней находим длину 1-5 -1+5 дуги окружности, лежащей над отрезком [—1 + d, 1 — <$]. Естественно поэтому считать, что длина I полуокружности есть предел lim Z[—1 + J, 1 —5]. В таком же смысле можно понимать и интеграл в соотно- шении (7). Этим естественно возникающим расширением понятия интеграла Римана мы подробнее займемся в следующем параграфе. Что же касается рассматриваемого конкретного вопроса, то, даже не ме- няя параметризацию, можно найти, например, длину I — ДУ™ единич- Г_1 11 L 2’2-Г ной окружности, опирающейся на хорду, конгруэнтную радиусу окружности. Тогда (уже из геометрических соображений) должно быть I = 3 • I Заметим также, что х/П^2 J = 2 X поэтому 1-5 1-5 —1+5 -1+5 Таким образом, — я;2 dx. полуокружности единичного радиуса обозначается символом л, и мы приходим к следующей формуле: Последний интеграл есть обычный (а не обобщенный) интеграл Римана, и его можно вычислить с любой точностью.
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 375 Если для х е [-1,1] величину I [я, 1] назвать arccos я, то в силу проведенных выше выкладок 1 f dt arccosя = / "-у..г, x ИЛИ 1 arccos x = x \/1 — x2 + 2 j \/1 — dt. x Если считать длину дуги первичным понятием, то первичными надо счи- тать функцию х »-> arccos х, введенную только что, и функцию х arcsinz, которую можно ввести аналогично, а функции х •-> cos а: и х t-> sin ж тогда можно получить как им обратные на соответствующих отрезках. В. сущно- сти, именно это и делается в элементарной геометрии. Пример с длиной полуокружности поучителен не только тем, что, разби- рая его, мы сделали, быть может, небесполезное для кого-то замечание об определении тригонометрических функций, но еще и тем, что он естественно порождает вопрос о том, не зависит ли вообще определенное формулой (3) число от выбора системы координат ж, у, z и параметризации кривой, когда речь идет о длине кривой. Оставляя читателю анализ роли пространственных декартовых коорди- нат, рассмотрим здесь роль параметризации. Уточним, что под параметризацией некоторой кривой в R3 мы подразуме- ваем задание простого пути Г: I —> R3, носителем которого является данная кривая. Точку или число t G I называют параметром, а промежуток I — областью изменения параметра. Если Г: I -> £ и Г: I -> £ — два взаимно однозначных отображения с одним и тем же множеством значений £, то естественно возникают взаимно однозначные отображения Г-1 о Г : I -> I, Г-1 о Г : 7 -> Z между областями определения I и I этих отображений. В частности, если имеются две параметризации одной кривой, то между самими параметрами t G Z, г G I устанавливается естественное соответствие t = t(r) или т = r(t), позволяющее по параметру точки в одной параметриза- ции определять ее же параметр в другой параметризации. Пусть Г: [а, 6] -> £ и Г: [а, Д -> £ - две параметризации одной кривой с соответствием Г(а) = Г (а), Г(Ь) = Г (/3) начала и конца. Тогда функции t — t(r), т = r(t) перехода от одного параметра к другому будут непрерыв- ными, строго монотонными отображениями отрезков а t Ь, а т /3 друг на друга с соответствием начал a 4-4 а и концов Ъ 4-» Если кривые Г и Г при этом задавались такими тройками (x(t),y(t),z(t)), (x(t),y(t),z(t)) гладких функций, что |v(t)|2 = x2(t) 4- y2(t) 4- z2(t) 0 на [a,6] и |v(r)|2 = х2(т) 4- У2(т) 4- i2(r) 0 на [a,/?], то можно проверить, что в
376 ГЛ. VI. ИНТЕГРАЛ этом случае функции перехода t = t(r) ит = r(t) будут гладкими функциями, имеющими положительную производную на отрезке своего определения. Мы не станем сейчас заниматься проверкой этого утверждения, оно бу- дет в свое время получено как одно из следствий важной теоремы о неявной функции. В данный же момент высказанное утверждение служит скорее мо- тивировкой следующего определения. Определение 9. Говорят, что путь Г : [а,Д] —> R3 получен из пути Г: [а, 6] -> R3 допустимым изменением параметризации, если существует та- кое гладкое отображение Т: [а, Д] -» [а,6], что Т(а) = a, T(J3) = b, Т'(т) > О на [а, Д] и Г = Г о Т. Проверим теперь следующее общее Утверждение 2. Если гладкий путь Г: [а, Д] -> R3 получен из гладкого пути Г: [а, 6] —> R3 допустимым изменением параметризации, то длины этих путей совпадают. ◄ Пусть Г : [а, Д] —> R3 и Г : [а, 6] —> R3 задаются соответственно трой- ками г (ж(т), j/(t),z(t)) и Ы (x(t), y(t),z(t)) гладких функций, a t = t(r) — допустимое изменение параметризации, при котором ж(т) = «(t(r)), у(т) = y(t(r)), z(r) = z(t(r)). Используя определение (3) длины пути, правило дифференцирования ком- позиции функций и правило замены переменной в интеграле, имеем ь 0 У \/i2(t) + 2/2(t) + *2(*) dt = у* Уяг2(^(т)) + j/2(t(r)) + i2(t(r)) t'(f)dr = a a 0 = J у/[ж (t(-r)) t' (r)]2 + [y(t(r)) t1 (r)]2 4- [i(t(r)) t' (r)]2 dr = a 0 - У у/х2(т) + £2(т) + z2(t) dr. ► a Итак, в частности, показано, что длина кривой не зависит от ее гладкой параметризации. Длину кусочно гладкого пути определяют как сумму длин гладких путей, на которые он подразделяется; поэтому легко проверить, что и длина кусочно гладкого пути не меняется при допустимом изменении его параметризации. Заканчивая обсуждение понятия длины пути и длины кривой (о которой мы после утверждения 2 теперь вправе говорить), рассмотрим еще один Пример 4. Найдем длину эллипса, задаваемого каноническим уравне- нием х2 и2 > + > = 1 («>»><>). (8)
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 377 Взяв параметризацию х — asin^, у = b cosip, 0 ip 2л, получаем тг/2 ___________________ тг/2 = 4a J 1 — а sin2 ip dip = 4a J ~~ k2sin2ip dip, о о где к2 = 1---- — квадрат эксцентриситета эллипса. аг Интеграл Е(к,<р) = у/1 — к2 sm2ip dip о не выражается в элементарных функциях и ввиду указанной связи с эллипсом называется эллиптическим. Точнее, Е(к, </>) — эллиптический интеграл вто- рого рода в форме Лежандра. Значение, которое он принимает при = тг/2, зависит только от к, обозначается через Е(к) и называется полным эллипти- ческим интегралом второго рода. Итак, Е(к) = E(k,ir/2), поэтому длина эллипса в этих обозначениях имеет вид I = 4аЕ(к). 3. Площадь криволинейной трапеции. Рассмотрим фигуру аАВЬ (рис. 48), называемую криволинейной трапецией. Фигура ограничена верти- кальными отрезками аА, ЬВ, отрезком [а, 6] оси абсцисс и кривой АВ, являю- щейся графиком некоторой интегрируемой на [а, 6] функции у = f(x). Пусть [а, (3] — отрезок, содержащийся в [а, 6]. Обозначим через S(a,(3) площадь соответствую- щей ему криволинейной трапеции a/(a)/(/?)/?. Наши представления о площади таковы: если a^a<^<7^6, то S(a,7) = £(«,/?) +Ж 7) (аддитивность площади) и inf f(x) (0 - a) 5(a, (3) sup f(x) - a) xe[a,/?] xe[a,0] (площадь объемлющей фигуры не меньше площади объемлемой). Значит, в силу утверждения 1, площадь указанной фигуры надо вычислять по формуле ь S(a,b) = J f(x)dx. a (9)
378 ГЛ. VI. ИНТЕГРАЛ Пр имер 5. Используем формулу (9) для подсчета площади эллипса, за- данного каноническим уравнением (8). В силу симметрии фигуры и предполагаемой аддитивности площади, до- статочно найти площадь только той части эллипса, которая расположена в первом квадранте, и затем учетверить полученный результат. Проведем вы- числения: а ----------— и/2 S = 4 f у Ь2 ^1 — dx = 46 j \/1 — sin2t a cost dt = о о тг/2 тг/2 = 4аЪ cos2 tdt = 2ab f (1 — cos 2t) dt = тгаЬ. о о По дороге мы сделали замену х = a sin/, 0 t тг/2. Итак, S — тгаЬ. В частности, при а = b = R получаем формулу irR2 площади круга радиуса R. Замечание. Необходимо отметить, что формула (9) дает площадь кри- волинейной трапеции при условии, что /(ж) 0 на [а, Ь]. Если же f — про- извольная интегрируемая функция, то интеграл (9), очевидно, даст алгебра- ическую сумму площадей соответствующих криволинейных трапеций, лежа- щих над и под осью абсцисс. Причем площади трапеций, лежащих над осью абсцисс, будут суммироваться со знаком плюс, а площади трапеций, лежащих под осью, — со знаком минус. 4. Объем тела вращения. Пусть теперь изображенная на рис. 48 кри- волинейная трапеция вращается вокруг отрезка [а, 6]. Определим объем полу- чающегося при этом тела. Обозначим через V(a, /3) объем тела, полученного вращением криволиней- ной трапеции af(a)f(J3)/3 (см. рис. 48), отвечающей отрезку [а,/3] С [а, Ь]. По нашим представлениям об объеме, должны быть справедливы следую- щие соотношения: если а^а</3<7^6, то v(o,7) = / \2 / \2 7г ( inf /(я)) (^ - а) У(а,^) 7г ( sup /(я)) (J3 - а). \а:€[а,0] / \a:G[a,/3] / В последнем соотношении мы оценили объем V(а,/3) через объемы вписан- ного и описанного цилиндров и воспользовались формулой объема цилиндра (которую нетрудно получить, если уже найдена площадь круга). Тогда в силу утверждения 1 V(a,b) = 7Г / f2(x)dx. (10)
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 379 Пример 6. Вращением вокруг оси абсцисс полукруга, ограниченного отрезком [—R, Л] этой оси и дугой окружности у — \/R2 — я2, —R ^x^R, можно получить трехмерный шар радиуса R, объем которого легко вычислить по формуле (10): R V = тг J {R2 — х2) dx = -я Подробнее об измерении длин, площадей и объемов будет сказано во II части курса. Тогда же мы решим и вопрос об инвариантности данных опре- делений. 5. Работа и энергия. Энергетические затраты, связанные с переме- щением тела под действием постоянной силы в направлении действия силы, измеряют произведением F S величины силы на величину перемещения. Эта величина называется работой силы на данном перемещении. В общем случае направление данной силы и перемещение могут быть неколлинеарны (напри- мер, везем за веревочку санки), и тогда работа определяется как скалярное произведение (F, S) вектора силы и вектора перемещения. Рассмотрим некоторые примеры вычисления работы и использования свя- занного с ней понятия энергии. Пример 7. Работа, которую нужно совершить против силы тяжести, чтобы поднять вертикально вверх тело массы тп с уровня hi над поверхно- стью Земли на уровень Лг, в силу данного определения равна mg{h,2 — hi). Предполагается, что вся операция происходит у поверхности Земли, когда изменением силы тяжести mg можно пренебречь. Общий случай разобран в примере 10. Пример 8. Пусть имеется идеально упругая пружина, один конец кото- рой закреплен в точке 0 числовой оси, а другой находится в точке х. Известно, что сила, с которой при этом приходится удерживать этот конец пружины, равна кх, где к — коэффициент жесткости пружины. Вычислим работу, которую надо совершить, чтобы переместить подвиж- ный конец пружины из положения х = а в положение х = Ь. Считая работу А(а,/3) аддитивной функцией промежутка [с*, /3] и прини- мая, что верны оценки inf {кх) {/3 — а) А{а, /3) sup {кх) {(3 — а), хЕ[а,0} получаем в силу утверждения 1, что г jfea:2 ь А{а, b) = I kxdx = —-— . •/ * а а Это работа против силы. Работа же самой силы пружины на том же пе- ремещении отличается только знаком.
380 ГЛ. VI. ИНТЕГРАЛ Функция U(x) = ~2~’ которую мы нашли, позволяет,вычислять работу, которую мы совершаем, меняя состояние пружины, а значит, и ту работу, которую пружина может совершить при возвращении в исходное состояние. Такая функция U(ж), зависящая только от конфигурации системы, называется потенциальной энергией системы. Из построения видно, что производная от нее дает силу пружины с обратным знаком. Если точка массы т движется вдоль оси под действием указанной упругой силы, то ее координата x(t) как функция времени удовлетворяет уравнению тх = —кх. (П) Мы уже однажды проверяли (см. гл. V, § 6, п. 6), что величина = K(t) + = Е, Л» и (12) представляющая из себя сумму кинетической и (как мы теперь понимаем) потенциальной энергий системы, остается во время движения постоянной. Пример 9. Теперь рассмотрим еще один пример. В нем встретится сразу целый ряд понятий, которые мы ввели и освоили в дифференциальном и интегральном исчислении. Заметим сначала, что по аналогии с функцией (12), записанной для кон- кретной механической системы, удовлетворяющей уравнению (11), для произ- вольного уравнения вида ад = (13) где /(з) — заданная функция, можно проверить, что сумма 2 не меняется со временем, если U' Действительно, dE Ids2. dU(s) ... . dU ds .... u n dT = 2 -dt+ л =ss+d7dt=s(s-/(s)) = 0- Таким образом, из (14), считая Е постоянной величиной, последовательно находим S = ±^/2(В - 17(e)) / v ds \ (где знак корня должен соответствовать знаку производной —), затем dt _ ±____1_____ ds ~ y/2(E-U(s^
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 381 и, наконец, t = ci ± [ = . -я—. J y/2(E-U(s)) Следовательно, используя закон сохранения «энергии» (14) уравнения (13), нам удалось в принципе решить это уравнение, но найдя не функцию s(t), а обратную к ней функцию t(s). Уравнение (13) возникает, например, при описании движения точки вдоль заданной кривой. Пусть частица перемещается под действием силы тяжести по узкому идеально гладкому желобу (рис. 49). Пусть s(t) — расстояние вдоль желоба (т. е. длина пути) от некоторой фиксированной точки О — начала отсчета — до точки, в которой находится частица в момент t. Ясно, что тогда s(t) есть величина скорости частицы, a s(t) — величина \Х тангенциальной составляющей ее ускорения, ''Х которая должна равняться величине тангенци- \\ альной составляющей силы тяжести в данной ' точке желоба. Ясно также, что тангенциаль- ная составляющая силы тяжести зависит толь- О ко от точки желоба, т. е. зависит только от з, Рис. 49 ибо з можно считать параметром, параметри- зующим кривую1), с которой мы отождествляем желоб. Если эту составляю- щую силы тяжести обозначить через f(s), то мы получим, что ms — f(s). Для данного уравнения сохраняться будет величина |ms2 + U(s) = Е, где СЛ(з) = -/(з). Поскольку слагаемое есть кинетическая энергия точки, а движение вдоль желоба происходит без трения, то можно, минуя вычисления, догадать- ся, что функция U(з) с точностью до постоянного слагаемого должна иметь вид трЛ(з), где mgh(s') — потенциальная энергия точки, находящейся на вы- соте Л(з) в паче тяжести. Если в начальный момент t = 0 было з(0) = 0, з(0) — зо и Л(зо) = /io, то из соотношения — = s2 + 2jft(s) = С т 1) Параметризация кривой посредством ее же длины называется натуральной, a s в этом случае называют натуральным параметром.
382 ГЛ. VI. ИНТЕГРАЛ находим, что С = 2рЛ(зо), поэтому s2 = 2p(/io — Л-(з)), ______ds_______ y/2g(ho - h(s)) (15) В частности, если, как в случае маятника, точка движется вдоль окруж- ности радиуса R, отсчет длины s ведется от нижней точки О окружности, 1ЛЛИ а начальные условия состоят в том, что при t = О з(0) — 0 и дан начальный угол — <ро отклонения (рис. 50), то, как легко проверить, выражая s и h(s) через угол отклонения у?, получим « <р ______d s________ t ___________Rdip_________ y/2g(ho - h(s)) J у/2g R (cos - cos у?0) ’ во — <Po —<Po 2V’ 2 (16) Таким образом, для полупериода - Т качания маятника получаем А sin (^/2) sin(y>o/2) = sin 0 находим (17) откуда после подстановки тг/2 Т = 4 V 9 J Vl — fc2sin20 о (18) где к2 = sin2 л Напомним, что функция F(k, <р)= f . de. . J л/1 — A;2sin20 о называется эллиптическим интегралом первого рода в форме Лежандра. При = тг/2 она зависит только от А:2, обозначается К (к) и называется полным
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 383 эллиптическим интегралом первого рода. Таким образом, период колебаний маятника равен Т = 4^К(к). (19) Если угол 9?о начального отклонения мал, то можно положить к = 0 и тогда получим приближенную формулу (20) Теперь, когда формула (18) получена, все же следует проанализировать весь ход рассуждений, и тогда мы заметим, что под знаками интегралов (15) —(17) стоят неограниченные на отрезке интегрирования функции. По- добная трудность нам уже встречалась при рассмотрении длины кривой, и мы примерно представляем себе, как и какой смысл можно придать интегра- лам (15)—(17). Но раз этот вопрос возник вторично, то его следует разобрать в точной математической постановке, что и будет сделано в следующем параграфе. Пример 10. Тело массы т совершает подъем над поверхностью Земли по траектории t (rc(t), j/(i),гг(<)), где t — время, а t Ь, а х, у, z — де- картовы координаты точки в пространстве. Необходимо вычислить работу тела против силы тяжести на промежутке времени [а, 6]. Работа А(а, /3) есть аддитивная функция промежутка [а,/3] С [а, Ь]. Постоянная сила F при действии на тело, движущееся с постоянной скоро- стью V, за время h совершает работу (F,v/i) = (F,v)7i, поэтому представля- ется естественной оценка inf (F(p(i)),v(i)) (J3 - а) A(at0) sup (F(p(i)), v(i)) (£-«), где v(t) — скорость тела в момент i, p(t) — точка пространства, в которой находится тело в момент t, a F(p(t)) — сила, которая в точке р = p(t) дейст- вует на тело. Если функция (F(p(t)), v(i)) окажется интегрируемой, то в силу утвержде- ния 1 мы должны считать, что ь А(а,Ь) = J (F(p(t)),v(t)) dt. а В нашем случае v(i) = (i(£),y(£), £(£)), и если r(t) = (aT(t),y(£),z(f)), то по закону всемирного тяготения находим F(p) = F(x,2/,z) = G тМ —г GmM . ч ;---т^/2 (ж> S6 *)> (т2 + у2 + z2y/2
384 ГЛ. VI. ИНТЕГРАЛ где М — масса Земли, а ее центр предполагается совпадающим с началом системы координат. iv -Гтм + + «(«)«(*) <F’V) W - GmM (x^+y^z2^ ’ поэтому 6 b f (F, v)(i)dt = | GmM [ J J a a (x2(t) + y2(t) + Z*(t))' (^W + srW + zW372 dt = _________GmM____________ (x^ + y^ + z^t))1!2 GmM HOI Итак, _ GmM _ GmM |r(6)| |r(a)| ' Мы обнаружили, что искомая работа зависит только от величин |г(а)|, |г(Ь)| удаления тела т от центра Земли в начальный и конечный моменты времени рассматриваемого промежутка [а,Ь]. Полагая GM г ’ получаем, что работа против силы тяжести по перемещению тела массы т из любой точки сферы радиуса го в любую точку сферы радиуса г\ вычисляется по формуле Aron = пъ(С7(г0) - Щи)). Функция 1/(г) называется потенциалом Ньютона. Если через R обозна- чить радиус Земли, то, поскольку = д, функцию U(г) можно переписать а* в виде С7(г) = S^-. г Учитывая это, можно получить следующее выражение для работы, необ- ходимой для выхода из поля тяготения Земли, точнее, для увода массы т с поверхности Земли на бесконечное расстояние от центра Земли. Под этой величиной естественно понимать предел lim ARr. г—>+оо Итак, работа выхода: . . 1-4 / аЯ2 т-. А = АДоо = lim ARr — hm т I —-----------= mgR. Г-44-ОО r-++oo \ л Г /
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 385 Задачи и упражнения 1. На рисунке 51 изображен график зависимости F = F(x) силы, действующей вдоль оси абсцисс на пробную частицу1, находящуюся в точке х этой оси. а) Нарисуйте в той же системе координат эскиз потенциала этой силы. Ь) Изобразите потенциал силы — F(x). с) Исследуйте, в каком из разобранных случа- ев положение xq является устойчивым положени- ем равновесия и с каким свойством потенциала это связано. 2. На основе результата примера 10 вычисли- те скорость, которую должно иметь тело, чтобы оно вышло из поля тяготения Земли (вторая кос- мическая скорость для Земли). 3. На основе примера 9 а) выведите уравнение R ip = д sin <р колеба- ний математического маятника; Ъ) считая колебания малыми, получите его приближенное решение; с) определите по приближенному решению период колебаний маятника и сравни- те результат с формулой (20). 4. По горизонтальной плоскости равномерно со скоростью и катится без про- скальзывания колесо радиуса г. Пусть в момент t = 0 верхняя точка А колеса имеет координаты (0,2г) в системе декартовых координат, ось абсцисс которой лежит в указанной плоскости и направле- на по вектору скорости. а) Запишите згцкон движения t »-> (x(t), y(t)) точки А. b) Найдите скорость точки А как функцию времени. с) Изобразите графически траекторию точки А (эта кривая называется циклоидой). d) Найдите длину одной арки циклоиды (длину одного периода этой периодической кривой). е) Циклоида обладает рядом интересных свойств, одно из которых, открытое Гюйгенсомсостоит в том, что период колебаний циклоидального маятника (шарика, ка- тающегося в циклоидальной ямке) не зависит от высоты его подъема над нижней точкой ямки. Попробуйте доказать это, опираясь на при- мер 9. (См. также задачу 6 следующего параграфа, посвященного несобственным интегралам.) 5. а) Исходя из рис. 52, объясните, почему если у = f(x) и х = д(у) — взаимно обратные непрерывные неотрицательные функции, равные нулю при х — 0 и у = 0 соответственно, то должно быть выполнено неравенство ту 1)Х. Гюйгенс (1629 — 1695) — нидерландский механик, физик, математик и астроном.
386 ГЛ. VI. ИНТЕГРАЛ Ь) Получите из а) неравенства Юнга ' 1 р . 1 п ху -Xй + - у при х, у 0, р, q > 0, i 4- i = 1. с) Какой геометрический смысл имеет знак равенства в неравенствах задач а) и Ь)? 6. Задача Бюффона^. Число л можно вычислять следующим весьма неожидан- ным способом. Берем большой лист бумаги, разлинованный параллельными прямыми с шагом h, и бросаем на него, никак специально не целясь, иголку длины I < h. Пусть мы бросили иголку N раз и пусть п раз из них иголка после падения пересекала какую- 21 нибудь из прямых линий на листе. Если число N достаточно велико, то тгй —, где рп п - р = — можно трактовать как приближенное значение вероятности того, что при бросании иголка пересечет одну из линий. Исходя из геометрических соображений, связанных с вычислением площадей, попробуйте дать удовлетворительное объяснение этому методу вычисления тг. § 5. Несобственный интеграл В предыдущем параграфе мы уже столкнулись с необходимостью несколько расширить понятие интеграла Римана. Там же на разборе конкретной задачи мы составили себе представление о том, в каком направлении и как это следует сделать. Настоящий параграф посвящен реализации этих представлений. 1. Определения, примеры и основные свойства несобственных интегралов Определение 1. Пусть функция х f(x) определена на промежутке [а, -Ьоо[ и интегрируема на любом отрезке [а, 6], содержащемся в этом проме- жутке. Величина +оо Ъ /f(x) dx := lim / f(x) dx, b—>+oo J a a если указанный предел существует, называется несобственным интегралом Римана или просто несобственным интегралом от функции f по промежут- ку [а, +оо[. +оо Сам символ J f(x)dx также называют несобственным интегралом и то- а гда говорят, что несобственный интеграл сходится, если указанный предел Ж. Л. Л. Бюффон (1707—1788) — французский естествоиспытатель.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 387 существует, и расходится в противном случае. Таким образом, вопрос о схо- димости несобственного интеграла равносилен вопросу о том, определен ли вообще этот несобственный интеграл или нет. Пример 1. Исследуем, при каких значениях параметра а сходится или, что то же самое, определен несобственный интеграл (1) Поскольку то предел lim Ь—>+оо при а / 1, при а = 1, существует только при а > 1. Итак, оо 1 если а > 1, а при других значениях параметра а интеграл (1) расходится, т. е. не опре- делен. Определение 2. Пусть функция х f(x) определена на промежутке [а,В[ и интегрируема на любом отрезке [а, 6] С [а,В[. Величина в а lim 6-+В-0 ь а если указанный предел существует, называется несобственным интегралом от функции f по промежутку [а, В[. Суть этого определения состоит в том, что в любой окрестности конечной точки В функция f может оказаться неограниченной. Аналогично, если функция х f(x) определена на промежутке ]А, 6] и интегрируема на любом отрезке [а, 6] С ]А, Ь], то по определению полагают ь А ь lim / f(x)dx а->А+О J ' ' а
388 ГЛ. VI. ИНТЕГРАЛ и также по определению полагают ъ —оо Ъ lim а Пример 2. Исследуем, при каких значениях параметра а сходится ин- теграл 1 /dx ха о (2) Поскольку при a G ]0,1] 1 /dx а 1— а если, а 1, если а = 1, то предел 1 ,. Z* dx hm I — а-++о J xa a существует только при a < 1. Итак, интеграл (2) определен только при а < 1. Пример 3. о о [ ех dx = lim f ех dx = lim fea:P') — lim (1 — ea) = 1. J a—>—oo J a—►—oo x a—>—oo —oo a Поскольку вопрос о сходимости несобственного интеграла решается оди- наково как для несобственного интеграла по неограниченному промежутку, так и для несобственного интеграла от функции, неограниченной около од- ного из концов промежутка интегрирования, то в дальнейшем мы будем рас- сматривать оба эти случая вместе, введя следующее основное Определение 3. Пусть [a,a>[ — конечный или бесконечный промежу- ток, а х f(x) — функция, определенная на нем и интегрируемая на каждом отрезке [a,b] С [a,a>[. Тогда по определению Ъ У/(z) dx := lim J f(x) dx, (3) a a если указанный предел при b -> а>, be [a, a>[, существует. В дальнейшем, если не оговорено противное, рассматривая несобственный интеграл (3), мы будем предполагать, что подынтегральная функция удовле- творяет условиям определения 3. х 1ПЖ1»> 1 а 1 — а
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 389 Кроме того, для определенности мы будем пока считать, что несобствен- ность интеграла связана только с верхним пределом интегрирования. Рас- смотрение случая, когда особенность интеграла связана с нижним пределом, проводится дословно так же. Из определения 3, свойств интеграла и свойств предела можно сделать следующее заключение о свойствах несобственного интеграла. Утверждение 1. Пусть х /(т) и х д(х) — функции, определен- ные на промежутке [а,си[ и интегрируемые на любом отрезке [а, Ь] С [а,и[. Пусть для них определены несобственные интегралы и) (4) а (5) а Тогда а) Если ш € R и f € 7£[a,cu], то значения интеграла (4), понимаемого как в несобственном, так и в собственном смысле, совпадают. Ь) При любых Ai, А2 € R функция (Ai/ + A2p)(x) интегрируема в несоб- ственном смысле на [а,а>[ и справедливо равенство а с) Если с € [а,си[, то а а с а а С d) Если <р : [а,7[ [а,си[ — гладкое, строго монотонное отображение, причем — а и <р(/3) -» ш при /3 -» у, 0 G [а,7[, то несобственный инте- грал от функции t (/ о на [а,7[ существует и справедливо ра- венство а а ◄ а) Следует из непрерывности функции ъ dx а на отрезке [а,си], на котором / € 7£[а,си].
390 ГЛ. VI. ИНТЕГРАЛ Ь) Следует из того, что при Ъ € [а,о>[ с) Следует из равенства ь У f(x)dx а с b справедливого при любых 6,с G [о,ш[. d) Следует из формулы ь = /з У /(ж) dx — у* (/ о (p)(t) v'tt) dt а = <p(ot) а замены переменной в определенном интеграле. ► Замечание 1. К свойствам несобственного интеграла, выраженным в утверждении 1, следует еще добавить весьма полезное правило интегрирова- ния по частям в несобственном интеграле, которое мы приведем в следующей формулировке: Если f,g& и существует предел lim то функции Х—¥ш f • д' и f • д одновременно интегрируемы или не й&п’е^рируемы в несобствен- ном смысле на [a,a>[ и в случае интегрируемости справедливо равенство IjJ ш J(/V)(z)<^ = (/-sO(*)|a (f'-9)(x)dx, а а где (f-ff)(x)la = lim (/”9)(^)-(/’9)(a). x—tu> xE[a,w[ ◄ Это следует из формулы ъ ь / (/ ’ ЮМ dx = (f • 0)(Х)|а ~ / (/' • s0(X) dx а а интегрирования по частям в собственном интеграле. ►
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 391 Замечание 2. Из пункта с) утверждения 1 видно, что несобственные интегралы У f(x) dx с сходятся или расходятся одновременно. Таким образом, в несобственных ин- тегралах, как и в рядах, сходимость не зависит от начального куска ряда или интеграла. По этой причине иногда, ставя вопрос о сходимости несобственного инте- грала, вообще опускают тот предел интегрирования, около которого интеграл не имеет особенности. При таком соглашении полученные в примерах 1, 2 результаты можно за- писать так: +оо /dx ч — сходится только при а > 1; ха /dx - — сходится только при а < 1. X 4-0 Знак 4-0 в последнем интеграле показывает, что рассматривается область х > 0. Заменой переменной из последнего интеграла сразу получаем, что интеграл / -—— сходится только при а < 1. J (х - То) хо4-О 2. Исследование сходимости несобственного интеграла а. Критерии Коши. В силу определения 3, сходимость несобственного интеграла (3) равносильна существованию предела функции ь Г(Ь) = а (6) при fe —> си, b € [a, w[. Поэтому справедливо следующее Утверждение 2 (критерий Коши сходимости несобственного инте- грала). Если функция х f(x) определена на промежутке [а,о>[ и инте- грируема на любом отрезке [а, 6] С [а, си[, то интеграл J f(x)dx сходится а тогда и только тогда, когда для любого е > 0 можно указать В G [а, си[
392 ГЛ. VI. ИНТЕГРАЛ так, что при любых &i, &2 € [а,о>[ таких, что В < bi, В < b?, имеет место соотношение ◄ Действительно, ведь У f(x) dx = J f(x) dx - J f(x) dx — — T(b^), bi a a поэтому выписанное условие есть просто критерий Коши существования пре- дела функции ?(Ь) при Ь —> cu, b € [а,си[. ► Ь. Абсолютная сходимость несобственного интеграла и> Определение 4. Про несобственный интеграл Jf(x)dx говорят, что а а/ он сходится абсолютно, если сходится интеграл J |y|(x)dx. а В силу неравенства f \f\(x)dx bl и утверждения 2 можем заключить, что если интеграл сходится абсолютно, то он сходится. Исследование абсолютной сходимости сводится к исследованию сходимо- сти интеграла от неотрицательной функции. Но в этом случае имеем Утверждение 3. Если функция f удовлетворяет условиям определе- ния 3 и f(x) 0 на [о, си[, то несобственный интеграл (3) существует в том и только в том случае, когда функция (6) ограничена на [а,си[. ◄ Действительно, если f(x) 0 на [а,си[, то функция (6) неубывающая на [о,си[ и потому она имеет предел при Ь —> cu, Ь € [а,си[, если и только если она ограничена. ► В качестве примера использования этого утверждения рассмотрим такое его Следствие (интегральный признак сходимости ряда). Если х /(z) — определенная на промежутке [1,+оо[ неотрицательная, невозрастающая, интегрируемая на каждом отрезке [1,Ь] С [1,+оо[ функция, то ряд оо Е /(n) = /(1) + /(2) + ... П=1
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 393 и интеграл +оо j f(x) dx 1 сходятся или расходятся одновременно. ◄ Из приведенных условий вытекает, что при любом п € N выполнены неравенства п+1 /(п 4-1) У f(x) dx /(п). п После суммирования этих неравенств получаем J f(x)dx. Поскольку Sk иГ(6)- неубывающие 1 к * + 1 к 52 /(п 4-1) I f(x) dx 52 f(n) П—1 1 n=l ИЛИ s*+l - /(1) $ Лк + 1) $ sk, к где Sk = £ /(n), a T’(d) = n=l функции своих аргументов, то полученные неравенства и доказывают выска- занное утверждение. ► В частности, теперь можно сказать, что результат примера 1 эквивалентен тому, что ряд п=1 сходится только при а > 1. Наиболее часто используемым следствием утверждения 3 является следую- щая Теорема (теорема сравнения). Пусть функции х f(x), 3 д(х) опре- делены на промежутке [а, а>[ и интегрируемы на любом отрезке\ [а, 6] С [а,и>[. Если на [а,со[ О /(») д(х), то из сходимости интеграла (5) следует сходимость интеграла (4) и спра- ведливо неравенство ш и> а а а из расходимости интеграла (4) следует расходимость интеграла (5).
394 ГЛ. VI. ИНТЕГРАЛ ◄ Из условий теоремы и неравенств для собственного интеграла Римана при любом Ь € [а, а>[ имеем ь ъ ?(Ь) = jf(x)dx^ j g(x)dx = G(b). a a Поскольку обе функции T7, Q неубывающие на [а, си[, то теорема следует из написанного неравенства и утверждения 3. ► Замечание 3. Если про функции f, д, участвующие в теореме, вместо неравенств 0 /(ж) д(х) известно, что они неотрицательны на [о, tu[ и одного порядка при х cu, х 6 [а,си[, т. е. что найдутся такие положительные константы С1, С2, что д(х) c2f(x), то с учетом линейности несобственного интеграла из доказанной теоремы в этом случае можно заключить, что интегралы (4), (5) сходятся или расходятся одновременно. Пример 4. Интеграл сходится, так как при х —> 4-оо. Пример 5. Интеграл сходится абсолютно, ибо при х 1. Следовательно, -|-оо /* COS X , 1 •> J X2 1 Пример 6. Интеграл +оо f у/х dx J у/1 4- х4 y/xdx 1 \/1 4- х4 х3/2 4-оо f COS х , / —х— dx J х2 i cosx 1 X2 X2 4-oo 4-oo . /* COS X J f 1 J - / —x- dx / — dx = 1. J x£ J x2 i i 4-oo J e~x2 dx 1
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 395 _ 2 _ сходится, так как е < е при х > 1 и +оо 4-оо е~х2 dx < J е~х dx = -. 1 1 Пример 7. Интеграл 4-оо dx In ж расходится, ибо 1 1 In X X при достаточно больших значениях х. Пример 8. Интеграл Эйлера к/2 In sin х dx о сходится, так как |lnsinx|~ |lna?J < -у= у/Х при х -> 4-0. Пример 9. Эллиптический интеграл 1 __________dx________ \/(1 — я2)(1 — к2х2) при 0 k2 < 1 сходится, поскольку /(1 — т2)(1 — к2х2) ~ 1/2(1 — к2) (1 — т)1/2 при х -4- 1 — 0. Пример 10. Интеграл ч> dtp х/ cos 0 — cos р о v сходится, так как у/ cos 0 — cos р = 2 sin Ч’ + О sin ~ i/smt/p (р - О')1/2 Л» л» при 0 -4 р — 0.
396 ГЛ. VI. ИНТЕГРАЛ Пример 11. Интеграл __ ¥>0 т=2./1 [ '... ....... V 9 J / • 2 9?0 • 2 V* о 4 / sin - sm % при 0 < (£о < ТГ сходится, поскольку при ф -> у?о ~ О J sin2 - sin2 ~ у/ sin <ро (<р0 -ф)1/2. у X л» (7) (8) Соотношение (7) выражает зависимость периода колебаний математиче- ского маятника от его длины L и начального угла его отклонения, отсчитывае- мого от радиуса, идущего в нижнюю точку траектории качания. Формула (7) является элементарной вариацией формулы (17) предыдущего параграфа. Маятник можно себе представлять, например, как невесомый стержень, один конец которого шарнирно закреплен, а другой, с присоединенной к нему точечной массой, свободен. В таком случае можно говорить о любых начальных углах 990 € [0, тг]. При <Pq = 0 и <pq = тг маятник качаться вообще не будет, находясь в первом слу- чае в состоянии устойчивого, а во втором случае в состоянии неустойчивого равновесия. Интересно отметить, что из (7) и (8) нетрудно получить, что Т —> оо при <Ро -» тг — 0, т. е. период колебаний маятника неограниченно растет по мере приближения его начального положения 990 к верхнему положению (неустой- чивого) равновесия. с. Условная сходимость несобственного интеграла Определение 5. Если несобственный интеграл сходится, но не абсо- лютно, то говорят, что он сходится условно. Пример 12. Используя замечание 1, по формуле интегрирования по ча- стям в несобственном интеграле находим, что х ysinx , COSX --------dx = X it/2 я/2 У COS X . —ТГ-dx хг к/2 коль скоро последний интеграл сходится. Но, как мы видели в примере 5, этот интеграл сходится, поэтому сходится также интеграл х (9)
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 397 Вместе с тем интеграл (9) не является абсолютно сходящимся. Действи- тельно, при b € [тг/2, +оо[ имеем sinz х . о sm а; х cos 2а; х dx. (10) Интеграл dx, как можно проверить интегрированием по частям, является сходящимся, по- этому при b -> +оо разность в правой части соотношения (10) стремится к +оо и в силу оценки (10) интеграл (9) не является абсолютно сходящимся. Приведем теперь один специальный признак сходимости несобственных интегралов, опирающийся на вторую теорему о среднем и, значит, в сущности на ту же формулу интегрирования по частям. Утверждение 4 (признак Абеля —Дирихле сходимости интеграла). Пусть х ь+ /(аг), х t-> д(х) — функции, определенные на промежутке [о, и>[ и интегрируемые на любом отрезке [а, Ь] С [а,си[. Пусть д — монотонная функция. Тогда для сходимости несобственного интеграла (Jj f (f -a)(®) а dx (И) достаточно, чтобы выполнялась либо пара условий: «1 интеграл dx сходится, Д1) функция g ограничена на [а, а>[, либо пара условий: ь аг) функция J’(b) = у f(x)dx ограничена на [а,си[, а Дг) функция д(х) стремится к нулю при х —> со, х € [а, си[. ◄ Для любых bi, Ьг € [о,а>[ по второй теореме о среднем имеем
398 ГЛ. VI. ИНТЕГРАЛ где 4 — точка, лежащая между и Ьг- Отсюда в силу критерия Коши (утвер- ждение 2) заключаем, что интеграл (11) действительно сходится, если выпол- нена любая из двух указанных выше пар условий. ► 3. Несобственные интегралы с несколькими особенностями. До сих пор мы говорили о несобственных интегралах с одной особенностью, свя- занной с неограниченностью функции у одного из пределов интегрирования или с неограниченностью самого этого предела. Здесь мы укажем, в каком смысле понимаются другие возможные варианты несобственного интеграла. Если оба предела интегрирования являются особенностями того или дру- гого из указанных выше типов, то полагают по определению J f(x) dx := J f(x)dx + J f(x)dx, (12) где с — произвольная точка промежутка ]cui, и^г[- При этом предполагается, что каждый из несобственных интегралов в пра- вой части соотношения (12) сходится. В противном случае говорят, что ин- теграл, стоящий в левой части (12), расходится. В силу замечания 2 и свойства аддитивности несобственного интеграла, определение (12) корректно в том смысле, что оно на самом деле не зависит от выбора точки с Е ]o>i,o>2[- Пример 13. 10 1 dx 1° . -I1 -I1 = arcsin ат |_1 + arcsmx|0 = arcsin х = тг. Пример 14. Интеграл +оо е х dx называется интегралом Эйлера — Пуассона, а иногда еще и интегралом Гаус- са. Он, очевидно, сходится в указанном выше смысле. Позже будет показано, что он равен у/И. Пример 15. Интеграл 4-оо dx ~Х“ О
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 399 расходится, поскольку при любом а разойдется по крайней мере один из двух интегралов 1 dx о Пример 16. Интеграл J ха 1 о сходится, если сходится каждый из интегралов 1 4-оо /sin ж , Г sin ж , ----dx, I dx. ха--J ха О 1 Первый из этих интегралов сходится, если а < 2, ибо sinz 1 ха za—1 при х —> +0. Второй интеграл сходится при а > 0, что можно проверить непосредственно интегрированием по частям, аналогичным проделанному в примере 12, или сославшись на признак Абеля —Дирихле. Таким образом, исходный интеграл имеет смысл при 0 < а < 2. В том случае, когда подынтегральная функция не ограничена в окрестно- сти одной из внутренних точек ш отрезка интегрирования [а, &], полагают b ш Ь dx (13) а а ш требуя, чтобы оба стоящих справа интеграла существовали. Пример 17. В смысле соглашения (13) 1 /dx . —7= = 4. х/И Пример 18. 1 Интеграл / — не определен. J х -1 отличное от (13) соглашение о вычислении интеграла от Существует и функции, неограниченной в окрестности внутренней точки ш отрезка инте- грирования. А именно, полагают ъ а lim J->+o 6 ь (14) о>+<5
400 ГЛ. VI. ИНТЕГРАЛ если стоящий справа предел существует. Этот предел называют, следуя Коши, интегралом в смысле главного значения и, чтобы отличить определения (13) и (14), во втором случае перед знаком интеграла ставят начальные буквы V. Р. французских слов valeur principal (главное значение). В англоязычном варианте используется обозначение Р. V. (от principal value). В соответствии с этим соглашением имеем Пример 19. Принимается также следующее определение: +оо V.P. f f(x)dx:= (15) Пример 20. 4-оо V.P. / xdx = 0. Наконец, если на промежутке интегрирования имеется несколько (конеч- ное число) тех или иных особенностей, лежащих внутри промежутка или со- впадающих с его концами, то неособыми точками промежуток разбивают на конечное число таких промежутков, в каждом из которых имеется только од- на особенность, а интеграл вычисляют как сумму интегралов по отрезкам разбиения. Можно проверить, что результат такого расчета не зависит от произвола в выборе разбиения. Пример 21. Точное определение интегрального логарифма теперь мож- но записать в виде Г dt n 1 / :—, если 0 < х < 1, J In t lix = < V. Р. [ , если 1 < х. J in t В последнем случае символ V. Р. относится к единственной внутренней для промежутка ]О,ат] особенности, расположенной в точке 1. Заметим, что в смысле определения (13) этот интеграл не является сходящимся.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 401 Задачи и упражнения 1. Покажите, что функция X a) Six = I dt (интегральный синус) определена на R, нечетна и имеет о предел при х —> +оо; ОО b) si х = — / —— dt определена на R и отличается от функции Si х только на */ V постоянную; х оо с) Ci х — — / dt (интегральный косинус) при достаточно больших значениях J V X х может вычисляться по приближенной формуле Ci х « ; оцените область тех значений, где абсолютная погрешность этого приближения меньше 10-4. 2. Покажите, что +оо 4-оо ч Г sin я , Г cost . п а) интегралы / —— аху I —— dx сходятся только при а > 0, причем схо- «/ Д7 «/ Д7 1 1 дятся абсолютно только при а > 1; Ь) интегралы Френеля С(х) = S(x) = ~^= j* sin £2 <ft о являются бесконечно дифференцируемыми функциями в промежутке ]0, 4-оо[, при- чем обе они имеют предел при х —> Ч-оо. 3. Покажите, что а) эллиптический интеграл первого рода ТГ определен при 0 k < 1, 0 — и приводится к виду £ F(k,<p)= [ -у=Л=== J у/1 — fc2sin2^ b) полный эллиптический интеграл первого рода ?г/2 К(к)= [ - dr/). J у/1 — fc2sin2^ неограниченно возрастает при к -> 1 — 0.
402 ГЛ. VI. ИНТЕГРАЛ 4. Покажите, что а) интегральная показательная функция {интегральная экспонента) Ei(z) = х t л — dt определена и бесконечно дифференцируема при х < 0; — оо b) - Ei(-s) = ^(1-1 + 4 5г + °(рг)) при а; —>-Ьоо; «*/ \ «*/ «Ж/ «*/ ОО | с) ряд 52 (—1)п_^ не сходится ни при каком значении х Е R; п=0 х d) li х ~ при х —> +0. (Определение интегрального логарифма li х см. в примере 21.) 5. Покажите, что X а) функция ф(я) == f е~* dt, называемая интегралом вероятности ошибок у ТГ J — х и часто обозначаемая символом erf (ж) (от англ, error function — функция ошибок), определена, нечетна, бесконечно дифференцируема на R и имеет предел при х -> -> +оо; Ь) если упомянутый в а) предел равен единице (а это так), то X _ 2 -х2/_1________1 13 _ 13 5 \2z 22s3 + 23z5 24z7 О при X —> -1-00. 6. Покажите, что: а) Если тяжелая частица под действием силы тяжести скользит вдоль кривой, заданной в параметрическом виде х = х(в), у = у(&), причем в момент t = 0 частица имела нулевую скорость и находилась в точке хо = z(#o), у = у(#о), то между парат метром в, определяющим точку на кривой, и моментом t прохождения частицей этой точки имеется связь (см. формулу (15) из § 4) t~±J V 29(i/o-9W) «о 1 в которой несобственный интеграл заведомо сходится, если у'(до) 0 (знак выби- рается в зависимости от того, имеют ли t и в одинаковый или противоположный характер монотонности, причем если росту t отвечает рост 0, то, разумеется, сле- дует брать знак плюс). Ь) Период колебания частицы в ямке, имеющей профиль циклоиды х = R(0 + тг + sin#), РЮ, у = —R(1 -I- cos#), не зависит от уровня уо = —R(l + cos#o), с которого она начинает скольжение, и равен faty/R/g (см. задачу 4 из § 4).
ГЛАВА VII ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ, ИХ ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ До сих пор мы рассматривали почти исключительно числовые функции х •-> н-> f(x), в которых число f(x) определялось заданием одного числа х из об- ласти определения функции. Однако многие величины, представляющие интерес, зависят не от одного, а от очень многих факторов, и если сама величина и каждый из определяющих ее факторов могут быть охарактеризованы некоторым числом, то указанная зависимость сводится к тому, что упорядоченному набору (я:1, ..., хп) чисел, каждое из которых описывает состояние соответствующего фактора, ставит- ся в соответствие значение у — /(х1, ... ,хп) исследуемой величины, которое она приобретает при этом состоянии определяющих величину факторов. Например, площадь прямоугольника есть произведение длин его сторон; объем данного количества газа вычисляется по формуле V = R — , Р где R — постоянная, т — масса, Т — абсолютная температура и р — давле- ние газа. Таким образом, значение V зависит от переменной упорядоченной тройки чисел (тп, Т, р) или, как говорят, V есть функция трех переменных т, Тир. Мы ставим себе целью научиться исследовать функции многих переменных так же, как мы научились исследовать функции одного переменного. Как и в случае функций одного переменного, изучение функций многих числовых переменных начинается с описания их области определения. § 1. Пространство Rm и важнейшие классы его подмножеств 1. Множество и расстояние в нем. Условимся через Rm обозна- чать множество всех упорядоченных наборов (ат1, ..., хт), состоящих из т действительных чисел хг G К (г = 1, ..., т). 14 Зорич В. А.
404 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Каждый такой набор будем обозначать одной буквой х — (ж1, ... ,хт) и в соответствии с удобной геометрической терминологией называть точкой множества Rm. Число х* в наборе (ж1, ..., хт) называют г-й координатой точки х = (ж1, ..., хт). Геометрические аналогии можно продолжить и ввести на множестве IRm расстояние между точками Ж1 = (ж},..., ж™)» ж2 = (ж^, ..., х™) по формуле Гт d(xi,x2) = J52 (zli-2^)2. (1) V »=i Функция d : х Rm -> R, определяемая формулой (1), очевидно, обладает следующими свойствами: а) б/(ж1,ж2) 0; Ь) (</(ж1,ж2) - 0) <=> (Ж1 = ж2); с) й(ж1,ж2) = d(x2,xi); d) б/(ж1,ж3) < d(xi,x2) + d(x2,x3). Последнее неравенство (называемое опять-таки по геометрической аналогии неравенством треугольника) есть частный случай неравенства Минковского (см. гл. V, § 4, п. 2). Функцию, определенную на парах (ж1, х2) точек некоторого множества X и обладающую свойствами a), b), с), d), называют метрикой или расстоянием вХ. Множество X вместе с фиксированной в нем метрикой называют метри- ческим пространством. Таким образом, мы превратили IRm в метрическое пространство, наделив множество Rw метрикой, заданной соотношением (1). Сведения о произвольных метрических пространствах читатель сможет получить в главе IX (часть II). Здесь же мы не хотим отвлекаться от необхо- димого нам сейчас конкретного метрического пространства Rm. Поскольку в этой главе множество Rm с метрикой (1) будет для нас един- ственным метрическим пространством, составляющим объект изучения, то общее определение метрического пространства нам по существу пока не нуж- но. Оно приведено только для пояснения употребляемого по отношению к множеству Rm термина «пространство» и по отношению к функции (1) тер- мина «метрика». Из соотношения (1) следует, что при г Е {1, ..., т} — #2! d(si,ж2) -У™ шах IxJ — жМ, (2) т. е. расстояние между точками х±, х2 Е Rm мало в том и только в том случае, когда мало отличаются соответствующие координаты этих точек.
§ 1. ПРОСТРАНСТВО Rm И КЛАССЫ ЕГО ПОДМНОЖЕСТВ 405 Из (2), как и из (1), видно, что при т = 1 множество 1R1 совпадает с множе- ством действительных чисел, расстояние между точками которого измеряется стандартным образом посредством модуля разности чисел. 2. Открытые и замкнутые множества в Определение 1. При <5 > 0 множество В(а; <5) = {х Е | d(a, х) < <5} называется шаром с центром а Е lRm радиуса б или также б-окрестностью точки а Е Определение 2. Множество G С называется открытым в Rm, если для любой точки х Е G найдется шар В(х-,б) такой, что В(х-,б) С G. Пример 1. — открытое множество в . Пример 2. Пустое множество 0 вообще не содержит точек и потому может считаться удовлетворяющим определению 2, т. е. 0 — открытое мно- жество в . Пример 3. Шар В(а\ г) — открытое множество в lRm. Действительно, если х Е B(a;r), т. е. d(a,a:) < г, то при 0 < б < г - d(a,x) будет В(х-,б) С B(a;r), поскольку (€ € В(ж;<5)) => (d(x,£) <<$)=> => (d(a, £) < d(a, ж) + d(x, £) < d(a, х) + г — d(a, х) — г). Пример 4. Множество G = {х Е Ж™ | d(a,х) > г}, т. е. совокупность точек, удаленных от фиксированной точки а Е на расстояние, большее чем г, является открытым, что, как и в примере 3, легко проверить, используя неравенство треугольника для метрики. Определение 3. Множество F с называется замкнутым в Rm, если его дополнение G = \F в является множеством, открытым в Кт. Пример 5. Множество B(a;r) = {х Е Km|d(a,х) г}, г 0, т. е. совокупность точек, удаленных от фиксированной точки а Е В™ не больше чем на г, является замкнутым, что следует из определения 3 и примера 4. Множество B(a;r) называют замкнутым шаром с центром а радиуса г. Утверждение 1. а) Объединение (J Ga множеств любой системы абА {<7a, a Е А} множеств, открытых в К™, является множеством, откры- тым в п Ь) Пересечение Q Gi конечного числа множеств, открытых в ]Rm, явля- г=1 ется множеством, открытым в Kw. 14*
406 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ а') Пересечение ("] Fa множеств любой системы {Fa, а Е А} множеств аеА. Fa, замкнутых в Кт, является множеством, замкнутым в Жт. п Ь') Объединение (J Fi конечного числа множеств F,, замкнутых в Жт, г=1 является множеством, замкнутым в Rm. ◄ а) Если х Е U (7а, то найдется такое «о € А, что х Е Gao, и, следо- а£А вательно, найдется такая (5-окрестность В(х-,б} точки х, что В(х-,6) С Gao. Значит, B(a:;<5) С |J Ga. абА п Ь) Пусть х Е П Gi. Тогда х Е Gi (г = 1, ..., п). Пусть <51, ..., <5П — г=1 такие положительные числа, что B(x',6i) С Gi (г = 1,..., п). Полагая <5 = п = min{<51, ..., (5П), очевидно, получим, что (5 > 0 и В(х',б) С Q Gi. г=1 а') Покажем, что множество Cl Р| Fa), дополнительное к Q Fa в Ж™, 'а€А ' а€А является открытым подмножеством . Действительно, с( П = U (<^«) = и Ga, ' а€А ' а€А aGA где Ga = СFa открыты в IRm. Теперь а') следует из а). Ь') Аналогично, из Ь) получаем U ft) = C](CFi)= n Gi. ► >i=i / i=i i=i Пример 6. Множество S(a;r) = {x E Km|d(a,x) = r}, r 0, назы- вается сферой с центром а Е радиуса г. Дополнение к S(a;r) в в силу примеров 3 и 4 является объединением открытых множеств. Значит, в силу доказанного утверждения оно открыто, а сфера S(a;r) есть замкнутое подмножество Rm. Определение 4. Открытое в множество, содержащее данную точ- ку, называется окрестностью этой точки в Ж™. В частности, как следует из примера 3, (5-окрестность точки является ее окрестностью. Определение 5. Точка х Е lRm по отношению к множеству Е С JRm называется: внутренней точкой Е, если она содержится в Е вместе с некоторой своей окрестностью; внешней точкой Е, если она является внутренней точкой дополнения к Е вГ;
§ 1. ПРОСТРАНСТВО Rm И КЛАССЫ ЕГО ПОДМНОЖЕСТВ 407 граничной точкой Е, если она не является ни внешней, ни внутренней точкой множества Е. Из этого определения следует, что характеристическое свойство граничной точки множества состоит в том, что в любой ее окрестности имеются как точки этого множества, так и точки, ему не принадлежащие. Пр и мер 7. Сфера 5(а;г), г > 0, является множеством граничных точек как открытого шара В (а; г), так и замкнутого шара В(а; г). Пример 8. Точка а Е lRm является граничной точкой множества \ а, которое не имеет внешних точек. Пример 9. Все точки сферы 5(а;г) являются ее граничными точками; внутренних точек множество S(a; г) как подмножество lRm не имеет. Определение 6. Точка а Е JRm называется предельной точкой множе- ства Е С Кт, если для любой окрестности О(а) точки а пересечение ЕГ)О(а) есть бесконечное множество. Определение 7. Объединение множества Е и всех его предельных то- чек из называется замыканием множества Е в Замыкание множества Е обычно обозначают символом Е. Пример 10. Множество В (а; г) — B(a;r) US(o;r) есть множество пре- дельных точек для открытого шара В(а;г), поэтому В(а;г), в отличие от В(а; г), и назвали замкнутым шаром. Пример 11. S(a; г) = S(a; г). Вместо того чтобы обосновывать последнее равенство, докажем следую- щее полезное Утверждение 2. (F замкнуто в Rm) <=> (F = F в Rm). Иными словами, F — замкнутое в множество тогда и только тогда, когда оно содержит все свои предельные точки. ◄ Пусть F замкнуто в Km, х Е и х F. Тогда открытое множество G = \ F является окрестностью точки х, вообще не содержащей точек множества F. Таким образом, показано, что если х F, то х — не предельная точка F. Пусть F = F. Проверим, что множество G — \ F открыто в Rm. Если х Е G, то х F и потому ,х не является, предельной точкой множества F. Значит, найдется такая окрестность точки я, в которой имеется только ко- нечное число точек х^, ..., хп множества F. Поскольку х £ F, то можно построить, например, шаровые окрестности C>i(a:), ..., Оп(ж) точки х так, п что Xi Oi(x). Тогда О(х) = Q Ог(х) будет открытой окрестностью точки г=1 х, которая вообще не содержит точек F, т. е. О(х) С lRm \F и, следовательно, множество \ F = \ F открыто, т. е. F замкнуто в Жт. ►
408 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 3. Компакты в Определение 8. Множество К С называется компактом, если из любого покрытия К множествами, открытыми в , можно выделить конеч- ное покрытие. Пример 12. Отрезок [а,Ь] С К1 является компактом в К1 в силу леммы о конечном покрытии. Пример 13. Обобщением отрезка в является множество I = {х G Rm | аг хг Ьг, i — 1,..., т}, которое называется т-мерным промежутком, m-мерным брусом или т-мер- ным параллелепипедом. Покажем, что I — компакт в Rm. ◄ Предположим, что из некоторого открытого покрытия I нельзя выде- лить конечное покрытие. Разделив каждый из координатных отрезков Р = = {х* G R| а* х* &*} (i = 1,..., т) пополам, мы разобьем промежуток I на 2т промежутков, из которых по крайней мере один не допускает конеч- ного покрытия множествами нашей системы. С ним поступим так же, как и с исходным промежутком. Продолжая этот процесс деления, получим по- следовательность вложенных промежутков I = Д D /г Э ... D /п D ... , ни один из которых не допускает конечного покрытия. Если In = {a; G | а'п &п, « = 1, • • •, т}> то при каждом i G {1,..., т} координатные отрезки агп xl b'n (n = 1, 2, ...) образуют, по построению, систему вложенных отрезков, длины которых стремятся к нулю. Найдя при каждом i G {1,..., т} точку , общую для всех этих отрезков, получим точ- ку С — > £т)> принадлежащую всем промежуткам I — Ii, h, ..., 1п, ... Поскольку £ 6 I, то найдется такое открытое множество G нашей систе- мы покрывающих множеств, что £ 6 G. Тогда при некотором 6 > 0 также В(£;6) С G. Но по построению в силу соотношения (2) найдется номер N такой, что In С В(£; 6) С G при п > N, и мы вступаем в противоречие с тем, что промежутки 1п не допускают конечного покрытия множествами данной системы. ► Утверждение 3. Если К — компакт в то а) К — замкнутое множество в b) любое замкнутое в Rm множество, содержащееся в К, само является компактом. ◄ а) Покажем, что любая точка a G Rm, предельная для К, принадле- жит К. Пусть а £ К. Для каждой точки х G К построим такую окрест- ность G(x), что точка а обладает окрестностью, не имеющей с G(x) общих точек. Совокупность {(7(а;)}, х G К, всех таких окрестностей образует от- крытое покрытие компакта К, из которого выделяется конечное покрытие G(xi), ... , G(xn). Если теперь О»(а) — такая окрестность точки а, что
§ 1. ПРОСТРАНСТВО Rm И КЛАССЫ ЕГО ПОДМНОЖЕСТВ 409 п G(xi) A Oi(a) — 0, то множество 0(d) = Q О»(а) также является окрест- i=i ностью точки а, причем, очевидно^ К АО(а) = 0. Таким образом, а не может быть предельной точкой для К. Ь) Пусть F — замкнутое в Rm множество и F С К. Пусть {Ga}, а 6 А, — покрытие F множествами, открытыми в Rm. Присоединив к нему еще одно открытое множество G — Rm \ F, получим открытое покрытие Rm и, в частности, К, из которого извлекаем конечное покрытие К. Это конечное покрытие К будет покрывать также множество F. Замечая, что G A F = 0, можно сказать, что если G входит в это конечное покрытие, то, даже удалив G, мы получим конечное покрытие F множествами исходной системы {(7а}, a G А. ► Определение 9, Диаметром множества Е С Rm называется величина d(E) := sup d(x\,X2). X1,X2EE Определение 10. Множество Е С Rm называется ограниченным, если его диаметр конечен. Утверждение 4. Если К — компакт в Rm, то К — ограниченное подмножество Rm. ◄ Возьмем произвольную точку а 6 Rm и рассмотрим последовательность шаров {B(a;n)} (п = 1, 2, ...). Они образуют открытое покрытие Rm, а следовательно, и К. Если бы К не было ограниченным множеством, то из этого покрытия нельзя было бы извлечь конечное покрытие К. ► Утверждение 5. Множество К С Rm является компактом в том и только в том случае, если К замкнуто и ограничено в Rm. ◄ Необходимость этих условий нами уже показана в утверждениях 3 и 4. Проверим достаточность этих условий. Поскольку К — ограниченное мно- жество, то найдется m-мерный промежуток I, содержащий. К. Как было по- казано в примере 13, I является компактом в Rm. Но если К — замкнутое множество, содержащееся в компакте I, то по утверждению ЗЬ) оно само является компактом. ► Задачи и упражнения 1. Расстоянием d(Ei,E2) между множествами Ei, Е2 С Rm называется вели- чина d(Ei,E2) := inf d(;ci,£2)- Приведите пример замкнутых в Rm множеств Ei, Е2 без общих точек, для которых d(Ei, Е2) = 0.
410 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 2. Покажите, что а) замыкание Ё в Rm любого множества Е С Rm является множеством, замкну- тым в Rm; b) множество ЭЕ граничных точек любого множества Е С Rm является замкну- тым множеством; с) если G — открытое множество в Rm, a F замкнуто в Rm, то G \ F — открытое подмножество Rm. 3. Покажите, что если Ki D К2 D • D Кп D ... — последовательность вложен- ОО ных компактов, то Q Ki / 0. 1=1 § 2. Предел и непрерывность функции многих переменных 1. Предел функции. В главе III мы подробно изучили операцию пре- дельного перехода для вещественнозначных функций /: X —>• К, определенных на множестве X, в котором фиксирована база В. В ближайших параграфах нам предстоит рассматривать функции f: X -> Rn, определенные на подмножествах пространства Rm, со значениями в R = К1 или вообще в К”, п G N. Мы сделаем сейчас ряд добавлений к теории предела, связанных со спецификой этого класса функций. Начнем, однако, с общего основного определения. Определение 1. Точка A G К” называется пределом отображения f : X —> Rn по базе Въ Х, если для любой окрестности У(Л) этой точки найдется элемент В G В базы В, образ которого f(B) содержится в У(Л). Короче, lim/(±) = А:= VV(A) ЗВ(ЕВ (/(В)сУ(А)). в Мы видим, что определение предела функции f: X —> К” полностью со- впадает с определением предела функции f: X —>• К, если мы представляем себе, что такое окрестность У(Л) точки Л G Кп для любого п G N. Определение 2. Отображение f: X —> Rn называется ограниченным, если множество f(X) С К” ограничено в К”. Определение 3. Пусть В — база в множестве X. Отображение f: X —> Rn называется финально ограниченным при базе В, если найдется элемент В базы В, на котором f ограничено. Учитывая эти определения, нетрудно проверить теми же рассуждениями, которые мы провели в главе III, что функция f: X —> К” может иметь не более одного предела по данной базе В в X- функция f : X —> Rn, имеющая предел по базе В, финально ограничена при этой базе В.
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 411 Определение 1 можно переписать также в иной форме, явно использующей наличие в К” метрики. А именно, Определение 1'. ,lim/(x) = A G К” := Ve > О ЗВ Ев Vz G В (d(f(x),A) < е) или Определение 1". lim/Cr) = A G К” := limd(/(z), А) = 0. Специфическая особенность отображения f: X —>• К” состоит в том, что поскольку точка у Е К” есть упорядоченный набор (у1, .. ^,уп) из п веществен- ных чисел, то задание функции f: X —> К” равносильно заданию п веществен- нозначных функций f': X —> R (i = 1, ..., п), где f*(x) — У1 (i = 1, • • •, »)• Если А = (А1, ..., А”) и у = (у1,..., j/n), то справедливы неравенства 11? - А*| d(y,A) < у/п max - А*|, (1) из которых видно, что lim/(ж) = А Ф=> = А* (г = 1, ...,п), (2) т. е. сходимость в R” покоординатная. Пусть теперь X = N — множество натуральных чисел, а В — база к —> оо, к 6 N в нем. Функция f: N —> Rn в данном случае есть последовательность & Е N, точек пространства К”. Определение 4. Последовательность {у*}, к Е N, точек yk Е называется фундаментальной, если для любого е > 0 найдется такое число N G N, что при любых кг, к% > N выполнено d(ykif yk2) < £- Из неравенств (1) видно, что последовательность точек уь = (у*,..., y%) Е G К” фундаментальна тогда и только тогда, когда фундаментальна каждая из последовательностей {у*.}, к G N, i — 1,..., п, их одноименных координат. Учитывая соотношение (2) и критерий Коши для числовых последователь- ностей, можно теперь утверждать, что последовательность точек в К” схо- дится тогда и только тогда, когда она фундаментальна. Иными словами, критерий Коши справедлив и в пространстве R”. Впоследствии метрические пространства, в которых каждая фундамен- тальная последовательность имеет предел, мы назовем полными метрически- ми пространствами. Таким образом, мы сейчас установили, что К” при любом п 6 N является полным метрическим пространством. Определение 5. Колебанием функции f: X —> R” на множестве Е С X называется величина «>(/;£) := d(/(E)), где d(/(E)) — диаметр множества f(E).
412 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Как видно, это есть прямое обобщение определения колебания веществен- нозначной функции, в которое определение 5 и переходит при п = 1. С полнотой связано то, что для функций f: X —> Rn со значениями в R” справедлив следующий критерий Коши существования предела. Теорема 1. Пусть X — множество, В — база в X. Функция f: X —>• К” имеет предел по базе В в том и только в том случае, когда для любого числа е > 0 найдется элемент В G В базы, на котором колебание функции меньше Е. Итак, 3 lim f(x) о Уе > О ЗВ € В (w(f,B) < е). Доказательство теоремы 1 дословно повторяет доказательство критерия Коши для числовых функций (гл. III, § 2, теорема 4) с единственным измене- нием, сводящимся к тому, что теперь вместо |/(xi) — /(^г)| следует всюду писать d(/(a?i),/(a;2))- В справедливости теоремы 1 можно убедиться и иначе, если считать из- вестным критерий Коши для вещественнозначных функций и воспользоваться соотношениями (2) и (1). Для функций со значениями в Кп остается в силе также важная теорема о пределе композиции. Теорема 2. Пусть Y — множество, Ву — база в Y, g : Y —> Rn — отображение, имеющее предел по базе Ву. Пусть X — множество, Вх — база в X, f: X —> У — такое отображе- ние X в Y, что для любого элемента By G Ву базы Ву найдется элемент Вх € Вх базы Вх, образ которого f(Bx) содержится в Ву. При этих условиях композиция g о f: X —> Rn отображений fug опре- делена, имеет предел по базе Вх и = Нт$(2/). Вх By Доказательство теоремы 2 можно провести, либо повторив доказательство теоремы 5 из § 2 гл. III, с заменой там R на Rn, либо сослаться на указанную теорему и воспользоваться соотношением (2). До сих пор мы рассматривали'функции f: X —> R” со значениями в К”, никак не конкретизируя область их определения X. В дальнейшем нас пре- жде всего будет интересовать случай, когда X есть подмножество простран- ства Rm. Условимся, что, как и прежде: U (а) — окрестность точки а G Rm; О о 17(a) — проколотая окрестность точки а € Rm, т. е. Ufa) := U(a) \ а\ Ue{o,} — окрестность точки а в множестве Е С Rm, т. е. Ue(cl) := ЕC\U{a)-, О • о Цв(а) — проколотал окрестность точки а в множестве Е, т. е. С/в(а) := = Епй(а);
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 413 х а — база проколотых окрестностей точки а в Rm; х —> оо — база окрестностей бесконечности, т. е. база, состоящая из мно- жеств Rm \ В (а; г); х —> а, х G Е, или (Е Э х -> а) — база проколотых окрестностей точки а в множестве Е, если а — предельная точка для Е-, х -> оо, х G Е, или (Е Э х —> оо) — база окрестностей бесконечности в множестве Е, состоящая из множеств Е \В(а’,г), если Е — неограниченное множество. В соответствии с этими обозначениями можно, например, дать следующие конкретизации определения 1 предела функции, если речь идет о функции f: Е —>• К”, отображающей множество Е С в Кп: ( lim f(x) = л) := (Ve > 0 3(7F(a) Va; G Ue(o) (d(f(x),A)<E)). \ ЕЭх—ьа / Это же можно записать и иначе: ( *im /(*) = А) ••= \ЕЭх—¥а / = (Ve > 0 35 > О Va; G Е (0 < d(a;,a) < 8 => d(f(x), А) < е)). Здесь подразумевается, что расстояния d(x,a) и d(f(x), А) измеряются в тех пространствах (Rm и R”), в которых лежат указанные точки. Наконец, ( lim /(а;) = А) := (Ve > 0 3B(a;r) Va; € RTO \B(a;r) (d(f(x), А) < е)). Условимся также, что запись «/(а;) —>оо при базе В» в случае отображения /: X —>• Кп всегда будет означать, что для любого шара В(А; г) С К” найдется элемент В G В базы В такой, что f(B) С R" \ В (А; г). Пример 1. Пусть х i-> тг*(а;) — отображение тгг: —> IR, состоящее в том, что каждой точке х = (а;1, ..., хтп) пространства ставится в соответ- ствие ее i-я координата а;*. Итак, тг*(а;) = хг. Если а = (а1, ..., ат), то, очевидно, 7гг(а;) —> а* при х —> а. Функция х i-> 7Г*(а;) не стремится ни к конечной величине, ни к бесконеч- ности при х —> оо, если т > 1. Вместе с тем т /(а;) = (тг*(а;))2 —> оо при х —> оо. i=i
414 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Не следует думать, что предел функции нескольких переменных можно найти, вычисляя последовательно пределы по каждой из координат. В этом можно убедиться на следующих примерах. Пример 2. Пусть функция /: К2 —> IR в точке (а;, у) 6 К2 определена так: [ если х2 + у2 / О, = { х +V I 0, если х2 4- у2 = 0. Тогда/(0, у) = /(ж,0) - 0, a f(x,x} - | при х / 0. Таким образом, эта функция не имеет предела при (я, у) —> (0,0). Вместе с тем lim { lim f(x, у)) — lim(0) = 0, lim ( lim f(x,y)} — lim(0) = 0. x-+O\y->O ' / x->o Пример 3. Для функции {x2 — у2 х2 + У2 ’ 0, если х2 4- у2 0, если х2 4- у2 = 0, имеем z \ / \ lim I lim f(x,y)) = lim ( — I = 1, x—>0 \j/—И) / x—>0 \Хг J Пример 4. Для функции f{x,y) = < x 4- у sin - x О, если х О, если х = О, имеем (ж,1/)->(0,0) lim ( lim f(x,y)] = О, z-И) Ху-И) 7 и в то же время повторный предел lim у->о вообще не существует.
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 445 f(x,y) = Пример 5. Функция • * 2 2 ’ если х2 + У2 °’ а;4 + у2 О, если х2 + у2 — О, имеет нулевой предел при стремлении к началу координат по любому лучу х — at, у — /3t. Вместе с тем функция равна в любой точке вида (а, а2), где а / 0, по- этому функция не имеет предела при (х,у) —> (0,0). 2. Непрерывность функции многих переменных и свойства не- прерывных функций. Пусть Е — множество в пространстве и f: Е -> Кп — определенная на нем функция со значениями в пространстве К”. Определение 6. Функция f: Е -> Кп называется непрерывной в точ- ке а Е Е, если для любой окрестности V(/(a)) значения /(а) этой функции, принимаемого ею в точке а, найдется такая окрестность UE(a} точки а в множестве Е, образ которой содержится в V(f(a)). Итак, (j: Е Rn непрерывна в а Е Е) := = (W(/(a)) 3UE(a) (f(UE(a)) С V(№)))). Мы видим, что по форме определение 6 совпадает со знакомым нам опре- делением 1 непрерывности вещественнозначной функции, приведенным в § 1 гл. IV. Как и там, мы можем дать следующие вариации записи этого опре- деления: (/: Е К” непрерывна в а Е Е) := = (Ve > 0 > 0 Vx Е Е (d{x,a) < 6 => d(f(x), f(a)) < е)), или, если а — предельная точка множества Е, (f:E-+TRn непрерывна в а Е Е) ( lim f(x) = /(а)). \ЕЭх-¥а / Как уже отмечалось в главе IV, понятие непрерывности представляет ин- терес именно в том случае, когда речь идет о точке а Е Е, предельной для множества Е, на котором определена функция /. Из определения б и соотношения (2) следует, что отображение f: Е -> Кп, задаваемое соотношением (г1,..., = X Л у = (у1,..., уп) = (/‘(Д • • ,s’"). • • - , Д)), непрерывно в некоторой точке в том и только в том случае, когда каждая из функций у* = /‘(ж1, • • •, хт) непрерывна в этой точке.
416 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ В частности, вспомним, что путем в R” мы назвали отображение f: I промежутка I С К, задаваемое непрерывными функциями У1 (а;), . • •, fn(x) в виде х^у = (у1,..., у") = (/*(*),.... /"(г)). Таким образом, мы теперь можем сказать, что путь в К” есть непрерыв- ное отображение промежутка IС К вещественной оси в пространство К”. По аналогии с определением колебания вещественнозначной функции в точке, вводится понятие колебания в точке функции со значениями в К”. Пусть Е — множество в Rm, а € Е и Ве(о,; г) = Е П В(а; г). Определение 7. Колебанием функции У : —> К” в точке а 6 Е назы- вается величина u?(/;a):= lim и(/-,ВЕ(а;гУ). г—>+0 Из определения 6 непрерывности функции, с учетом свойств предела и кри- терия Коши, получаем совокупность часто используемых локальных свойств непрерывных функций. Перечислим эти Локальные свойства непрерывных функций а) Отображение f : Е -+ W1 множества Е С непрерывно в точке a G Е тогда и только тогда, когда cj(f-,a) = 0. Ь) Отображение f: Е —>• К”, непрерывное в точке а € Е, ограничено в некоторой окрестности Ue(u) этой точки. с) Если отображение g:Y —>• R* множества У С Ж" непрерывно в точке Уо 6 У, а отображение f: X —> Y множества X С непрерывно в точке Xq G X, причем f(xo) = Уо, то определено отображение go f; X —>• R* и оно непрерывно в точке хо € X. Вещественнозначные функции, кроме того, обладают еще следующими свойствами: d) Если функция /: jE? -> К непрерывна в точке a G Е и f(a)>Q (или f(d) < 0), тпо найдется такая окрестность Ue(o) точки а в Е, что для х G Ue(o) справедливо f(x) > 0 (соответственно, f(x) < 0). е) Если функции f:E-+%ug:E-)Vi непрерывны в точке a G Е, то их линейная комбинация (af + /Зд) : Е —> К, где а, /3 6 R, произведение (f • g): Е —>• К, а если д(х) 0 на Е, то и частное : Е —> К, определены на Е и непрерывны в точке a G Е. Условимся говорить, что функция f: Е —> R” непрерывна на множестве Е, если она непрерывна в каждой точке этого множества. Множество функций f : Е —> R”, непрерывных на Е, будем обозначать символом C(jE?;Rn) или символом С(Е), если область значений функций од- нозначно определяется по контексту; как правило, это сокращение будет ис- пользоваться в случае, когда = R.
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 417 Пример 6. Функции (а;1, ..., хт) х' (i = 1,..., т), отображающие на R (проекции), очевидно, непрерывны в любой точке а = (а1, ..., ат) 6 G Кт, ибо lim ir'(x) = а* = 7Г*(а). х— Пример 7. Любую функцию х >-> /(я), определенную на R, например х i-> sin а;, можно рассматривать и как функцию (х, у) /(х), определен- ную, положим, на К2. В таком случае, если f была непрерывна как функция на К, новая функция (х,у) /(х) будет непрерывна как функция на R2. Это можно проверить либо непосредственно по определению непрерывности, либо заметить, что функция F есть композиция (/ о л1)(а;, у) непрерывных функций. В частности, отсюда с учетом с) и е) следует, что, например, функции /(а;, у) = sinx + eiy, /(аг, у) = arctg (ln(|x| + |у| + 1)) непрерывны на R2. Заметим, что проведенные рассуждения по существу своему локальны, а то, что в примере 7 функции f и F рассматривались соответственно на всей оси R или плоскости К2, является обстоятельством случайным. Пример 8. Функция f(x,y) из примера 2 непрерывна в любой точке пространства К2, кроме точки (0,0). Заметим, что, несмотря на разрывность функции f(x, у) в точке (0,0), эта функция непрерывна по любой из двух своих переменных при каждом фиксированном значении другой переменной. ~ Пример 9. Если функция f: Е —>• Кп непрерывна на множестве Е, а Е — подмножество Е, то ограничение ’/I# функции f на это подмножество есть функция, непрерывная на Е, что непосредственно следует из определения непрерывности функции в точке. Перейдем теперь к глобальным свойствам непрерывных функций. Чтобы сформулировать их для функций /: Е -> R”, дадим сначала два определения. Определение 8. Отображение f: Е —>• К” множества-Е1 С в про- странство К” называется равномерно непрерывным на Е, если для любого числа е > 0 найдется такое число 6 > 0, что для любых точек Х1,х% G Е таких, что d(xi,x2) < <5, выполнено d(/(a?i),/(я2)) < £ Как и прежде, подразумевается, что расстояния d(xi,x2), d(/(zi),/(х2)) измеряются соответственно в и К”. При т — п — 1 мы возвращаемся к уже знакомому нам определению рав- номерной непрерывности числовых функций. Определение 9. Множество Е С называется линейно связным, если для любой пары xo,xi его точек существует путь Г : I —> Е с носителем в Е и с концами в этих точках. Иными словами, из любой точки х0 G Е можно пройти к любой точке a?i G Е, не выходя за пределы множества Е.
418 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Поскольку мы пока не будем рассматривать иного понятия связности мно- жества, кроме понятия линейной связности, то для краткости условимся пока линейно связные множества назвать просто связными. Определение 10. Областью в пространстве IR.m называется открытое связное множество. Пример 10. Шар В(а;г), г > 0, в HU71 является областью. Откры- тость В(а;г) в нам уже известна. Проверим, что шар связен. Пусть xq = (xq, ..., Xq1) и Xi = (rrj, ..., x™) — две точки шара. Путь, задаваемый функциями x'(t) = tx\ + (1 — t)xl (г = 1, ..., т), определенными на отрезке 0 t 1, имеет своими концами точки xq и xi. Кроме того, его носитель лежит в шаре В(а;г), поскольку, в силу неравенства Минковского, при любом *€ [0,1] d(x(t),a) = т Im ~t'\ YI(xi”°г)2 +~о• J52(жо_at)2<tr+(г“= г- V i=l V t=l Пример 11. Окружность (одномерная сфера) радиуса г, > 0 есть подмно- жество в IR2, задаваемое уравнением (х1)2 + (ж2)2 = г2. Полагая ж1 = г cost, х2 = rsinf, видим, что любые точки окружности можно соединить путем с носителем на окружности. Значит, окружность — связное множество. Однако это множество не является областью в IR2, поскольку оно не открыто в IR2. Сформулируем теперь основные Глобальные свойства непрерывных функций а) Если отображение f: К —> IR” непрерывно на компакте К С ИГ”, то оно равномерно непрерывно на К. Ь) Если отображение f: К —> R" непрерывно на компакте К С то оно ограничено на К. с) Если функция f : К —> Ж. непрерывна на компакте К С Rm, то она принимает в некоторых точках К минимальное и максимальное из своих значений на К. d) Если функция f: Е —> IR. непрерывна на связном множестве Е, прини- мает в точках a,b € Е значения f(a) = A, f(b) = В, то для любого числа С, лежащего между А и В, найдется точка с € Е, в которой f(c) = С. Изучая в свое время (гл. IV, § 2) локальные и глобальные свойства число- вых функций одной переменной, мы дали такие их доказательства, которые
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 419 переносятся и на рассматриваемый здесь более общий случай. Единственное изменение, которое при этом следует сделать в прежних доказательствах, со- стоит в том, что выражения типа |ti — X2I или |/(^i) — f (жг)! надо заменить на d(xi,X2) и d(f(xi),f(x2))> где d — метрика в том пространстве, где лежат рассматриваемые точки. Это замечание относится в полной мере ко всему, кроме последнего утверждения d), доказательство которого мы сейчас про- ведем. ◄ d) Пусть Г : I —> Е — путь, являющийся таким непрерывным отобра- жением отрезка [а, Д] = / с R, что Г(а) = а, Г(Д) = Ь. В силу связности Е такой путь существует. Функция /о Г : I —> R, как композиция непрерывных функций, непрерывна, поэтому на отрезке [а, Д] найдется точка 7 € [а,/?], в которой / о Г (7) — С. Положим с — Г(7). Тогда с € Е и f(c) = С. ► Пример 12. Сфера S(0;г), задаваемая в уравнением (т1)2 4-... 4- (тт)2 = г2, является компактом. Действительно, из непрерывности функции (х1,...,^) —4 (х1)2 + ...4-(хт)2 следует замкнутость сферы, а из того, что на сфере |т*| г (г — 1,..., тп), следует ее ограниченность. Функция (т1, ..., хт) I—> (т1)2 4-... 4- (хк)2 - (т*+1)2 - ... - (тт)2 непрерывна на всем пространстве Rm, поэтому ее ограничение на сферу есть также непрерывная функция, которая в силу глобального свойства с) непре- рывных функций имеет на сфере минимальное и максимальное значения. В точках сферы (1,0, ..., 0), (0, ..., 0,1) рассматриваемая функция принимает значения 1 и —1 соответственно. Ввиду связности сферы (см. задачу 3 в конце параграфа) на основании глобального свойства d) непрерывных функций мож- но утверждать, что на сфере есть точка, в которой рассматриваемая функция обращается в нуль. Пример 13. Открытое множество \ 5(0;г) при г > 0 не является областью, так как оно несвязно. Действительно, если Г: I -4 Rm есть путь, один конец которого совпадает с точкой хо = (0,..., 0), а другой — с некоторой точкой xi = (z|,..., z™) такой, что (т})2 4- ••• 4- (т™)2 > г2, то композиция непрерывных отображений Г : I -4 и f:Rm->R, где (г1,...,хт) Л+ (х1)2 +... + (х™)2,
420 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ есть непрерывная на отрезке I функция, принимающая на его концах значе- ния, меньшее и большее чем г2. Значит, на этом отрезке найдется точка 7, в которой (/ о Г)(7) = г2. Тогда точка ху = Г(7) носителя нашего пути ока- зывается лежащей на сфере 5(0; г). Мы показали, что нельзя выйти из шара В(0;г) С Кт, не пересекая его граничной сферы 5(0; г). Задачи и упражнения 1. Пусть / G C(Rm;R). Покажите, что а) множество Ei = {г 6 Rm | f(x) < с} открыто в Rm; b) множество Е2 = {х 6 Rm | f(x) с} замкнуто в с) множество Ез = {х 6 Rm | f(x) = с} замкнуто в Rm; d) если f(x) —> +00 при х —> оо, то Е2 и Ез компактны в Rm; е) для любой функции / : > R множество Е4 = {ж € Rm | а>(/; х) е} замкнуто в Rm. 2. Покажите, что отображение /: Rm —> Rn непрерывно тогда и только тогда, когда прообраз любого открытого в Rn множества является открытым в Rm мно- жеством. 3. Покажите, что а) образ f(E) связного множества Е С Rm при непрерывном отображении /: Е —> —> Rn является множеством связным; Ь) объединение связных множеств, имеющих общую точку, является связным множеством; с) полусфера (х1)2 -I-... -I- (xm)2 = 1, хт 0, является связным множеством; d) сфера (а:1)2 -I-... -I- (х*71)2 = 1 является связным множеством; е) если Е С R и Е связно, то Е есть промежуток на R (т. е. отрезок, полуинтер- вал, интервал, луч или вся числовая ось); f) если хо — внутренняя, а х\ — внешняя точка множества М С Rm, то носитель любого пути с концами хо, х\ пересекает границу множества М.
ГЛАВА VIII ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ § 1. Линейная структура в Rm 1. как векторное пространство. Из курса алгебры вам уже хо- рошо известно понятие векторного пространства. Если в Rm ввести операцию сложения элементов х± = (а?},..., х™), жг = = (ж|, ..., ж™) по формуле Х1 + Ж2 = (я} +«2> W а умножение элемента х = (а?1,..., хт) на число A G R — соотношением Хх = (Аж1, ..., Ххт), (2) то ВТ” становится линейным пространством над полем действительных чисел. Его точки теперь можно называть векторами. Векторы е* = (0, ...,0,1,0, ...,0) (г = 1,...,т) (3) (где единица стоит лишь на г-м месте) образуют максимальную линейно неза- висимую систему векторов этого пространства, ввиду чего оно оказывается m-мерным векторным пространством. Любой вектор х € может быть разложен по базису (3), т. е. представлен в виде х = ж1С1 + ... + хтет. (4) Индекс при векторе мы условимся писать внизу, а координаты, как и до сих пор, будем отмечать верхним индексом. Это удобно по многим причинам, одна из которых, в частности, состоит в том, что, следуя Эйнштейну1), можно Х>А. Эйнштейн (1879—1955) — крупнейший физик нашего столетия, работы которого по квантовой теории и особенно по теории относительности оказали революционизирующее влияние на всю современную физику.
422 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ условиться выражения типа (4) записывать коротко в виде X = Хгвг, (5) считая, что появление одинакового индекса сверху и снизу означает суммиро- вание по этому индексу в пределах диапазона его изменения. 2. Линейные отображения L : R”1 —> R”. Напомним, что отображе- ние L : X —> Y векторного пространства X в векторное пространство Y на- зывается линейным, если для любых xi, Х2 G X и Ai, Аг G R выполнено L(Aia?i + Аг^г) = AiL(a?i) + АгЦяг)- Нас будут интересовать линейные отображения L : Rm —> Rn. Если {ei, ..., ето} и {ei,..., ёп} — фиксированные базисы пространств Rm и R" соответственно, то, зная разложения Ь(е») = ajei + ... + а"ёп = ajej (г = 1, ..., т) (6) образов векторов базиса при линейном отображении L : Rm —> Rn, мы в силу линейности преобразования L можем найти разложение по базису {£i, ...,ёп} образа L(h) любого вектора h = hxei 4-... 4- hmem = hlei. А именно: L(h)=L(hiei) = hiL(ei) = hia^j=aihiej. (7) Значит, в координатной записи: L(h) = (8) Отображение L: Rm —> Rn при фиксированном в Rn базисе можно, таким образом, рассматривать как набор L=(L1,...,Ln) (9) из п (координатных) отображений : Rm —> R. С учетом (8) легко заключаем, что отображение L : Rm —> Rn линейно тогда и только тогда, когда каждое отображение L? набора (9) линейно. Если записать набор (9) в виде столбца, то с учетом соотношения (8) имеем Итак, фиксация базисов в Rm и R" позволяет установить взаимно одно- значное соответствие между линейными отображениями L: ИГ71 —> Rn и т х п- матрицами (а^) (г = 1, ..., т, j = 1, ..., п). При этом столбец с номером
§ 1. ЛИНЕЙНАЯ СТРУКТУРА В Rm 423 г матрицы (af), отвечающей отображению L, состоит из координат образа L(ei) вектора е< € {ei,..., em}. Координаты образа L(h) произвольного век- тора h = h'ei € IKW могут быть получены из соотношения (10) умножением матрицы линейного отображения на столбец координат вектора h. При наличии в Кп структуры векторного пространства можно говорить о линейной комбинации Ai/i + Аг/2 отображений /1: X —> R”, /2 : X —> R”, полагая (Ai/i + А2/2Х®) := А1/1(ж) + Аг/г(^)- (П) В частности, линейная комбинация линейных отображений Li : lRm —> К", L2 : lRm —> IR" есть, в соответствии с определением (11), отображение h •—> XiLi(h) + АгЬ2(/г) — которое, очевидно, линейно. Матрица этого отображения есть соответству- ющая линейная комбинация матриц отображений Li и L2. Композиция С = В о А линейных отображений А : IRm —> IRn, В : IR" —> IR*, очевидно, также является линейным отображением, матрица которого, как следует из (10), есть произведение матрицы отображения А и матрицы ото- бражения В (на которую умножаем слева). Кстати, закон умножения матриц определен известным вам образом именно для того, чтобы композиции ото- бражений отвечало произведение матриц. 3. Норма в IRm. Величину и = V(zv)2 + --- + (?m')2 (12) назовем нормой вектора х — (г1,..., xm) € Rm. Из этого определения с учетом неравенства Минковского следует, что 1° IMI > 0, 2° (||т|| = 0) « (х = 0), 3° ||Ах|| = |А| ||х||, где А е R, 4° hi + х2|| ||Ж1|| + ||щ2||- Вообще, любую функцию || || : X -> IR на векторном пространстве X, удо- влетворяющую условиям 1°—4°, называют нормой в векторном пространстве. Иногда, чтобы уточнить, о какой норме идет речь, знак нормы вектора на- деляют символом того пространства, в котором эту норму рассматривают. Например, можно написать ||z||r™ или ||г/||к«, однако мы, как правило, не ста- нем этого делать, ибо из контекста всегда будет ясно, о каком пространстве и какой норме идет речь. Заметим, что в силу (12) ||Ж2 - ®1!Г= d(xi,x2), (13)
424 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ где d(a;i, х2) — расстояние в Rm между векторами zi и х2, рассматриваемыми как точки метрического пространства Rm. Из соотношения (13) видно, что следующие условия равносильны: х -> то, d(T,x0) 0, ||т — т0|| О- Ввиду (13), в частности, имеем ||т|| =d(0,T). Свойство 4° нормы называют неравенством треугольника, и теперь ясно почему. Неравенство треугольника по индукции распространяется на сумму любо- го конечного числа слагаемых. А именно, справедливо неравенство ||Т1 + ... +тл|| ||Т1|| + ...+ ||тл||. Наличие нормы вектора позволяет сравнивать по величине значения функ- ций /: X -> Rm, д: X R”. Условимся писать, что /(т) = о(<?(т)) или f = о(д) при базе В в X, если ||/(T)||Rm = o(||^(T)||Rn) при этой базе В. Если /(т) = (/1(т), ..., /т(т)) — координатное представление отображе- ния f : X —> Rm, то ввиду неравенств т Im $ н/(®)|| Е irwi (и) г=1 можно сделать следующее полезное для дальнейшего наблюдение: (/ = °(<?) пРи базе В) <=> (/г = о(д) при базе В; i = 1, ..., m). (15) Условимся также, что запись f = 0(g) при базе В в X будет означать, что ||/(x)||Rm = O(||^(T)||Rn) при этой базе В. Тогда из (14) получаем, что (/ = 0(g) при базе В) <=> (/г = 0(g) при базе В; i = 1, ..., т). (16) Пример. Пусть L : Rm —> Rn — линейное отображение и h = Mei + • • • + + hmem — произвольный вектор пространства Rm. Оценим ||L(h)||Rn: (17) Таким образом, можно утверждать, что L(h) = 0(h) при h -> 0. (18) В частности, из этого следует, что L(x — xq) = L(x) — L(xq) —> 0 при x —> xq, t. e. линейное отображение L: Rm —> Rn непрерывно в любой точке Xq G Rm. Из оценки (17) видна даже равномерная непрерывность линейного отображения.
§ 1. ЛИНЕЙНАЯ СТРУКТУРА В Rm 425 4. Евклидова структура в Rm. Из алгебры известно понятие ска- лярного произведения в вещественном векторном пространстве как числовой функции {х,у), определенной на парах векторов пространства и обладающей свойствами (х,х) О, (х,х) = О О х = О, (Т1,т2) = {х2,Х\), (Ati,X2> = А<Я1,х2), где А е R, <Т1 + х2, х3) = <xi, х3) + (х2,хз). Из этих свойств, в частности, следует, что если в пространстве фиксирован базис {ei, ..., ет}, то через координаты (х1, ..., т771), (г/1, ..., ут) векторов х и у их скалярное произведение (х, у) запишется в виде билинейной формы {х,у} = gijx'y3 (19) (подразумевается суммирование по i и по j), в которой д^ = Векторы называются ортогональными, если их скалярное произведение равно нулю. Базис {ei, ..., ет} называется ортонормированным, если д^ = <5^-, где ]0, если i / j, ( 1, если г = j. В ортонормированием базисе скалярное произведение (19) имеет самый простой вид {х,у) = tijX'y3, или {х, у) = х1 • у1 + ... + хт • ут. (20) Координаты, в которых скалярное произведение имеет такой вид, называ- ют декартовыми координатами. Напомним, что пространство Rm с определенным в нем скалярным произ- ведением называется евклидовым пространством. Между скалярным произведением (20) и нормой вектора (12) имеется оче- видная связь {х,х) = ||т||2. Из алгебры известно следующее неравенство: (х,г/)2 {х,х){у,у),
426 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ которое, в частности, показывает, что для любой пары векторов найдется угол € [0, тг] такой, что (х, 2/> = |kll||j/||cos^. Этот угол называют углом между векторами х и у. Именно по этой при- чине естественно считать ортогональными векторы, скалярное произведение которых равно нулю. Полезным для нас будет также следующий известный из алгебры простой, но очень важный факт: любая линейная функция L : Rm —> R в евклидовом пространстве имеет вид Цх) — (£, х), где £ 6 К7” — фиксированный и однозначно соответствующий функции L вектор. § 2. Дифференциал функции многих переменных 1. Дифференцируемость и дифференциал функции в точке Определение 1. Функция f : Е —> R", определенная на множестве Е С Rm, называется дифференцируемой в точке х€Е, предельной для мно- жества Е, если f(x + А) - /(т) = L(x)h + a(x;h), (1) где L(x) : Rm —> R" — линейная относительно h функция1), a a(x;h) = o(h) при h —> 0, х 4- h € Е. Векторы Дх(А) := (х + h) — х = /г, Д/(х; А) := f(x + А) - /(х) называются соответственно приращением аргумента и приращецием функ- ции (отвечающим этому приращению аргумента). Эти векторы пр традиции обозначают символами Дх и Д/(т) самих функций от h. Линейная функция Цх) : Rm —> Rn в соотношении (1) называется диф- ференциалом, касательным отображением или производным отображением функции f: Е —> R" в точке х € Е. Дифференциал функции f: Е —> Rn в точке х 6 Е обозначается символами df^x), Df(x) или f'(x). 1)По аналогии с одномерным случаем, мы позволим себе писать L(x)h вместо L(rr)(h). Отметим также, что в определении мы подразумеваем, что И?*71 и Rn наделены указанной в § 1 нормой.
§ 2. ДИФФЕРЕНЦИАЛ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 427 В соответствии с введенными обозначениями, соотношение (1) можно пё- реписать в виде /(х + h) - f(x) = f'(x)h + а(т; h) или Af(x;h) = df(x)h + a(x\ h). Заметим, что дифференциал, в сущности, определен на смещениях h от рассматриваемой точки х 6 ВТ”. Чтобы это подчеркнуть, с точкой х € К™ связывают свой экземпляр век- торного пространства Rm и обозначают его через TxRm, TRm(:E) или TR™; TR™ можно трактовать как совокупность векторов, приложенных к точке х € Rm. Векторное пространство TR™ называют касательным простран- ством к Rm в точке х € Rm. Происхождение этой терминологии прояснится позже. Значение дифференциала на векторе h € есть вектор f (x)h € приложенный к точке f(x) и аппроксимирующий приращение f(x 4- А) — f(x) функции, вызванное приращением h аргумента х. Итак, df(x) или /'(а?) есть линейное отображение f(x): DR™ -4 Мы видим, что, в полном соответствии с уже изученным нами одномерным случаем, функция многих переменных с векторными значениями дифференци- руема в точке, если ее приращение Д/(т; А) в этой точке как функция прира- щения аргумента h линейно по h с точностью до поправки о(х; /г), бесконечно малой при h —> 0 в сравнении с приращением аргумента. 2. Дифференциал и частные производные вещественнозначной функции. Если векторы f(x + А), /(т), a(x;h) из R" записать в координатах, то равенство (1) окажется равносильным п равенствам Г(х + А) - Г(х) = Г(т)А + <?(т; h) (i = 1,..., n) (2) между вещественнозначными функциями, в которых, как следует из соотно- шений (9) и (15) § 1, Ь*(х): Rm —> R суть линейные функции, а аг(х; h) = o(h) при -4 О, x + htE для любого i = 1,..., п. Таким образом, справедливо Утверждение 1. Отображение f:E—>№n множества Е С Rm диффе- ренцируемо в точке хеЕ, предельной для множества Е, тогда и только то- гда, когда в этой точке дифференцируемы функции fz: Е —> R (г = 1,..., п), задающие координатное представление данного отображения. Поскольку соотношения (1) и (2) равносильны, то для отыскания диффе- ренциала L(x) отображения f: Е —> Rn достаточно научиться находить диф- ференциалы Ьг(х) его координатных функций /г: Е -4 R. Итак, рассмотрим вещественнозначную функцию /: Е -4 R, определенную на множестве Е С Rm и дифференцируемую во внутренней точке х G Е этого множества. Заметим, что в дальнейшем нам большей частью придется иметь
428 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ дело с тем случаем, когда Е будет областью в Кт. Если х есть внутренняя точка множества Е, то при любом достаточно малом смещении h от точки х точка х + h также будет принадлежать Е и, следовательно, будет находиться в области определения функции f: Е —> К. Если перейти к координатной записи точки х = (ж1,..., вектора h = = (Л1,..., hm} и линейной функции L(x)h — ai(x)/i1+ ... + am(x)hm, то условие f(x + h) — /(я) = L(x)h + o(h) при h —> 0 (3) перепишется в виде f(x1 + h\...,xm + hm)-f(x1,...,xm)== = aitxjh1 + ... + am(x)hm + o(h) при h —> 0, (4) где ai(x), ..., ат(х) — связанные с точкой х вещественные числа. Мы хотим найти эти числа. Для этого^вместо произвольного смещения h рассмотрим специальное смещение h{ — h*ei = 0 • ei + ... + 0 • в|—1 + h'ei + 0 • e»+i + ... + 0 • ет на вектор hi, коллинеарный вектору е, базиса {ei, ..., ето} в Кт. При h = hi, очевидно, ||Л|| = |Л’|, поэтому из (4) при h = hi получаем /(х1,..., х1-1, хг + h\ x'+1, ...,xm)~ /(x1, ..., хг, ..., xm) = = а,(х)Л* + о(Л*) при hl —> 0. (5) Это равенство означает, что если фиксировать в функции /(а1, ...,хт) все переменные, кроме г-й переменной, то получаемая при этом функция г-й переменной оказывается дифференцируемой в точке хг. Из равенства (5), таким образом, находим, что п - lim xi + Х*+1’ • • • ’ ХГП} ~ №1} • • • > > *т) аДх) = lim-------------------------------------------------------. (6) h'—tO Е1 Определение 2. Предел (6) называется частной производной функции /(ж) в точке х = (х1, ..., хт) по переменной х*. Его обозначают одним из следующих символов: ^(х), Difix'), fxi(x). Пример 1. Если f(u,v) = и3 + v2sinu, то dif(u, v) = = 3u2 + v2 cosu, ou f d2f{u,v) — ^-(u, v) = 2vsinu. ov
§ 2. ДИФФЕРЕНЦИАЛ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 429 Пр и мер 2. Если f(x,y,z) — arctg (яу2) + ez, то 9if(x,y,z) = ^(z,y,2) = j > дз!&,у,г) = = ez. Итак, мы доказали Утверждение 2. Если функция f: Е определенная на множестве Е С Кт, дифференцируема во внутренней точке х G Е этого множества, то в этой точке функция имеет частные производные по каждой переменной и дифференциал функции однозначно определяется этими частными производ- ными в виде df(x)h=^(x)h1 + ...+ £L(x)h’n. (7) ОХ* ох™ Формулу (7), используя соглашение о суммировании по повторяющемуся снизу и сверху индексу, можно записать компактно: dfWh^diftxjfj. (8) Пример 3. Если бы мы знали (а скоро мы это узнаем), что рассмотрен- ная в примере 2 функция f(x,y, z) дифференцируема в точке (0,1,0), то можно было бы сразу записать, что d/(0,1,0) А = 1- h1 + 0 • h2 + 1- h3 = h1 + h3 и, в соответствии с этим, flh1,1 + л2, л3) - 7(0,1,0) = df(O,1,0)Л+o(h) ИЛИ arctg (Л1 (1 + Л2)2) +eft3= 1 + Л1 +/г3 + o(h) при h -> 0. Пример 4. Для функции х = (х1,хт) которая точке х G ВТ” ставит в соответствие ее г-ю координату, имеем Д%Чя;Л) = (? +/г)-? = /?, т. е. приращение этой функции само есть линейная по h функция h h\ Таким образом, Дтгг(х;Л) — dKl{x)h, причем отображение с?7гг(х) = dir1 на
430 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ самом деле оказывается не зависящим от х € Кт в том смысле, что difHxjh = = 7? в любой точке х G Rw. Если вместо тгг(х) писать хг(х), то получаем, что dxl(x)h = dxlh = hl. Учитывая это обстоятельство и формулу (8), мы теперь можем предста- вить дифференциал любой функции в виде линейной комбинации дифферен- циалов координат ее аргумента х G Кт. А именно: df(x) = dif(x)dxi = ^(x)dxl + ...+ -^(x)dxm, (9) их их поскольку для любого вектора h G ГК™ имеем df(x)h = dif(x)hl — dif^dx'h. 3. Координатное представление дифференциала отображения. Матрица Якоби. Итак, мы нашли формулу (7) для дифференциала веще- ственнозначной функции f: Е —> BL Но тогда, в силу установленной эквива- лентности соотношений (1) и (2), уже для любого отображения f: Е —> IRn множества Е С Кт, дифференцируемого во внутренней точке х € Е это- го множества, можно выписать координатное представление дифференциала df(x) в виде (dp(x)h\ (dtplriiA (&(*) df(x)h = ........ = ........ = ......... \dfn(x)h) \д,Г(х)К) \|С(г).. Определение 3. Матрица (5,/7(х)) (i = 1, ...,m, j = 1, ...,п) из частных производных координатных функций данного отображения в точке х е Е называется матрицей Якоби1} или якобианом2} отображения в этой точке. В случае, когда п = 1, мы возвращаемся к формуле (7), а ьргда п = 1 и т = 1, мы приходим к дифференциалу вещественнозначной функции одного вещественного переменного. Из эквивалентности соотношений (1) и (2) и единственности дифференци- ала (7) вещественнозначной функции следует Утверждение 3. Если отображение f : Е->КП множества $ С Кт дифференцируемо во внутренней точке хЕЕ этого множества, то оно име- ет в этой точке единственный дифференциал df(x), причем координат- ное представление отображения df(x) : ГК™ —> задается соотно- шением (10). Х)К. Г. Я. Якоби (1804—1851) — известный немецкий математик. 2) Якобианом чаще называют определитель этой матрицы (когда она квадратная).
§ 2. ДИФФЕРЕНЦИАЛ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 431 4. Непрерывность, частные производные и дифференцируемость функции в точке. Мы закончим обсуждение понятия дифференцируемо- сти функции в точке указанием на взаимоотношения между непрерывностью функции в точке, наличием у нее частных производных в точке и дифферен- цируемостью ее в этой точке. В § 1 (соотношения (17) и (18)) мы установили, чтр .если L : -> Rn — линейное отображение, то Lh —> 0 при h —> 0. Таким образом, из соотношения (1) можно заключить, что функция, дифференцируемая в точке, непрерывна в этой точке, поскольку f(x + h) — f(x) = L(x)h + o(h) при h —> 0, x + h G E. Обратное, конечно, не верно потому, что, как нам известно, это не верно уже в одномерном случае. Таким образом, взаимоотношение непрерывности и дифференцируемости функции в точке в многомерном случае такое же, как и в одномерном. Совсем иначе обстоит дело во взаимоотношениях частных производных и дифференциала. В одномерном случае, т. е. в случае вещественнозначной функции одного вещественного переменного, наличие дифференциала и на- личие производной у функции в точке были условиями равносильными. Для функций многих переменных мы показали (утверждение 2), что дифферен- цируемость функции во внутренней точке области определения обеспечивает существование у нее частных производных по каждой переменной в этой точ- ке. Однако обратное утверждение уже не имеет места. Пример 5. Функция если х1#2 = 0, если х1#2 0, равна нулю на осях координат и потому имеет в точке (0,0) обе частные производные: г ЛЛ\0)-/(0,0) г 0-0 _ 01/(0,0) = lim --------—-------= lim —-j— = 0, v ' hJ->o h1 h^p h1 я.,пп, 1- 7(0,A2) -/(0,0) .. 0-0 „ 02/(0,0) = hm —-------—--------- = hm —-j— = 0. 7 ft2->o h2 h2->o h2 h2 Вместе с тем эта функция не дифференцируема в точке (0,0), поскольку она, очевидно, разрывна в этой точке. Приведенная в примере 1 функция не имеет одной из частных производных в точках осей координат, отличных от точки (0,0). Однако функция 2^7 2 ’ если я2 + у2 # 0, х2 + у2 0, если х2 + у2 = 0 f(x,y) =
432 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ (которая нам встречалась в примере 2 из § 2 гл. VII), уже во веек точках плоскости (х,у) имеет частные производные, однако она тоже разрывна в начале координат и потому не дифференцируема в точке (0,0). Таким обра^Ьм, возможность написать правую часть равенств (7), (8) еще не гарантирует того, что это будет дифференциал нашей функции, поскольку функция может оказаться не дифференцируемой. Это обстоятельство могло бы стать серьезной помехой всему дифферен- циальному исчислению функций многих переменных, если бы не выяснилось (это будет доказано позже), что непрерывности частных производных в точке достаточно для дифференцируемости функции в этой точке. § 3. Основные законы дифференцирования 1. Линейность операции дифференцирования Теорема 1. Если отображения fi: Е —> Кп, Д: Е —> Кп, определенные на множестве Е С дифференцируемы в точке х G Е, то их линейная комбинация (Ai/i + Л2/2) : F —> Кп также является дифференцируемым в этой точке отображением, причем имеет место равенство + А2/2)'(х) = (Ах/; + Л2Л)(х). (1) Равенство (1) показывает, что операция дифференцирования, т. е. сопоста- вление отображению его дифференциала в точке, является линейной операци- ей на векторном пространстве отображений f: Е —> Кп, дифференцируемых в фиксированной точке множества Е. Слева в (1) стоит, по определению, ли- нейное отображение (Ai/i + Аг/гУС^Х а справа стоит линейная комбинация (А1/{ + Аг/2)(я) линейных отображений f[(x): —> Кп, /Х37): которая, как нам известно из § 1, также является линейным отображением. Теорема 1 утверждает, что эти отображения совпадают. (Ai/i + Аг/гХ^ 4- Л) — (Ai/i + А2/2Х®) = = (Ai fi(х + h) + Аг/гСс 4- h)) - (А1/1 (х) 4- А2/2(^)) = = Ai (Л (х + Л) - Л(ж)) 4- А2(/2 (я + h) - /2(я)) = = Xi(fl(x)h + о(Л)) + А2(Л(х)Л + о(Л)) = = (А1/1,(х)4-АгЛ(^))Л + о(Л). ► Если рассматриваемые функции вещественнозначны, то над ними выпол- нимы также операции умножения и (при необращении знаменателя в нуль) деления. Имеет место Теорема 2. Если функции f : Е —>• К, g : Е —> К, определенные на множестве Е С дифференцируемы в точке х 6 Е, то
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 433 а) их произведение дифференцируемо в х, причем = g(x)f'(x) + /(z)p'(z); (2) b) их отношение дифференцируемо в х, если д(х) 0, причем (я) = (g(x)f'(x) - f(x)g’(x)). (3) \gj gz(x) Доказательство этой теоремы совпадает с доказательством соответству- ющих пунктов теоремы 1 из § 2 гл, V, поэтому мы на нем не останавливаемся. Соотношения (1), (2), (3) можно переписать также и в иных обозначениях дифференциала. А именно: Ш + А2/2)(х) = (Aid/i + A2d/2)(x), d(f-g)(x) = g(x)df(x) + /(x)dp(x), d(t\x) = \gy ~27^\ (g(xW(x) ~ f(x)dg(x)). g \x) Посмотрим, что означают эти равенства в координатном представлении отображений. Нам известно, что если отображение <р: Е —> Кп, дифференци- руемое во внутренней точке х множества Е С Кт, записать в координатном виде /^(ж1, ...,хт)У ф(х) = .............. , то его дифференциалу d<p(x): К™ —> Кп в этой точке будет соответствовать матрица Якоби /д^1 ... ¥>'(*) = (х) = (дцр3)(х). \д!<рп ... дт<рп/ При фиксированных базисах в Кт и Кп соответствие между линейными отображениями L : Кш —> Кп и т х п-матрицами — взаимно однозначное, поэтому линейное отображение L можно отождествить с задающей его ма- трицей. Для обозначения матрицы Якоби мы все же, как правило, будем исполь- зовать символ f'(x), а не символ df(x), ибо это больше соответствует тому традиционному разделению понятий производной и дифференциала, которое проводится в одномерном случае.
434 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, в силу единственности дифференциала, во внутренней точ- ке х множества Е получаем следующие координатные формы записи соотно- шений (1), (2), (3), означающие равенства соответствующих матриц Якоби: = (Xidifi + Х&К)(х) (i = l,...,m, > = l,...,n), (1') (ft(/•»))(*) = s(x:)SiJ(x) + f(x)dig(x) (i = l, (2') ft(0)(x) = ^(s(x)3i/(x)-/(x)ai9(x)) (i = 1,...,m). (3') Из поэлементного равенства указанных матриц, например, следует, что частную производную по переменной хг от произведения вещественнозначных функций /(х1, ..., хт) и д(х\ ..., хт) надо брать так: = д(х\ ...,хт)^(х\ х”>) + f(x\ ...,х">)g(x\....хт). Отметим, что как это равенство, так и матричные равенства (1'), (2'), (3') являются очевидными следствиями определения частной производной и обычных правил дифференцирования вещественнозначных функций одного вещественного переменного. Однако нам известно, что наличия частных про- изводных еще может оказаться недостаточно для дифференцируемости функ- ции многих переменных. Поэтому наряду с важными и вполне очевидными равенствами (Г), (2'), (3') особую роль в теоремах 1 и 2 приобретают утвер- ждения о существовании дифференциала соответствующего отображения. Заметим, наконец, что по индукции из равенства (2) можно получить со- отношение d(h /*)(*) = (h • • • WWi/iW + dfk{x) для дифференциала произведения (/i... /*) дифференцируемых вещественно- значных функций. 2. Дифференцирование композиции отображений а. Основная теорема Теорема 3. Если отображение f: X —> Y множества X С Rm в мно- жество Y С Кп дифференцируемо в точке х G X, а отображение д: Y —> 1R* дифференцируемо в точке у = f(x) G Y, то композиция д о f : X №к этих отображений дифференцируема в точке х, причем дифференциал d(g о /): TR™ —> композиции равен композиции dg(y) о df (х) дифференциалов df(x): TR™ rR;(l)=v, dg(y): TKJ TR$(ll).
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 435 Доказательство этой теоремы почти полностью повторяет доказательство теоремы 2 из § 2 гл. V. Чтобы обратить внимание на одну новую, появля- ющуюся теперь деталь, мы все же проведем еще раз это доказательство, не вдаваясь, однако, в уже разобранные технические подробности. ◄ Используя дифференцируемость отображений f и д в точках х и у = = f(x), а также линейность дифференциала д'(х), можно написать, что (9 ° /)(я + h) - (д о /)(z) = g(f(x + h)) - g(f(x\) = = </(№)) (/(х + h) - /(z)) + o(/(z + Л) - /(z)) = = 9'(y)(f'(x)h + o(/i)) + o(/(z + h) - /(z)) = = У(з/)(/'(я)Л) + g'(y)(o(h)) + o(/(z + h) - /(z)) = = (g'(y) ° + a(z; h), где p'Q/) ° f'(x) есть линейное отображение (как композиция линейных ото- бражений), а a(z; h) = д'(у) (o(h)) + o(/(z + h) - /(z)). Но, как показывают соотношения (17), (18) из § 1, g'(y)(o(h)) = o(h) при h -> О, /(z + h) — /(z) = f'(x)h + o(h) = O(h) 4- o(h) = O(h) при h -> 0 и o(f(x + h) - /(z)) = о(О(Л)) = о(Л) при h -> 0. Следовательно, a(z; h) = o(ti) + o(7i) = o(h) при h -> 0, и теорема доказана. ► Будучи переписана в координатной форме, теорема 3 означает, что если z — внутренняя точка множества X и = ................... = \dxfn{x) ... dmfn(x)J а у = /(z) — внутренняя точка множества Y и я'(у} = ••• дпрЧз/Л ......................... = (дз91]{у), \д\дк(у) • • dngk(y)J 15 Зорич В. А.
436 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ТО ^i(plo/)(®) ••• Om(glcf)(x) ^1(р* о/)(ж) ... дт(дк о f)(x) (di(gl ° = dig^y) ••• dng\y)\ digk(y) ... dngk(y)j dif^x) ... .................\ = &д1(у)-д^(х)). difn(x) ... dmfn(x)J В равенстве (di(g‘о/))(!) = (djg‘(f(x)) ft ?(z)) (4) справа имеется в виду суммирование по индексу j в пределах его изменения, т. е. от 1 до п. В отличие от равенств (!'), (2х), (3х), соотношение (4) нетривиально даже в смысле поэлементного равенства участвующих в нем матриц. Рассмотрим некоторые важные частные случаи доказанной теоремы. Ъ. Дифференциал и частные производные сложной вещественно- значной функции. Пусть z = д(у1, ..., уп) — вещественнозначная функция вещественных переменных у1, ... ,уп, каждое из которых в свою очередь есть функция yi = fifx1,, хт) (j = 1,..., п) переменных х1, ..., хт. В предпо- ложении дифференцируемости функций д и fi (j = 1,..., п) найдем частную производную — (х) композиции отображений f: X —> Y и д: Y — и X По формуле (4), в которой при наших условиях 1 = 1, находим Oi(g ° f)(x) = djg(J(x)) • difi(x) (5) или, в более подробной записи, &L(X) = д^9 ° Г), 1 . 9д дуп _ дх' дх' ’ ' ду1 дх' дуп дх' = дМ(х)) • dif1^ + ... + 9ng(f(x)) • difn(х). с. Производная по вектору и градиент функции в точке. Рас- смотрим установившийся поток жидкости или газа в некоторой области G пространства IR3. Термин «установившийся» означает, что скорость потока в каждой точке области G не меняется со временем, хотя в различных точ- ках области G она, разумеется, может быть различной. Пусть, например, /(х) = /(а1, х2, х3) — давление в потоке в точке х = (х1, х2, х3) G G. Если мы будем перемещаться в потоке по закону х = x(t), где t — время, то в момент t мы будем регистрировать давление (fox)(t) = f(x(t)). Скорость изменения
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 437 давления со временем вдоль нашей траектории, очевидно, есть производная (t) по времени от функции (/ о x)(t). Найдем ее в предположении, что (•( /(х1, х2, х3) — дифференцируемая в области G функция. По закону диффе- ренцирования композиции функций находим to dt ox1 ox* ox^ = (i = 1,2,3). at Поскольку (x1, x2, i3)(t) — v(t) есть вектор скорости нашего перемещения в момент t, a (dif, d^f, дз/)(х) есть координатная запись дифференциала df(x) функции f в точке х, то равенство (6) можно переписать также в виде ^^(t) = d/(x(t))v(t), (7) at т. е. искомая величина есть значение дифференциала df(x(t)) функции /(х) в точке x(t) на векторе v(t) скорости нашего движения. В частности, если при t = 0 мы были в точке хо = ж(0), то ^Ц-^(О) =</№,)», (8) at где v = v(0) — вектор скорости в момент t = 0. Правая часть соотношения (8) зависит только от точки хо G G и вектора v скорости, которую мы имеем в этой точке, и не зависит от конкретного вида траектории х = x(t), лишь бы было выполнено условие ±(0) = v. Это означает, что на любой траектории вида x(t) = х0 + vt + a(t), (9) где a(t) — o(f) при t —> 0, значение левой части равенства (8) будет одинаково, поскольку оно вполне определяется заданием точки хо и вектора v G , приложенного к этой точке. В частности, если бы мы хотели непосредственно вычислить значение левой (а значит, и правой) части равенства (8), то можно было бы в качестве закона движения выбрать функцию x(t) = Хо + vt, (10) отвечающую равномерному движению со скоростью v, при котором в момент t = 0 мы находимся в точке х(0) = хо- Дадим теперь следующее Определение 1. Если функция f(x) определена в окрестности точки xq G a v G ПИ™ — вектор, приложенный к точке xq, то величина (И) п к™ + vt) ~ Dvf(x0) .= lim----------t------- 15*
438 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ (если указанный предел существует) называется производной функции f в точке хо по вектору и. Из проведенных рассмотрений следует, что если функция f дифференци- руема в точке то, то при любой функции x(t) вида (9) и, в частности, вида (10) имеет место равенство Dvf(x0) = ^Ц^(О) = df(x0)v, (12) at что в координатном представлении означает D„/(zo) = ^-(zo)«I + ... + ^L(zo)«m. (13) ох1 охт В частности, для базисных векторов ei = (1,0,..., 0), ..., ет = (0, ..., 0,1) из этой формулы получаем Deif(xo) = ^г(хо) (г = 1, На основании равенства (12) в силу линейности дифференциала d/(xo) за- ключаем, что если f — дифференцируемая в точке хо функция, то для любых векторов «1, V2 Е TIR™ и любых Ai, Л2 Е IR функция имеет в точке то произ- водную по вектору (А1??1 4- A2v2) Е T1R™ и при этом W1+A2 «2 /Ы = AiPwl/(x0) 4- A2ru2/(xo). (14) Если пространство IR”1 рассматривать как евклидово пространство, т. е. как векторное пространство со скалярным произведением, то (см. § 1) любую линейную функцию L(v) можно будет записать в виде скалярного произведе- ния (£, и) фиксированного вектора £ = £(L) и переменного вектора и. В частности, найдется- вектор £ такой, что df(x0)v = <£,v>. (15) Определение 2. Вектор £ Е TIR^, отвечающий в смысле равенства (15) дифференциалу df(xo) функции f в точке хо, называется градиентом функции в этой точке и обозначается символом grad /(#о)- Итак, по определению d/(x0)v = (grad/(zo),v). (16) Если в IRm выбрана декартова система координат, то, сопоставляя соотно- шения (12), (13) и (16), заключаем, что в такой системе координат градиент имеет следующее координатное представление: grad/(z0)= (|£, -^)(x0). (17)
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 439 Выясним теперь геометрический смысл вектора grad/(xo). Пусть е е TIR™ — единичный вектор. Тогда в силу (16) DefM = | grad/(х0)| cos </?, (18) где tp — угол между векторами е и grad/(xo). Таким образом, если grad/(xo) / 0 и е = || grad/(^о) II-1 grad/(xo), то про- изводная Х>е/(хо) принимает наибольшее значение. То есть скорость роста функции f (выраженная в единицах величины f, отнесенных к единице длины в IR”1) при движении из точки а?о максимальна и равна || grad/(zo) It когда мы смещаемся именно в направлении вектора grad /(#o)- При смещении в проти- воположном направлении значения функции наиболее резко уменьшаются, а при смещении в направлении, перпендикулярном вектору ^rad/(xo), скорость изменения значений функции равна нулю. Производную по единичному вектору данного направления обычно назы- вают производной по данному направлению. Поскольку единичный вектор в евклидовом пространстве задается напра- вляющими косинусами: е = (cosai, ..., cosam), где щ — угол, который вектор е образует с базисным вектором ег декартовой системы координат, то Def(xo) = (grad/(x0),e) = df . ч Of , ч cos а, + . . . + cosam- Вектор grad /(^о) встречается очень часто и имеет многочисленные приме- нения. Например, на отмеченном выше геометрическом свойстве градиента основаны так называемые градиентные методы численного (на ЭВМ) поиска экстремумов функций многих переменных. (См. в этой связи задачу 2 в конце параграфа.) Многие важные векторные поля, как, например, ньютоновское поле сил тя- готения или кулоновское поле заряда, являются градиентами некоторых ска- лярных функций — потенциалов этих полей (см. задачу 3). Многие физические законы в самой своей формулировке используют век- тор grad/. Например, в механике сплошной среды эквивалентом основного закона Ньютона та = F динамики точки является соотношение pa — — gradp, связывающее ускорение а = а(ж, t) в потоке свободной от внешних сил идеаль- ной жидкости или газа в точке х в момент t с плотностью среды р = p(x,t) и градиентом давления р = р(я,£), отнесенными к этой же точке и к этому же моменту времени (см. задачу 4). О векторе grad / мы еще будем говорить позже, при изучении векторного анализа и элементов теории поля.
440 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 3. Дифференцирование обратного отображения Теорема 4. Пусть f: U(x) -» V(y) — отображение окрестности U(х) С С К"1 точки х на окрестность V(y) С К.”1 точки у = f(x). Пусть f непре- рывно в точке х и имеет обратное отображение : V (у) U(х), непре- рывное в точке у. Если при этом отображение f дифференцируемо в точке х и касательное к f в точке х отображение f(x): Т1&™ -> TRJ1 имеет обратное отобра- жение [/'(х)]-1: TRJ1 —> TRJ1, то отображение f~v ‘ V(y) U(x) диффе- ренцируемо в точке у = f(x) и справедливо равенство Таким образом, взаимно обратные дифференцируемые отображения име- ют в соответствующих точках взаимно обратные касательные отображения. ◄ Положим f&) = у, f(x + h) = y + t, t - f(x 4- h) - /(x); тогда /-1(j/) = x, + = x + h, Л = /-1(у4-«)-/-1(у). Будем предполагать, что h столь мало, что х + Л G С7(х), а значит, у 4-1 Е е W Из непрерывности / в х и / 1 в г/ следует, что i = /(х 4- Л) — /(х) -> 0 при h -> 0 (1) и h = + *) ~ /-1(2/) "> 0 при £-»0. (2) Из дифференцируемости f в точке х следует, что t = ff(x)h 4- o(h) при h -> 0, (3) т. е. можно утверждать даже, что t = O(h) при h -> 0 (см. соотношения (17), (18) из § 1). Покажем, что если /'(х) — обратимое линейное отображение, то и h = O(t) при t —> 0. В самом деле, из (3) последовательно получаем [/'(ж)]— 1 i = h 4- [/'(20]-1о(Л) при h -> 0,- (4) [/'(я)] 1t = h 4- о(Л) при h -> 0, ||[/'(*)]~М > INI - ||о(Л)|| при Л->0, 'W] "МН INI при
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 441 где число <5 > 0 выбрано так, что ||о(Л)|| < ^||h|| при ||Л|| < 5. Тогда с учетом i соотношения (2) находим ||Л|| < 2||[/'«]'*t|| = O(||i||) при t-> О, что равносильно соотношению h — 0(t) при t —» 0. Отсюда, в частности, следует, что o(h) = o(t) при t -> 0. Учитывая это, из (2) и (4) получаем h = [/'(я)]-1* 4- o(t) при t -> О или /-1(У+ *) -= [Л^)]-1*+ о(*) при i->0. ► Из алгебры известно, что если линейному преобразованию L: Rm —» Rm отвечает матрица А, то обратному к L линейному преобразованию L-1: lRm —> -> соответствует матрица А-1, обратная к матрице А. Построение эле- ментов обратной матрицы также известно из алгебры, следовательно, дока- занная теорема дает прямой рецепт для построения отображения (/“1)/(у)- Отметим, что при т = 1, т. е. при Rm = R, якобиан отображения f: U(x) -> V(y) в точке х сводится к одному числу /'(я) — производной функ- ции f в точке х, а линейное преобразование /'(ж) : TRZ —> сводится к умножению на это число: h »-> f'(x)h. Это линейное преобразование обра- тимо тогда и только тогда, когда /'(х) 0 0, причем матрица обратного пре- образования [/'(т)]-1: ТКу -> ТЯс также состоит из одного числа, равного [/'(х)]-1, т. е. обратного к /'(я). Значит, теорема 4 содержит в себе также доказанное ранее правило отыскания производной обратной функции. Задачи и упражнения 1. а) Два пути t •-> t •-> ®г(<) в Rm будем считать эквивалентными в точке 6 Rm, если ®i(0) = ®г(0) = Хо и d(xi(t),X2(t)) — o(t) при t -> 0. Проверьте, что указанное отношение действительно является отношением экви- валентности, т. е. оно рефлексивно, симметрично и транзитивно. Ь) Проверьте, что между векторами v G TR^J, и классами эквивалентных в точке гладких путей имеется взаимно однозначное соответствие. с) Отождествляя касательное пространство TR£J, с множеством классов эквива- лентных в точке хо G Rm гладких путей, введите операции сложения классов путей и умножения их на число. d) Проверьте, зависят ли введенные вами операции от системы координат в Rm.
442 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 2. а) Изобразите график функции z — х2 + 4р2, где (х, y,z) — декартовы коорди- наты bR3. b) Пусть f: С —> R — числовая функция, определенная в области G С R™. Уров- нем (с-уровнем) функции называется множество Е С G, на котором функция при- нимает одно значение (f(E) = с). Точнее, Е = f~r(c). Изобразите в R2 уровни функции, указанной в а). с) Найдите градиент функции f(x, у) = х2 + 4у2 и проверьте, что в любой точке (х,у) вектор grad/ ортогонален линии уровня функции /, проходящей через эту точку. d) Используя результаты задач а), Ь), с), проложите на поверхности z = х2+4у2 самый короткий, на ваш взгляд, маршрут спуска из точки (2,1,8) поверхности в низшую ее точку (0,0,0). е) Какой алгоритм, пригодный для ЭВМ, вы могли бы предложить для отыскания минимума функции f(x, у) = х2 + 4у2? v 3. Говорят, что в области G пространства Rm задано векторное поле, если ка- ждой точке х € G сопоставлен некоторый вектор v(x) G TR™. Векторное поле v(x) в G называется потенциальным, если в области G есть числовая функция U: G -4 R такая, что v(x) = gradt7(x). Функцию U(x) называют потенциалом поля v(x). (В физике потенциалом обычно называют функцию — U(x), а функцию U(x) на- зывают силовой функцией, если речь идет о поле сил.) а) Изобразите на плоскости с декартовыми координатами (х,у) поле grad/(x,p) для каждой из функций /1(х, у) - х2+у2; fz(x,y) = ~(х2+у2); /з(х,у) = arctg (х/р) в области у > 0; /д(х, у) — ху. Ь) Согласно закону Ньютона частица массы тп, находящаяся в точке 0 G R3, притягивает частицу массы 1, находящуюся в точке х G R3 (х / 0), с силой F = = —тп|г|~3г, где г — вектор Ох (размерную постоянную G мы опустили). Покажите, что векторное поле F(x) в R3 \ 0 потенциально. с) Проверьте, что массы тп,, (г = 1, ..., п), помещенные в точках (&,7/»,С») (г — — 1, ..., п) соответственно, создают вне этих точек ньютоновское поле сил, потен- циалом которого служит функция у,*) = 52 •/; / \2, / • V(® -&)2 + (у- гц)2 + (2 - Ci)2 d) Укажите потенциал кулоновского электростатического пода напряженности, создаваемого точечными зарядами qi (г = 1, ..., п), помещенными в точках (&, т/», С») (г = 1, ..., п) соответственно. 4. Рассмотрим движение идеальной несжимаемой жидкости в пространстве, сво- бодном от внешних (в том числе и гравитационных) сил. Пусть v = v(x,y,z,t), а = a(x,y,z,t), р = p(x,y,z,t), р = p(x,y,z,t) суть соответственно скорость, ускорение, плотность и давление в точке (х, у, z) среды в момент времени t. Идеальность жидкости означает, что давление в любой ее точке не зависит от направления. а) Выделите из жидкости объем в виде небольшого параллелепипеда, одно из ре- бер которого параллельно вектору gradp(x,p, z,t) (где gradp берется по простран- ственным координатам). Оцените действующую на объем за счет перепада давления
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 443 силу и дайте приближенную формулу для ускорения этого объема, считая жидкость несжимаемой. Ь) Проверьте, согласуется ли полученный вами в а) результат с уравнением Эйлера р&= — gradp. с) Линия, в любой точке которой касательная имеет направление вектора'скоро- сти в этой точке, называется линией тока. Движение называется установившимся, если функции v, а, р, р не зависят от t. Используя Ь), покажите, что вдоль ли- ний тока в установившемся потоке несжимаемой жидкости величина | ||v||2 + р/р Л постоянна (закон Бернулли^). d) Как изменятся формулы в а) и Ь), если движение будет происходить в поле тяжести вблизи поверхности Земли? Покажите, что в этом случае р& = — grad(gz +р) и потому вдоль каждой линии тока установившегося движения несжимаемой жид- кости на сей раз постоянна величина ^||v||2 + 9Z + р/р, где 9 ~ ускорение силы тяжести, a z — высота точки линии тока, отсчитываемая от некоторого нулевого уровня. е) Объясните на основании предыдущих результатов, почему несущее крыло име- ет характерный выпуклый вверх профиль. f) В цилиндрический стакан с круглым дном радиуса R налита до уровня h несжимаемая идеальная жидкость плотности р. После этого стакан стали вращать вокруг его оси с угловой скоростью ш. Используя несжимаемость жидкости, найдите уравнение z — f(x,y) ее поверхности в установившемся режиме (см. также задачу 3 из гл. V, § 1). g) По найденному в f) уравнению z — f(x,y) поверхности напишите формулу р — р(х, у, z) для давления в любой точке (х, у, z) объема, заполненного вращающейся жидкостью. Проверьте, выполнено ли для найденной вами формулы полученное в d) уравнение pa = — grad(<?z + р). h) Не могли бы вы теперь объяснить, почему чаинки тонут (хотя и не слишком быстро!), а при вращении чая собираются не у стенок стакана, а в центре дна? 5. Оценка погрешностей вычисления значений функции. а) Используя определение дифференцируемой функции и приближенное равен- ство Af(x,h) ~ df(x)h, покажите, что относительная погрешность 6 = 6(f(x);h) в значении произведения f(x) = х1... хт т отличных от нуля сомножителей, вы- званная погрешностями в задании самих сомножителей, может быть найдена в виде m <5 ~ 52 гДе ~ относительная погрешность задания г-го сомножителя. i=i Ь) Используя то, что din/(я) = —d/(z), еще раз получите результат преды- f\X) дущей задачи и покажите, что вообще относительную погрешность дроби — (ал, ...,хт) 91“-9k *)Д. Бернулли (1700—1782) — швейцарский ученый, один из наиболее выдающихся фи- зиков и математиков своего времени.
444 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ можно найти как сумму относительных погрешностей значений функций fa, ..., fn, 9i, , 9k- 6. Однородные функции и тождество Эйлера. Функция f: G —> R, определенная в некоторой области G С Rm, называется однородной {положительно однородной) степени п, если для любых х 6 Rm и А € R таких, что х G G и Ах G G, имеет место равенство f(Xx) = Хп f(x) (f(Xx) = |А|“/(»)). Функция называется локально однородной степени п в области G, если она явля- ется однородной функцией указанной степени в некоторой окрестности любой точки области G. а) Докажите, что в выпуклой области всякая локально однородная функция явля- ется однородной. Ь) Пусть область G есть плоскость R2 без луча L — {(х, у) € R2 | х = 2 Л у 0}. Проверьте, что функция /(»,»)=( у*’ У если х > 2 Л у > 0, в остальных точках области, локально однородна в G, но не является однородной функцией в этой области. с) Укажите степень однородности или положительной однородности следующих функций, рассматриваемых в их естественной области определения: / /л.1 ~т\ _ л.1-2 1 1 I -.тп— 1гп. /1 (X , . . . , X ) — хх+хх+...+х X , д.1^,2 1 —.3 м4 f (пЛ _ хх 4~ х х _ J2 (,х , X , X , X ) — . Л о . 9 о Л , ®1дг2х3 4- х2х3х4 fa{x\ ... ,хт) = lx1... х™!2. d) Продифференцировав равенство f{tx) = tnf{x) по t, покажите, что если диф- ференцируемая функция f: G -> R локально однородна степени п в области G С Rm, то она удовлетворяет в G следующему тождеству Эйлера для однородных функций: „1 f_l „т\ 1 1 („Л ~т\ _ „{(„I Х дх1 Х X ) + ...+ X , • • • 5 х ) — nf 5 , х ). е) Покажите, что если для дифференцируемой в области G функции f : G —> -> R выполнено тождество Эйлера, то эта функция локально однородна степени п в области G. У казание. Проверьте, что функция <p{t) — t~nf{tx) при любом х G G опреде- лена и постоянна в некоторой окрестности единицы. 7. Однородные функции и метод размерности. 1° Размерность физической величины и особенности функциональных связей между физическими величинами. Физические законы устанавливают взаимосвязи физических величин, поэтому если для некоторых из этих величин принять какие-то единицы измерения, то едини- цы измерения связанных с ними других величин будут определенным образом выра- жаться через единицы измерения фиксированных величин. Так возникают основные и производные единицы той или иной системы единиц измерения. В системе СИ (Systeme International) за основные механические единицы изме- рения приняты единицы длины — метр (м), массы — килограмм (кг) и времени — секунда (с).
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 445 Выражение производной единицы измерения через основные называется ее раз- мерностью. Это определение ниже будет уточнено. Размерность любой механической величины записывают символически в виде формулы, выражающей ее через предложенные Максвеллом1) символы L, М,Т раз- мерностей указанных выше основных единиц. Например, размерности скорости, ускорения и силы имеют соответственно вид [v] = LT~1, [а] = LT-2, [F] = MLT-2. Если физические законы не зависят от выбора единиц измерения, то отражени- ем этой инвариантности должны быть определенные особенности функциональной зависимости = (*) между числовыми характеристиками физических величин. Рассмотрим, например, зависимость с — /(а, 6) = >/а2 4- Ь2 между длинами кате- тов и длиной гипотенузы прямоугольного треугольника. Изменение масштаба длин должно одинаково сказаться на всех длинах, поэтому для любых допустимых зна- чений а и & должно быть выполнено соотношение f(aa,ab) — ^(а)/(а,Ь), причем в нашем случае ^(а) = а. Основная (на первый взгляд очевидная) предпосылка теории размерности состо- ит в том, что претендующая на физическую значимость зависимость (*) должна быть такой, чтобы при изменении масштабов основных единиц измерения числен- ные значения всех одноименных величин, участвующих в формуле, менялись в одно и то же число раз. В частности, если xi, х2) хз — основные независимые физические величины и (®1,я2,хз) /(®1 ,Х2,хз) — зависимость от них некоторой четвертой физической величины, то, в силу сформулированного принципа, при любых допустимых значе- ниях Xi, х2, хз должно быть выполнено равенство /(а1Х1,Л2®2,азхз) = <p(ai,a2,a3)/(х1,х2,хз), (**) с некоторой конкретной функцией tp. Функция <р в равенстве (**) полностью характеризует зависимость численного значения рассматриваемой физической величины от изменения масштабов основных фиксированных физических величин. Таким образом, эту функцию и следует счи- тать размерностью данной физической величины по отношению к фиксированным основным единицам измерения. Уточним теперь вид функции размерности. а) Пусть х >-> /(х) — функция одного переменного, удовлетворяющая условию У (ах) = <р(а)/(х), где f и <р — дифференцируемые функции. Покажите, что <р(а) = ad. b) Покажите, что функция размерности р в равенстве (**) всегда имеет вид а*1 • а^2 • аз3’ гДе показатели степени di, di, дз суть некоторые действительные числа. Таким образом, если, например, фиксированы основные единицы L, М, Т, г)Дж. К. Максвелл (1831—1879) — выдающийся английский физик; создал математи- ческую теорию электромагнитного поля, известен также исследованиями по кинетической теории газов, оптике и механике.
446 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ то набор (di,d2,d3) показателей в степенном выражении LdlMd2Td3 также можно считать размерностью данной физической величины. с) В Ь) было получено, что функция размерности всегда имеет вид степенной зависимости, т. е. является однородной функцией определенной степени по каждой из основных единиц измерения. Что означает, что степень однородности функции размерности некоторой физической величины по отношению к одной из основных единиц измерения равна нулю? 2° П-теорема и метод размерности. Пусть [ar»] = Xi (г = 0,1, ..., п) — размерности физических величин, участвую- щих в законе (*). Предположим, что размерности величин хо, , хп могут быть выражены через размерности величин xi, ... , Xk, т. е. М = = хг»... х?. [»*+,) = Xi+, = Х* ... Хгк‘, (1 = 1....,»- к). d) Покажите, что тогда наряду с (*) должно быть справедливо соотношение а1° • • • ak0 = , akXk, aP1... aj1 xfc+i, ... , аРп~к ... аРкп~кхп)- (*♦*) е) Если xi, ... , Xk независимы, то в (♦**) можно положить оц = хг \ ..., а*. = = xjT1. Проверьте, что при этом из (***) получается равенство Хр ХР° rP° *1 • • лк xp'... x* ’ 1 к ₽n-fe • - Хк являющееся соотношением П =/(1, ..., 1, П1, ..., nn_fc) (****) между безразмерными величинами П, П1, ... , Пп_*;. Таким образом, получается следующая П-теорема теории размерности. Если в соотношении (*) величины xi,...,x*; независимы, то это соотношение сводится к функции (♦***) от п — к безразмерных параметров. f) Проверьте, что если к = п, то на основании П-теоремы функция f из соот- ношения (*) может быть найдена с точностью до числового множителя. Найдите таким путем выражение с(<ро)\/l/g для периода колебаний маятника (т. е. подве- шенной на нити длины I массы т, качающейся у поверхности Земли; <ро — начальный угол отклонения). g) Найдите формулу Р — с \/mr/F для периода обращения тела массы тп, удер- живаемого на круговой орбите центральной силой величины F. Ь).Из закона Кеплера (Р1/Р2)2 — (п/гг)3, устанавливающего в применении к кру- говым орбитам связь между отношением периодов обращения планет (спутников) и отношением радиусов их орбит, найдите, вслед за Ньютоном, показатель степени а »-i fTli7Tl2 в законе г = G-----всемирного тяготения.
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 447 f(x + h)-f(x) = f'®h. § 4. Основные факты дифференциального исчисления вещественнозначных функций многих переменных 1. Теорема о среднем Теорема 1. Пусть f : G -> R — вещественнозначная функция, опре- деленная в области G С Пусть отрезок [х,х 4- h] с концами х, х + h содержится в G. Если при этих условиях функция f непрерывна в точках отрезка [ж, а: 4-Л] и дифференцируема в точках интервала ]rr,a; + h[, то най- дется такая точка £ G ]х,х 4- Л[, что имеет место равенство (1) ◄ Рассмотрим вспомогательную функцию F(t) = f(x + ^), определенную на отрезке 0 t 1. Функция F удовлетворяет всем условиям теоремы Лагранжа: она непрерывна на [0,1], как композиция непрерывных отображений, и дифференцируема в интервале ]0,1[, как композиция диффе- ренцируемых отображений. Следовательно, найдется точка 0 € ]0,1[ такая, что F(l) - F(0) = F'w • 1. Но F(l) = f(x4-Л), F(0) = f(x), F'(0) = f'(x + 01i)h и, значит, выделенное равенство совпадает с утверждением теоремы 1. ► Приведем теперь координатную форму записи соотношения (1). Если х = (ж1, ..., хт), h = (h1, ..., hm) и £ = (ж1 4- Oh1, ..., хт 4- 0hm), то равенство (1) означает, что f(x + h) - f(x) = /(т1 + h1, ..., х™ + hm) - f(x\ ...,xm) = = diftQh1 + ... + dmf(£)hm = £ dif(xl + eh1,..., xm + 0hm) h1. 1=1 Используя соглашение о суммировании по повторяющемуся сверху и снизу индексу, окончательно можно записать fix1 + Л1,..., хт + Лт) - f(x\ ..., хт) = = dif(x1 + 0h1,...,xm + ehm)hi, ‘(Г) где 0 < 0 < 1, причем 0 зависит и от х, и от h.
448 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Замечание. Теорема 1 называется теоремой о среднем в связи с тем, что существует некоторая «средняя» точка £ 6 ]я, я + Л[, в которой выполняет- ся равенство (1). Мы уже отмечали при обсуждении теоремы Лагранжа (см. гл. V, § 3, п. 1), что теорема о среднем специфична именно для вещественно- значных функций. Общая теорема о конечном приращении для отображений будет доказана в главе X (часть II). Из теоремы 1 вытекает полезное Следствие. Если функция f: G —> К дифференцируема в области G С С lRm и в любой точке х е G ее дифференциал равен нулю, то f постоянна в области G. ◄ Равенство нулю линейного отображения равносильно обращению в нуль всех элементов отвечающей ему матрицы. В нашем случае df(x)h = (dif,..., dmf)(x)h, поэтому dif(x) = ... = dmf(x) = 0 в любой точке х € G. По определению, область есть открытое связное множество. Воспользуем- ся этим. Покажем сначала, что если х G G, то в шаре В(х;г) С G функция f по- стоянна. Действительно, если (х 4- h) € В(х;г), то и [я, х 4- /г] С B(x;r) С G. Применяя соотношение (1) или (1'), получаем f(x 4- /г) - f(x) = = 0 • h = 0, т. е. f(x 4- h) = f(x) и значения f в шаре В(х; г) совпадают со значением f в центре этого шара. Пусть теперь xq, Xi € G — произвольные точки области G. В силу связ- ности G найдется путь t н-> x(t) € G такой, что я(0) = х0, я(1) = xi. Мы предполагаем, что непрерывное отображение t x(t) определено на отрезке 0 t 1. Пусть В(хо’,г) — шар с центром в хо, содержащийся в G. Посколь- ку z(0) = хо и отображение t x(t) непрерывно, найдется положительное число д такое, что x(t) G В(хо;г) С G при 0 t 5. Тогда по доказанному (/ oz)(t) = f(xo) на промежутке [0,(5]. Пусть I = sup (5, где верхняя грань берется по всем числам (5 € [0,1] таким, что (/ о x)(t) = f(xo) на промежутке [0,(5]. В силу непрерывности функции f(x(t)) имеем f(x(l)) = f(xo)- Но тогда I — 1. Действительно, в противном случае можно было бы взять некоторый шар B(z(Z);r) С G, в котором f(x) = = = /(яо), затем в силу непрерывности отображения t x(t) найти А > 0 так, что x(t) € В(ж(/);г) при I t I 4- А. Тогда (j ox)(t) = /(я(/)) = = /(яо) ПРИ 0 Z 4- А и I sup (5. Итак, показано, что (f ox)(t) = f(xo) при любом t € [0,1]. В частности, (/oz)(l) = f(xi) = f(xo) и мы проверили, что в любых двух точках xq, Xi gG значения функции f : G —> 1R совпадают. ►
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 449 2. Достаточное условие дифференцируемости функции многих переменных Теорема 2. Пусть f: U(x) -> R — функция, определенная в окрестно- сти U(x) с Rm точки х = (ж1,..., хт). Если функция f имеет в каждой точке окрестности U(x) все частные df дхт ’ производные . то из их непрерывности в точке х следует диф- ференцируемость функции f в этой точке. ◄ Без ограничения общности будем считать, что U(x) является шаром В(ж;г). Тогда вместе с точками х = (ж1, ..., хт), x + h = (жх4- /г1, ..., жт4-/гт) области U(ж) должны принадлежать также точки (ж1, ж2 4- h2, ..., хт + hm), ... , (ж1, ж2, , жт-1, хт 4- hm) и соединяющие их отрезки. Воспользуемся этим, применяя в следующей выкладке теорему Лагранжа для функций одной переменной: /(ж + /г) - /(ж) = /(?4 h1, ..., хт 4- hm) - /(ж1,..., жт) = = /(г1 + h1,..., хт + Лт) - /(х1, х2 + h2,..., хт + Лт) + + /(х1,х2 + h2,, хт + Лт) - /(ж1, х2, ж3 + Л3,..., хт + Лт) + ... ... + /(ж1, ж2,..., х"1-1, хт + hm) - }(х\ ..., жга) = = dlf(x1 + 9lh1,x2 + h2,...,xm + hm)h1 + + difkx1, х2 + 92h2,x3 + h3,..., хт + hm)h2 + ... ... + dnJlx1, ж2,..., xm~l, xm + 9mhm)hm. Пока мы воспользовались лишь наличием у функции f в области U(ж) част- ных производных по каждой из переменных. Теперь воспользуемся их непрерывностью в точке ж. Продолжая предыду- щую выкладку, получаем, что /(ж 4- Л) - /(ж) = ^/(ж1,..., ж™) Л14- -ЬдгЛж1, ...,жт)/г2 + а2Л2 + ... ... + dmf(x1,...,xm)hm + amhm, где величины cti, ..., ат в силу непрерывности частных производных в точке ж стремятся к нулю при h —> 0. Но это означает, что /(ж 4- /г) — /(ж) = L(x)h 4- o(h) при h -> 0, где L(x)h = ^/(ж1,...,ж™)/? 4-... 4- ^/(ж1,...,xm)hm. ► Из теоремы 2 следует, что если частные производные функции f: G -> R непрерывны в области G С Rm, то функция дифференцируема в любой точке этой области.
450 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Условимся в дальнейшем через или, проще, через C^(G) обо- значать множество функций, имеющих в' области G непрерывные частные производные. 3. Частные производные высшего порядка. Если функция f: G -> -> R, определенная в некоторой области G С Кт, имеет частную производную —(ж) по одной из переменных ж1, .. хт, то эта частная производная вновь является некоторой функцией dif : G —> R, которая в свою очередь может иметь частную производную dj(dif)(x) по некоторой переменной ж-7. Функция dj(dif) : G —> R называется второй производной от функции f по переменным хг, х? и обозначается одним из символов ОХ3 охг Порядок индексов указывает, в каком порядке производится дифференци- рование по соответствующим переменным. Мы определили частные производные второго порядка. Если определена частная производная дп..л^(.х) - dxil dxik (*) порядка к, то по индукции определяем частную производную порядка к + 1 соотношением Здесь возникает специфический для случая функций многих переменных вопрос о том, влияет ли порядок дифференцирований на вычисляемую част- ную производную. Теорема 3. Если функция f : G —> К имеет в области G частные производные d2f ( . d2f дх'дх^' дхздх^' то в любой точке х € G, в которой обе эти производные непрерывны, их значения совпадают. ◄ Пусть х € G — точка, в которой обе функции dijf: G —> R, djif: G -> Ж непрерывны. Дальнейшие рассмотрения будем проводить в некотором шаре В(х; г) с G, г > 0, являющемся выпуклой окрестностью точки х. Мы хотим проверить, что —(Х1 ж">) = (д1 ж">) дх‘дх^ ’ dxidx'{ ’ Поскольку во всех дальнейших выкладках меняться будут только перемен- ные хг и ж-7, то мы для сокращения записи предположим, что / есть функция
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 451 двух переменных /(ж1, ж2), и нам надо проверить, что d2f 7 1 24 _ d2f ( 1 24 ’х ) “ дх^х'(ж ’х если в точке (ж1, i2) Е R2 обе указанные функции непрерывны. Рассмотрим вспомогательную функцию Ffji1, h2) = /(ж1 4- /г1, х2 + /г2) - /(ж14- /г1, х2) - /(ж1, х2 + /г2) 4- /(ж1, х2), где смещение h = (/г1, h2) предполагается достаточно малым, а именно таким, что х 4- h Е В(ж;г). Если F^1, h2) рассмотреть как разность F(h1,/г2) = </?(1) — </?(0), где tp(t) = /(ж14-^/г1, ж24-Л2) — /(ж14-^Л1, ж2), то по теореме Лагранжа найдем, что F(A\ h2) = <p'(0i) = (dif(x14- 0iЛ1, x2 4- h2) — dif(x1 4- 01Л1, x2))^1. Применяя к последней разности вновь теорему Лагранжа, найдем, что F^h2) = d2if(x1 + 01h1,x2 + 02h2)h2h1. (2) Если теперь Ffh1, /г2) представить в виде разности F(h\ h2) = £(1) - £(0), где <p(t) = /(ж1 4- /г1, х2 4- th2) — /(ж1, х2 4- th2), то аналогично найдем, что F(7?, h2) = duflx1 + 0ih\ x2 4- 02h2)hrh2. (3) Сравнивая равенства (2) и (3), заключаем, что fynfix1 4- Oih1, ж2 4- 02h2) = 4- Oih1, x2 4- fah2), (4) где 0i, 02, 01, 02 € ]0,1[. Воспользовавшись непрерывностью рассматривае- мых частных производных в точке (ж1, ж2) при h —> 0, из (4) получаем нужное равенство ^i/C®1,®2) = Яп/С®1,®2)- ► Заметим, что без каких-либо дополнительных предположений, вообще го- воря, нельзя утверждать, что справедливо равенство dijf(x) = djif(x), если обе указанные частные производные определены в точке ж (см. задачу 2 в конце параграфа). Договоримся в дальнейшем через C^k\G; К) или C^k\G) обозначать мно- жество функций f: G —> К, все частные производные которых до порядка к включительно определены и непрерывны в области G С .
452 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В качестве следствия теоремы 3 получаем Утверждение 1. Если f Е C^(G;^t), то значение dix...ihf(x) част- ной производной не зависит от порядка ti, ..., i* дифференцирования, т. е. остается тем же при любой перестановке индексов ti, ..., г*. ◄ В случае к = 2 это утверждение содержится в теореме 3. Предположим, что утверждение справедливо до порядка п включительно. Покажем, что тогда оно справедливо и для порядка п 4-1. Но di1i2...in+1f(x) = dil(di2...in+if)(x). Индексы г2, ..., гп+1 по предположе- нию индукции можно переставлять, не меняя функции ^»2..лп+1/(ж), а следова- тельно, и функции Поэтому достаточно проверить, что можно переставлять также, например, индексы ii и г2, не меняя значения производ- ной dili2...in+1f(x). Поскольку то возможность этой перестановки непосредственно вытекает из теоремы 3. В силу принципа индукции утверждение 1 доказано. ► Пример 1. Пусть/(я) =/(я1, я2) — функция класса (7К). Пусть h = (Л1, /г2) таково, что отрезок [я, х -I- /г] содержится в области G. Покажем, что функция 9?(t) = f(x + определенная на отрезке [0,1], принадлежит классу [0,1], и найдем ее про- изводную по t порядка к. Имеем <//(£) = faffx1 4- thr,x2 4- th^h14- 4- th1,x2 4- th2)h2, <p"(t) = dnf(x 4- ttyh^h14- d2i f(x 4- ttyh^h14- 4- d12f(x 4- ttyhth2 4- d22f(x 4- th)h2h2 = = dnf(x 4- th)^1)2 4- 2di2/(a: 4- thjhHi2 4- 922/(x 4- th)(h2)2. Эти соотношения можно записать в форме действия оператора (Л1^ 4- /г2д2) на функцию: ^(t) = (Л1^ 4- h2d2)f(x 4- th) = h'diffx 4- th), y>”(t) = (Л1^ 4- h2d2)2f(x 4- th) = h4i3 dili2f(x 4- th). По индукции получаем ^(*)(t) = (h1d1 4- h2d2)kf(x + th) = h*'... h^ d^.ijtx 4- th) (справа имеется в виду суммирование по всевозможным наборам ii, ..., г* из к индексов, каждый из которых принимает значения 1 или 2).
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 453 Пример 2. Если f(x) — /(ж1,..., хт) и f 6 C^(G', R), то, в предпо- ложении, что [я, х 4- h] С G, для функции <p(t) = f(x 4- th), определенной на отрезке [0,1], получаем ^(*)(t) = h'1... hik div..ikf(x 4- th), (5) где справа имеется в виду суммирование по всевозможным наборам индексов «1, ..., ik, каждый из которых может принимать любое значение от 1 до т включительно. Формулу (5) можно записать также в виде <pW(t) = (Л1 di 4-... 4- hmdm)kf(x 4- th). (6) 4. Формула Тейлора Теорема 4. Если функция f: U(x) —> R определена и принадлежит классу С(п\и(х)',№) в окрестности U(x) С Rm точки х G Rw, а отрезок [ж, х 4- А] полностью содержится в U(x), то имеет место равенство /(ж14- h1, ..., xm 4- hm) - /(ж1,..., xm) — п—1 = У 1 (fe1^ + ... + hmdm)kJ(x) + rn_! (x; h), * A! Л=1 где i /fl _ f\n-l L----. + hmdm)nf(x 4- th) dt. (n- 1)! о (7) (8) Равенство (7) совместно с соотношением (8) называется формулой Тейлора с интегральной формой остаточного члена. ◄ Формула Тейлора (7) немедленно следует из соответствующей формулы Тейлора для функции одной переменной. В самом деле, рассмотрим вспомо- гательную функцию 4- th), которая в силу условий теоремы 4 определена на отрезке 0 t 1 и (как мы проверили выше) принадлежит классу С*(п)[0,1]. Тогда при т € [0,1] в силу формулы Тейлора для функций одной переменной можно записать, что <р(т) = ^(0) 4- ~ ^(0) т 4-... 4- 2 1)1 ^(П-1) (°)тП-1 + + 0
454 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Полагая здесь т = 1, получаем 1 Р(1) = ?(0) + ±</(0) +... + + у*>(n) Wdt- W О Подставляя в полученное равенство, в соответствии с формулой (6), зна- чения ^*)(0) = (/?di + ... + hmdm)kf(x) (к = 0,..., п - 1), ^(n)(t) = (h1^ + ... + hmdm)nf(x + th), получаем то, что и утверждает теорема 4. ► Замечание. Если вместо интегральной формы остаточного члена в со- отношении (9) написать остаточный член в форме Лагранжа, то из равенства ¥>(1) = v(0) + 1 </(0) + ... + 1 </п>(0), где 0 < 0 < 1, получается формула Тейлора (7) с остаточным членом r^x-.h) = 1(^9, + ... + hmdm)nf(x + eh). (10) П! Эту форму остаточного члена, так же как и в случае функций одной пере- менной, называют формой Лагранжа остаточного члена формулы Тейлора. .Коль скоро f € C^(t7(x);IR), то из (10) следует, что гп_1(ж;Л) = 1(Л1Э1 + ... + Л’"Эт)"/(а:) + о(||Мп) при h -> О, поэтому имеет место равенство /(ж1 + h\ ...,хт + hm) - /(ж1,..., хт) = п = ЕA^ai + .-.+A^j^M+odi/iii") пРи h->o, (п) К1 к=1 называемое формулой Тейлора с остаточным членом в форме Пеано. 5. Экстремумы функций многих переменных. Одним из важней- ших применений дифференциального исчисления является его использование для отыскания и исследования экстремумов функций. Определение 1. Говорят, что функция /: Е —> К, определенная на множестве Е С Rm, имеет локальный максимум (локальный минимум) во вну- тренней точке Xq множества Е, если существует окрестность U(xq) С Е точки Xq такая, что f(x) f(xo) (соответственно, f(x) /($о)) при х G U(x0). Если при х G U(xq)\xo имеет место строгое неравенство f(x) < f(xo) (или, соответственно, f(x) > f(xo)), то говорят, что функция имеет в точке хо строгий локальный максимум (строгий локальный минимум).
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 455 Определение 2. Локальные минимумы и локальные максимумы функ- ции называют ее локальными экстремумами. Теорема 5. Пусть функция f: U(xq) —> R, определенная в окрестности U(xq) С точки хо — (х^, ..., х™), имеет в точке хо частные производные по каждой из переменных х1, ..., хт. Тогда для того, чтобы функция имела в xq локальный экстремум, необ- ходимо, чтобы в этой точке были выполнены равенства = <12) ОХ1 охт ◄ Рассмотрим функцию ipfx1) = /(ж1, х%, ..., х™) одной переменной, опре- деленную, в силу условий теоремы, в некоторой окрестности точки Xq ве- щественной оси. В точке Xq функция ^(х1) имеет локальный экстремум, и поскольку то = °- Аналогично доказываются и остальные равенства системы (12). ► Обратим внимание на то, что равенства (12) дают лишь необходимые, но не достаточные условия экстремума функции многих переменных. Примером, подтверждающим это, может стать любой пример, построенный по этому же поводу для функции одной переменной. Так, если раньше мы говорили о функции х х3, имеющей в нуле нулевую производную, но не имеющей там экстремума, то теперь можно рассмотреть функцию / /(я1, ...,хт) = (я1)3, все частные производные которой в точке xq = (0, ..., 0) равны нулю, но экстремума в этой точке функция, очевидно, не имеет. Теорема 5 показывает, что если функция / : G> R определена на от- крытом множестве G С Кт, то ее локальные экстремумы находятся либо среди точек, в которых f не дифференцируема, либо в тех точках, в которых дифференциал df(xo) или, что то же самое, касательное отображение /х(жо) обращается в нуль. Нам известно, что если отображение f : U(то) —> Кп, определенное в окрест- ности U(x0) С точки xq 6 Rm, дифференцируемо в хо, то матрица каса- тельного отображения /'(то): > Кп имеет вид fd1f1(x0') ... dmf1(x0)\ (13) \d1fn(x0) ... дт}п(Хц))
456 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Определение 3. Точка хо называется критической точкой отобра- жения f: U(xq) —> IRn, если ранг матрицы Якоби (13) отображения в этой точке меньше, чем min {т,п}, т. е. меньше, чем максимально возможный. В частности, при п = 1 точка xq критическая, если выполнены условия (12), т. е. все частные производные функции f : U(xq) -> 1R обращаются в нуль. Критические точки вещественнозначных функций называют также ста- ционарными точками таких функций. После того как в результате решения системы уравнений (12) найдены кри- тические точки функции, их дальнейший анализ в отношении того, являются они точками экстремума или нет, часто удается провести, используя форму- лу Тейлора и доставляемые ею следующие достаточные условия наличия или отсутствия экстремума. Теорема 6. Пусть f: U(xq) —> IR — функция класса C^(U(xq)', IR), опре- деленная в окрестности U(xo) С IRm точки xq = (xq, ..., х™) G lRm, и пусть хо — критическая точка этой функции f. Если в тейлоровском разложении /(^ + Л1,...,< + Л™) = = /(rJ,...,a:g') + l £ + о(||Л||2) (14) i,J=l функции в точке хо квадратичная форма т Е м=1 ОХг OXJ (15) а) знакоопределена, то в точке xq функция имеет локальный экстремум, который является строгим локальным минимумом, если квадратичная фор- ма (15) положительно определена, и строгим локальным максимумом, если она отрицательно определена', Ь) может принимать значения разных знаков, то в точке xq функция экстремума не имеет. Пусть Л/Оихо + ^ё U(xo). Представим соотношение (14) в виде Ж + 5)-№о) = ^|К д2/ dx'dxi (*о) fe* h> IHI ||Л|| + о(1) , (16) где о(1) есть величина, бесконечно малая при h —> 0. Из (16) видно, что знак разности f(xo 4- h) — f(x0) полностью определяется знаком величины, стоящей в квадратных скобках. Этой величиной мы теперь и займемся.
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 457 Вектор е = (h1/||/i||, ..., hm/ ||/г||), очевидно, имеет единичную норму. Ква- дратичная форма (15) непрерывна как функция h в Rm, поэтому ее ограни- чение на единичную сферу 5(0; 1) = {я € | ||ж|| = 1} также непрерывно на 5(0; 1). Но сфера 5 есть замкнутое ограниченное подмножество в IRm, т. е. компакт. Следовательно, форма (15) имеет на 5 как точку минимума, так и точку максимума, в которых она принимает соответственно значения т и М. Если форма (15) положительно определена, то 0 < т М и потому най- дется число 6 > 0 такое, что при ||Л|| < 6 будет |о(1)| < т. Тогда при ||h|| < 6 квадратная скобка в правой части равенства (16) окажется положительной и, следовательно, f(xo 4- h) — f(xo) > 0 при 0 < ||h|| < 3. Таким образом, в этом случае точка жо оказывается точкой строгого локального минимума рассматриваемой функции. Аналогично проверяется, что в случае отрицательной определенности фор- мы (15) функция имеет в xq строгий локальный максимум. Тем самым пункт а) теоремы 6 исчерпан. Докажем утверждение Ь). Пусть ет и ем — те точки единичной сферы, в которых форма (15) при- нимает соответственно значения т, М, и пусть т < 0 < М. Полагая h = tem, где t — достаточно малое положительное число (настоль- ко малое, что xq -I- tem G С7(ато))> из (16) находим f(x0 4- tem) - /(хо) = ^*2(т + °(1)), где о(1) —> 0 при t —> 0. Начиная с некоторого момента (т. е. при всех доста- точно малых значениях t), величина т 4- о(1) в правой части этого равенства будет иметь знак т, т. е. будет отрицательна. Следовательно, отрицательной будет и левая часть. Аналогично, полагая h = teM, получим f(x0 4- teM) - /(so) = ^t2(M 4- o(l)), и, следовательно, при всех достаточно малых t разность f(xo 4- te^) — /(#о) положительна. Таким образом, если квадратичная форма (15) на единичной сфере или, что, очевидно, равносильно, в принимает значения разных знаков, то в любой окрестности точки xq найдутся как точки, в которых значение функ- ции больше /(жо), так и точки, в которых оно меньше f(xo). Следовательно, в этом случае xq не является точкой локального экстремума рассматриваемой функции. ► Сделаем теперь несколько замечаний в связи с доказанной теоремой. Замечание 1. Теорема 6 ничего не говорит о случае, когда форма (15) полуопределена, т. е. неположительна или неотрицательна. Оказывается; в этом случае точка Жо может быть точкой экстремума, а может и не быть таковой. Это видно, в частности, из следующего примера.
458 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 3. Найдем экстремумы определенной в К2 функции f(x,y) = = х4 4- у4 — 2х2. В соответствии с необходимыми условиями (12) напишем систему уравне- ний Г ^-(х,у) = 4х3 - 4х = О, I ох I ^(х,у) = 4у3 = О, из которой находим три критические точки: (—1,0), (0,0), (1,0). Поскольку g^,y) = 12z2-4, £L{x,y) = 0, ^{х,у) = 12у\ то квадратичная форма (15) в указанных трех критических точках имеет соответственно вид 8(fti)2, -4(Л1)2, 8(Л2)2, т. е. во всех случаях она полуопределена (положительно или отрицательно). Теорема 6 тут не применима, но поскольку f(xyy) = (х2 — I)2 4- у4 — 1, то очевидно, что в точках (—1,0), (1,0) функция f(x,y) имеет строгий минимум — 1 (и даже нелокальный), а в точке (0,0) у нее нет экстремума, поскольку при х = 0 и у / 0 /(0,т/) = у4 > 0, а при у = 0 и достаточно малых х ф О /(х, 0) = х4 — 2х2 < 0. Замечание 2. После того как квадратичная форма (15) получена, ис- следование ее определенности может быть проведено с помощью известного из курса алгебры критерия Сильвестра1). Напомним, что в силу критерия т Сильвестра квадратичная форма ^2 64? я*#7 с симметрической матрицей г, j=l (Пц ... dim \ dml • dmmJ положительно определена тогда и только тогда, когда положительны все глав- ные миноры этой матрицы; форма отрицательно определена тогда и только тогда, когда ац < 0 и при переходе от любого главного минора матрицы к главному минору следующего порядка знак значения минора меняется. Пример 4. Найдем экстремумы функции f(x,y) = xj/ln(x2 Ч-j/2), определенной в плоскости К2 всюду, кроме начала координат. Дж. Дж. Сильвестр (1814—1897) — английский математик; наиболее известные его работы относятся к алгебре.
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 459 Решая систему |^»)=»М*2 + »2) + Jt7 = o> ^(x,y)=x^x2 + yl) + -^L_=0, находим все критические точки функции (О, ±1); (±1,0); Г± /х->± /57^’ /о^)' \ vze у2е/ \ у2е y2e,J Поскольку функция нечетна относительно каждого из двух своих аргумен- тов в отдельности, то точки (0, ±1) и (±1,0), очевидно, не являются точками экстремума нашей функции. Видно также, что данная функция не меняет своего значения при одновре- менном изменении знака обеих переменных х и у. Таким образом, если мы исследуем только одну из оставшихся критических точек, например точку (~2==, , то мы сможем сделать заключение и о характере остальных. Поскольку d2f ( s _ вху _ 4х3у дх^х,У} х2 + у2 (ж2 + 3/2)2’ &L(X ») = 1п(*2 + V2) + 2 - дхду( ,У> М® +!М+2 (х2 + у2)2’ d2f . бху 4ху3 ду2^^У) х2 + у2 (я2 +^2’ то в точке (~^=, -т= ) квадратичная форма дц f(xo)h'hi имеет матрицу \v2e v2e/ А °\ \° 2/ ’ т. е. она положительно определена, и, следовательно, в этой точке функция имеет локальный минимум f(— Лу^ё’^ё/ 2е' В силу сделанных выше наблюдений относительно особенностей рассма- триваемой функции можно сразу же заключить, что *2ё’ у/2е 2е — также локальный минимум, а *2ё’ х/2ё 5ё’х^ё/ 2е
460 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ — локальные максимумы функции. Впрочем, это можно проверить и непо- средственно, убедившись в определенности соответствующей квадратичной формы. Например, в точке (—7=, -4=) матрица квадратичной формы (15) \ v2e v2e/ имеет вид /-2 (А \ 0 “2/ ’ откуда видно, что форма отрицательно определена. Замечание 3. Следует обратить внимание на то, что мы указали необ- ходимые (теорема 5) и достаточные (теорема 6) условия экстремума функции лишь во внутренней точке области определения. Таким образом, при отыс- кании абсолютного максимума или минимума функции необходимо наряду с внутренними критическими точками функции исследовать также точки гра- ницы области определения, поскольку максимальное или минимальное значе- ние функция может принять в одной из таких граничных точек. Подробнее общие принципы исследования невнутренних экстремумов бу- дут разбираться позже (см. раздел, посвященный условному экстремуму). Полезно иметь в виду, что при отыскании минимумов и максимумов часто наряду с формальной техникой, а иногда и вместо нее, можно использовать некоторые простые соображения, связанные с природой задачи. Например, если рассматриваемая в JRm дифференцируемая функция по смыслу задачи должна иметь минимум и вместе с тем она не ограничена сверху, то, при условии, что функция имеет единственную критическую точку, можно без дальнейшего исследования утверждать, что в этой точке она и принимает свое минимальное значение. Пример 5. Задача Гюйгенса. На основе законов сохранения энергии и импульса замкнутой механической системы несложным расчетом можно по- казать, что при соударении двух абсолютно упругих шаров, имеющих массы mi и m2 и начальные скорости Vi и V2, их скорости после центрального удара (когда скорости направлены по линии центров) определяются соотношениями ~ (mi — m2)wi 4- 2m2V2 ^1 — ; j 7771 4“ 7712 ~ (m2 — 7711)^2 + 27771^1 V2 _ ----------------------------- 7771 4- 7772 В частности, если шар массы М, движущийся со скоростью V, ударяется о неподвижный шар массы 777, то приобретаемая последним скорость v может быть найдена по формуле ™ v т + М ’ v — (17) из которой видно, что если 0 777 М, то V v 2V. Каким же образом телу малой массы можно передать значительную часть кинетической энергии большой массы? Для этого, например, между шарами
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 461 малой и большой масс можно вставить шары с промежуточными массами ш < /ni < 7712 < . • • < T72n < М. Вычислим (вслед за Гюйгенсом), как надо вы- брать массы 7721, 7722, ..., Т72п, чтобы в результате последовательных централь- ных соударений тело т приобрело наибольшую скорость. В соответствии с формулой (17) получаем следующее выражение для иско- мой скорости как функции от переменных 7721, 7722, • • •, гпп: v = Ш1 • 1712 тп • • 2n+1 V. (18) 772 4- 7721 7721 7722 772п-1 4" 772п 772п 4- М Таким образом, задача Гюйгенса сводится к отысканию максимума функ- ции zz ч mi тп М /(7721, ..., тп) = ----- ... ---------- • ----—. 772 4- 7721 772п-1 4" 771 п 772п 4- М Система уравнений (12), представляющих необходимые условия внутрен- него экстремума, в данном случае сводится к системе ( 772 • 7722 — 77Z2 = О, 7721 • ш3 — ТП,2 = О, тп-.1 • М - т2п = О, из которой следует, что числа т, пц, ..., тпп, М образуют геометрическую прогрессию со знаменателем q, равным п+\/М/т. Получаемое при таком наборе масс значение скорости (18) определяется равенством (9 \n4-l гУ v’ (19) которое при тг = 0 совпадает с равенством (17). Из физических соображений ясно, что формула (19) указывает максималь- ное значение функции (18), однако это можно проверить и формально (не привлекая громоздких вторых производных; см. задачу 9 в конце параграфа). Заметим, что из формулы (19) видно, что если т -> 0, то v -> 2n+1V. Таким образом, промежуточные массы действительно заметно увеличивают передаваемую малой массе Т72 часть кинетической энергии массы М. 6. Некоторые геометрические образы, связанные с функциями многих переменных а. График функции и криволинейные координаты. Пусть х, у, z — декартовы координаты точки пространства К3, и пусть z = f(x,y) — непре- рывная функция, определенная в некоторой области G плоскости К2 перемен- ных (х,у).
462 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В силу общего определения графика функции, график функции f: G —> К в нашем случае есть множество S = {(x,y,z) € К3 | (х,у) € G, z = f(x,y)} в пространстве К3. Отображение G -^4 S, определяемое соотношением (х,у) •-> (х,у, f(x,y)), очевидно, есть непрерывное взаимно однозначное отображение G на S, в силу которого любую точку множества S можно задать, указывая соответствую- щую ей точку области G или, что то же самое, задавая координаты (х, у) этой точки G. Таким образом, пары чисел (х, у) G G можно рассматривать как некоторые координаты точек множества S — графика функции z = f(x,y). Поскольку точки S задаются парами чисел, то S будем условно называть двумерной по- верхностью в К3 (общее определение поверхности будет дано позже). Если задать путь Г : I —> G в G, то автоматически возникает путь F о Г : I -> S на поверхности S. Если х = x(t), у = y(t) — параметрическое задание пути Г, то путь F о Г на S задается тремя функциями: х = x(t), у = y(t), z = f(x(t), y(t)). В частности, если положить х = xq + t, у = уо, то мы получим кривую х = Xq + t, у = уо, z = f(xo + t,yo) на поверхности S, вдоль которой координата у = у о точек S не меняется. Аналогично можно указать кривую х = Xq, у = уо + t, z = f(xo, уо + t) на S, вдоль которой не меняется первая координата хо точек S. Эти линии на S по аналогии с плоским случаем естественно называть координатными линиями на поверхности S. Однако, в отличие от координатных линий в G С К2, являющихся кусками прямых, координатные линии на S, вообще говоря, являются кривыми в R3. По этой причине введенные координаты (х,у) точек поверхности S часто называют криволинейными координатами на S. Итак, график непрерывной функции z = f(x,y), определенной в области G С R2, есть двумерная поверхность S в R3, точки которой можно задавать криволинейными координатами (х, у) 6 G. Мы пока не останавливаемся на общем определении поверхности, посколь- ку сейчас нас интересует только частный случай поверхности — график функ- ции, однако мы предполагаем, что из курса аналитической геометрии читате- лю хорошо знакомы некоторые важные конкретные поверхности в К3 (плос- кость, эллипсоид, параболоиды, гиперболоиды). Ь. Касательная плоскость к графику функции. Если функция z = — f(x,y) дифференцируема в точке (хо,уо) 6 G, то это означает, что f(x,y) = f(xo,yo) + А(х - х0) + В(у - Уо) 4- + о(х/(я - Яо)2 + 0/ - ?/о)2 ) при (х,т/) (хо,уо), (20) где А и В — некоторые постоянные. Рассмотрим в К3 плоскость z = Zo 4- А(х - Хо) 4- В(у - у0), (21)
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 463 где zq = f(x0, уо). Сравнивая равенства (20) и (21), видим, что график нашей функции в окрестности точки (xo,yo,zo) хорошо аппроксимируется плоско- стью (21). Точнее, точка (я, y,f(x,y)) графика функции уклоняется от точки (х, y,z(x,y)) плоскости (21) на величину, бесконечно малую в сравнении с ве- личиной \/(х — xq)2 + (у — уо)2 смещения ее криволинейных координат (х,у) от координат (xQ,yo) точки (хо,Уо,го). В силу единственности дифференциала функции, плоскость (21), обладаю- щая указанным свойством, единственна и имеет вид Z = f(x0, Уо) 4- ?^(хо,Уо)(х - хо) 4- |^(z0, уо)(у - Уо)- (22) Она называется касательной плоскостью к графику функции z = f(x,y) в точке (xo,yo,f(xo,yo))- Итак, дифференцируемость функции z = f(x,y) в точке (хо,уо) и наличие у графика этой функции касательной плоскости в точке (гго, уо, /(^о,Уо)) суть равносильные условия. с. Нормальный вектор. Записывая уравнение (22) касательной плоско- сти в каноническом виде ^(хо,уо)(х - Хо) + ^(хо,уо)(у - Уо) - (Z - f(xo,yo)) =0, заключаем, что вектор (^о»Уо), Уо)» — (23) является нормальным вектором касательной плоскости. Его направление считается направлением, нормальным или ортогональным к поверхности S (графику функции) в точке (х0, Уо, f(xQ, у0))- В частности, если (я0} Уо) — критическая точка функции f(x, у), то в точке (хо,Уо, f(xo,yo)) графика нормальный вектор имеет вид (0, 0, —1) и, следова- тельно, касательная плоскость к графику функции в такой точке горизон- тальна (параллельна плоскости (х,у)). Следующие три рисунка иллюстрируют сказанное. Рис. 53
464 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ На рис. 53 а, с изображено расположение графика функции по отношению к касательной плоскости в окрестности точки локального экстремума (со- ответственно, минимума и максимума), а на рис. 536 — в окрестности так называемой седловой критической точки. d. Касательная плоскость и касательный вектор. Мы знаем, что если путь Г: I —> К3 в К3 задается дифференцируемыми функциями х = x(t), у = z — z(t), то вектор (i(0),j/(0), z(0)) есть вектор скорости в момент t = 0. Это направляющий вектор касательной в точке zo — я(0), уо = 2/(0), zo = z(0) к кривой в IR3, являющейся носителем пути Г. Рассмотрим теперь путь Г : I —> S на графике функции z = f(x,y), зада- ваемый в виде х = x(t), у — y(t), z — /(®(t),y(O)- В этом конкретном случае находим, что (i(O),j/(O),z(O)) = (±(0), 2/(0), j/o)i(0) 4- |^(zo,J/o)2/(0)}, откуда видно, что найденный вектор ортогонален вектору (23), нормальному к графику S функции в точке (жо,!/о}/(аЧьЗ/о))- Таким образом, мы показали, что если вектор (£, ту, С) касателен в точке (яо, Уо, f(xo, З/о)) к некоторой кривой на поверхности S, то он ортогонален вектору (23) и (в этом смысле) лежит в плоскости (22), касательной к поверхности S в указанной точке. Точнее можно было бы сказать, что вся прямая х = xq 4- ff, у = у0 4- T)t, z — f(xo,yo) 4- лежит в касательной плоскости (22). Покажем теперь, что верно и обратное утверждение, т. е. если прямая х = хо 4- ££, у — уо 4- rjt, z — /(zo, 2/о) + или, что то же самое, вектор (С,т/, () лежит в плоскости (22), касательной к графику S функции z — f(x> у) в точке /(яо,3/о)), то на S есть путь, для которого вектор (£,//,£) является вектором скорости в точке (хо,Уо, У(^о?3/о))« В качестве такового можно взять, например, путь х = х0 + &, У = Уо + Щ, z-f(xo + ^t,yo+T]t). В самом деле, для него *(0) = 3/(0) = 7?, z(0) = |£(яо,?/о)£ 4- |^(жо,1/о)т?. Ввиду того, что |£(so,3/o)*(0) 4- Ц(хо,Уо)у(0) ~ i(0) = 0 и по условию также |^(^о,2/о)С + ^(^о,З/о)т? - < = 0, заключаем, что (i(0),y(0),i(0)) = (£.»). С).
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 465 Итак, касательная плоскость к поверхности S в точке (хо, j/o,^o) образо- вана векторами, касательными в точке (xo,yo,zo) к кривым, проходящим на поверхности S через указанную точку (рис. 54). Это уже более геометричное описание касательной плоскости. Во всяком случае, из него видно, что если инвариантно (относительно выбора системы координат) определена касательная к кривой, то касательная плоскость также определена инвари- антно. /. ’ $ Для наглядности мы рассматривали функции п /ty • двух переменных, однако все сказанное, очевидно, • • i переносится и на общий случай функции /' • / •'. ’ • / у = /(х1,..., хт) (24) т переменных, где т Е N. Плоскость, касательная к графику такой функ- Рис- 54 ции в точке (xq, ... ,х™, /(xq, ...,х™)), запишется в виде » = + (25) i=l вектор ‘ ‘ -1) есть нормальный вектор плоскости (25). Сама эта плоскость, как и график функции (24), имеет размерность т, т. е. любая точка задается теперь набо- ром (ж1, ..., хт) из т координат. Таким образом, уравнение (25) задает гиперплоскость в Km+1. Дословно повторяя проведенные выше рассуждения, можно проверить, что касательная плоскость (25) состоит из векторов, касательных в точке (xq, ..., Xq1, /(xq, ..., Xq1)) к кривым, проходящим через эту точку и лежащим на тп-мерной поверхности S — графике функции (24). Задачи и упражнения 1. Пусть z = f(x, у) — функция класса R). Я f а) Если —— (х, у) = 0 в G, то можно ли утверждать, что функция f не зависит от ду у в области G? Ь) При каком условии на область G ответ на предыдущий вопрос положителен? 2. а) Проверьте, что для функции f&,y) = 2 2 х -у ху-2, 2, х2 4- у2 О, если х2 + у2 О, если х2 4- у2 = О,
466 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ имеют место следующие соотношения: d2f d2f ^4-(0,0) = 1 / -1 = ^-(0,0). дхду оуох' ^в ду (или d2f 1 fi f b) Докажите, что если функция f(x,y) имеет частные производные — и ох некоторой окрестности U точки (жо,1/о) и если смешанная производная ох оу d2f ) существует в 17 и непрерывна в (жо,2/о), то смешанная производная q^qx (соответственно, ) также существует в этой точке и имеет место равенство &{х°’^ = &хо’*>- 3. Пусть ж1, ..., хт — декартовы координаты в Дифференциальный опера- тор д_А д2 г=1 действующий на функции f G C^2\G;R) по правилу л , А д2 ^дх‘2'~.1"’)’ называется оператором Лапласа. Уравнение Д/ = 0 относительно функции f в области G С Rm называется урав- нением Лапласа, а его решения — гармоническими функциями в области G. а) Покажите, что если х = (ж1, ..., хт) и j т м = J 52(ж*)2’ V »=1 то при т > 2 функция 771 — /(ж) = ||ж|| 2 является гармонической в области Rm \0, где 0= (0, Ь) Проверьте, что функция fix' хт t} =____________________-_____exn f-lHEA ,t) (2a%/Sp ia2t)' рпределенная при t > 0 и ж = (ж1, ..., хт) € Rm, удовлетворяет уравнению тепло- проводности £=“2д/' df 2 A d2f • я л . т. е. что -^ = а X» —^2 в лю®ои точке области определения функции. dt дх%
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 467 4. Формула Тейлора в мультииндексных обозначениях. Символ а :== (oti,..., ат), состоящий из неотрицательных целых чисел аг, л — = 1, ... , т, называется мультииндексом а. Условились в следующих обозначениях: |а| := |Л1| 4-... 4- |oim|, а! := ad ... ат!; наконец, если а = (<ц, ..., ат), то CL • а) Проверьте, что если к € N, то (<ч + ...+О‘= £ |а|=Л ИЛИ (°1 + • • • 4-От)* = УТ “7а°> |a|=fc где суммирование ведется по всем наборам а = (»i,..., am) неотрицательных целых т чисел, таким, что |а*| = Л. »=i Ь) Пусть Л|«1 f Daf(x>>:= (дх^а1...(дх^)ат Покажите, что если f € C^\G;R), то в любой точке х € G имеет’место равенство *l+.--+»m=fc |a|=k где Л = (Л1, ..., Л™). с) Проверьте, что в мультииндексных обозначениях формулу Тейлора, например, с остаточным членом в форме Лагранжа можно записать в виде f(x + h)= £ ±р«/(х)Л°+ Е ^О“/(х + »Л)Ла- |а|=0 |а|=п d) Запишите в мультииндексных обозначениях формулу Тейлора с интегральным остаточным членом (теорема 4). 5. а) Пусть 1т = {ж = (х1, ..., хт) € R™ 11®*| с*, i = 1, ..., т} — тп-мер- ный промежуток, а I — отрезок [а, 6] С R. Покажите, что если функция f(x,y) .= = /(х1, ..., хт, у) определена и непрерывна на множестве Im х I, то для любого положительного числа £ > 0 найдется число 6 > 0 такое, что если х € 1т, уг,У2 € I и |j/i — V21 < <5, ТО |/(ж, J/1) - /(*, J/г)I < £•
468 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ъ) Покажите, что функция ъ F(x) = У f(x, У) а определена и непрерывна на промежутке 1т. с) Покажите, что если f 6 C'(/*n;R), то функция Л*3) = /(^) определена и непрерывна на Im х I1, где 71 = {t6R||t|^l}. d) Докажите следующую лемму А дамара. Если f G C(1)(/TO;R) и /(0) = 0, то существуют функции pi, ..., gm G C(/m;R) такие, что т /(х1, ..., хт) = У x*gi(x\ ..., хт) *=1 в 1т, причем ^(°) = г = 1,...,т. 6. Докажите следующее обобщение теоремы Роллл для функций многих перемен- ных. Если функция / непрерывна в замкнутом шаре В(0; г), равна нулю на его границе и дифференцируема во внутренних точках шара В(0; г), то по крайней мере одна из внутренних точек этого шара является критической точкой функции. 7. Проверьте, что функция f(x, у) = (у - я2) (г/ - Зж2) не имеет экстремума в начале координат, хотя ее ограничение на любую прямую, проходящую через начало координат, имеет строгий локальный минимум в этой точке. 8. Метод наименьших квадратов. Это один из наиболее распространенных методов обработки результатов наблю- дений. Он состоит в следующем. Пусть известно, что физические величины х я у связаны линейным соотношением у = ах + Ъ, (26) или пусть на основе экспериментальных данных строится эмпирическая формула указанного вида. Допустим, сделано п наблюдений, в каждом из которых одновременно измеря- лись значения х и у, и в результате получены пары значений xi, s/i; ... ; хп,Уп- Поскольку измерения имеют погрешности, то, даже если между величинами х я у имеется точная связь (26), равенства Ук = axh + b могут не выполняться для некоторых значений к € {1, ..., п}, каковы бы ни были коэффициенты а я Ь.
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 469 Задача состоит в том, чтобы по указанным результатам наблюдений определить разумным образом неизвестные коэффициенты а и Ь. Гаусс, исходя из анализа распределения вероятности величины ошибки наблюде- ния, установил, что наиболее вероятные значения коэффициентов а и b при данной совокупности результатов наблюдений следует искать, исходя из следующего прин- ципа наименьших квадратов: если 6k = (axk +Ъ) — уь — невязка к-го наблюдения, то а и Ь надо выбирать так, чтобы величина Л = k —1 т. е. сумма квадратов невязок, была минимальной. а) Покажите, что принцип наименьших квадратов в случае соотношения (26) приводит к системе линейных уравнений Г [як,я*,]а + [ж*,, 1] Ь = [як,ук], I [1,«*]а+ [1,1]Ь= [l,s/fc] для определения коэффициентов а и Ь; здесь, следуя Гауссу, положено [тк,Жк] := = Х1Т1 + ... +хпхп-, [ж*;, 1] := Х1 1 + ... +жп 1; [Жк,Ук] := xiyi + ... + хпуп и т. д. Ь) Напишите систему уравнений для чисел ai, ..., ат, Ь, к которой приводит принцип наименьших квадратов в том случае, когда вместо равенства. (26) имеется соотношение 771 у = + Ь i=i (или, короче, у = aiX* + b) между величинами ж1, ..., хт, у. с) Как, используя метод наименьших квадратов, искать эмпирические формулы вида у = сх?1... х°п, связывающие физические величины Ж1, ..., хт с величиной у? d) (М. Джермен.) У нескольких десятков особей кольчатого червя Neries di versicolor была измерена частота R сокращений сердца при различных температу- рах Т. Частота выражалась в процентах относительно частоты сокращений при 15°C. Полученные данные приведены в следующей таблице: Температура, °C Частота, % Температура, °C Частота, % 0 39 20 136 5 54 25 182 10 74 30 254 15 100 Зависимость R от Т похожа на экспоненциальную. Считая R = Аеьт, найдите значения констант А и Ь, которые бы наилучшим образом соответствовали резуль- татам эксперимента. 72i6*
470 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 9. а) Покажите, что в рассмотренной в примере 5 задаче Гюйгенса функция (18) стремится к нулю, если хотя бы одна из переменных mi, ..., тп стремится к бес- конечности. Ь) Покажите, что функция (18) имеет в Rn точку максимума и потому един- ственная критическая точка этой функции в Rn должна быть ее точкой максимума. с) Покажите, что величинам, определяемая формулой (19), монотонно возрастает с ростом п, и найдите ее предел при п —> оо. 10. а) Во время так называемого круглого наружного шлифования инструмент — быстро вращающийся шлифовальный круг (с шероховатой периферией), играющий роль напильцика, — приводится в соприкосновение с медленно (в сравнении с ним) поворачивающейся поверхностью круг- лой детали (рис. 55). Круг К постепенно подается на де- таль Д ив результате происходит съем заданного слоя Н металла, доведение детали до нужного размера и образо- вание гладкой рабочей поверхности из- делия. Эта поверхность в будущем ме- ханизме обычно является трущейся, и, чтобы увеличить срок ее службы, ме- талл детали проходит предварительную закалку, повышающую твердость ста- ли. Однако из-за высокой температуры в зоне контакта шлифовального круга с деталью могут произойти (и часто про- исходят) структурные изменения в некотором слое Д металла и падение в этом слое твердости стали. Величина Д монотонно зависит от скорости з подачи круга на деталь, т. е. Д = </>(«). Известно, что существует некоторая критическая скорость «о > 0, при которой еще Д = 0, а при з > So уже Д > 0. Для дальнейшего удобно ввести в рассмотрение обратную к указанной зависимость s = ^(Д), определенную при Д > 0. Здесь тр — известная из эксперимента монотонно возрастающая функция, опре- деленная при Д 0, причем V(0) = So > 0. Режим шлифования должен быть таким, чтобы на окончательно получаемой по- верхности изделия не было структурных изменений металла. Оптимальным по быстродействию при указанных условиях, очевидно, будет та- кой режим изменения скорости з подачи шлифовального круга, когда s = ^(<S), где 6 = 6(t) — величина еще не снятого к моменту t слоя металла или, что то же самое, расстояние от периферии круга в момент t до окончательной поверхности будущего изделия. Объясните это. Ь) Найдите время, необходимое для снятия слоя Н в оптимальном режиме изме- нения скорости з подачи круга.
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 471 с) Найдите зависимость з — s(t) скорости подачи круга от времени в оптималь- ном режиме при условии, что функция Д i-^-> з линейна: з = во + АД. В силу конструктивных особенностей некоторых видов шлифовальных станков изменение скорости в может происходить только дискретно. Тут и возникает за- дача оптимизации производительности процесса при дополнительном условии, что допускается только фиксированное число п переключений скорости з. Ответы на следующие вопросы дают представление о характере оптимального режима. d) Какова геометрическая интерпретация найденного вами в Ь) времени t(H) = н . о шлифования в оптимальном непрерывном режиме изменения скорости s о е) Какова геометрическая интерпретация потери во времени при переходе от оптимального непрерывного режима изменения з к оптимальному по быстродей- ствию ступенчатому режиму изменения в? f) Покажите, что точки 0 = вп+i < хп < •• < xi < ж о = Н промежутка [0,77], в которых следует производить переключение скорости, должны удовлетворять усло- виям 1 1 (1Y ~П----\ ~ ТГ~\ ~ “( 7 )(*<)(*< -Si-i) (i = 1, ...,п) \l)(xi+\) i/>(Xi) \ll>/ и, следовательно, на участке от Xi до ж»+1 скорость подачи круга имеет вид з — = ^(ж<+1) (г = 0, ...,п). g) Покажите, что в линейном случае, когда V(A) = во + АД, точки Xi (из зада- чи f)) на промежутке [0,77] располагаются так, что числа So . So , . . во . -в01О- т- < -г- + жп < . •. < -г- + xi < — + 77 А А А А образуют геометрическую прогрессию. 11. а) Проверьте, что касательная к кривой Г: 7 —> R™ определена инвариантно относительно выбора системы координат в R771. Ь) Проверьте, что касательная плоскость к графику S функции у = /(ж1, ..., хт) определена инвариантно относительно выбора системы координат в R771. с) Пусть множество S С R*71 х R1 является графиком функции у = /(ж1, ..., ж771) в координатах (ж1, ..., ж*71, у) в Rm х R1 и графиком функции у = /(ж1, ..., жт) в координатах (ж1, ..., хт, у) в Rm х R1. Проверьте, что касательная к S плоскость инвариантна относительно линейного преобразования координат в R771 х R1. т d%f d) Проверьте, что оператор Лапласа Д/ = ^3 —^(ж) определен инвариантно »=1 дх* относительно ортогональных преобразований координат в R771. § 5. Теорема о неявной функции 1. Постановка вопроса и наводящие соображения. В этом пара- графе будет доказана важная как сама по себе, так и благодаря ее многочи- сленным следствиям теорема о неявной функции. Поясним сначала, в чем состоит вопрос. Пусть, например, мы имеем соот- ношение х2 + у2 - 1 = 0 (1) 16 Зорич В. А.
472 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ между координатами х, у точек плоскости R2. Совокупность точек плоско- сти R2, удовлетворяющих этому соотношению, есть единичная окружность (рис. 56). Наличие связи (1) показывает, что, фиксировав одну из координат, напри- мер ж, мы не вправе брать вторую координату произвольно. Таким образом, соотношение (1) предопределяет зависимость у от х. Нас интересует вопрос об условиях, при которых неявная связь (1) может быть разрешена в виде явной функциональной зависимости у = у(х). Решая уравнение (1) относительно у, найдем, что у = ±х/1 — ж2, (2) т. е. каждому значению х такому, что |я| < 1, на самом деле отвечают два допустимых значения у. При формировании функциональной зависимости у = у(х), удовлетворяющей соотношению (1), нельзя без привлечения дополнительных тре- бований отдать предпочтение какому-нибудь одному из значений (2). Например, функция у(х), которая в рациональных точках отрез- ка [—1,1] принимает значение -Ь\/1 — я2, а в иррациональных — значение —л/1 — я2, оче- видно, удовлетворяет соотношению (1). Ясно, что вариацией этого примера можно предъявить бесконечно много функциональ- ных зависимостей, удовлетворяющих соотно- шению (1). Вопрос о том, является ли множество, за- даваемое в R2 соотношением (1), графиком некоторой функциональной зависимости у = у(х), очевидно, решается отри- цательно, ибо с геометрической точки зрения он равносилен вопросу о воз- можности взаимно однозначного прямого проектирования окружности на не- которую прямую. Но наблюдение (см. рис. 56) подсказывает, что все-таки в окрестности от- дельной точки (я?(ьЗ/о) Дуга окружности взаимно однозначно проектируется на ось х и ее единственным образом можно представить в виде у = у(х), где х у (ж) — непрерывная функция, определенная в окрестности точки я?о и принимающая в xq значение уо. В этом отношении плохими являются только точки (—1,0), (1,0), ибо никакая содержащая их внутри себя дуга окружно- сти не проектируется взаимно однозначно на ось х. Зато окрестности этих точек на окружности хорошо расположены относительно оси у и могут быть представлены в виде графика функции х = х(у), непрерывной в окрестности точки 0 и принимающей в этой точке значение — 1 или 1 в соответствии с тем, идет ли речь о дуге, содержащей точку (—1,0) или (1,0).
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 473 Как же аналитически узнавать, когда наше геометрическое место точек, определяемое соотношением типа (1), в окрестности некоторой точки (я?о,2/о), принадлежащей ему, может быть представлено в виде явной зависимости У — 2/(я) или х = х(у)? Будем рассуждать следующим, уже привычным способом. У нас есть функция F(x,y) = х2 4- у2 — 1. Локальное поведение функции в окрестности точки (а:о,2/о) хорошо описывается ее дифференциалом Р*х(хо>уо)(х - т0) + Г^(то,2/о)(2/ - 2/о), поскольку Г(х,2/) = F(x0,y0) +F*(xo,yo)(x - х0) + Fy(x0,y0)(y - у0) + + о(|т - т0| 4- \у - 2/о|) при (х,у) (хо,уо)- Если F(xo,i/o) = 0 и нас интересует поведение линии уровня Г(т, у) = О нашей функции в окрестности точки (то, уо), то о нем можно судить по рас- положению прямой (касательной) F^(.xo,yo)(x - х0) 4- Fy(xo,yo)(y - Уо) = 0. (3) Если эта прямая расположена так, что ее уравнение можно разрешить от- носительно у, то, коль скоро в окрестности точки (хо,уо) линия F(x,y) = 0 мало уклоняется от этой прямой, можно надеяться, что ее в некоторой окрест- ности точки (то, уо) тоже можно будет записать в виде у = у(х). То же самое, конечно, можно сказать о локальной разрешимости уравнения F(x, у) = 0 относительно х. Записав уравнение (3) для рассматриваемого конкретного соотношения (1), получим следующее уравнение касательной: хо(х - хо) 4- уо(у - Уо) = 0. Это уравнение разрешимо относительно у всегда, когда уо / 0, т. е. во всех точках (хо,уо) окружности (1), кроме точек (—1,0) и (1,0). Оно разрешимо относительно х во всех точках окружности, кроме точек (0, -1) и (0,1). 2. Простейший вариант теоремы о неявной функции. В этом па- раграфе теорема о неявной функции будет получена очень наглядным, но не очень эффективным методом, приспособленным только к случаю веществен- нозначных функции вещественных переменных. С другим, во многих отно- шениях более предпочтительным способом получения этой теоремы, как и с более детальным анализом ее структуры, читатель сможет познакомится в главе X (часть II), а также в задаче 4, помещенной в конце параграфа. 16*
474 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Следующее утверждение является простейшим вариантом теоремы о неяв- ной функции. Утверждение 1. Если функцця F: U(xo,yo) —> определенная в окрестности (7(яо?3/о) точки (яо?2/о) € К2, такова, что 1° FeC®(U;R), гдер^1, 2° F{xo,yo) = О, 3° F'(iro,J/o) А то существуют двумерный промежуток I = 1Х х 1У, где 1Х - {я е R| - а?о| < a}, Iy = {j/ G R| |j/ - j/0| < 0}, являющийся содержащейся в U(xo,yo) окрестностью точки (яо?2/о)? w такая функция f G 1У), что для любой точки (х,у) G 1Х х 1У F(x,y) = 0 <=> у = /(я), (4) причем производная функции у = f(x) в точках х € 1Х может быть вычи- слена по формуле f(x) = - [fj(x, №))] К(х, /(х))]. (5) Прежде чем приступить к доказательству, дадим несколько возможных пе- реформулировок заключительного соотношения (4), которые должны заодно прояснить смысл самого этогф соотношения. Утверждение 1 говорит о том, что при условиях 1°, 2°, 3° порция мно- жества, определяемого соотношением F(x,y) = 0, попавшая в окрестность I = 1Х х 1у точки (хо,уо), является графиком некоторой функции f: 1Х —> 1У класса (1Х ]1У). Иначе можно сказать, что в пределах окрестности I точки (я^о,2/о) урав- нение F(x,y) = 0 однозначно разрешимо относительно у, а функция у = f(x) является этим решением, т. е. F(x,/(а;)) = 0 на 1Х. Отсюда в свою очередь следует, что если у — f(x) — функция, определенная на 1Х, про которую известно, что она удовлетворяет соотношению F(x, /(я)) = = 0 на 1Х и что /(^о) = Уо, то при условии непрерывности этой функции в точке хо G 1Х можно утверждать, что найдется окрестность Д С 1Х точки хо такая, что /(Д) С 1У и тогда /(ж) = f(x) при х G Д. Без предположения непрерывности функции f в точке Xq и условия /(^о) = = у о последнее заключение могло бы оказаться неправильным, что видно на уже разобранном выше примере с окружностью. Теперь докажем утверждение 1. ◄ Пусть для определенности Fy(xo,yo) > 0. Поскольку F G C^(U; IR), то Fy(x,y) > 0 также в некоторой окрестности точки (хо,уо). Чтобы не вводить
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 475 новых обозначений, без ограничения общности можно считать, что Fy(x,y) > > 0 в любой точке исходной окрестности U(хо,Уо)- Более того, уменьшая, если нужно, окрестность U(xo,yo), можно считать ее кругом некоторого радиуса г — 2/3 > 0 с центром в точке (я^о, 2/о)- Поскольку Fy(x, у) > 0 в U, то функция F(zoj2/) от У определена и моно- тонно возрастает на отрезке уо ~ /3 У Уо + /3, следовательно, F(x0, уо - j0) < F(x0, уо) = 0 < F(xOi уо + /3). В силу непрерывности функции F в U, найдется положительное число а < /3 такое, что при |я — жо| а будут выполнены соотношения F(x, уо - (3) < 0 < F(x, уо + 0). Покажем теперь, что прямоугольник I — 1х х 1У, где 1Х = {ж G R| |® - я?о| < а}, 1У = {у е R|\у - j/o| < 0}, является искомым двумерным промежутком, в котором выполняется соотно- шение (4). При каждом х G 1Х фиксируем вертикальный отрезок с концами (ж, уо — 0), (х, уо + /3)- Рассматривая на нем F(x, у) как функцию от у, мы получаем строго возрастающую непрерывную функцию, принимающую значения раз- ных знаков на концах отрезка. Следовательно, при х G 1Х найдется един- ственная точка у(х) G 1У такая, что F(x, у(х)) = 0. Полагая у(х) = f(x), мы приходим к соотношению (4). Теперь установим, что f G С^(1Х\1У). Покажем сначала, что функция f непрерывна в точке я?о и что /(хо) = Уо- Последнее равенство, очевидно, вытекает из того, что при х = хо имеется единственная точка у(хо) 6 1У такая, что F(xo,y(xo)) — 0. Вместе с тем по условию F(xo,yo) = 0, поэтому /(яо) = За- фиксировав число £, 0 < £ < /3, мы можем повторить доказательство существования функции f(x) и найти число 6, 0 < 6 < а, так, что в двумерном промежутке I = 1Х х 1у, где lx = {z е R| |х - я0| < <5}, 1у = {у G R| |т/ - 2/о| < £}, будет выполнено соотношение (F(a;,s/) = 0 в I) <=> (у = /(ж), х G 1Х) (6) с некоторой вновь найденной функцией f: 1Х —> /у. Но Ix С Ix, iy С 1у и i С I, поэтому из (4) и (6) следует, что f(x) = f(x) при х € Ix С 1Х- Тем самым проверено, что |/(ж) — f(xo)| = \f(x) — 3/01 < £ при |я — хо| < 5.
476 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Мы установили непрерывность функции f в точке xq. Но любая точка (х, у) € Z, в которой F(x,y) — 0, также может быть принята в качестве ис- ходной точки построения, ибо в ней выполнены условия 2°, 3°. Выполнив это построение в пределах промежутка Z, мы бы в силу (4) вновь пришли к со- ответствующей части функции /, рассматриваемой в окрестности точки х. Значит, функция f непрерывна в точке х. Таким образом, установлено, что fec(ixyiv). Покажем теперь, что f € C^(Zx;Zy), и установим формулу (5). Пусть число Да; таково, что х 4- Да; € 1Х. Пусть у = /(а;) и у 4- Ду — = /(а; 4- Да;). Применяя в пределах промежутка I к функции F(a;, у) теорему о среднем, находим, что О = F(x 4- Да;, f(x 4- Да;)) - F(x, /(а;)) = = F(x 4- Да;, у 4- Ду) - F(x, у) = = Fx(x 4- 0Да;, у 4- 6Ду) Да; 4- Fy(х 4- 6Ах, у 4-0Ду)Ду (0 < в < 1), откуда, учитывая, что Fy(x,y) / 0 в I, получаем Ау = Fx(x + 0Ах,у+ 0Ау) Ах F^(x 4- 0 Ах, у 4- ОАу) ‘ Поскольку f € C(Ix;Iy), то при Ах —> 0 также Ду —> 0 и, учитывая, что FeCW([/;R), из (7) в пределе при Ах —► 0 получаем /'W = где у = f(x). Тем самым формула (5) установлена. В силу теоремы о непрерывности композиции функций, из формулы (5) вытекает, что f 6 С^(1Х,1У). Если F € C^2\U; R), то правая часть формулы (5) допускает дифференци- рование по а; и мы находим, что (5') где F'x, Fy, Fxx, F"y, F”y вычисляются в точке (а;,/(а;)). Таким образом, f G C^2\lx;Iy), если F G C^(U; R). Поскольку порядок производных от /, входящих в правую часть соотношений (5), (5') и т. д., на единицу ниже, чем порядок производной от /, стоящей в левой части равен- ства, то по индукции получаем, что f G C^p\lx;Iy), если F G R). ► Пример 1. Вернемся к рассмотренному выше соотношению (1), задаю- щему окружность в R2, и проверим на этом примере утверждение 1.
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 477 В данном случае F(x, у) = я2 + у2 - 1 и очевидно, что F G С(°°)(К2;1&). Далее, ^(ж,2/) = 2т, F^y) = 2у, поэтому F'y(x,y) ф 0, если у / 0. Таким образом, в силу утверждения 1, для любой точки (xo,J/o) данной окружности, отличной от точек (—1,0), (1,0), найдется такая окрестность, что попадающая в нее дуга окружности может быть записана в виде у = /(т). Непосредственное вычисление подтверждает это, причем /(т) = /! — т2 или /(т) = —х/1 — х2. Далее, в силу утверждения 1, ^(До,2/о) = хо _ л а; *J(zo,2/o) Уо (8) Непосредственное вычисление дает z X если /(т) = х/1 - X2, z если /(т) = -/1-я2, V \/1 — х2 что можно записать одним выражением вычисление по которому приводит к тому же результату что и вычисление по формуле (8), полученной из утверждения 1. Важно заметить, что формула (5) или (8) позволяет вычислять f(x), даже не располагая явным выражением зависимости у = /(т), если нам только известно, что f(xo) = уо. Задание же условия уо = /(то) необходимо для выделения той порции линии уровня F(x,y) — 0, которую мы намереваемся представить в виде у = f(x). На примере окружности видно, что задание только координаты xq еще не определяет дугу окружности и, только фиксировав j/o, мы выделяем одну из двух возможных в данном случае дуг. 3. Переход к случаю зависимости F(x\ ..., хт, у) = 0. Простым обобщением утверждения 1 на случай зависимости F(x\ .. .,хт, у) = 0 явля- ется следующее утверждение.
478 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Утверждение 2. Если функция F: U —> К, определенная в окрестно- сти U С Rm+1 точки (хо,уо) = (жд, х™, уо) € Rm+1, такова, что 1° FeC^^R), P^l, 2° F(x0, уо) = F(xl,..., х^, уо) = О, 3° F^x0,y0) = Ffal, ...,я#\уо) # О, то существуют (т + 1)-мерный промежуток I = I™ х 1у, где 1™ = {х = (ж1,..., хт) € Rm 1- ж£| < a*, i = 1,..., m}, 11у = {уеЩ\у-у0\<Р}, являющийся лежащей в U окрестностью точки (хо,уо), и такая функция что для любой точки (х, у) G 7™ х 1у F(x\ ..., хт, у) = О <=> у = /(ж1, хт), (9) причем частные производные функции у — /(ж1, ..., хт) в точках 1Х могут быть вычислены по формуле /(х))]”* [Г< (х,/(х))]. (10) ◄ Доказательство существования промежутка Im+1 = 7£* х 7j, функции у = У (ж) = /(ж1, ..., хт) и ее непрерывности в I™ дословно повторяет соот- ветствующие части доказательства утверждения 1, с единственным измене- нием, которое сводится к тому, что теперь под символом х надо понимать набор (ж1,..., хт), а под символом а — набор (а1, ..., ат). Если теперь в функциях F(x1, ..., хт, у) и /(ж1,..., жт) фиксировать все переменные, кроме ж* и у, то мы окажемся в условиях утверждения 1, где на сей раз роль ж выполняет переменная ж*. Отсюда следует справедливость формулы (10). Из этой формулы видно, что J-4 G С(1™;1у) (г = 1, ..., т), т. е. f € 1у). Рассуждая, как и при доказательстве утверждения 1, по индукции устанавливаем, что f G 1у), коль скоро FeC^([Z;R). ► Пример 2. Предположим, что функция F : G R определена в области G С Rm и принадлежит классу C^(C?;R). Пусть жо = (Жд, ...,Ж^) е G и Ffo) = F^g, ..., Xq1) = 0. Если жо не является критической точкой функции F, то хотя бы одна из частных производных функции F в точке жо отлична 9F от нуля. Пусть, например, &^(хо) / 0. Тогда, в силу утверждения 2, в некоторой окрестности точки жо подмно- жество Rm, задаваемое уравнением F^1, ...,жт) = 0, может быть задано как график некоторой функции хт = /(ж1, ..., жт-1), определенной в окрест- ности точки (жд, . ..,ж™-1) € Rm-1, непрерывно дифференцируемой в этой окрестности и такой, что /(жд, ..., х™~*) — ж™.
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 479 Таким образом, в окрестности некритической точки Хо функции F урав- нение F(x\ ..., хт) = О задает (тп — 1)-мерную поверхность. В частности, в случае R3 уравнение F(z,y,z) = О в окрестности некритической точки (xo,yo,zo), удовлетворяющей ему, задает двумерную поверхность, которая при выполнении условия -х— (xo,yo,zo) О OZ локально может быть записана в виде Z = f(x,y). Как мы знаем, уравнение плоскости, касательной к графику этой функции в точке (xo,yo,zo), имеет вид (хО,Уо)(х - Xq) + Q-(Xo,yo)(y -Уо). Но по формуле (10) df, ^(жо,Уо,^о) df ( ч ^у(хо,Уо, zq) ^x»,Va)--F,(xoMzo), ^хо,уо) = -^7(хо;—о? поэтому уравнение касательной плоскости можно переписать в виде Fx(xo,yo,zo)(x - xq) + Fy(xo,yo,zo)(y - Уо) + F^xo,yo,zo)(z - z0) = 0, симметричном относительно переменных х, у, z. Аналогично и в общем случае получаем уравнение m ^г^(ж0)(^-4) = о i=i гиперплоскости в Rm, касательной в точке хо = (xq, ..., х™) к поверхно- сти, задаваемой уравнением F(z1, ..., хт) = 0 (разумеется, при условии, что F(xq) = 0 и что хо — некритическая точка F). Из полученных уравнений видно, что при наличии евклидовой структуры в Rm можно утверждать, что вектор j г/ \ (&F &F А / \ gradF(xo) = ^,...,^(xo) ортогонален поверхности r-уровня F(x) = г функции F в соответствующей точке хо € Rm.
480 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Например, для функции ,2/’ > а2 Ь2 с2’ определенной в R3, r-уровнем являются: пустое множество при г < 0; точка при г = 0; эллипсоид а2 Ь2 с2 при г > 0. Если (zo,Уо,?о) ~ точка на этом эллипсоиде, то по доказанному вектор j \ ( 2з?о 2уо 2z0 \ gradF(zo,jZo,zo) = I ] ортогонален этому эллипсоиду в точке (хо, jzo,zo), а касательная к нему в этой точке плоскость имеет уравнение х0(х - х0) у0(у - Уо) Zq(z -Zq) _ а2 b2 с2 которое с учетом того, что точка (xo,JZo5zo) лежит на эллипсоиде, можно пе- реписать в виде хох уоу , zoz а2 + & + с2 Г‘ 4. Теорема о неявной функции. Теперь перейдем к общему случаю системы уравнений f F'(x\ ...,хт, у1, = О, < ............................. (11) (. F»(x1,...,z”‘,y1,...,y") = 0, которую мы будем решать относительно у1,..., у", т. е. искать локально экви- валентную системе (11) систему функциональных связей ( У1 = f1 (х1?. • •, ят), < ........................................ (12) I Уп = /"(ж1, ...,жт). Для краткости, удобства письма и ясности формулировок условимся, что х — (т1, ..., zm), у = (у1, ..., уп)\ левую часть системы (11) будем записывать как F(x,у), систему (11) как F(x,y) = 0, а отображение (12) как у = f(x). Если То = (Жо,...,X™), Уо = (Уо, а = ат), 0 = (J31, ..., Г), то запись |ж — яо| < или \у — т/о| < Р будет означать, что |zl — Sol < (г = 1, ..., т) и, соответственно, |yJ — y3Q| < /Р’ (j = 1, ..., п).
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 481 Далее положим дх1 ’ дхт dfn dfn (*)> (13) (14) 1 дхх ''’ дхт dFn dFn \ дх1 * ’ ’ дхт ' 1 ду1 ’' * дуп (15) dFn dFn Заметим, что матрица Fy(x, у) квадратная и, следовательно, она обратима тогда и только тогда, когда ее определитель отличен от нуля. В случае п = 1 она сводится к единственному элементу и в этом случае обратимость матри- цы Fy(x,y) равносильна тому, что этот единственный ее элемент отличен от нуля. Матрицу, обратную к Fy(x, у), будем, как обычно, обозначать символом [Fyix.y)]'1. Теперь сформулируем основной результат параграфа. Теорема (о неявной функции). Если отображение F : U Rn, опреде- ленное в окрестности U точки (хо,уо) € RTn+n, таково, что 1° FeC^(tZ;Rn), р^1, 2° F(xo,yo) — О, 3° Fy(xo,yo) — обратимая матрица, то существуют (т + п) -мерный промежуток I = I™ х I™ с U, где 1^ = {хе^т\\х-х0\<а}, 12 = {уе№\\у-уо\<0}, и такое отображение f € что для любой точки F(x,y) = 0 О у = f(x), (16) причем f(x) = Ч^(х,/(х))ГЧ^(*,/(*))]- (17) ◄ Доказательство теоремы будет опираться на утверждение 2 и простей- шие свойства определителей. Разобьем его на отдельные этапы. Будем рас- суждать методом индукции. При п = 1 теорема совпадает с утверждением 2 и потому верна.
482 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пусть теорема справедлива для размерности п—1. Покажем, что она тогда справедлива и для размерности п. а) В силу условия 3°, определитель матрицы (15) отличен от нуля в точке (xo,jzo) € Rm+n, а значит, и в некоторой окрестности точки (хо,уо)- Следо- вательно, по крайней мере один элемент последней строки этой матрицы от- личен от нуля. С точностью до перемены обозначений можно считать, что dFn таким является элемент -z—. дуп Ь) Применяя тогда к соотношению F"(x1,...,xm,y1,...,y") = 0 утверждение 2, найдем промежуток Im+n = (I™ х I”-1) х Iy с U и такую функцию / G 0^(1™ х У”"1;!*), что (Fn(z1, ..., хт, у\ ..., уп) = 0 в 1т+п) ** (vn = fa1, • • •, Хт, у1,..., ynfa, (18) if, (у1,у"-1) е fa1). с) Подставляя найденное выражение уп = f(x, у1, ..., у”-1) переменной уп в первые п — 1 уравнений системы (11), получим п — 1 соотношений Ф1^1, ...,zm,y1, . ..,уп-1) := = F1(x1i ..., хт, у1, ..., уп~\ /(я1,..., хт, у1, ..., у”"1)) = О, < .......................................................... (19) Фп-1(ж1, ..., zm, у1, ..., у”-1) := . = Fn~\x\ ..., хт, у\ ..., уп~\ /(я1,..., хт, у1, ..., у”’1)) = 0. Видно, что Ф* 6 х Iy !; R) (i = 1,..., п - 1), причем Ф*(®о, ..., xg1, yj, ..., у?-1) = 0 (г = 1, ..., п - 1), ибо /(xj, ..., xg1, у^,..., z/q-1) = Уо и Р\х0,у0) = 0 (г = 1,..., п). В силу определения функций Ф* (к = 1,..., п — 1), дФ^_дР^_ dFk df /•._! ду* ду' + дуп ду' г’ (20) Положив еще ♦"(х1,..., хт, у1, ..., у""1) := = , хт, у1,..., у"-1, fa1, ...,хт,у1,..., у"-1)),
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 483 в силу (18) получаем, что в области своего определения Фп = 0, поэтому ЭФП _ ^Fn dFn а/ _ ду* ду' дуп ду* ’ ’ (21) Учитывая соотношения (20), (21) и свойства определителей, можно заме- тить, что определитель матрицы (15) равен определителю матрицы / dF1 dF1 a/ dF1 dF1 df dF1 dy1 dyn dy1 dyn~l dyn dyn~1 dyn dFn dFn а/ dFn dFn df dFn dy1 dyn dy1 dyn-1 dyn dyn-1 dyn / / ЭФ1 dy1 ЭФ1 дуп~1 аФп-1 ___________ dy1 '' * дуп-1 0 ... 0 dyn аг"-1 дуп dFn QFn По предположению, 0, а определитель матрицы (15) по условию от- личен от нуля. Следовательно, в некоторой окрестности точки (zq, ..., z™, yj, • • ♦ > Уо1) отличен от нуля и определитель матрицы / ЭФ1 0Ф1 \ dy1 dyn~l дФп-1 d$n~' \ dy1 “ ’ dy71-1 / /^.1 — ТП „,1 ».n—1\ (Ж , . . . , Z , у , . . . , у ). Тогда по предположению индукции найдутся промежуток /т+п-1 = х X /”-1 С /™Х/”-1, ЯВЛЯЮЩИЙСЯ ОКреСТНОСТЬЮ ТОЧКИ (Xq, . . . , X™, 7/q, ..., j^-1) в Rm+n-1, и такое отображение f G /”-1), что в пределах проме- жутка /т+п-1 = х Iy -1 система (19) равносильна соотношениям у1 = /1(ж\ ...,хт), .......................................... (22) уП-1 _ yn-l^l, , хту^ d) Так как /”-1 С Iy -1, а С I™, то, подставляя У1, ..., /п-1 из (22) вме- сто соответствующих переменных в функцию уп = /(ж1, ..., хт, у1, ..., у”-1) из соотношения (18), получаем зависимость Уп = /"(г1,...,хт) (23) переменной уп от (х1,, хт).
484 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ е) Покажем теперь, что система равенств ( V1 = , < .................. ге!?, (24) задающая отображение f € где I" = /у-1 х I* равносильна в пределах окрестности Jm+n = I™ х J” системе уравнений (11). В самом деле, сначала мы в пределах Im+n = (I™ х /”-1) х заменили последнее уравнение исходной системы (11) эквивалентным ему, в силу (18), равенством уп = f(x, у1, ..., уп-1). От так полученной второй системы мы перешли к равносильной ей третьей системе, заменив в первых п — 1 уравне- ниях переменную уп на f(x, у1, уп~г). Первые n —1 уравнений (19) третьей системы мы в пределах I™ х Z”-1 С I™ х /”-1 заменили равносильными им соотношениями (22). Тем самым получили четвертую систему, после чего пе- решли к равносильной ей в пределах I™ х /”-1 х I* = 1т+п окончательной системе (24), заменив в последнем уравнении уп = /(ж1, ..., хт, у\ у”-1) четвертой системы переменные у1,..., уп-1 их выражениями (22) и получив в качестве последнего уравнения соотношение (23). f) Для завершения доказательства теоремы остается проверить форму- лу (17). Поскольку в окрестности I™ х точки (яо, Jfo) системы (11) и (12) равно- сильны, то F(x, f(x)) = 0, если х € В координатах это означает, что в области Fk(x\ ..., хт, f\x\ ..., хт),..., fn(x\ ..., хт)) = О (к = 1, ..., п). (25) Поскольку f е и Fe (№(№*), где р > 1, то F(- ,/(•))€ G C(p)(/™;Rn) и, дифференцируя тождества (25), получаем * dFk dFk дР + = 0 = г = (26) j=i Соотношения (26), очевидно, равносильны одному матричному равенству f;(x,i/) + f;(x,i/)-/'W = o, в котором у = f(x). Учитывая обратимость матрицы Fy(x,y) в окрестности точки (шо, 2/о), из этого равенства получаем, что ш = -га*,/(*))]’>;(*-/(*))], и теорема полностью доказана. ►
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 485 Задачи и упражнения 1. На плоскости R8 с координатами х, у соотношением F(x, у) = 0, где F € 6 C(2)(R2, R), задана кривая. Пусть (жо, уо) — некритическая точка функции F(x, у), лежащая на кривой. а) Напишите уравнение касательной к этой кривой в точке (хо,уо). Ь) Покажите, что если (жо, уо) — точка перегиба кривой, то в этой точке выпол- няется равенство (f;,f;2 - 2f"vf'f; + f;;f'2)(xo,vo) = о. с) Найдите формулу для кривизны кривой в точке (хо,уо)- 2. Преобразование Лежандра для т переменных. Преобразование Лежандра от переменных ж1, ..., хт и функции /(ж1,..., хт) есть переход к новым переменным £1,..., £т и функции , Cm), задаваемый соотношениями С» = (г = 1, < дх т (27) 1 = 1 а) Дайте геометрическую интерпретацию преобразования (27) Лежандра как пе- рехода от координат (ж1, ..., жт, /(ж1, ..., хт)) точки на графике функции f(x) к параметрам (С1» ..., Cm, /*(Ci, ..., Cm)), задающим уравнение плоскости, касатель- ной к графику в этой точке. Ь) Покажите, что преобразование Лежандра локально заведомо возможно, если / е С(2) и det /0. \дх*дхЗ J с) Используя для функции /(ж) = /(я1, ..., хт) то же определение выпуклости, что и в одномерном случае (подразумевая теперь под ж вектор (ж1, ..., хт) G йт), покажите, что преобразованием Лежандра выпуклой функции является выпуклая функция. d) Покажите, что т т т df = Y.x'^‘ + X.bdx‘-'1f = '£.x'dS'- t=l i=l i=l и выведите отсюда инволютивность преобразования Лежандра, т. е. проверьте, что (f)'(x) = f(x). е) Учитывая d), запишите преобразование (27) в симметричном относительно переменных виде (т ле,.......е„)+№‘,...,х’“) = 52б< 1=1 (28) е _ (rl <rm\ -Л _________ (е е \ ^“9ж^ ’ ’ ® Ст)
486 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ или, короче, в виде ГЮ + /(®)=^, e = W(o:), ® = w*(e), где V/(x) = (df_ \ari’ , (X), W (?) = £x = £iX* = 1=1 дГ df\ d£i’ ’ d£m) (a f) Матрицу, составленную из частных производных второго порядка функции (а иногда и определитель этой матрицы), называют гессианом функции в данной точке. Пусть dij is. dij — алгебраические дополнения элементов гессианов ( d*f d*f дхгдх1 ' ' дхгдхт d2f d2f \дхтдх1 дхтдхт у / д2Г д2Г \ d£id£i •• д^т (£) d2f* d2f* Э^тд^т / функций /(я) и /*(£), a d и d* — определители этих матриц. Считая, что d / О, покажите, что d d* = 1 и что —(я) = — (€) / (ч) — d'j (х) dx'dxi{Х) d* ™ d { g) Мыльная пленка, натянутая на проволочный контур, образует так называе- мую минимальную поверхность, имеющую наименьшую площадь среди всех поверх- ностей, натянутых на этот контур. Если локально задать эту поверхность как график функции z = f(x,y), то, ока- зывается, функция f должна удовлетворять следующему уравнению минимальных поверхностей: (1+л2)л; - гллл;+(1+л2)/;,=о. Покажите, что после преобразования Лежандра это уравнение приводится к виду (1 + ч2) С + 2?ч/Й' + (1 + ?2) fit = 0. 3. Канонические переменные и система уравнений Гамильтона^. а) В вариационном исчислении и фундаментальных принципах классической ме- ханики важную роль играет следующая система уравнений Эйлера —Лагранжа: (dL d dL\ , v _ < \ дх dt dv ) (29) k v = x(t), У. Р. Гамильтон (1805—1865) — знаменитый ирландский математик и механик. Сфор- мулировал вариационный принцип (принцип Гамильтона), построил феноменологическую теорию оптических явлений; создатель теории кватернионов и родоначальник векторного анализа (кстати, ему принадлежит сам термин «вектор»).
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 487 где L(t, x,v) — заданная функция переменных t, х, и, среди которых t обычно явля- ется временем, х — координатой, a v — скоростью. Систему (29) составляют два соотношения на три переменные. Из системы (29) обычно желают найти зависимости х = x(t) и v = v(t), что по существу сводится к отысканию зависимости х — x(t), ибо v = CLv Запишите подробно первое уравнение системы (29), раскрыв производную — с учетом того, что х = x(t) и v = v(t). b) Покажите, что если от переменных t, х, v, L перейти к так называемым каноническим переменным t,x,p, Н, сделав преобразование Лежандра (см. задачу 2) {9L Р~ dv' Н = pv — L по переменным v, L, заменяя их на переменные р, Н, то система Эйлера—Лагранжа (29) приобретает симметричный вид дН дН р~ дх' х~ др’ (30) в котором она называется системой уравнений Гамильтона. с) В многомерном случае, когда L = L(tt ж1,..., хт, и1, ..., vm), система уравне- ний Эйлера—Лагранжа имеет вид ' dL , d dL \ (. ч _ п ,дх‘ + dtdv‘)^’ ’ v' = x*(t) (г = 1,... ,тп), (31) где для краткости положено х = (ж1, ..., жт), v = (и1, ..., vm). Сделав преобразование Лежандра по переменным и1, ..., vm, L, перейдите от переменных t, ж1, ..., хт, и1, ..., vm, L к каноническим переменным t, ж1, ..., жт, Pi, ..., рт, Н и покажите, что в них система (31) перейдет в следующую систему уравнений Гамильтона: дН .i дН (. , х Р< = “я^£’ х (» = 1, ...,т). (32) ох1 дтк 4. Теорема о неявной функции. Решение этой задачи дает другое, быть может, менее наглядное и эффектив- ное, но более короткое в сравнении с изложенным выше доказательство основной теоремы настоящего параграфа. а) Пусть выполнены условия теоремы о неявной функции, и пусть „о dF'\, х Fv(x,y) - , ..., дуП)(х’У) — i-я строка матрицы Ру(ж, у). Покажите, что определитель матрицы, составленной из векторов Fy(xi,yi), от- личен от нуля, если все точки (ж*, j/*) (i = 1, ..., п) лежат в некоторой достаточно малой окрестности U = I™ к 1у точки (жо, j/o)-
488 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ь) Покажите, что если при х € I™ найдутся точки |/i, уг € 1у такие, что F(a;,yi) = = 0 и F(x,y2) = 0, то для каждого i € {1, ..., п} найдется такая точка (ж,|д), лежащая на отрезке с концами (ж,|/1), (®,|/г), что ^v(®,^)(!/2 -!/i) =0 (» = 1, ...,n). Покажите, что отсюда следует, что yi = у2, т. е. если неявная функция f : I™ -ь Iу существует, то она единственна. с) Покажите, что если шар В(уо',г) лежит в 1у , то F(xo,y) / 0 при |||/ — |/o||Rn = = г > 0. d) Функция ||F(a?o,!/) ||Rn непрерывна и имеет положительный минимум /л на сфере ||у - уо||Rn = г. е) Существует 8 > 0 такое, что при ||ге — ®o||r"» < 8 1^(ж, У)IIRn если ||у - i/oIIr" = г, если |/ = |/о- f) При любом фиксированном х таком, что ||ж — жо|| < 8, функция ||F(x, у)||Rn достигает минимума в некоторой внутренней точке у — f(x) шара |||/ — |/o||Rn г, и поскольку матрица Fy(x,f(x)) обратима, то F(x,f(x)) = 0. Этим устанавливается существование неявной функции /: В(хо;6) —► В(|/о;г). g) Если Д|/ = f(x 4- Дж) — /(ж), то где Fy — матрица, строками которой являются векторы ^(ж;,|/;) (» = 1, ...,п), где (ж<, yi) — соответствующая точка на отрезке с концами (ж, у), (ж + Дж, у + Ду). Аналогичный смысл имеет символ Fz. Покажите, что из этого соотношения следует непрерывность функции у = /(ж). h) Покажите, что (ж) = -[^'(жЛж))]-1. [Д'(ж, /(ж))]. 5. «Если f(x,y,z) = 0, то S ' I? = ~Ь. оу OX OZ а) Придайте точный смысл этому высказыванию. Ь) Проверьте его справедливость на примере формулы Клапейрона Р V Т = const и в общем случае функции трех переменных. с) Как выглядит аналогичное высказывание для соотношения /(ж1, ..., жт) = 0 между тп переменными? Проверьте его справедливость. 6. Покажите, что корни уравнения яп +С1Яп-1 + ... + сп =0 гладко зависят от его коэффициентов, во всяком случае, пока все корни различны.
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 489 § 6. Некоторые следствия теоремы о неявной функции 1. Теорема об обратной функции Определение 1. Отображение f: U —> V, где U и V — открытые под- множества в Rm, называется С -диффеоморфизмом или диффеоморфизмом гладкости р (р = 0,1,...), если 1) /6С(₽)(У;У); 2) f — биекция; 3) /-1 EC^(V;U). (7 <°)-диффеоморфизмы называют гомеоморфизмами. Здесь мы, как правило, будем рассматривать только гладкий случай, т. е. случай р Е N или р = оо. Следующая часто используемая теорема в идейном плане утверждает, что если дифференциал отображения обратим в точке, то само отображение обра- тимо в некоторой окрестности этой точки. Теорема 1 (теорема об обратной функции). Если отображение f: G Rm области G С Rm таково, что 1° р>1, 2° Уо = /(яо) при х0 € G, 3° f'(xo) обратимо, то существуют окрестность U(xq) С G точки хо и окрестность V(yo) точки уо такие, что f : U(®о) -> У(у0) есть С-диффеоморфизм. При этом если х € U(xo) и у = f(x) € V(yo), то (/-*)'(») = (/'(я))-1. ◄ Соотношение у = f(x) перепишем в виде F(x,y) = f(x)-y = 0. (1) Функция F(x,y) = f(x) — у определена при х € G и у е Rm, т. е. опреде- лена в окрестности G х Rm точки (хо,Уо) € Rm х Rm. Мы хотим разрешить уравнение (1) относительно х в некоторой окрест- ности точки (хо,уо)- В силу условий 1°, 2°, 3° теоремы отображение F(x,y) таково, что ГеС^((?хГ;Г), 1, F(xo,yo) = О, Fi(xo,yo) = ГЫ обратимо.
490 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ По теореме о неявной функции найдутся окрестность 1Х х 1у точки (ято, З/о) и отображение д € C^(Zy;Zx) такие, что для любой точки (я;, у) € 1Х х 1У f(x)-y.= 0 <=> х = д(у) (2) 9'(у) = - [Fx(x, 2/)]“1[-Fj(a?, у)]. В нашем случае F^x,y) = f'(x), Fy(x^y) = -Е, где Е — единичная матрица; поэтому 9'(У) = (3) Если положить V = 1у и U = д(У), то соотношение (2) показывает, что отображения f:U->V ид :V-tU взаимно обратны, т. е. д = /-1 на V. Поскольку V = 1у, то V — окрестность точки уо. Это означает, что при условиях 1°, 2°, 3° образ уо = /(^о) точки xq € G, внутренней для G, является точкой, внутренней для образа /(G) множества G. В силу формулы (3) ма- трица д'(уо) обратима. Значит, отображение д : V U обладает свойствами 1°, 2°, 3° относительно области V и точки уо € V. Тогда по уже доказанному я?о = д(уо) — внутренняя точка множества U = g(V). Поскольку условия 1°, 2°, 3° в силу формулы (3), очевидно, выполнены в любой точке у € V, то любая точка х = д(у) является внутренней точкой множества U. Таким образом, U — открытая (и, очевидно, даже связная) окрестность точки xq в Rm. Теперь проверено, что отображение f:U->V удовлетворяет всем условиям определения 1 и утверждению теоремы 1. ► Приведем несколько примеров, иллюстрирующих теорему 1. Очень часто теорема об обратной функции используется при переходе от одной системы координат к другой системе координат. Простейший вариант такого пре- образования координат рассматривался в аналитической геометрии и линей- ной алгебре и имел вид или, в компактной записи, yi = ajx*. Это линейное преобразование А: R™ -> —> R£* имеет обратное А-1: R^1 —> R™, определенное во всем пространстве R^1, тогда и только тогда, когда матрица (а?) обратима, т. е. при условии, что det (а/) / 0. Теорема об обратной функции является локальным вариантом этого утвер- ждения, опирающимся на то обстоятельство, что гладкое отображение в ма-
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 491 лой окрестности точки ведет себя примерно так же, как его дифференциал в этой точке. Пр и м е р 1. Полярные координаты. Отображение /: R2 —> R2 полуплос- кости R2 = {(Р> ¥>) £ R2 | р 0} на плоскость R2, задаваемое формулами х = р cos (р, У = р sin у?, (4) проиллюстрировано на рис. 57. Якобиан этого отображения, как нетрудно подсчитать, равен р, т. е. от- личен от нуля в окрестности любой точки (р, у?), где р > 0. Таким образом, формулы (4) локально обратимы и, значит, локально числа р, <р могут быть приняты в качестве новых координат точки, которую раньше задавали декар- товы координаты х, у. Координаты (р, у?) являются хорошо известной системой криволинейных координат на плоскости — это полярные координаты. Их геометрический смысл виден из рис. 57. Отметим, что в силу периодичности функций cosy?, sin у? отображение (4) при р > 0 только локально диффеоморфно, а во всей этой области оно не является биективным. Именно поэтому переход от декартовых координат к полярным всегда сопровождается выбором ветви (т. е. указанием диапазона изменения) аргумента у?. Полярные координаты (р, у?) в трехмер- ном пространстве R3 называют сферическими координатами. Они связаны с декартовыми координатами формулами z = рсозф, у = р sin ф sin у?, (5) х = р sin ф cos у?. Геометрический смысл параметров р, ф, у? показан на рис. 58. Якобиан отображения (5) равен р2 sin ф и в силу теоремы 1 преобразование (5) обратимо в окрестности любой точки (р, ф, у?), в которой р > 0 и sinф / 0. 17 Зорич В. Л.
492 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Множествам, где р = const, <р = const или i/) = const, в пространстве (х, у, г), очевидно, отвечают соответственно сферическая поверхность (на сфере радиуса р), полуплоскость, проходящая через ось г, и поверхность ко- нуса с осью z. Таким образом, при переходе от координат (я, у, г) к координатам (р, <р), например, сферическая поверхность и поверхность конуса локально распрям- ляются: им соответствуют куски плоскостей р — const и = const соответ- ственно. Аналогичное явление мы наблюдали и в двумерном случае, когда дуге окружности на плоскости (х, у) отвечал отрезок прямой на плоскости с координатами (р, <р) (см. рис. 57). Обратите внимание на то, что это именно локальное выпрямление. В тп-мерном случае полярные координаты вводятся соотношениями ж1 = р cos , х2 = р sin cos <р2, ............................................... (5') xm~L = р sin (pi sin <р2 ... sin <рт-2 cos <pm-i > ят = p sin <pi sin <p2 .. • sin <pm-2 sin <pm-i. Якобиан этого преобразования равен Pm-1 sinm~2 (pl sinm-3(p2 ... sin (pm-2 (6) и в силу теоремы 1 оно тоже локально обратимо всюду, где этот якобиан отличен от нуля. Пример 2. Общая идея локального выпрямления кривых. Новые коор- динаты обычно вводят с целью упростить аналитическую запись объектов, участвующих в задаче, и сделать их более обозримыми в этой новой записи. Пусть, например, на плоскости R2 некоторая кривая задана уравнением F(x, у) = 0. Пусть F — гладкая функция, а точка (х0, уо) такова, что она лежит на кривой, т. е. F(xQ,yo) = 0, и не является критической точкой функции F, например, пусть Щхо,уо)£0. Попробуем подобрать координаты £, р так, чтобы в них дуге нашей кри- вой, содержащей (хо,уо), отвечал отрезок одной из координатных линий, на- пример линии Т) = 0. Положим £ = х-х0, T) = F(x,y). Матрица Якоби
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 493 этого преобразования имеет своим детерминантом величину F^(x,y), кото- рая по предположению отлична от нуля в точке (з?о> 2/о)- Тогда по теореме 1 это отображение является диффеоморфизмом окрестности точки (гго,2/о) на окрестность точки (£,т]) = (0,0). Значит, в пределах указанной окрестности числа £, Т) можно принять за новые координаты точек, лежащих в окрестности точки (хо, уо)- В новых координатах наша кривая, очевидно, имеет уравнение г] = 0, и в этом смысле мы действительно добились ее локального выпрямле- ния (рис. 59). 2. Локальное приведение гладкого отображения к каноническо- му виду. Мы рассмотрим здесь только один вопрос этого типа, а именно укажем канонический вид, к которому удачным выбором координат можно локально привести любое гладкое отображение, имеющее постоянный ранг. Напомним, что рангом гладкого отображения f: U —> Rn области U С Rm в точке х € U называется ранг касательного к нему в этой точке линейно- го отображения, т. е. ранг матрицы f'(x). Ранг отображения f в точке х обозначают обычно символом rang f(x). Теорема 2 (теорема о ранге). Пусть f : U —> Rn — отображение, определенное в окрестности U С Rm точки xq € Rm. Если f € C^(C7;Rn), р 1, ив любой точке х € U отображение f имеет один и тот же ранг к, то существуют окрестности O(xq), О(уо) точек xq, уо = f(xo) и такие их диффеоморфизмы и = <р(х), v = t/>(y) класса С№, что в окрестности O(uq) = ^(Q{xq)) точки uq — <р(хо) отображение v = о f о </>-1(и) имеет следующее координатное представление: (u1,...,ит) = и к—> v = (v1, ...,vn) = (и1, ...,г?,0, ...,0). (7) Иными словами, теорема утверждает (рис. 60), что вместо координат (я;1, ..., хт) можно выбрать координаты (u1, ...,um), а вместо координат 17*
494 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ (у1, • • •, Уп) ~ координаты (v1,..., vn) так, что локально наше отображение в этих новых координатах будет иметь вид (7), т. е. канонический вид линей- ного отображения ранга к. нашего отображения f: U -+ определенного в окрестности точки а?о € Чтобы не менять нумерацию координат и окрестность Ц, будем считать, что в любой точке х G U главный минор порядка к, стоящий в левом верхнем углу якобиевой матрицы отображения /, отличен от нуля. Рассмотрим отображение, определяемое в окрестности U точки х0 равен- ствами и1 = ^(ж1, ...,хт) = f1(x\...,xm), ик = = fk(x\...,xm), uk+1 = <pk+1 (ж1,..., хт) = xk+1, ит = <рт(х\ ... ,хт) - хт. Его матрица Якоби имеет вид / df1 df1 df1 df \ dx1 dxk • dxk+1 dxm df df j df df dx1 dxk ; dxk+l dxm 1 0 0 о i , и в силу сделанного предположения ее определитель отличен от нуля в U. По теореме об обратной функции, отображение и = <р(х) является диф- феоморфизмом гладкости р некоторой окрестности O(xq) С U точки х0 на окрестность O(uq) = <p(O(xq)) точки uq = <р(хо)-
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 495 Сравнивая соотношения (8) и (9), видим, что композиция д — f о р 1: 0{uq) —> R” имеет следующее координатное представление: J/1 = У1 = u1, ук = fk о . ,Um) = uk, (10) yk+1 = fk+1 о , um) = gk+l(ul, ..., um), yn = fn = gn(u\... ,um). Поскольку отображение р"1: O(uo) O(xq) в любой точке и 6 O(uo) имеет максимальный ранг т, а отображение f : <2(яо) —> в любой точке х € О(я?о) имеет ранг к, то, как известно из линейной алгебры, матрица д'(и) = • (^-1)/(г«) имеет ранг к в любой точке и € O(uo)- Прямой подсчет матрицы Якоби отображения (10) дает f 1 0 0 1 0 \ dgk+l dgk+1 dgk+1 9gk+1 du1 duk Quk+1 dum dgn dgn dgn \ du1 duk duk+l dum / Значит, в любой точке и 6 O(uq) получаем = 0 (* — к + 1,..., т\ j = к 4-1,.. •, п). Считая окрестность O(uo) выпуклой (чего можно добиться, уменьшив О(и0), например, до шара с центром и0), отсюда можно заключить, что функции gi при j = к + 1, ..., п на самом деле не зависят от переменных ик+1, ..., ит. После этого решающего наблюдения отображение (10) можно переписать в виде У1 = А Ук = и\ L К (И) yk+i = 5*+1(u1, ...,и*), уп = дп(и\...,ик).
496 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Теперь уже можно указать отображение ф. Положим v1 = J/1 =: ^(l/), v* = ук =: фк(у), v*+1 = yk+1 - дк+1(у\ ...,ук)-: Фк+1(у), vn = yn-gn(y\ “ ,yk) ='Фп(.у)> Из построения функций gi (j = к + 1,..., п) видно, что отображение ф определено в некоторой окрестности точки у о и принадлежит классу в этой окрестности. Матрица Якоби отображения (12) имеет вид / 1 О : i О О 1 dgt+1 ддк+' : . п ду1 дук ; _д£_ L ’ г \ду^ дук Ее определитель равен 1, и, значит, по теореме 1 отображение ф является диффеоморфизмом гладкости р некоторой окрестности О (у о) точки у о € на окрестность O(v0) = Ф(0(уо)) точки v0 € R£. Сравнивая соотношения (11) и (12), видим, что в достаточно малой окрест- ности O(uq) С O(uq) точки ио такой, что p(0(uo)) С О(уо), отображение фо f оip-1: O(uq) R” является отображением гладкостир этой окрестности О(ио) на некоторую окрестность О(уо) С O(vq) точки v0 € R” и при этом имеет канонический вид V1 = и1, vk = ик, vk+1 = 0, (13) vn = 0. Полагая <£-1(О(и0)) = О(®о), ^~1(О(«е)) = О(уо), получаем указанные в теореме окрестности точек xq, уо, чем и завершается доказательство. ►
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 497 Теорема 2, как и теорема 1, очевидно, является локальным вариантом со- ответствующей теоремы линейной алгебры. В связи с проведенным доказательством теоремы 2 сделаем следующие полезные для дальнейшего замечания. Замечание 1. Если в любой точке исходной окрестности U С Rm ранг отображения f : U —> Rn равен п, то точка уо = У(а;о), где xq € U, явля- ется внутренней точкой множества f(U), т. е. содержится в f(U) вместе с некоторой своей окрестностью. ◄ Действительно, по доказанному отображение фо fotp-1: O(uq) O(v0) в этом случае имеет вид (и1,..., ип,..., ит) = и I—► v = (v1,..., vn) = (и1,..., ип), поэтому образ окрестности точки uq = (р(хо) содержит некоторую окрест- ность точки Vq = V’ ° f ° У’-1 (^o)- Но отображения : O(xq) -у O(uq), V’ : О(уо) —> О(уо) — диффеомор- физмы, поэтому они переводят внутренние точки во внутренние. Записывая теперь исходное отображение У в виде У = V’-1 ° {Ф ° f ° <р-1) ° можем заключить, что точка уо = f(xo) является внутренней точкой образа окрест- ности ТОЧКИ Xq. ► Замечание 2. Если ранг отображения f: U Rn в любой точке окрест- ности U равен к и к < п, то, в силу равенств (8), (12) и (13), в некоторой окрестности точки а?о € U С Rm имеют место п — к соотношений УЧ*1,..., хт) = МЧх1, ..., хт),..., fk(x\ ..., X-)) (14) (г = к + 1,..., п). Указанные соотношения выписаны в принятом нами предположении о том, что главный минор порядка к матрицы У'(яо) отличен от нуля, т. е. что ранг к реализуется уже на наборе функций у1, ..., fk. В противном случае можно было бы изменить нумерацию функций У1, ..., fn и снова иметь указанную ситуацию. 3. Зависимость функции Определение 2. Говорят, что система непрерывных функций У*(х) = = У*(ж1,..., хт) (г = 1,..., п) является функционально независимой в окрест- ности точки хо = (arj,..., Xq1), если для любой непрерывной функции F(y) = = Fty1,..., уп), определенной в окрестности точки yQ — (j/J,..., у$) = (У1 (а?о)5 ..., Уп(я?о)) = У(*о), соотношение в окрестности точки xq возможно только в случае, когда F(y\ , уп) = 0 в окрестности точки уо.
498 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Линейная независимость, рассматривавшаяся в алгебре, есть независи- мость по отношению к линейным соотношениям Яг/1, • • ,г/") = Ais/1 + • • • + А»г/П- Если система не является функционально независимой, то ее называют функционально зависимой. В случае линейной зависимости векторов один из них, очевидно, является линейной комбинацией остальных. Аналогичная ситуация имеет место и в отношении функционально зависимой системы гладких функций. Утверждение 1. Если система f'fx1, ..., хт) (i = 1, ..., п) гладких функций, определенных в окрестности U(xq) точки хо € Мт, такова, что ранг матрицы /df1 df1 \ Эя:1 *' * dxm dfn dfn \ dx1 ' ‘’ dxm / (я) в любой точке х EU один и тот же и равен к, то а) при к = п система функционально независима в окрестности xq; Ь) при к < п найдутся окрестность точки х0 и такие к функций си- стемы, пусть f1, ..., fk, что остальные п — к функций системы в этой окрестности представляются в виде ftf, ...,хт) = Я\р(х\ .... Z-),..., /‘(х1....хт)), где дг(у\ •. • ,ук) — гладкие функции, определенные в окрестности точки Уо — (/Ч^о)) • • •, /п(^о)) и зависящие только от к координат текущей точ- ки у = (у1, ...,уп). ◄ В самом деле, если к = п, то в силу замечания 1 к теореме о ранге при отображении v1 ....................................... (15) Vя = Г (х1,..., хт) образ окрестности рассматриваемой точки хо содержит целую окрестность точки уо — /(^о)« Но тогда соотношение Я/V........»”), • • •, Г (а:1.im)) = 0 в окрестности ГГо возможно только при условии, что Ffoi,..., »") = () в окрестности точки уо- Этим утверждение а) доказано.
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 499 Если же к < п и ранг к отображения (15) реализуется уже на функ- циях J1, ..., fk, то в силу замечания 2 к теореме о ранге найдется такая окрестность точки у0 = f(x0) и п - к определенных в ней функций дг(у) = — 9г(У1 > • • • > Ук) (г = & + 1,..., п) того же порядка гладкости, как и функции системы, что в некоторой окрестности точки а?о будут выполнены соотноше- ния (14). Этим доказано утверждение Ь). ► Мы показали, что если к < п, то найдутся п — к специальных функций F*(y) = у1 — д*(у\ .. •, ук) (г = к + 1,..., п), устанавливающих соотношения г(ГИ,---,/‘И,Г«)=о (» = * + i,...,n) между функциями системы /п в окрестности точки Xq. 4. Локальное разложение диффеоморфизма в композицию про- стейших. Здесь мы покажем, как, используя теорему об обратной функции, можно локально представить диффеоморфное отображение в виде композиции таких диффеоморфизмов, каждый из которых меняет только одну из коорди- нат. Оп ределение 3. Диффеоморфизм д : U —> открытого множества U G будем называть простейшим, если его координатное представление имеет вид ' у* = хг, i G {1, ..., т], i/ j, k у3 = д3(х\ ...,хт), т. е. при диффеоморфизме д : U —> меняется только одна из координат отображаемой точки. Утверждение 2. Если f:G—> — диффеоморфизм открытого мно- жества G С К”1, то для любой точки хо G G найдется такая ее окрест- ность, в которой справедливо представление f — gi о.. .ogn, где gi, ..., gn — простейшие диффеоморфизмы. ◄ Проверим это по индукции. Если исходное отображение / само является простейшим, то для него утверждение тривиально справедливо. Предположим, что утверждение справедливо для диффеоморфизмов, меня- ющих не более чем (к — 1) координату, где к — 1 < п. Рассмотрим теперь диффеоморфизм f: G —> Rm, меняющий к координат: У1 = fk(xl,...,xm), ук = fk(x1,...,xm), у‘+> = Хк+1, (16) V т — хт
500 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Мы приняли, что меняются именно первые к координат, чего можно до- стичь линейными преобразованиями. Значит, это не умаляет общности рас- суждений. Поскольку / — диффеоморфизм, то его матрица Якоби f'(x) в любой точке х Е G невырожденная, ибо Фиксируем хд £ G и вычислим определитель матрицы f'(xo): df df a/1 df dx1 dxk dxm dfk dfk dfk dfk dx1 dxk dxk+x dxm 1 0 0 0 1 df dx1 df dxk Oo) = dfk dx1 0fk dxk Oo) # 0 Таким образом, один из миноров порядка к — 1 последнего определителя должен быть отличен от нуля. Опять для упрощения записи будем считать, что таким является главный минор порядка к — 1. Рассмотрим тогда вспомо- гательное отображение д: G -> Rm, определяемое равенствами и1 = ...,ят), u*-i = У*"1 (ж1, ...,жт), т = хт Поскольку якобиан df dx1 df dxk~' df dxk df dxm dfk~x dfk-l dfk~i df1*-1 dx1 дхк~г dxk dxm Oo) = 1 0 0 0 1 df1 df1 dx1 dxk-1 df*-1 dx1 dxk~l Oo) # 0 отображения g : G —> в точке Xq € G отличен от нуля, отображение д является диффеоморфизмом в некоторой окрестности точки xq.
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 501 Тогда в некоторой окрестности точки uq = р(ято) определено обратное к д отображение х = д~1(и), которое позволяет ввести в окрестности х0 новые координаты (и1,..., ит). Пусть h = f о д~г. Иными словами, отображение у = h(u) есть наше отображение (16) у = /(ж), записанное в координатах и. Отображение h, как композиция диффеоморфизмов, является диффеоморфизмом некоторой окрестности точки uq. Его координатная запись, очевидно, имеет вид У1 - f1 ° 9 Х(«) = t?, ук 1 - fk 1 од _ ик i, Ук ^fbog-'tu), *.fc+l _ „.A+l ут = т. е. h — простейший диффеоморфизм. Но f = h о д, а по предположению индукции отображение д, определенное формулами (17), раскладывается в композицию простейших диффеоморфиз- мов. Таким образом, диффеоморфизм /, меняющий к координат, в некоторой окрестности точки xq тоже раскладывается в композицию простейших диф- феоморфизмов, что и завершает индукцию. ► 5. Лемма Морса. К рассматриваемому кругу идей принадлежит также красивая сама по себе и важная в приложениях лемма Морса1) о локальном приведении гладкой вещественнозначной функции к каноническому виду в окрестности невырожденной критической точки. Определение 4. Пусть xq — критическая точка функции f Е (U; R), определенной в окрестности U этой точки. Критическая точка xq называется невырожденной критической точкой f функции f, если гессиан функции в этой точке (т. е. матрица q iQ j (^о)> составленная иЗ частных производных второго порядка) имеет отличный от нуля определитель. Если хо — критическая точка функции, т. е. /'(гго) — 0, то по формуле Тейлора /(®) - /(а?0) = - ~ Х^^ + “ Х°И2) • (18) ^Х. К. М. Морс (1892 — 1977) — американский математик; основные труды посвящены применению топологических методов к различным разделам анализа.
502 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Лемма Морса утверждает, что локально можно сделать такую замену х = д(у) координат, что в координатах у функция / будет иметь вид (/ ° <Ш - /(*□) = -(у1)2 - • - (у*)2 + (у‘+1)2 + • • + (Г)2- Если бы в правой части равенства (18) отсутствовал остаточный член о(||гг —гг0||2), т. е. разность /(ж) — /(жо) была бы просто квадратичной формой, то, как известно из алгебры, линейным преобразованием ее можно было бы привести к указанному каноническому виду. Таким образом, утверждение, которое мы собираемся доказать, есть локальный вариант теоремы о приве- дении квадратичной формы к каноническому виду. Доказательство его будет использовать идею доказательства этой алгебраической теоремы. Мы будем опираться также на теорему об обратной функции и следующее предложение. Лемма А дамара. Пусть f: U —> К — функция класса C^P\U; К), р 1, определенная в выпуклой окрестности U точки 0 = (0, ..., 0) G Rm и такая, что /(0) = 0. Тогда существуют функции gi G C^P~^(U; R) (г = 1, ..., т) такие, что в U имеет место равенство т ..., хт) = 52 • • •,хГП), (19) i=i причем дг(в) = |Х(0). ◄ Равенство (19) — это, в сущности, иная полезная запись уже известной нам формулы Тейлора с интегральным видом остаточного члена. Оно выте- кает из равенств f(x',..., тт) = [ dt = '£x' [ .... tera) dt, J GX - J ox 0 1=1 о если положить i gi(x\ xm) = f y~-(tx\ ..., txm) dt (i = 1, ..., m). j OX 0 df dx* To, что gi (0) = (0) (i = 1,..., m), очевидно, а то, что gi G C^p ^(U; R), тоже нетрудно проверить. Но мы не будем сейчас заниматься этой проверкой, поскольку в свое время будет доказано общее правило дифференцирования ин- тегр’ала, зависящего от параметра, из которого нужное нам свойство функций gi будет непосредственно вытекать. Таким образом, с точностью до указанной проверки, формула Адамара (19) установлена. ►
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 503 Лемма Морса. Если f : G -> R — функция класса опреде- ленная на открытом множестве G С Rm, a xq Е G — невырожденная крити- ческая точка этой функции, то найдется такой диффеоморфизм g : V —> U некоторой окрестности начала координат 0 пространства на окрест- ность U точки xq, что для всех точек у Е V = /(«о) - К»1)3 + • • • + (г/‘)2] + [(»‘+1)2 + • • + (Г)2]- ◄ Линейными заменами вопрос сводится к случаю, когда xq = 0 и f(xo) = = 0, что мы в дальнейшем и будем считать выполненным. Поскольку xq = 0 — критическая точка функции /, то в формуле (19) ^(0) = 0 (г = 1, ..., тп). Тогда по той же лемме Адамара т gi(xr, ...,хт) = ^xJhij(x1, ...,хт), j=i где hij — гладкие функции в окрестности точки 0, и, следовательно, т fix1, хт). (20) i,J=l Подставляя здесь, если нужно, вместо hij функции hij = (h^ + hji), можем считать, что = hji. Заметим также, что, в силу единственно- сти тейлоровского разложения, из непрерывности функций hij следует, что hijifi) = я Л -(0) и, значит, матрица (hij(O)) невырожденная. ОХ ох* Теперь функция / записана подобно квадратичной форме и мы хотим, так сказать, привести ее к диагональному виду. Как и в классическом случае, будем действовать по индукции. Предположим, что существуют координаты и1,..., ит в окрестности Ui точки 0 Е Rm, т. е. диффеоморфизм х = <р(и) такой, что в координатах и1,..., ит т (/ о V)(U) = ±(u‘)2 ± ... ± (иг-1)3 + 22 «УВД»1, um), (21) где г 1, а = Hji. Заметим, что при г = 1 соотношение (21) имеет место, что видно из фор- мулы (20), где Н^ = hij. т По условию леммы, квадратичная форма 52 х*х*Ьц(0) невырожденная, М=1 т. е. det (hjj (0)) 0 0. Замена переменных х = <р(и) осуществляется диффео- морфизмом, поэтому det</?'(0) / 0. Матрица формы ±(и1)2 ± ... ± (иг~1)2 + тп + 52 ulu^Hij(0) получается из матрицы (hjj(O)) домножением справа на ма- t,J=r трицу <£>'(0) и слева на транспонированную по отношению к ‘/’'(О) матрицу,
504 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ поэтому она тоже невырожденная. Следовательно, по крайней мере одно из чисел (i, j = г, ..., тп) отлично от нуля. Линейной заменой переменных m форму $2 u'uiHijfi) можно привести к диагональному виду, поэтому мож- но считать, что в равенстве (21) Нгг(0) / 0. Ввиду непрерывности функций Hij(u) неравенство Нгг(и) / 0 будет выполнено также в некоторой окрестно- сти точки и = 0. Положим ^(п1,..., um) = \/|17rr(u)|. Тогда функция принадлежит клас- су C^\U2', R) в некоторой окрестности U2 С U\ точки и — 0. Сделаем теперь переход к координатам (v1, ..., vm) по формулам v* = u1, i / г, vr — tpfu1,, um) (ur -I- ' 1>г и*Н1г(и\ ...,ит)\ Нгг(и\ ...,ит) / (22) Якобиан преобразования (22) в точке и = 0, очевидно, равен ip(0), т. е. отличен от нуля. Тогда в силу теоремы об обратной функции можно утвер- ждать, что в некоторой окрестности U3 С U2 точки и = 0 отображение v = i/)(u), заданное соотношениями (22), является диффеоморфизмом класса ИГ”) и потому переменные (v1,..., vm) действительно могут служить координатами точек U$. Выделим в правой части равенства (21) все члены ururHrr(u\...,um) + 2 У urujHrj(u\...,um), (23) J=r+1 содержащие иг. В записи (23) суммы этих членов мы использовали то, что Hij = Hj{. Сравнивая (22) и (23), видим, что выражение (23) можно переписать в виде ±vrvr - Знак ± перед vrvr появляется в связи с тем, что Hrr — ±(^)2, причем берется знак плюс, если Нгг > 0, и знак минус, если Нгг < 0. Таким образом, после замены v = i/tfu) выражение (21) преобразуется в равенство (/ о ip о г)(и) = У [±(t/)2] + У ..., vm), i=l i,j>r где Hij — некоторые новые гладкие функции, симметричные по индексам i, j. Отображение tp о является диффеоморфизмом. Таким образом, завершен индуктивный переход от г — 1 к г и лемма Морса доказана. ►
§ 6. СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 505 Задачи и упражнения 1. Вычислите якобиан перехода (6) от полярных координат к декартовым коор- динатам в Rm. 2. а) Пусть xq — некритическая точка гладкой функции F : U —> R, определенной в окрестности U точки х0 = (xj, • • > ®о*) 6 Покажите, что в некоторой окрест- ности U С U точки Xq можно так ввести криволинейные координаты (£\ ..., £т), что множество точек, выделяемое условием F(x) = F(xq), в этих новых координатах будет задаваться уравнением = 0. b) Пусть 9?, V’ € C^(D;R) и пусть в области D (9?(х) = 0) => (ф(х) = 0). Покажите, что если grad / 0, то в D справедливо разложение ф = 0 • где 0 G G C(fc-1)(D;R). 3. Пусть f: R2 —> R2 — гладкое отображение, удовлетворяющее системе уравне- ний Коши — Римана а/1 _ df df^= df2 дх1 дх2 ’ дх2 дх1 а) Покажите, что якобиан такого отображения равен нулю в некоторой точке тогда и только тогда, когда матрица f(x) в этой точке нулевая. Ь) Покажите, что если f'(x) 0, то в окрестности точки х определено обратное к f отображение /-1, которое также удовлетворяет системе уравнений Коши — Римана. 4. Зависимость функций (прямое доказательство). а) Покажите, что функции тг1(х) — хг (г = 1, ..., т) от точки х = (х1, ..., хт) € G R"1 образуют независимую систему функций в окрестности любой точки про- странства Rm. b) Покажите, что, какова бы ни была функция f Е C'(Rn; R), система тг1, ..., тгт, f функционально зависима. с) Если система гладких функций f1, ..., fk, k < т, такова, что ранг отобра- жения f = If1, ..., fk) в точке хо = (xq, • • , х™) Е Rm равен к, то в некоторой окрестности этой точки ее можно дополнить до независимой системы f1, ..., fm, состоящей из т гладких функций. d) Если система £г =/г(х\ ..., хт) (г = 1, ...,тп) гладких функций такова, что осуществляемое ею отображение f = (f1, ;.., fm) име- ет в точке хо = (xq, ..., х™) ранг т, то переменные (£\ ..., £т) могут служить криволинейными координатами в некоторой окрестности ?7(хо) точки хо и любая функция 9?: ?7(хо) —> R может быть записана в виде 9?(х) = F(/1(x), ..., /т(х)), где F = <po f-1. е) Ранг отображения, осуществляемого системой гладких функций, называют также рангом этой системы. Покажите, что если ранг системы гладких функ- ций fix1, ..., хт) (г = 1, ..., к) равен к и ранг системы функций f1, ..., fm, 9? тоже равен к в некоторой точке хо € Rm, то в окрестности этой точки 9?(х) = У казание. Используйте с), d) и покажите, что F(f\ ..., fm) = fX/1./*). 5. Покажите, что ранг гладкого отображения f : Rm —> Rn является функцией, полунепрерывной снизу, т. е. rang/(x) rang/(xo) в окрестности точки Хо Е R771.
506 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 6. а) Дайте прямое доказательство леммы Морса для функций f : R —> R. b) Выясните, применима ли лемма Морса в начале координат к функциям f(x) = х3; /(х) = х sin /(х) = е-1/ж2 sin2 JU JU f(x,y) = х3-Зху2; f(x,y) = x2. с) Покажите, что невырожденные критические точки функции f G (7^(RTO;R) являются изолированными: каждая из них имеет такую окрестность, в которой нет других критических точек функции /, кроме самой этой точки. d) Покажите, что число к отрицательных квадратов в каноническом предста- влении функции в окрестности невырожденной критической точки не зависит от способа приведения, т. е. от системы координат, в которой функция имеет канони- ческий вид. Это число называется индексом критической точки. § 7. Поверхность в и теория условного экстремума Для неформального понимания важной в приложениях теории условного экс- тремума весьма полезно иметь некоторые начальные сведения о поверхностях (многообразиях) в пространстве Rn. 1. Поверхность размерности k в ЙГ. Обобщая понятие закона дви- жения х = x(t) материальной точки, мы в свое время ввели понятие пути в Rn как непрерывного отображения Г : I —> Rn промежутка I С R. Степень гладкости пути определялась как степень гладкости этого отображения. Но- ситель Г(/) С Rn пути мог быть довольно причудливым множеством в Rn, которое иногда только с очень большой натяжкой можно было бы назвать линией. Например, носитель пути мог оказаться просто точкой. Аналогично, непрерывное или гладкое отображение f: Ik —> Rn fc-мерного промежутка Ik С RA, называемое k-путпем в Rn, может иметь в качестве образа f(Ik) совсем не то, что хотелось бы назвать fc-мерной поверхностью в Rn. Например, это снова может быть точка. Чтобы гладкое отображение f: G —> Rn области G С R* определяло в Rn /г-мерную геометрическую фигуру, точки которой описываются к независи- мыми параметрами (t1, ..., tk) € G, достаточно, как мы знаем из предыдуще- го параграфа, потребовать, чтобы в каждой точке t G G ранг отображения f : G —> Rn был равен к (разумеется, к ri). В этом случае отображение f : G —> f(G) локально (т. е. в окрестности любой точки t € G) является взаимно однозначным. Действительно, пусть rang f (to) = к и он реализуется, например, на первых к из п функций ( X1 = /'(t1, (.................. (1) задающих координатную запись отображения f: G —> Rn.
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 507 Тогда по теореме об обратной функции переменные t1, ... ,tk в некото- рой окрестности U(to) точки to можно выразить через переменные ж1, ... ,хк. Значит, множество /(C7(to)) может быть записано в виде Ж*+1 = 99*+1(ж1, ..., хк), ..., хп = 93п(ж\ ..., Хк) (т. е. оно взаимно однозначно проектируется на координатную плоскость ж1, ..., хк), и потому отображение /: 7/(to) -> /(t/(to)) действительно взаимно однозначное. Однако уже на примере одномерного гладкого пути (рис. 61) ясно, что подобная локальная вза- имная однозначность отображения f : G —> Rn из области G параметров в пространство Rn вовсе не обязана быть взаимной однозначностью в целом. Траектория может иметь многократные самопе- ресечения, поэтому если мы желаем определить гладкую fc-мерную поверхность в Rn и видеть ее как множество, которое около каждой своей точки устроено как несколько деформированный кусок fc-мерной плоскости (/с-мерного подпространства пространства Кп), то нам не достаточно регулярно отображать канонический кусок G С R* /с-мерной поверхности в пространство IRn, но необходимо также следить за тем, как он в целом оказывается вложенным в это пространство. Определение 1. Множество S С Rn будем называть к-мерной глад- кой поверхностью в пространстве Rn (или к-мерным подмногообразием Rn), если для любой точки Хо € S найдутся окрестность U(ж0) в Кп и диффеомор- физм U(xq) —> 1п этой окрестности на стандартный n-мерный промежуток In = {t 6 Rn 11£*| < 1, i = 1, пространства Rn, при котором образ множества S П U(xq) совпадает с лежащей в I частью fc-мерной плоскости пространства Rn, задаваемой соотношениями tk+1 = 0, ... , tn = 0 (рис. 62).
508 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Степень гладкости поверхности S будем измерять степенью гладкости диффеоморфизма <р. Если смотреть на переменные t1, ..., tn как на новые координаты в окрестности U(я?о)> то определение 1 в сокращенном варианте можно перефор- мулировать следующим образом: множество S С R” называется А:-мерной по- верхностью (А;-мерным подмногообразием) в R”, если для любой точки xq 6 S можно указать окрестность U(xq) и такие координаты t1, ..., tn в ней, что множество S Г) t/(xo) в этих координатах задается соотношениями Роль стандартного промежутка в определении 1 чисто условная и примерно такая же, как роль стандартного размера или формы страницы в географи- ческом атласе. Каноническое расположение промежутка в системе координат t1, ...,tn также относится к области стандартизации и не более того, по- скольку любой куб в R” дополнительным линейным диффеоморфизмом всегда можно преобразовать в стандартный n-мерный промежуток. Эти замечанием мы часто будем пользоваться, сокращая проверку того, что некоторое множество S С Rn является поверхностью в Rn. Рассмотрим примеры. Пример 1. Само пространство R” является n-мерной поверхностью класса СЛ°°\ В качестве отображения : Rn -+ 1п здесь можно взять, на- пример, отображение 2 £г = — arctgх1 (г = 1, ..., п). 7Г Пример 2. Построенное в примере 1 отображение заодно устанавлива- ет, что подпространство векторного пространства 1R”, задаваемое условиями хк+1 — ... = хп = 0, является /с-мерной поверхностью в R” (или /с-мерным подмногообразием Ж”). Пример 3. Множество в R”, задаваемое системой соотношений ajx1 + ... + а%хк + а*+1я*+1 + . • • + а„хп = 0, а? кхг + ... + а? кхк + а?, ?ж*:+1 +...+ а” кхп = 0 А Iv А • при условии, что ранг этой системы равен п — к, является А:-мерным подмно- гообразием Действительно, пусть, например, определитель <4+1 ап а"-*= ... а?~к к+1 п
§ 7. ПОВЕРХНОСТЬ В Яп И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 509 отличен от нуля. Тогда линейное преобразование t — у tk = хк, tk+1 = ajx1 4-... 4- а„хп, tn = а^^х1 + ... + а”~кхп, очевидно, является невырожденным. В координатах t1, , tn наше множе- ство задается условиями tk+1 = ... = tn = 0, уже рассмотренными в при- мере 2. Пример 4. График определенной в некоторой области G С Rn-1 гладкой функции хп = /(х1,..., хп-1) является гладкой (п — 1)-мерной поверхностью в Кп. Действительно, полагая J tl = х1 (i = 1,..., п — 1), мы получаем систему координат, в которой график нашей функции имеет уравнение tn = 0. Пример 5. Окружность х2 4- у2 = 1 в К2 является одномерным подмно- гообразием в R2, что устанавливается разобранным в предыдущем параграфе локально обратимым переходом к полярным координатам (/?, ср), в которых окружность имеет уравнение р = 1. Пример 6. Этот пример является обобщением примера 3 и вместе с тем, как видно из определения 1, дает общую форму координатной записи подмногообразий пространства R”. Пусть F^x1, ..., хп) (i = 1, ..., п — к) — система гладких функций ранга п — к. Покажем, что соотношения F1(x1, ..., хк, xfc+1, ..., хп) = 0, < .................................................... (2) Fn-fc(x1, ..., хк, хк+1, ..., х”) = 0 задают в Rn подмногообразие S размерности к. Пусть в точке хо 6 S выполнено условие dF1 dF1 dxk+1 * ’" дхп dFn~k dFn~k dxk+1 *‘‘ Qxn (х0) / 0. (3)
510 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Тогда преобразование ( t* = хг (г = 1,..., к), { t* = F1-*^1,..., хп) (г = к + 1,..., п) в силу теоремы об обратной функции является диффеоморфизмом некоторой окрестности рассматриваемой точки. В координатах t1, ..., tn исходная система будет иметь вид tk+1 = ... = = tn =0; таким образом, S является /г-мерной гладкой поверхностью в 1R”. Пример 7. Множество Е точек плоскости К2, удовлетворяющих уравне- нию х2 — у2 = 0, состоит из двух прямых, пересекающихся в начале координат. Это множество не является одномерным подмногообразием R2 (проверьте!) именно из-за указанной точки пересечения. Если удалить из Е начало координат 0 € К2, то множество Е\0 уже,,, очевидно, будет удовлетворять определению 1. Заметим, что множество F\0 несвязно. Оно состоит из четырех не имеющих общих точек лучей. Таким образом, удовлетворяющая определению 1 А:-мерная поверхность в может оказаться несвязным подмножеством, состоящим из некоторого числа связных компонент (и уже эти компоненты являются связными /с-мерны- ми поверхностями). Часто под поверхностью в Rn понимают именно связную А:-мерную поверхность. Сейчас нас будут интересовать проблемы отыскания экстремумов функций, заданных на поверхностях. Это локальные проблемы, поэтому в них условие связности поверхности не проявляется. Пример 8. Если гладкое отображение f : G -> 1R” области G С Жп, задаваемое в координатном виде соотношениями (1), имеет в точке to G G ранг к, то найдется такая окрестность U(to) С G этой точки, образ f(U(to)) С С 1R” которой является гладкой поверхностью в 1R”. Действительно, как уже отмечалось выше, в этом случае соотношения (1) могут быть в некоторой окрестности U(to) точки to 6 G заменены эквива- лентной им системой соотношений [ Хк+1 = у>*:+1(±1, ..., хк), < ........................................ (4) X = \Х , . . . , X ) (для упрощения записи мы считаем, что уже система функций У1, ..., fk имеет ранг к). Полагая Fix1, ...,х") = xk+i - ,хк) (i = 1,...,n - k), записываем систему (4) в виде (2). Поскольку соотношение (3) выполнено, то в силу примера 6 множество f(U(to)) действительно является /с-мерной гладкой поверхностью в Rn.
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 511 2. Касательное пространство. При рассмотрении закона движения х = x(t) материальной частицы в R3, исходя из соотношения x(t) = я(0) 4- x'(Q)t + o(t) при t -> 0 (5) и считая, что точка t = 0 не является критической для отображения R Э 11-> i-> x(t) E К3,т. e. x'(0) / 0, мы определили прямую, касательную к траектории в точке х(0), как линейное подмножество в R3, задаваемое в параметрическом виде уравнением х — хо = x'(Q)t (6) или уравнением х - хо = £ t, (7) где Хо = я(0), а £ = я?(0) — направляющий вектор прямой. В сущности, аналогичную вещь мы делали, определяя плоскость, касатель- ную к графику функции z = f(x,y) в R3. Действительно, дополнив соотно- шение z = f(x,y) тривиальными равенствами х = х, у = у, мы получаем отображение R2 Э (х, у) i—> (ж, у, f(x, у)) 6 R3, касательным к которому в точке (хо,уо) является линейное отображение ^х — Xq^ У ~ Уо \z - zo) f 1 0 > 0 1 X — Хо У-Уо (8) где zo = /(^о, 1/о)- Полагая здесь t = (х -- жо, у — уо), х = (х — хо, у — уо, z — zq) и обозначая через ж'(0) указанную в (8) матрицу Якоби рассматриваемого отображения, замечаем, что ее ранг равен двум и что в этих обозначениях соотношение (8) имеет вид (6). Особенность соотношения (8) состоит в том, что из трех равенств: (X *Z*Q ““ X Xq У - Уо = У - Уо, (9) Z - Zo = Гх(хо,уо)(х - хо) + fy(xo,yo)(y - у0), совокупности которых оно равносильно, только последнее нетривиально. По- этому именно оно осталось у нас как уравнение, задающее плоскость, каса- тельную к графику функции z = f(x, у) в точке (хо, уо, zo)- Сделанное наблюдение можно использовать, чтобы теперь дать определе- ние fc-мерной плоскости, касательной к /г-мерной гладкой поверхности S С Rn. Из определения 1 поверхности видно, что в окрестности любой своей точки Хо Е S fe-мерная поверхность S может быть задана параметрически, т. е. с помощью отображения 1к Э (t1, ...,tk) i—> (х1, ...,хп) 6 S. В качестве такового может выступать ограничение отображения (р-1: 1п —> £7(яо) на fc-мерную плоскость tk+1 = ... = tn = 0 (см. рис. 62).
512 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Поскольку — диффеоморфизм, то якобиан отображения у?-1: 1п —> -> U{xq) в любой точке куба 1п отличен от нуля. Но тогда ранг отображения 1к Э (t1, ...,tk) ।—> (ж1,..., хп) 6 S, полученного ограничением у?-1 на ука- занную плоскость, должен быть равен к в любой точке куба 1к. Полагая теперь (t1,..., tk) =t € 1к и обозначая отображение 1к Э t х € S через х = я(/), получаем локальное параметрическое представление поверх- ности S, обладающее свойством, выраженным равенством (5), на основании которого уравнение (6) принимаем в качестве уравнения касательного про- странства или касательной плоскости к поверхности S С Rn в точке xq G S. Итак, мы принимаем следующее Определение 2. Если ^-мерная поверхность S С Rn, 1 к п, в окрестности точки xq Е S задана параметрически с помощью гладкого ото- бражения (t1, = t1—> х = (ж1,..., хп) такого, что хо = ж(0) и матрица ж'(0) имеет ранг к, то &-мерная плоскость в Rn, задаваемая параметрически матричным равенством (6), называется касательной плоскостью или каса- тельным пространством к поверхности S в точке xq G S. В координатной записи равенству (6) соответствует система уравнений < .............................................. (10) Пространство, касательное к поверхности S в точке х G S, будем, как и пре- жде, обозначать1^ символом TSX. Важным и полезным упражнением, которое читатель может проделать самостоятельно, является доказательство инвариантности определения каса- тельного пространства и проверка того, что линейное отображение t •-> гг'(О) t, касательное к отображению t i-> x(t), задающему локально поверхность S, осуществляет отображение пространства R* = на плоскость TSx(q) (см. задачу 3 в конце параграфа). Выясним теперь, как выглядит уравнение касательной плоскости к /с-мер- ной поверхности S, заданной в Rn системой (2). Будем для определенности считать, что в окрестности рассматриваемой точки xq Е S выполнено усло- вие (3). Полагая (ж1,..., хк) = и, (xfc+1,..., хп) = v, (F1,..., Fn~k) = F, запишем систему (2) в виде F(u,v) = 0, (11) а условие (3) — в виде detF;(u,v)/0. (12) х)Это — небольшое отклонение от наиболее распространенного обозначения TXS или TX(S).
§ 7. ПОВЕРХНОСТЬ В R" И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 513 В окрестности точки («о» vo) = (xj,..., х£, xj+1, ...,Xq) по теореме о не- явной функции перейдем от соотношения (11) к эквивалентному ему соотно- шению v = /(«), (13) дополняя которое тождеством и = и, получаем параметрическое представле- ние поверхности S в окрестности точки xq G S: и = и, < k v = /(и). (И) На основании определения 2, из (14) получаем параметрическое уравнение и — Uq = Е • t, < V - Vq = /'(uq) • t (15) касательной плоскости; здесь Е — единичная матрица, a t = и — uq. Подобно тому, как это было в случае системы (9), в системе (15) оставляем только нетривиальное уравнение V - Vq = f'(uQ)(u - Uq), (16) которое и содержит в себе связи переменных х1, ..., хк с переменными ж*+1, ..., хп, выделяющие касательное пространство. Пользуясь тем, что по теореме о неявной функции /Ч^о) = - К(«о, М] 1К(ио, ^о)], перепишем (16) в виде F^Uq, Vq)(u - Uq) + F^Uq, Vq)(v - Vq) = 0, откуда после возвращения к переменным (х1, ... ,хп) = х получаем искомое уравнение F'(xo)(x-xo)=0 (17) касательного пространства TSXo С Rn. В координатном представлении уравнение (17) равносильно системе урав- нений f “ жо) + • • • + |^(*o)(xn - х%) = 0, I (73/ ОХ { .................................................... (18) I ~Яг'Г “ *о) + • • • + ~ гГп -М(хП - Хо) = 0- ох ох Ранг этой системы по условию равен п — к, поэтому она задает fc-мерную плоскость в Rn.
514 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Аффинное уравнение (17) эквивалентно (если указана точка хо) вектор- ному уравнению F;(®o)4 = 0, (19) В котором £ = X — Xq. Значит, вектор £ лежит в плоскости TSXQ, касательной в точке xq 6 S к поверхности S С R”, заданной уравнением F(x) = 0, в том и только в том случае, когда он удовлетворяет условию (19). Таким образом, TSXQ мож- но рассматривать как векторное пространство векторов £, удовлетворяющих уравнению (19). Именно с этим обстоятельством и связан сам термин касательное про- странство. Докажем теперь следующее, уже встречавшееся нам в его частном случае (см. § 4, п. 6) Утверждение. Пространство TSXo, касательное к гладкой поверхно- сти S С Кп в точке xq € S, состоит из векторов, касательных в точке хо к гладким кривым, лежащим на поверхности S и проходящим через точку xq. ◄ Пусть поверхность S в окрестности точки хо € S задана в виде системы уравнений (2), которую мы коротко запишем как F(x) = 0, (20) где F = (F1, ..., Fn '*), х = (х1,..., хп). Пусть Г : I —> S — произвольный гладкий путь с носителем на поверхности S. Взяв Z = {tGK||t|<l}, будем считать, что х(0) = xq. Поскольку x(t) G S при t Е I, то после подстановки x(t) в уравнение (20) получаем F(x(t)) = 0 (21) при tel. Дифференцируя это тождество по t, находим, что F%(x(t)) х'(t) = 0. В частности, при t == 0, полагая £ = х'(0), получаем т. е. вектор £, касательный к траектории в точке xq (в момент t = 0), удовле- творяет уравнению (19) касательного пространства TSXo. Покажем теперь, что для любого вектора £, удовлетворяющего уравнению (19), найдется гладкий путь Г: I -> S, который задает кривую на поверхно- сти S, проходит при t = 0 через точку хо и имеет вектор £ своим вектором скорости в момент t = 0. Этим заодно будет установлено само существование гладких кривых, про- ходящих на S через точку хо, которое мы неявно предполагали в уже прове- денной первой части доказательства утверждения.
§ 7. ПОВЕРХНОСТЬ В R” И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 515 Пусть для определенности выполнено условие (3). Тогда, зная первые к ко- ординат £к вектора £ = (£\ ...,£*, £*+1,.. ., £п), мы из уравнения (19) (равносильного системе (18)) однозначно определим остальные его координа- ты £fc+1, .. •, £п. Таким образом, если для некоторого вектора £ = (£\..., £*, £fc+1, • • • j будет установлено, что он удовлетворяет уравнению (19), то можно заключить, что £ = £. Воспользуемся этим. Вновь, как это было сделано выше, введем для удобства обозначения и = = (а;1, ...,□:*), v ~ (xk+1,... ,хп), х = (х1, ... ,хп) = (u,v), F(x) = F(u,v). Тогда уравнение (20) будет иметь вид (11), а условие (3) — вид (12). В под- пространстве И* С Rn переменных х1,..., хк возьмем параметрически задан- ную прямую а;1 - zj = £4, < ................ t е R, . Хк -xS = $kt, с направляющим вектором (£\ ...,£*), который мы обозначим через £и. В более коротких обозначениях эта прямая может быть записана в виде u = u0 + £ut. (22) Решая уравнение (11) относительно v, в силу теоремы о неявной функции получим гладкую функцию (13), подставляя в аргумент которой правую часть равенства (22), с учетом самого равенства (22), получим гладкую кривую в К”, заданную в следующем виде: < U — Uq + £ut, , V = f(u0+£ut), Поскольку F(u,f(u)) = 0, то, очевидно, эта кривая лежит на поверхно- сти S. Кроме того, из равенств (23) видно, что при t = 0 кривая проходит через точку (it0, v0) = (zj,..., хк, zj+1,..., х% ) = xq € S. Дифференцируя no t тождество F(u(t),v(f)) = F(u0 + £ut,f(uo + £ut)) = 0, при t = 0 получаем 7^(uo, ^o)£u + ^v(uo» Vo)£v = 0, где = v'(0) = (£fc+1,... > £n). Это равенство показывает, что вектор £ = — (£u,£v) = (£\ • • • > £fc>£fc+1, • • • >£п) удовлетворяет уравнению (19). Таким образом, в силу сделанного выше замечания заключаем, что £ = £. Но вектор £ является вектором скорости при t — 0 для траектории (23). Тем самым высказанное утверждение доказано полностью. ► £7(0) С R. (23
516 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 3. Условный экстремум а. Постановка вопроса. Одним из наиболее ярких и популярных до- стижений дифференциального исчисления являются предлагаемые им реце- пты отыскания экстремумов функций. Необходимые условия и достаточные дифференциальные признаки экстремума, которые мы получили из формулы Тейлора, относятся, как уже отмечалось, к внутренним экстремумам.. Иными словами, эти результаты применимы только к исследованию пове- дения функции Rn Э г Н /(i) G К в окрестности точки х0 € К” тогда, когда аргумент х может принимать любое значение из некоторой окрестности в Rn точки Xq- Часто возникает более сложная и с практической точки зрения даже бо- лее интересная ситуация, когда ищется экстремум функции при некоторых условиях, ограничивающих область изменения аргумента. Типичным приме- ром может служить изопериметрическая задача, когда ищется тело, имеющее максимальный объем при условии, что ограничивающая его поверхность име- ет заданную площадь. Чтобы получить доступную нам математическую за- пись такой задачи, упростим постановку и будем считать, что задача состоит в том, чтобы среди прямоугольников, имеющих заданный периметр 2р, найти тот, который имеет наибольшую площадь о. Обозначив через х и у длины сторон прямоугольника, запишем, что = х • у, х + у =р. Итак, надо найти экстремум функции сг(ят, £/) при условии, что переменные х, у связаны соотношением х + у — р. Таким образом, экстремум функции ищется только на множестве тех точек плоскости К2, которые удовлетворя- ют указанному соотношению. Эта конкретная задача, конечно, решается без труда: достаточно, записав, что у = р — х, подставить это выражение в фор- мулу для а(х,у) и найти обычными методами максимум функции х(р — х). Она нам была нужна лишь для пояснения самой постановки вопроса. В общем случае задача на условный экстремум обычно состоит в том, что- бы найти экстремум вещественнозначной функции у = f(x\ ..., ®") (24) от п переменных при условии, что эти переменные удовлетворяют системе уравнений ( Fi(x1,...,xn) = 0, ..................................... (25) [ Fm(x1,...,xn) = 0. Поскольку мы собираемся получать дифференциальные условия экстрему- ма, мы будем предполагать, что все рассматриваемые функции дифференци- руемы и даже непрерывно дифференцируемы. Если ранг системы функций
§ 7 ПОВЕРХНОСТЬ В Г И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 517 F1, ..., Fm равен п — к, то условия (25) задают в IRn некоторую /с-мерную гладкую поверхность S и с геометрической точки зрения задача на условный экстремум состоит в отыскании экстремума функции f на поверхности S. Более точно, рассматривается ограничение f\s функции f на поверхность S и ищется экстремум функции f\s- Смысл самого понятия точки локального экстремума при этом, конечно, остается прежним, т. е. точка xq С S считается точкой локального экстремума функции f на S или, короче, функции f\s, если найдется такая окрестность Us(xq) точки Xq в множестве1^ S С Кп, что для любой точки х G ?Zs(^o) выполнено неравенство f(x) f(xo) (тогда xq — точка локального минимума) или /(ат) 5$ /(ато) (тогда Xq — точка локального максимума). Если при х (Е 6 Us(x0) \ Xq указанные неравенства являются строгими, то экстремум, как и прежде, будем называть строгим. Ь. Необходимый признак условного экстремума Теорема 1. Пусть f: D —> К — функция, определенная на открытом множестве D С lRn и принадлежащая классу C^(D;№). Пусть S — гладкая поверхность в D. Для того чтобы точка xq е S, некритическая для функции f, была точ- кой локального экстремума функции f\s, необходимо выполнение условия ТSxo С. TNXo, (26) где TSXo — пространство, касательное к поверхности S в точке Xq, а TNXq — пространство, касательное к поверхности N = {х е D\ f(x) — /(#о)} уровня функции f, которому принадлежит Xq. Заметим прежде всего, что требование, чтобы точка xq была некритиче- ской для функции /, в контексте обсуждаемой задачи отыскания условного экстремума не является существенным ограничением. Действительно, если уж точка Xq G D является критической точкой функции / : D —> К. или точ- кой экстремума этой функции, то ясно, что она будет подозрительной точкой или соответственно точкой экстремума и для функции f\s. Таким образом, новый элемент в рассматриваемой задаче состоит именно в том, что функция /|s может иметь критические точки и экстремумы, отличные от критических точек и экстремумов функции /. ◄ Возьмем произвольный вектор £ € TSXQ и такой гладкий путь х = x(t) на S, который проходит через точку х0 при t = 0 и для которого вектор £ является вектором скорости при t = 0, т. е. ^(0)=?• (27) Напомним, что Us(xo) = S Г) 17(то), где U(xo) — окрестность точки гго в Rn.
518 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если жо — точка экстремума функции /|s, то гладкая функция должна при t — 0 иметь экстремум. По необходимому условию экстремума ее производная при t = 0 должна обращаться в нуль, т. е. должно выполняться условие гм • е=о, (28) где = @........ Поскольку хо — некритическая точка функции /, условие (28) равносиль- но тому, что £ € TNXo, ибо именно соотношение (28) является уравнением касательного пространства TNX0. Таким образом, доказано, что TSXQ С TNX0. ► Если поверхность S в окрестности точки жо задана системой уравнений (25), то пространство TSXQ1 как нам известно, задается системой линейных уравнений ' dF1 ! \tl 1 . 5F1 ( \ СП Л 1 + + " = °. < ........................................... (29) ^(*о)«, + ... + &Го)«" = 0. Пространство TNXo задается уравнением ^L(Xo)e + --- + ^M(n = o, (зо) С7Ж1 ОХп и, поскольку всякое решение системы (29) является решением уравнения (30), последнее уравнение является следствием системы (29). Из этих соображений вытекает, что соотношение TSXo С TNX0 в анали- тической записи равносильно тому, что вектор grad /(жо) является линейной комбинацией векторов gradFl^o) (г = 1, ..., m), т. е. т grad /(ж0) = 52 Лг grad Гг(ж0). г=1 (31) Учитывая эту форму записи необходимого признака экстремума функ- ции (24), переменные которой связаны соотношениями (25), Лагранж пред- ложил при отыскании условного экстремума использовать следующую вспо- могательную функцию: Цх, А) = /(ж) - 52 grad F*(ж) г=1 (32) от п + т переменных (ж, А) = (ж1, ..., жп, Ai, ..., Am).
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 519 Эту функцию называют функцией Лагранжа, а метод ее использования — методом множителей Лагранжа. Функция (32) удобна тем, что необходимые условия ее экстремума как функции переменных (ж, Л) = (х1, ..., хп, Ai, ..., Лт) в точности совпадают с условиями (31) и (25). Действительно, (В(ж’А)=В(ж)-£А‘£(а:)=о w=i.->n). < i=1 (33) ^(®,А) = -Г‘(®) = ° (» = 1, V CJ Таким образом, при отыскании экстремума функции (24), переменные ко- торой подчинены связям (25), можно написать с неопределенными множителя- ми функцию Лагранжа (32) и искать уже ее критические точки. Если есть воз- можность из системы (33) найти хо = (х$, ..., Жд), не находя А = (Ai,..., Am), то с точки зрения исходной задачи именно это и следует делать. Как видно из соотношения (31), множители А» (г = 1, ..., т) определяются однозначно, если только векторы grad F1(xq) (i = 1, ..., m) линейно независи- мы. Независимость этих векторов равносильна тому, что ранг системы (29) равен т, т. е. что все уравнения этой системы существенны (ни одно из них не является следствием остальных). Это обычно выполнено, ибо считается, что все соотношения (25) незави- симы и ранг системы функций F1, ..., Fm в любой точке х € S равен т. Функцию Лагранжа часто записывают в виде т Цх, А) = f(x) + £ A<F‘(х), г=1 который отличается от прежнего только несущественной заменой А» на — Ai.1) Пример 9. Найдем экстремумы симметрической квадратичной формы №) = $2 ai3x'x3 (34) m=i на сфере п П*) = £ (х‘)2 -1 = 0. (35) 1=1 Запишем функцию Лагранжа данной задачи: Цх, А) = а^х*х* — f У2 ~ i,j=l \г=1 / По поводу необходимого признака условного экстремума см. также задачу 6 к § 7 гл. X (часть И).
520 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ и, с учетом того, что необходимые условия экстремума функции дь дх' п j=i (36) = 0 = 0. i=i Домножая первое уравнение на х* и суммируя затем все первые соотноше- ния, с учетом второго уравнения получим, что в точке экстремума должно быть выполнено равенство 52 dijx'xi — А = 0. (37) Систему (36) без последнего уравнения можно переписать в виде ^^aijxi = Ххг (г = 1, ..., п), (38) г=1 откуда следует, что А — собственное значение линейного преобразования А, задаваемого матрицей (а^), а х = (ж1, ...,хп) — собственный вектор этого преобразования, отвечающий этому собственному значению. Поскольку непрерывная на компакте S = х € Rn £ (*92 = 1} »=1 J функция (34) обязана принимать в некоторой его точке максимальное значение, систе- ма (36), а значит и система (38), должна иметь решение. Таким образом, мы попутно установили, что любая вещественная симметрическая матрица (а^) имеет по крайней мере одно вещественное собственное значение. Это хорошо известный вам из линейной алгебры результат, являющийся основным в дока- зательстве существования базиса из собственных векторов симметрического оператора. Чтобы указать геометрический смысл собственного значения А, заметим, что если А > 0, то, переходя к координатам t* = х*/\fX, вместо (37) получим п i,j=l (39) а вместо (35) — n 1 Е(«‘)2 = Т- (40) г=1 п Но 52 (**)2 есть квадрат расстояния от точки t = (t1,..., tn) квадрики (39) »=i до начала координат. Таким образом, если, например, соотношение (39) зада-
§ 7. ПОВЕРХНОСТЬ В R" И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 521 ет эллипсоид, то величина 1/А, обратная к собственному значению А, является квадратом величины одной из его полуосей. Это полезное наблюдение. Оно, в частности, показывает, что соотношения (36), необходимые для условного экстремума, еще не являются достаточными: ведь, например, в R3 эллипсоид кроме наибольшей и наименьшей полуосей мо- жет иметь промежуточную по величине полуось, в любой окрестности конца которой есть как точки более близкие к началу координат, так и более дале- кие от него в сравнении с расстоянием от конца полуоси до начала координат. Последнее становится совсем очевидным, если рассмотреть эллипсы, получа- ющиеся в сечении исходного эллипсоида двумя плоскостями, проходящими через промежуточную полуось и меньшую или большую полуоси эллипсоида соответственно. В одном из этих случаев промежуточная полуось будет боль- шей из двух полуосей эллипса сечения, а в другом случае — меньшей полуосью. К сказанному следует добавить, что если 1/д/А есть величина этой про- межуточной полуоси, то, как видно из канонического уравнения, эллипсоида, величина А, очевидно, будет собственным значением преобразования А, поэто- му система (36), выражающая необходимые условия экстремума функции /|з, действительно будет иметь решение, не дающее экстремума этой функции. Полученный в теореме 1 результат (необходимый признак условного экс- тремума) проиллюстрирован на рис. 63 а, Ь. Первый из этих рисунков поясняет, почему точка xq поверхности S не может быть точкой экстремума функции f\s, если S не касается поверхности N = {ж € R” | f(x) = f(xo) = со} в точке xq. При этом предполагается, что grad f(xo) / 0. Последнее условие гарантирует то, что в окрестности точки хо имеются точки как более высокого Сг-уровня функции /, так и точки более низкого Ci-уровня этой функции. Рис. 63 Поскольку гладкая поверхность S пересекает поверхность N, т. е. со-уро- вень гладкой функции /, то S будет пересекать как более высокие, так и более низкие уровни функции f в окрестности точки xq. Но это и означает, что хо не может быть точкой экстремума функции /|$. Второй рисунок показывает, почему при касании N и S в точке xq эта точка может оказаться точкой экстремума. На рисунке х0 — точка локального максимума функции /|s.
522 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Эти же соображения позволяют нарисовать картинку, аналитическая за- пись которой может показать, что необходимый признак условного экстрему- ма не является достаточным. Действительно, в соответствии с рис. 64 положим, например, f&,y) = y, F(x,y) = х3 -у = 0. Тогда очевидно, что на кривой S С К2, заданной уравнением у = х3, величина у не имеет экстремума в точке (0,0), хотя эта кривая касается линии уровня f(x, у) = = 0 функции f в этой точке. Заметим, что grad/(0,0) = (0,1) / 0. Очевидно, это по существу тот же пример, который нам в свое время служил для иллюстрации различия между необходимым и достаточным усло- виями классического внутреннего экстремума функции. с. Достаточный признак условного экстремума. Докажем теперь следующий достаточный признак наличия или отсутствия условного экстре- мума. Теорема 2. Пусть /: D —> R — функция, определенная на открытом множестве D С Rn и принадлежащая классу S — поверхность в D, заданная системой уравнений (25), где F* € C^2\D; R) (г = 1,..., т) и ранг системы функций {F1,..., Fm} в любой точке области D равен т. Пусть в функции Лагранжа т L(x) = L(x; А) = f(x\ A, ........хп) . »=1 параметры Ai,..., Хт выбраны в соответствии с необходимым признаком (31) условного экстремума функции /|s в точке од € SS* Для того чтобы при этом точка од была точкой экстремума функции f\s, достаточно, чтобы квадратичная форма се7 (41) ох1 ох-' была знакоопределенной для векторов £ € TSXQ. Если форма (41) положительно определена на TSXQ, то од — точка стро- гого локального минимума функции f\s; если форма (41) отрицательно опре- делена на TSXQ, то од — точка строгого локального максимума функции f\s- Для того чтобы точка од не была точкой экстремума функции f\s, до- статочно, чтобы форма (41) принимала на TSXo значения разных знаков. Фиксировав А, мы получаем из L(x; А) функцию, зависящую только от ж; мы позволили себе обозначать ее через L(x).
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 523 <4 Отметим прежде всего, что L(x) = f(x) для х € S, поэтому, показав, что точка Xq € S является точкой экстремума функции L\s, мы одновременно покажем, что она является точкой экстремума функции f\s- По условию необходимый признак (31) экстремума функции /|$ в точке xq € S выполнен, поэтому в этой точке gradL(xo) = 0. Значит, тейлоровское разложение функции L(x) в окрестности точки хо = (xj,..., х”) имеет вид L(x) -L(x0) = ~ хо)(х3 -*о) +о(||х-х0{|2) (42) при X —> Хо- Напомним теперь, что, мотивируя определение 2, мы отметили возмож- ность локального (например, в окрестности точки Хо € S) параметрического задания гладкой Л-мерной поверхности S (в нашем случае к = п — т). Иными словами, существует гладкое отображение R Э (t1, ...,£*) = £ ।—> х = (х1, ..., xn) € Rn (мы будем его, как и прежде, записывать в виде х = x(t)), при котором окрест- ность точки 0 = (0,... ,0) € I* биективно преобразуется в некоторую окрест- ность точки Хо на поверхности S, причем хо = х(0). Заметим, что соотношение х(£) - х(0) = х'(0)£ + (||£||) при t -4 0, выражающее дифференцируемость отображения t »-> x(t) в точке t = 0, рав- носильно п координатным равенствам x'(t) -х‘(0) = ^(0)t“ +o(||i||) (i = l,...,n), (43) С/ ъ в которых индекс а пробегает целые значения от 1 до А; и по нему происходит суммирование. Из этих числовых равенств следует, что |x*(t) - х*(0)| = О(||t||) при t -4 О и, значит, l|x(t) - x(0)||Rn = O(||*||R*) при t -4 0. (44) Используя соотношения (43), (44), из равенства (42) получаем, что при t -4 О £(x(t)) - L(x(0)) = 1dvL(a:0) ви?(0) 0^(0) t“ + o(|111|2). (42') 18 Зорич В. А.
524 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Отсюда при условии знакоопределенности формы dijL(xo) dax'(G) d(jxj(Q) ta (45) следует, что функция L(x(t)) имеет при t = 0 экстремум. Если же форма (45) принимает значения разных знаков, то £(#(£)) при t = 0 экстремума не имеет. Но, поскольку при отображении 1i-> x(t) некоторая окрестность точки 0 6 IR* преобразуется в окрестность точки z(0) = Zo € S на поверхности S, можно заключить, что тогда и функция L|s в точке хо либо будет иметь экстремум, причем того же характера, что и функция L(x(t)), либо, как и L(x(t)), не будет иметь экстремума. Итак, остается проверить, что для векторов £ € TSXo выражения (41) и (45) просто являются разными записями одного и того же объекта. Действительно, полагая мы получаем вектор £, касательный к S в точке zq, и если £ = (£\ ..., £п), a:(t) = (а:1,.... xn)(i), t = (t1,..., tk), то £> = ^(0)4* (J = l,...,n), откуда и следует совпадение величин (41), (45). ► Отметим, что практическое использование теоремы 2 затруднено тем, что среди координат вектора £ = (£\ ..., £n) € TSXQ только к = п — т незави- симых, поскольку координаты вектора £ должны удовлетворять системе (29), определяющей пространство TSXQ. Таким образом, непосредственное при- менение к форме (41) критерия Сильвестра в нашем случае, вообще говоря, ничего не дает: форма (41) может не быть определенной на Т1й”о, но оказать- ся определенной на TSXo. Если же из соотношений (29) выразить т коорди- нат вектора £ через остальные к координат и полученные линейные формы подставить в (41), то мы придем к квадратичной форме относительно к пере- менных, определенность которой уже можно исследовать с помощью критерия Сильвестра. Поясним сказанное простейшими примерами. Пример 10. Пусть в пространстве R3 с координатами х, j/, z задана функция f(x,y,z) = х2 -у2 + Z2. Ищется экстремум этой функции на плоскости S, заданной уравнением F(x, у, z) = 2х - у - 3 = 0. Записав функцию Лагранжа L(x, у, z) = (х2 -у2 + z2) - Х(2х-у - 3)
§ 7. ПОВЕРХНОСТЬ В йл И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 525 и необходимые условия экстремума — = -(2s-j/-3) = 0, ал каходвш. подозрительную точку р = (2,1,0). Далее находим форму (41): = (f1)2 - («2)2 + (43)2- (46) Отметим, что в данном случае параметр А не вошел в эту квадратичную форму, поэтому мы его и не вычисляли. Записываем теперь условие £ € TSP: 2£1-£2 = 0. (47) Из этого равенства находим £2 = 2£х и подставляем в форму (46), после чего она приобретает вид -3(e*)2+(e3)2, где на сей раз и £3 — независимые переменные. Последняя форма, очевидно, может принимать значения разных знаков, поэтому в точке р € S функция f\s экстремума не имеет. Пример 11. В условиях примера 10 заменим R3 на R2 и функцию f на №,у) = х2 -у2, сохранив условие 2х — у — 3 = 0, которое теперь задает прямую S в плоскости R2. В качестве подозрительной найдем точку р = (2,1). Вместо формы (46) получим форму (J1)2-^)2 (48) с прежним соотношением (47) между и £2. Таким образом, на TSP форма (48) теперь имеет вид т. е. является отрицательно определенной. Отсюда заключаем, что точка р = (2,1) является точкой локального максимума функции /|s. 1Я*
526 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Весьма поучительны во многих аспектах следующие простые примеры, на которых можно отчетливо рассмотреть механизм работы как необходимых, так и достаточных условий экстремума, в том числе роль параметра и нефор- мальную роль самой функции Лагранжа. Пример 12. На плоскости R2 с декартовыми координатами (я,у) дана функция f(x,y) = х2 + у2. Найдем экстремумы этой функции на эллипсе, заданном каноническим со- отношением X2 У2 F(®,y) = 2i + ^-l=0. az tr где 0 < а < Ъ. Из геометрических соображений очевидно, что min /|s = а2, тах/|$ = Ь2. Получим это, опираясь на рекомендации теорем 1 и 2. Записав функцию Лагранжа • (2 2 ~2 + W “ 1 az bz , г л dL dL dL Л и решая уравнение dL = 0, т. е. систему — = — = — = О, находим ее решения: (х, у, Л) = (±а,0, а2), (0,±Ь,Ь2 Теперь в соответствии с теоремой 2 выпишем и исследуем квадратичную форму ± d?L£2 — второй член тейлоровского разложения функции Лагранжа & в окрестности соответствующих точек: 1^42 = (i-A)(f1)2+(i-A)(^)2. В точках (±а, 0) эллипса S касательный вектор £ = (С1» С2) имеет вид (0,£2), а квадратичная форма при Л = а2 принимает вид (п2\ 1-й«2)2. Учитывая условие 0 < а < Ь, заключаем, что эта форма положительно определена и, значит, в точках (±а,0) € S имеется строгий локальный (а здесь, очевидно, и глобальный) минимум функции /|з, т. е. min/|s = а2. Аналогично находим форму отвечающую точкам (0, ±6) € S, и получаем max/|s = Ь2.
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 527 Замечание. Обратите здесь внимание на роль функции Лагранжа в сравнении с ролью функции /. В соответствующих точках на указанных ка- сательных векторах дифференциал функции f (как и дифференциал L) обра- щается в нуль, а квадратичная форма ^d2/^2 = (С1)2 + (С2)2 положительно определена, в какой бы из этих точек ее ни вычислять. Тем не менее функция f\s в точках (±а,0) имеет строгий минимум, а в точках (О, ±Ь) — строгий максимум. Чтобы понять, в чем тут дело, просмотрите еще раз доказательство те- оремы 2 и попробуйте, заменив в (42) L на /, получить соотношение (42')- Заметьте, что при этом у вас появится дополнительный член, содержащий ж"(0). Он не исчезнет в связи с тем, что в отличие от dL дифференциал df функции / в соответствующих точках не есть тождественный нуль, хотя на касательных векторах (вида а/(0)) его значения действительно равны нулю. Пример 13. Найдем экстремумы функции У, z) = х2 + у2 + z2 на эллипсоиде 5, заданном соотношением Х^ 1/2 2^2 F(x,y,z) = ^ + ^ + ^-l = 0, az bz cz где 0 < а < b < с. Записав функцию Лагранжа ( 2 2 2 \ ^2 + W + ~2* ~ 1)’ az bz cz / в соответствии с необходимым признаком экстремума находим решения урав- .г п dL dL dL dL п нения dL = 0, т. е. системы — = — = — = — = 0: ох оу oz дл (я,3/,г,А) = (±а,0,0,а2), (0,±Ь,0,Ь2), (0,0,±с,с2). Квадратичная форма = (1 - A) (ei)2 + (i - A) + (1 - A) (fv в каждом из этих случаев на соответствующей касательной плоскости имеет вид .2 (а) (Ь) (с)
528 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Поскольку 0 < а < b < с, то на основании теоремы 2, дающей достаточный признак наличия или отсутствия условного экстремума, можно заключить, что в случаях (а) и (с) мы нашли соответственно min/|$ = а2 и тах/|$ = с2, а в точках (О, ±Ь, 0) € S, отвечающих случаю (Ь), функция f\s экстремума не имеет. Это вполне согласуется с очевидными геометрическими соображени- ями, высказанными по этому поводу при обсуждении необходимого признака условного экстремума. Некоторые дальнейшие, порой весьма полезные стороны встретившихся в этом параграфе понятий анализа и геометрии, в том числе физическая интер- претация самой задачи об условном экстремуме, а также его необходимого признака (31) как разложения сил в точке равновесия и интерпретация мно- жителей Лагранжа как величин реакций идеальных связей, представлены в приведенных ниже задачах и упражнениях. Задачи и упражнения 1. Путь и поверхность. а) Пусть f : I —> R2 — отображение класса C^r\/;R2) интервала I С R., Рас- сматривая это отображение как путь в R2, покажите на примере, что его носитель /(/) может не быть подмногообразием в R2, а вот график этого отображения в R3 = R1 х R2 всегда является одномерным подмногообразием R3, проекцией которо- го в R2 является носитель /(/) указанного пути. Ь) Решите задачу а) в случае, когда I — промежуток в R*, a f € C^r\/;Rn). Покажите, что в этом случае график отображения / : I —> Rn является гладкой fc-мерной поверхностью в R* х Rn, проекция которой на подпространство Rn совпа- дает с f(I). с) Проверьте, что если fi : h —> S и /2 : I2 —> S — две гладкие параметризации одной и той же fc-мерной поверхности S С Rn, причем ни /1 в Л, ни /2 в h не имеют критических точек, то определенные при этих условиях отображения fi 1 ° /2 : I2 —> Zi, /2 1 ° Л : А —► Z2 являются гладкими. 2. Сфера в Rn. а) На сфере S2 = {х G R3 | ||х|| = 1} укажите какую-нибудь максимальную область действия криволинейных координат (<р, ф), полученных из полярных коор- динат в R3 (см. формулу (5) предыдущего параграфа) при р = 1. Ь) Ответьте на вопрос а) в случае (гп — 1)-мерной сферы S—1 = {х g Rm | ||х|| = 1} в Rm и координат (</?i, ..., </?m-i) на ней, получаемых из полярных координат в Rn (см. формулы (6) предыдущего параграфа) при р = 1. с) Можно ли сферу Sk С Rfc+1 задать одной системой координат (t1, ..., t*), т. е. одним диффеоморфизмом f : G —> R*+1 области G С R* ? d) Какое наименьшее количество карт должно быть в атласе поверхности Земли?
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 529 е) Расстояние между точками сферы S2 С R3 будем измерять длиной кратчай- шей кривой, лежащей на сфере S2 и соединяющей эти точки. Такой кривой является дуга соответствующего большого круга. Может ли существовать такая локальная плоская карта сферы, что все расстояния между точками сферы были бы пропор- циональны (с одним и тем же коэффициентом пропорциональности) расстояниям между их изображениями на карте? f) Углом между кривыми (лежащими или не лежащими на сфере) в точке их пересече- ния называется угол между касательными к этим кривым в этой точке. Покажите, что существуют локальные плоские карты сферы, в которых углы меж- ду кривыми на сфере и соответствующими кривыми на карте одинаковы (см. рис. 65, изображающий так называемую стереогра- фическую проекцию). 3. Касательное пространство. а) Проверьте прямым расчетом, что касательное к гладкой fc-мерной поверх- ности S С Rn в точке хо € S многообразие TSXQ не зависит от выбора системы координат в Rn. b) Покажите, что если при диффеоморфизме / : D —> D' области D С Rn на область D' С Rn гладкая поверхность S С D отображается на гладкую поверх- ность Sl С D', а точка хо G S переходит в х'о € S', то при линейном отображении f(xo): Rn —> Rn, касательном к f в точке хо € D, векторное пространство TSXQ изоморфно преобразуется в векторное пространство TS'x'o. с) Если в условиях предыдущей задачи отображение /: D —> D' является любым отображением класса D'), ПРИ котором f(S) С S', то f'(TSXo) С TSX'Q. d) Покажите, что ортогональная проекция гладкой А;-мерной поверхности S С Rn на касательную к ней в точке хо € S fc-мерную плоскость TSXQ является отображе- нием, взаимно однозначным в некоторой окрестности точки касания хо- е) Пусть в условиях предыдущей задачи £ G TSXo и ||f|| = 1. Уравнение х — хо — & прямой в Rn, лежащей в TSX0, можно использовать, чтобы каждую точку х € TSXf\xo характеризовать парой (t, £). Это по существу полярные координаты в TSXQ. Покажите, что прямым х — хо = на поверхности S в окрестности точки хо от- вечают гладкие кривые, пересекающиеся только в точке хо- Проверьте, что, сохра- няя в качестве параметра на этих кривых величину t, мы получаем пути, скорость вдоль которых при t = 0 совпадает с вектором £ G TSXQ) определяющим прямую х — хо = из которой получена данная кривая на S. Таким образом, пары (£,£), где £ € TSXQi ||f|| = 1, a t — вещественные числа из некоторой окрестности 17(0) нуля в R, могут служить аналогом полярных координат в некоторой окрестности точки хо G S на поверхности S. 4. Пусть функция F € C'^1\Rn;R), не имеющая критических точек, такова, что уравнение F(x1,..., хп) = 0 задает в Rn компактную поверхность S (т. е. S как подмножество Rn является компактом). Для любой точки х € S находим вектор Т)(х) — gradF(x), нормальный к S в точке х. Если каждую точку х G S заставить
530 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ двигаться равномерно со своей скоростью п(х)> то возникает зависящее от времени t отображение S Э х ।—> х 4- i)(x)t € Rn. а) Покажите, что при достаточно близких к нулю значениях t это отображение биективно и при каждом таком значении t из S получается гладкая поверхность St- b) Пусть Е — множество в Rn; J-окрестностью множества Е назовем совокуп- ность тех точек Rn, расстояние которых до Е меньше 6. Покажите, что при значениях t, близких к нулю, уравнение F(x'....x") = t задает компактную поверхность St С Rn, и покажите, что поверхность St лежит в <5(£)-окрестности поверхности St, где 6(t) = o(t) при t —> 0. с) С каждой точкой х поверхности S = So свяжем единичный вектор нормали ( } ~ Ич(х)|| и рассмотрим новое отображение S Э х ।—► х + n(x)t 6 Rn. Покажите, что при всех достаточно близких к нулю значениях t это отображение биективно, получающаяся из S при конкретном значении t поверхность St гладкая и если ti / t2, то St! П St2 = 0. d) Опираясь на результат предыдущей задачи, покажите, что найдется число <5 > 0 такое, что между точками J-окрестности поверхности S и парами (t,x), где t G ]—<5, (5[ С R, х G S, имеется взаимно однозначное соответствие; если (Р, ..., tk) — локальные координаты на поверхности S в окрестности Us(xo) точки хо, то вели- чины (t, tl, ..., tk) могут служить локальными координатами в некоторой простран- ственной окрестности U(хо) точки хо Е Rn. е) Покажите, что при |t| < 6 точка х Е S является ближайшей к (х + n(x)t) € Rn точкой поверхности S. Таким образом, поверхность St при |t| < 6 есть геометриче- ское место точек пространства Rn, удаленных от поверхности S на расстояние |t|. 5. а) Пусть dp : S —> R — функция на fc-мерной гладкой поверхности S С Rn, определенная равенством dp(x) — ||р — ж||2, где р — фиксированная точка Rn, х — точка S, а ||р — ж|| — расстояние в Rn между этими точками. Покажите, что в точках экстремума функции dp(x) вектор р — х ортогонален поверхности S. Ь) Покажите, что на любой прямой, ортогонально пересекающей поверхность S в точке q Е S, имеется не более к таких точек р, что функция dp(x) имеет q своей вырожденной критической точкой (т. е. точкой, в которой гессиан функции обращается в нуль). с) Покажите, что в случае кривой S (к = 1) на плоскости R2 (п — 2) точка р, для которой точка q Е S является вырожденной критической точкой функции dp(x), совпадает с центром кривизны кривой S в точке q Е S. 6. Постройте в плоскости R2 с декартовыми координатами х, у линии уровня функции f(x, у) = ху и кривую s={(*.y)6R2l*2 + »2 = i}- Используя полученную картинку, проведите полное исследование задачи об экс- тремуме функции /|s.
§ 7. ПОВЕРХНОСТЬ В йп И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 531 7. На плоскости R2 с декартовыми координатами х, у определены следующие функции класса C(eo)(R2;R): х 2 ev \ Г х2- у + e_1/x2sm-, если х / О, f(x,y) = x -у, F(x,j/)=< о ” х I яг — у, если х = 0. а) Нарисуйте линии уровня функции f(x,y) и линию S, заданную соотношением F(x,!/) =0. b) Исследуйте на экстремум функцию /|$. с) Покажите, что условие определенности формы dijf(xo)C€3 на в отличие от условия определенности формы dijL(xo)C^3 на TSXQ) приведенного в теореме 2, еще не является достаточным для того, чтобы подозрительная точка хо Е S была точкой экстремума функции /|$. d) Проверьте, является ли точка хо — (0,0) критической для функции f и можно ли исследовать поведение / в окрестности этой точки только с помощью второго (квадратичного) члена формулы Тейлора, как это подразумевалось в с). 8. В дифференциальной геометрии при определении главных кривизн и глав- ных направлений бывает полезно уметь искать экстремум одной квадратичной фор- мы hiju'u3 при условии постоянства другой (положительно определенной) формы gtju'u3. Решите эту задачу по аналогии с разобранным выше примером 9. 9. Пусть А — [а}] — квадратная матрица порядка п хвхая, что = Ь = 1..........„), »=1 где Н\, ..., Нп — фиксированный набор из п неотрицательных действительных чисел. а) Покажите, что det2 А при указанных условиях на матрицу А может иметь экстремум, только если строки матрицы А являются попарно ортогональными век- торами в Rn. b) Исходя из равенства det2 А = det А • det А*, где А* — транспонированная по отношению к А матрица, покажите, что при ука- занных выше условиях max det2 А = Hi... Нп. А с) Докажите, что для любой матрицы [а}] имеет место неравенство Адамара det2 (aj) < ft fX3(aj')2Y j=i \»=i / d) Дайте наглядно-геометрическое истолкование неравенства Адамара. 10. ») Нарисуйте поверхности уровня функции f и плоскость S в примере 10. Объясните на рисунке результат, полученный 5 этом примере. Ь) Нарисуйте линии уровня функции f и прямую S в примере 11. Объясните на рисунке результат, полученный в этом примере.
532 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 11. В примере 6 из § 4 главы V, исходя из принципа Ферма, был получен закон Снеллиуса преломления света на поверхности раздела двух сред в случае, когда эта поверхность — плоскость. Остается ли этот закон в силе для произвольной гладкой поверхности раздела? 12. а) Материальная точка в потенциальном поле сил может находиться в положе- нии равновесия (называемом также состоянием покоя или стационарным состояни- ем) только в критических (стационарных) точках потенциала. При этом строгому локальному минимуму потенциала отвечает положение устойчивого равновесия, а локальному максимуму — неустойчивого. Проверьте это. Ь) К какой задаче на условный экстремум (которую и решал Лагранж) сводится вопрос о положении равновесия материальной точки, находящейся в потенциальном поле сил (например, тяжести) и стесненной идеальными связями (например, точка не может покидать некоторой гладкой поверхности, или бусинка — гладкой нити, или шарик — желоба)? Связь идеальна (нет трения); это значит, что ее воздействие на точку (реакция связи) происходит только в нормальном к связи направлении. с) Какой физический (механический) смысл имеют в этом случае разложение (31) — необходимый признак условного экстремума и множители Лагранжа? Кстати, каждую из функций системы (25) можно поделить на модуль ее градиен- та, что, очевидно, приводит к равносильной системе (если ее ранг всюду равен т). Значит, все векторы gradFl(zo) в правой части соотношения (31) можно считать единичными нормалями к соответствующей поверхности. d) Не становится ли после приведенной физической интерпретации самоочевид- ным и естественным сам метод Лагранжа отыскания условного экстремума?
НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ Введение в анализ (число, функция, предел) 1. Длину стягивающего земной шар по экватору обруча увеличили на 1 метр. Образовался зазор. Достаточен ли он для прохода муравья? Каковы величины абсо- лютного и относительного увеличения радиуса Земли при таком увеличении длины экватора? (Радиус Земли ж 6400 км.) 2. Как связаны полнота (непрерывность) действительных чисел, неограничен- ность натурального ряда и принцип Архимеда? Почему любое действительное чи- сло можно сколь угодно точно приблизить рациональным? Объясните на модели рациональных дробей (рациональных функций), что принцип Архимеда может быть нарушен, и в таких числовых системах натуральный ряд ограничен и имеются бес- конечно малые числа. 3. Четыре букашки, сидевшие в вершинах единичного квадрата, стали двигаться друг за другом с единичной скоростью, держа курс на преследуемого. Нарисуйте траектории их движения. Какова длина каждой траектории? Каков закон движения (в декартовых и полярных координатах)? 4. Нарисуйте диаграмму вычисления у/a (а > 0) итерационным процессом _ 1 ( , а \ ®п4-1 — n I ~г I • « \ / Как связано решение уравнений с отысканием неподвижных точек? Как нахо- дить \/а? 5. Пусть д(х) = f(x) + о(/(ж)) при х -4 оо. Верно ли, что тогда и f(x) = д(х) + + о(д(х)) при х —> оо ? 6. Методом неопределенных коэффициентов (или иначе) найдите несколько пер- 113 вых коэффициентов (или все) степенного ряда для (14-ж)“ при а = — 1, — -, 0, -, 1, -. £ Л» (Интерполируя коэффициенты при одинаковых степенях х в таких разложениях, Ньютон выписал закон образования коэффициентов при любом a G R — бином Нью- тона.) 7. Зная степенное разложение функции е®, найдите методом неопределенных ко- эффициентов (или иначе) несколько первых членов (или все) степенного разложения функции In (1 + х).
534 НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 8. Вычислите ехр А, когда А — одна из матриц /О 0\ \0 о/’ 0 Ц О О/ О 1 0\ 0 0 11, ООО/ 1 о 0\ 0 2 О 0 0 3/ 9. Сколько членов ряда для е® надо взять, чтобы получить многочлен, позволя- ющий вычислять е® на отрезке [—3,5] с точностью до 10“2 ? 10. Нарисуйте эскизы графиков следующих функций: х3 a) logcoai sinz; b) arctg (1 _ + • Дифференциальное исчисление функций одной переменной 1. Покажите, что если вектор ускорения a(t) в любой момент t ортогонален век- тору v(t) скорости движения, то величина |v(t)| остается постоянной. 2. Пусть (x,t) и (x,t) — соответственно координата и время движущейся точки в двух системах отсчета. Считая известными формулы х — ах 4- fit, t = ух 4- dt перехода из одной системы отсчета в другую, найдите формулу преобразования » dx ~ dx скоростей, т. е. связь между v = и v — ~^=. 3. Функция f(x) = х2 sin - при х / 0 и /(0) = 0 дифференцируема на R, но /' разрывна при х = 0 (проверьте). «Докажем», однако, что если /: R —> R дифферен- цируема на R, то f непрерывна в любой точке a G R. По теореме Лагранжа - f(a) х — а = Г (О, где £ — точка между а и х. Тогда если х —> а, то £ —> а. По определению, Вт Я?). =/(,), X — а и поскольку этот предел существует, то существует и равен ему предел правой части формулы Лагранжа, т. е. f'(£) —> f'(a) при £ —> а. Непрерывность f в точке а «доказана». Где ошибка? 4. Пусть f имеет (п 4-1) производную в точке хо, и пусть £ — хо 4- вх(х — хо) — средняя точка в формуле Лагранжа остаточного члена так что 0 < 0х < 1 • Покажите, что вх —> —— п 4* 1 при х —> хо, если /<п+1\яо) / 0. 5. Докажите неравенство а?1 а“п < аки 4-... 4-апап, где числа <и, ..., ап, аг, ..., ап неотрицательны и ai 4-... 4- ап = 1-
НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 535 6. Показать, что / z \» lim (14—) = ex(cosy + «sinу) (z — x + iy), n-»oo \ П / поэтому естественно считать, что e'v = cos у + i sin у (формула Эйлера) и е* = e*e*v = ex(cosy + г sin t/). 7. Найдите форму поверхности жидкости, равномерно вращающейся в стакане. Ж2 V2 , ч 8. Покажите, что касательная к эллипсу -у + fz- — 1 в точке (Хо,уо) имеет а и уравнение = 1 и что световые лучи от источника, помещенного в одном а2 ог из фокусов Fi = (—\/а2 — Ь2,0), Fi — (Va2 — Ь2,0) эллипса с полуосями а > b > 0, собираются эллиптическим зеркалом в другом фокусе. 9. Частица без предварительного разгона под действием силы тяжести начи- нает скатываться с вершины ледяной горки эллиптического профиля. Уравнение профиля: х2 + 5{/2 = 1, у 0. Рассчитайте траекторию движения частицы до ее приземления. Интеграл и введение в многомерный анализ 1. Зная неравенства Гёльдера, Минковского и Йенсена для сумм, получите соот- ветствующие неравенства для интегралов. 1 2. Вычислить интеграл J e~x^dx с относительной погрешностью в пределах 10 %, о X 3. Функция erf (ж) = —= I е~* dt> называемая интегралом вероятности ошибок, уТГ J —х имеет пределом 1 при х —> +оо. Изобразите график этой функции и найдите ее производную. Покажите, что при х —> +оо к п 2 _ж2/1 1 ХЬЗ 13 5, / 1 \\ 1 \2х 22хз + 23х* 24х7 Как продолжить эту асимптотическую формулу до ряда? Сходится ли этот ряд хотя бы при каком-то значении х G R? 4. Зависит ли длина пути от закона движения (от параметризации)? 5. Вы держите один конец резинового шнура длиной 1 км. От второго его конца, который закреплен, к вам со скоростью 1 см/с ползет жук. Каждый раз, как только он проползает 1 см, вы удлиняете резинку на 1 км. Доползет ли жук до вашей руки? Если да, то приблизительно сколько ему на это потребуется времени? (Задача Л. Б. Окуня, предложенная им А. Д. Сахарову.) 6. Подсчитайте работу по перемещению массы в гравитационном поле Земли и покажите, что эта работа зависит только от уровней высот исходного и конечно- го положений. Найдите для Земли работу выхода из ее гравитационного поля и соответствующую (вторую) космическую скорость.
536 НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 7. На примере маятника и двойного маятника поясните, как на множестве соот- ветствующих конфигураций можно ввести локальные координаты и окрестности и как при этом возникает естественная топология, превращающая его в конфигураци- онное пространство механической системы. Можно ли метризовать это простран- ство в рассмотренных случаях? 8. Является ли компактом единичная сфера в Rn? Ав С [а, Ь]? 9. Подмножество данного множества называется его е-сетью, если любая точ- ка множества находится на расстоянии меньшем чем е от какой-либо точки этого подмножества. Обозначим через N(e) наименьшее возможное число точек в е-сети данного множества. Оцените е-энтропию log2 N(e') отрезка, квадрата, куба и огра- ниченной области в пространстве Rn. Дает ли величина log2 N{e) log2(l/e) при £ —> 0 предста- вление о размерности рассматриваемого множества? Может ли такая размерность быть равной, например, 0,5? 10. На поверхности единичной сферы S в R3 температура Т как функция точ- ки меняется непрерывно. Обязаны ли на сфере быть точки минимума и максимума температуры? При наличии точек с двумя фиксированными значениями температу- ры, должны ли быть точки и с промежуточными ее значениями? Что из этого верно в случае, когда единичная сфера S берется в пространстве С[а,Ь], а температура в точке f € S выражается в виде ь ? T(f) = 11. а) Взяв 1,5 в качестве исходного приближения для v2, проведите две итера- ции по методу Ньютона и посмотрите, сколько верных знаков получилось на каждом из двух шагов. Ь) Найдите итерационным процессом функцию /, удовлетворяющую уравнению X /(ж) = ж + J о Дифференциальное исчисление функций многих переменных 1 \ TZ X |Д/| 1. а) Какова относительная погрешность д = --у™ при вычислении значения функции f(x,y,z) в точке (ж, y,z), координаты которой даны с абсолютными по- грешностями Дж, Ду, Дг соответственно? Ь) Какова относительная ошибка в вычислении объема комнаты, размеры кото- рой таковы: длина ж = 5 ± 0,05 м, ширина у = 4 ± 0,04 м, высота z = 3 ± 0,03 м? с) Верно ли, что относительная погрешность значения линейной функции совпа- дает с относительной погрешностью значения ее аргумента? d) Верно ли, что дифференциал линейной функции совпадает с ней самой? е) Верно ли, что для линейной функции / справедливо соотношение f — f?
НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 537 2. а) Одна из частных производных функции двух переменных, заданной в кру- ге, равна нулю во всех точках круга. Значит ли это, что функция не зависит от соответствующей переменной в этом круге? Ь) Изменится ли ответ, если вместо круга взять произвольную выпуклую об- ласть? с) А если взять вообще произвольную область? d) Пусть х = x(t) — закон движения точки в плоскости (или в Rn) в промежутке времени t G [а, Ь]; v(t) — ее скорость как функция времени, а С = convex {v(t) |t Е G [а, Ь]} — наименьшее выпуклое множество, содержащее все векторы v(t) (называе- мое обычно выпуклой оболочкой того множества, на которое оболочка натягивает- ся). Покажите, что в С найдется такой вектор v, что х(Ъ) — ж(а) = v • (Ь — а). 3. а) Пусть F(x,y,z) = 0. Верно ли, что = — 1? Проверьте это на ау ах az зависимости — — 1=0 (соответствующей уравнению Клапейрона ~~ = R состоя- z Т кия идеального газа). Ь) Пусть теперь F(x,y) — 0. Верно ли, что = 1? ах ау с) Что можно утверждать в общем случае зависимости F(xi, ..., хп) =0? d) Как, зная первые несколько членов тейлоровского разложения функции F(x, у) в окрестности точки (хо,уо), где F(xo,yo) — 0, a Fy(xo,yo) обратима, найти первые несколько членов тейлоровского разложения неявной функции у — f(x), определяе- мой в окрестности (хо,уо) уравнением F(x,y) = 0? 4. а) Проверьте, что плоскость, касательная к эллипсоиду а2 Ь2 с2 точке (хо,уо, zo), может быть задана уравнением = 1. а2 о2 с2 Ь) Точка P(t)'= * В момент времени t = 1 стартовала с эллипсо- ^2 ида + 75- Ч—у = 1. Пусть p(t) — точка того же эллипсоида, ближайшая к P(t) в а2 о2 с2 момент времени t. Найдите предельное положение точки p(t) при t —> +оо. 5. а) В плоскости R2 с декартовыми координатами (х, у) постройте линииуровня функции f(x,y) — ху и кривую S € й2 { = 1}. Используя получен- ную картинку, проведите полное исследование задачи об экстремуме функции f\s — ограничения / на окружность S. ( Ь) Какой физический смысл имеют множители Лагранжа в методе Лагранжа отыскания условного экстремума, когда ищется положение равновесия материаль- ной точки в поле тяжести, если движение точки стеснено идеальными связями (на- пример, вида Fi(x, у, z) = 0, F2(x, у, z) = 0)?
ВОПРОСЫ К ЭКЗАМЕНУ I семестр Введение в анализ (число, функция, предел) Дифференциальное исчисление функций одной переменной 1. Действительные числа. Ограниченные (сверху, снизу) числовые множества. Аксиома полноты и существование верхней (нижней) грани множества. Неограни- ченность множества натуральных чисел. 2. Основные леммы, связанные с полнотой множества действительных чисел R (вложенные отрезки, конечное покрытие, предельная точка). 3. Предел последовательности и критерий Коши его существования. Критерий существования предела монотонной последовательности. 4. Ряд и его сумма. Геометрическая прогрессия. Критерий Коши и необходимое условие сходимости ряда. Гармонический ряд. Абсолютная сходимость. 5. Критерий сходимоеГ2 ряда с неотрицательными членами. Теорема сравнения. Ряд С(з) = П = 1 6. Идея логарифма и число е. Функция ехр(х) и представляющий ее степенной ряд. 7. Предел функции. Основные базы предельного перехода. Определение предела функции при произвольной базе и его расшифровка в конкретных случаях. Беско- нечно малые функции к их СЕОЙетга. Оравне^кс Фин^аного поведения функций, асимптотические формулы и основные операции с символами о(), О(). 8. Взаимосвязь предельного перехода с алгебраическими операциями и отноше- нием порядка в R. Предел при х —> 0. х 9. Предел композиции функций и монотонной функции. Предел х —> оо. 10. Критерий Коши существования предела функции.
ВОПРОСЫ К ЭКЗАМЕНУ 539 11. Непрерывность функции в точке. Локальные свойства непрерывных функ- ций (локальная ограниченность, сохранение знака, арифметические операции, не- прерывность композиции). Непрерывность многочлена, рациональной функции и тригонометрических функций. 12. Глобальные свойства непрерывных функций (промежуточные значения, мак- симумы, равномерная непрерывность). 13. Разрывы монотонной функции. Теорема об обратной функции. Непрерыв- ность обратных тригонометрических функций. 14. Закон движения, перемещение за малое время, вектор мгновенной скорости, траектория и касательная к ней. Определение дифференцируемости функции в точ- ке. Дифференциал, его область определения и область значений. Единственность дифференциала. Производная вещественнозначной функции вещественного пере- менного и ее геометрический смысл. Дифференцируемость функций sinx, cosx, е®, 1п|х|, ха. 15. Дифференцируемость и арифметические операции. Дифференцирование многочлена, рациональной функции, тангенса и котангенса. 16. Дифференциал композиции функций и обратной функции. Производные обратных тригонометрических функций. 17. Локальный экстремум функции. Необходимое условие внутреннего экстре- мума дифференцируемой функции (лемма Ферма). 18. Теорема Ролля. Теоремы Лагранжа я Коши о конечном приращении (о сред- нем). 19. Формула Тейлора с остаточными членами в формах Коши и Лагранжа. 20. Ряд Тейлора. Тейлоровские разложения функций е®, cos ж, sin ж, 1п(1 + х), (1 4- х)“ (бином Ньютона). 21. Локальная формула Тейлора (с остаточным членом в форме Пеано). 22. Взаимосвязь характера монотонности дифференцируемой функции и положи- тельности ее производной. Достаточные условия наличия или отсутствия го экстремума в терминах первой, второй и высших производив**. 23. Выпуклая функция. Дифференциальные yc.’iOBjsg выпуклости. Расположение графика выпуклой функции по отношенцю ^ Аасательной. 24. Общее неравенство ИвЗсена для выпуклой функции. Выпуклость (вогну- тость) логарифма. КгТихические неравенства Коши, Юнга, Гёльдера и Минков- ского. 25 ^ Комплексное число в алгебраической и тригонометрической записи. Сходи- ’лОсть последовательности комплексных чисел и ряда с комплексными членами. Кри- терий Коши. Абсолютная сходимость и достаточные признаки абсолютной сходи- мости ряда с комплексными членами. Предел lim (1-1— ) . 26. Круг сходимости и радиус сходимости степенного ряда. Определение функ- ций ех, cos г, sinz (z € С). Формула Эйлера и взаимосвязь элементарных функций. 27. Дифференциальные уравнения как математическая модель явления, примеры. Метод неопределенных коэффициентов и метод ломаных Эйлера. 28. Первообразная, основные общие приемы ее отыскания (почленное интегриро- вание слагаемых, интегрирование по частям, замена переменной). Первообразные основных элементарных функций.
540 ВОПРОСЫ К ЭКЗАМЕНУ II семестр Интеграл (функции одной переменной) Дифференциальное исчисление функций многих переменных 1. Интеграл Римана на отрезке. Необходимое условие интегрируемости. Множе- ства меры нуль, их общие свойства, примеры. Критерий Лебега интегрируемости функции по Риману (формулировка). Пространство интегрируемых функций и до- пустимые операции над интегрируемыми функциями. 2. Линейность, аддитивность и общая оценка интеграла. 3. Оценки интеграла от вещественнозначной функции. Теорема о среднем (пер- вая). 4. Интеграл с переменным верхним пределом, его свойства. Существование пер- вообразной у непрерывной функции. Обобщенная первообразная и ее общий вид. 5. Формула Ньютона — Лейбница. Замена переменной в интеграле. 6. Интегрирование по частям в определенном интеграле. Формула Тейлора с интегральным остатком. Вторая теорема о среднем. 7. Аддитивная функция ориентированного промежутка и интеграл. Общая схема появления интеграла в приложениях, примеры: длина пути (и ее независимость от параметризации), площадь криволинейной трапеции, объем тела вращения, работа, энергия. 8. Интеграл Римана —Стилтьеса. Условия сведения к интегралу Римана. Син- гулярности и дельта-функция Дирака. Понятие обобщенной функции. 9. Понятие несобственного интеграла. Канонические интегралы. Критерий Коши и теорема сравнения для исследования сходимости несобственного интеграла. Интегральный признак сходимости ряда. 10. Локальная линеаризация, примеры: мгновенная скорость и перемещение; упрощение уравнения движения при малых колебаниях маятника; вычисление линей- ных поправок к значениям величин ехр(а), det (£?), (а, Ь) при малом изменении аргументов (здесь А — обратимая, Е — единичная матрицы; а, b — векторы; (•) — скалярное произведение). 11. Норма (длина, модуль) вектора в векторном пространстве; важнейшие при- меры. Пространство L(X,Y) линейных непрерывных операторов и норма б нем. Непрерывность линейного оператора и конечность его нормы. 12. Дифференцируемость функции в точке. Дифференциал, его область опре- деления и область значений. Координатная запись дифференциала отображения f : Rm —> Rn. Соотношения между дифференцируемостью, непрерывностью и нали- чием частных производных. 13. Дифференцирование композиции функций и обратной функции. Координат- ная запись полученных законов применительно к различным случаям отображений f : Rm -> Rn. 14. Производная по вектору и градиент. Геометрические и физические приме- ры использования градиента (уровни функций, градиентный спуск, касательная
ВОПРОСЫ К ЭКЗАМЕНУ 541 плоскость; потенциальные поля; уравнение Эйлера динамики идеальной жидкости, закон Бернулли, работа крыла). 15. Однородные функции и соотношение Эйлера. Метод размерностей. 16. Теорема о конечном приращении. Ее геометрический и физический смысл. Примеры приложений (достаточное условие дифференцируемости в терминах част- ных производных; условие постоянства функции в области). 17. Высшие производные и их симметричность. 18. Формула Тейлора. 19. Экстремумы функций (необходимые и достаточные условия внутреннего экс- тремума) . 20. Сжимающие отображения. Принцип Пикара —Банаха неподвижной точки. 21. Теорема о неявной функции. 22. Теорема об обратной функции. Криволинейные координаты и выпрямления. Гладкая поверхность размерности к в Rn и касательная плоскость к ней. Способы задания поверхности и соответствующие им уравнения касательного пространства. 23. Теорема о ранге и зависимость функций. 24. Условный экстремум (необходимый признак). Геометрическая, алгебраиче- ская и физическая интерпретации метода Лагранжа. 25. Достаточный признак условного экстремума. 26. Метрическое пространство, примеры. Открытые и замкнутые подмноже- ства. Окрестность точки. Индуцированная метрика, подпространство. Топологи- ческое пространство. Окрестность точки, отделимость (аксиома Хаусдорфа). Топо- логия, индуцируемая на подмножествах. Замыкание множества и описание относи- тельно замкнутых подмножеств. 27. Компакт, его абсолютность. Замкнутость компакта и компактность замк- нутого подмножества компакта. Вложенные компакты. Метрические компакты, е-сеть. Критерий метрического компакта и его конкретизация в пространстве Rn. 28. Полное метрическое пространство. Полнота R, С, Rn, Сп и пространства С [а, Ь] непрерывных функций относительно равномерной сходимости. 29. Критерий непрерывности отображения топологических пространств. Сохра- нение компактности и связности при непрерывном отображении. Классические те- оремы об ограниченности, максимуме и промежуточном значении для непрерывных функций. Равномерная непрерывность на метрическом компакте.
ЛИТЕРАТУРА I. Классика 1. Первоисточники Ньютон И. а. Математические начала натуральной философии. Пер. с лат. В кн.: Кры- лов А. Н. Собрание трудов. Т. 7. — Л.-М.: Изд-во АН СССР, 1936, с. 57-662. Ь. Математические работы. — М.-Л.: ОНТИ, 1937. Лейбниц Г. В. Избранные отрывки из математических сочинений. Успехи матпем. наук, 1948. 3 (1), 165-205. 2. Важнейшие систематические изложения предмета Эйлер Л. а. Введение в анализ бесконечных. В 2-х т. — М.: Физматгиз, 1961. Ь. Дифференциальное исчисление. — М.-Л.: Гостехиздат, 1949. с. Интегральное исчисление. В 3-х т. — М.: Гостехиздат, 1956-1958. Коши О. Л. а. Алгебраический анализ. — Лейпциг: Бэр и Хэрманн, 1864. Ь. Краткое изложение уроков о дифференциальном и интегральном исчисле- нии. — СПб.: Ими. Акад, наук, 1831. II. Современные учебники1) Ильин В. А., Позняк Э. Г. Основы математического анализа. В 2-х ч. — М.: Наука, Ч. I. Изд. 4-е, перераб. и доп., 1982; Ч. II. Изд. 2-е, стереотип., 1980. Ильин В. А., Садовничий В. А., Сендов Б. X. Математический анализ. В 2-х ч. Изд. 2-е, перераб. — М.: Изд-во Моск, ун-та, 1985, 1987. 7 1) Приведенные в этом разделе книги допущены Минвузом СССР или рекомендованы Комитетом по высшей школе Миннауки России в качестве учебников для студентов, обу- чающихся по специальностям «Математика», «Прикладная математика», «Механика», «При- кладная математика и информатика»
ЛИТЕРАТУРА 543 Камынин Л. И. Курс математического анализа. В 2-х ч. — М.: Изд-во Моск, ун-та, 1993, 1995. Кудрявцев Л. Д. Курс математического анализа. В 3-х т. — М.: Высшая школа, 1988, 1989. Никольский С. М. Курс математического анализа. В 2-х т. — М.: Наука, 1990. III. Учебные пособия Виноградова И. А., Олехник С. Н., Садовничий В. А. Задачи и упражнения по математическому анализу. — М.: Изд-во Моск, ун-та, 1988. Демидович Б. П. Сборник задач и упражнений по математическому анали- зу. — М.: Наука, 1990. Макаров Б. М., Голузина М. Г., Лодкин А. А., Подкорытов А. Н. Избранные задачи по вещественному анализу. — М.: Наука, 1992. Рудин У. Основы математического анализа. Изд. 2-е. — М.: Мир, 1976. Шилов Г. Б. а. Математический анализ. Функции одного переменного. Ч. 1-2. — М.: Наука, 1969. Ь. Математический анализ. Функции нескольких вещественных переменных. В 3-х ч. — М.: Наука, 1972. Фихтенгольц Г. М. Курс дифференциального и интегрального исчисления. В 3-х т. Изд. 7-е, стереотип. — М.: Наука, 1969. IV. Дополнительная литература Александров П. С., Колмогоров А. Н. Введение в теорию функций действительного переменного. — М.: ГТТИ, 1938. Альберт Эйнштейн и теория гравитации: Сб. статей. К 100-летию со дня рожде- ния. — М.: Мир, 1979. Арнольд В. И. а. Гюйгенс и Барроу, Ньютон и Гук — первые шаги математического анализа и теории катастроф, от эвольвент до квазикристаллов. — М.: Наука, 1989. Ь. Математические методы классической механики. — М.: Наука, 1989. Бурбаки Н. Очерки по истории математики. — М.: Изд-во иностранной ли- тературы, 1963. (В частности, статья «Архитектура математики».) В ал ле-Пуссен Ш.-Ж. Курс анализа бесконечно малых. В 2-х т. — Л.-М.: ГТТИ, 1933. Вейль Г. Математическое мышление. — М.: Наука, 1989. Гелбаум Б., Олмстед Дж. Контрпримеры в анализе. — М.: Мир, 1967. Гельфанд И. М. Лекции по линейной алгебре. — М.: Наука, 1971. Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геоме- трия: Методы и приложения. — М.: Наука, 1986.
544 ЛИТЕРАТУРА Дьедонне Ж. Основы современного анализа. — М.: Мир, 1964. Зельдович Я. Б., Мышкис А. Д. Элементы прикладной математики. — М.: Наука, 1967. Зорич В. А. Анализ. [Записки лекций для студентов Математического кол- леджа НМУ и механико-математического ф-та МГУ.] В 3-х вып. Вып. I. Лекции 5-7: Дифференциал. Вып. П. Лекция 8: Теорема о неявной функ- ции. Вып. III. Лекции 9-11: Приложения теоремы о неявной функции. — М.: Изд-во механико-математич. ф-та МГУ, 1995. К ар тан А. Дифференциальное исчисление. Дифференциальные формы. — М.: Мир, 1971. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функцио- нального анализа. Изд. 4-е, перераб. — М.: Наука, 1976. Кострикин А. И., Манин Ю. И. Линейная алгебра и геометрия. — М.: Наука, 1986. Кириллов А. А. Что такое число? — М.: Наука, 1993. Курант Р. Курс дифференциального и интегрального исчисления. В 2-х т. — М.: Наука, 1970. Ландау Э. Основы анализа. — М.: Изд-во иностранной литературы, 1947. Манин Ю. И. Математика и физика. — М.: Знание, 1979. — (Новое в жизни, науке, технике. Серия: Математика, кибернетика; № 12.) Милнор Дж. Теория Морса. — М.: Мир, 1965. — (Библиотека сборника «Ма- тематика».) Нарасимхан Р. Анализ на действительных и комплексных многообразиях. — М.: Мир, 1971. Полна Г., Сеге Г. Задачи и теоремы из анализа. В 2-х ч. Изд. 3-е. — М.: Наука, 1978. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. — М.: Нау- ка, 1974. Пуанкаре А. О науке. — М.: Наука, 1990. Спивак М. Математический анализ на многообразиях. — М.: Мир, 1971. Уиттекер Э. Т., Ватсон Дж.Н. Курс современного анализа. В2-хч. Изд. 2-е. — М.: Физматгиз, 1962-1963. Успенский В. А. Что такое нестандартный анализ? — М.: Наука, 1987. Фейнман Р., Лейтон Р., Сэндс М. Фейнмановские лекции по физике. Т. I: Современная наука о природе. Законы механики. — М.: Мир, 1965. Халмош П. Конечномерные векторные пространства. — М.: Наука, 1963. Шварц Л. Анализ. В 2-х т. — М.: Мир, 1972. Эйнштейн А. Физика и реальность: Сб. статей. — М.: Наука, 1965. (В частности, статьи «Принципы научного исследования» — с. 8-10 и «Физика и реальность» — с. 38-60.)
алфавитный указатель Абель (Abel N. Н.) 34, 265, 318, 319, 348, 397 Абсолютная величина числа 54. См. также Модуль действительного числа Адамар (Hadamard J.) 264, 468, 502, 531 Аддитивность интеграла 342 Аксиома Архимеда 50, 51. См. также Принцип Архимеда — бесконечности 28 — выбора 28 — выделения 27 — Дедекинда 63 — множества подмножеств 27 — непрерывности 36, S3 — объединения 27 — объемности 26 — пары 27 — подстановки 28 — полноты (непрерывности) 36, 41, 50, 53, 63, 65, 66, 68, 71 — Цермело 28 Аксиоматика действительных (вещест- венных) чисел 34, 50, 67 — категоричная 36 — непротиворечивая 36 — теории множеств 6, 26, 28 — Цермело — Френкеля 28 Алгоритм Евклида 64, 103 Альтернанс 169 Аргумент комплексного числа 260, 261 — функции 12 Архимед (Архцлт^тк) 50, 51, 325 Асимптота 249 — вертикальная 249 — горизонтальная 249 — наклонная 249 Асимптотика функции 135, 223 Атомный котел 287, 289 База (базис фильтра) 125, 126 — в множестве разбиений 326 Базис 421 — пронормированный 425 Бернулли Д. (Bernoulli D.) 443 Бернулли И. (Bernoulli J.) 19, 245 Бернулли Я. (Bernoulli J.) 64, 87 Бернштейн (Bernstein F.) 26, 31 Биекция 16 Бином дифференциальный' 321 — Ньютона 64, 206, 220 Бойли (Bolyai J.) 19 Больцано (Bolzano В.) 69, 83, 88, 157, 188 Бонне (Бойись О.) 352 Борель (Borel Е.) 69 Бунлковский В. Я. 353 Бурбаки (Bourbaki N.) 5, 126 Бюффон (Buffon G. L. L.) 386 Валле-Пуссен (La Vallfce Poussin Ch. J.) 168 Ван дер Варден (van der Waerden В. L.) 188 Вейерштрасс (Weierstrass К.) 69, 85, 88 97, 158, 188 Вектор касательный 464, 465, 514 — нормальный 463, 465 Векторы ортогональные 425 Ветвь аргумента комплексного числа 261 Взрыв 288, 289 Виет (Vidte F.) 146 Вложение 16 Выпрямление 492, 493 Галилей (Galilei G.) 1, 13 Гамильтон (Hamilton W. R.) 486, 487
546 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Гаусс (Gauss С. F.) 19, 147, 155, 259, 277, 398, 469 Гейне (Heine Е.) 108, 161 Гёльдер (Holder О.) 236, 353 Гелъфонд А. О. 50 Гессиан 486, 501, 530 Гильберт (Hilbert D.) 50, 63 Градиент 436, 438, 439 Граница числового множества верхняя (мажоранта) 41 -------нижняя (миноранта) 41 -------точная верхняя 42 -------нижняя 42 Грань числового множества верхняя 42, 43 -------нижняя 42, 43 График функции 21, 22, 166, 246, 248, 251, 255 ----многих переменных 461, 462 Группа 34 — абелева 34, 46 — аддитивная 34 — коммутативная 34 — мультипликативная 35 Гук (Hooke R.) 300 Гюйгенс (Huygens С ) 385, 460, 461 Даламбер (D’Alembert J.) 98 Дарбу (Darboux G.) 228, 333, 340 ___ Декарт (Descartes R.) 10 Делитель 47 — наибольший 64 — нуля 66 Диаметр множества 409, 411 Дирихле (Dirichlet Р. G.) 155, 397 Диффеоморфизм 489, 499 — простейший 499 Дифференциал отображения 426, 430 -* функции 175-177, 182, 189 ----многих переменных 426, 427, 429, 430 Дифференцирование и арифметические операции 189, 191, 273, 432, 433 — композиции функций 192-194, 434 — неявной функции 200, 208 — обратной функции 196, 440, 441 — степенного ряда 273 Длина кривой 14, 373, 375, 376 — пути 371-373, 376 — числового промежутка 53 — эллипса 376, 377 Дополнение множества 9 Дробь непрерывная 102 — подходящая 102-104 — простейшая 279, 309 — цепная 102, 103 Дюбуа-Реймон (Du Bois Reymond Р.) 341 Евклид (EvxAe4<5»?<;) 64, 74, 135 Евклидова структура 424 Единица в множестве действительных чисел 35, 38, 41 -----мультипликативной группе 35 — мнимая 259 Жесткости коэффициент 294, 300, 379 Зависимость функций 497, 505 Задача Бюффона 386 — Гюйгенса 460, 461, 470 — Кеплера (двух тел) 170 — Окуня 535 Закон Бернулли 443 — Кеплера 446 — Клапейрона 286, 488 — НымТОча 170, 210, 289, 442, 446 — Ома 24 — преломления 235, 532 -— сложения скоростей 202-204 -С’г€ллиуса 235, 532 ___ Замена параметризации пути 375, 376 -------допустимая 376 — переменной в интеграле неопреде- ленном 306 ---------определенном 359 Замкнутость алгебраическая поля комплексных чисел 275-277 Замыкание множества 407, 410 Значение главное несобственного интеграла 400 — функции 12, 21 ---- среднее 364 Идеал кольца 169 ----непрерывных функций 169 ----------максимальный 169 Йенсен (Jensen J. L.) 243, 353 Изоморфизм 37, 145 Индекс критической точки 506 Интеграл вероятности ошибок 402 — Гаусса 398 — гиперэллиптический 318 — Дарбу верхний (нижний) 340 — неопределенный 302, 304-306
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 547 Интеграл несобственный 386, 387 ----расходящийся 387 — — с несколькими особенностями 398 ----сходящийся 386 -------абсолютно 392 -------условно 396 — определенный 324-326 — от векторноэначной функции 341 — Римана 326 — с переменным верхним пределом 354 — Френеля 322, 363, 401 — Эйлера 395 — Эйлера—Пуассона 322, 398 — эллиптический 318, 319, 321, 322, 377, 395 ----второго рода 319, 377 ----------полный 377 — — первого рода 319, 382, 401 ----------полный 382, 401 ----третьего рода 319 Интегрирование 301, 302, 324 — заменой переменной 306, 359 — по частям 306, 357 Интервал действительных чисел 53 Инъекция 16 Итерации 17, 31, 167 Кантор (Cantor G.) 5, 26, 73, 83, 161 Канторово множество 75, 341 Кардинальное число (кардинал) 25, 26 Карно Л. (Carnot L. N.) 112 Карно Сади (Carnot N. L. S.) 112 Картон (Cartan Н.) 126 Касательная 174, 179-182, 213, 240, 471, 511 — плоскость 463-465, 471, 479, 511 — прямая, см. Касательная Касательное отображение 426, 493, 512 — пространство 427, 511-514, 529 Квантор всеобщности 7, 30 — существования 7, 30 Кельвин, лорд (Kelvin), см. Томсон У. Кеплер (Kepler J.) 170, 446 Клапейрон (Clapeyron В. Р. Е.) 286 Колебание функции в точке 151, 416 ----на множестве 128, 151, 329, 411 Колебания 293 — гармонические 295, 299 — затухающие 297 — маятника 382, 383, 385, 396, 402, 446 Кольцо непрерывных функций 169 — ростков непрерывных функций 169 Компакт 159, 408 - вйт 408, 409, 418 Композиция отношений 22 — отображений 17, 130, 156, 192, 194, 340, 412, 423, 434 Континуум 73. 74 Координаты декартовы 425 — криволинейные 461, 462 ----вйт 492 — полярные 491 — сферические 491 Координаты точки 52, 404 Корень многочлена 168, 275, 276, 278 — кратный 230, 279 — n-й степени арифметический 65, 116 -------из комплексного числа 262 Косинус гиперболический 198 — интегральный 309 Котангенс гиперболический 199 Коши (Cauchy A. L.) 56, 68, 83, 93, 97, 99, 105, 106, 129, 157, 214, 217, 221, 264, 282, 353, 400, 505 Коэн (Cohen Р.) 74 Коэффициент жесткости 294, 300, 379 — полезного действия 297 Кратность корня многочлена 279 Кривая 371 — параметризованная 371 — простая замкнутая 371 — уникурсальная 320 Кривизна кривой 257, 258 Критерий Дарбу интегрируемости функции 340 — Дюбуа-Реймона интегрируемости функции 341 — Коши существования предела после- довательности 83, 263, 411 ---------функции 129, 412 ----сходимости несобственного инте- грала 391 -------ряда 93, 263 — Лебега интегрируемости функции 337, 338, 341 — непрерывности монотонной функции 164 — Сильвестра 458 — существования предела монотонной последовательности 85 --------- функции 134 — сходимости ряда с неотрицательными членами 96 Круг сходимости степенного ряда 264, 265
548 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Лагранж (Lagrange J. L.) 177, 212, 217, 224, 229, 230, 486, 518, 519, 532 Лакруа (Lacroix S. F.) 19 Лаплас (Laplace Р. S.) 267, 466 Лебег (Lebesgue Н.) 69, 337, 338 Лежандр (Legendre А. М.) 256, 319, 366, 377, 382, 485 Лейбниц (Leibniz G. W.) 1, 19, 50, 170, 177, 194, 206, 324, 356 Лемма Адамара 468, 502 — Больцано — Вейерштрасса 88,92 — Морса 501, 502 — о верхней грани 42, 50 ----вложенных компактах 410 -------отрезках 68, 69 ----конечном покрытии 69, 70 ----предельной точке 69, 70 — Ферма 211 Линдеман (Lindemann F.) 49 Линейность интеграла 342 Линия геодезическая 14 — тока 443 — уровня 442, 473 Лиувилль (Liouville J.) 65, 318 Лобачевский Н. И. 19 Логарифм 121, 122, 187, 194, 195, 282 — интегральный 309, 322, 400 — натуральный 121, 282 Логарифмическая шкала 195 Лопитпаль (L’Hospital G. F. А.) 245 Лоренц (Lorentz Н. А.) 13, 204 Макларен (Maclaurin С.) 217 Максвелл (Maxwell J. С.) 445 Максимум 42, 66, 158, 418, 460 — локальный 210, 233, 234, 454, 456, 532 — условный 517, 522 Мантисса 67 Масса критическая 288 Матрица Якоби 430, 433, 434, 456 Маятник 382, 383, 385, 396, 446 — циклоидальный 385, 402 Метод градиентный 439 — исчерпания 325 — ломаных Эйлера 292 — множителей Лагранжа 519, 532 — наименьших квадратов 468 - — неопределенных коэффициентов 280, 293 — Остроградского 319 — размерности 444, 446 Метрика 404, 405, 419 — в Rm 404, 411 Мещерский И. В. 285 Минимум 42, 66, 158, 418, 460 — локальный 210, 233, 234, 454, 456, 532 — условный 517, 522 Минковский (Minkowski Н.) 237, 353 Многочлен Лагранжа 229, 366 — Лежандра 366 — наилучшего приближения 168, 169 — Тейлора 216, 221-223 — Чебышева 169 — Эрмита 230 Множество 5, 6, 26 — бесконечное 26 — замкнутое 405-409 — инвариантное 24 — индуктивное 28, 44, 64 — интегрируемых функций 327, 328, 336 — канторово 75, 341 — конечное 25 — меры нуль 337, 338, 341 — неограниченное 54, 413 — несчетное 73 — ограниченное 41, 409 ----сверху (снизу) 41 — открытое 405, 406, 408, 418, 420 — пустое 11, 27 — равномощное другому множеству 25 — связное 418, 420 ---- линейно 417 — счетное 71, 72 — устойчивое 24 Модель действительных чисел 36, 37, 56, 63, 66 Модуль действительного числа 54 — (длина) вектора 171, 260. См. также Норма вектора — комплексного числа 260, 261 — непрерывности функции 167, 168 Монотонность интеграла 345 Морган (de Morgan А.) 9 Морс (Morse М.) 501, 502 Морфизм 12 Мощность континуума 73, 74 — множества 25, 26, 74 Муавр (de Moivre А.) 261 Мультииндекс 467 Нейман, фон (von Neumann J.) 28, 31 Неравенство Адамара 531 — Бернулли 64, 87, 236 — Гёльдера 236, 244, 353 — Йенсена 243, 244, 353 — Коши — Бунлковского 353 — Минковского 237, 353, 404
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 549 Неравенство треугольника 54, 404, 424 ---- числовое 54 — Шварца 353 — Юнга 236, 257, 386 Норма вектора 423, 425 Носитель пути 371, 375 Ньютон (Newton I.) 1, 64, 170, 220, 324, 356, 384, 446 Область в Rm 418 — значений отношения 19 ---- функции 12 — определения отношения 19 ----Функции 12 Образ 15, 21 Объединение множеств 8, И Объем тела вращения 378 Ограничение функции, см. Сужение функции Окрестность точки 54, 69, 105, 106, 406, 412 ----проколотая 105, 106, 412 Окружность соприкасающаяся 258 Окунь Л. Б. 535 Ом (Ohm G. S.) 24 Оператор 12 — Лапласа 466, 471 — сдвига 14 Операция ассоциативная 17, 34, 35 — дистрибутивная 35 — дифференцирования 189 — коммутативная 34, 35 — логическая 4, 11, 29 — над множествами 8, 11 — сложения 34, 35 — умножения 34, 35 Орбиты планет 300 Основание логарифма 121 — системы счисления 60 Осреднение функции, см. Усреднение функции Остаточный член формулы Тейлора 216, 220, 224, 368 ---------в интегральной форме 357, 358, 453, 454, 467, 502 ---------в форме Коши 217, 359 --------------Лагранжа 217, 224, 229, 230, 359, 454, 467 --------------Пеано 223, 224, 454 Остроградский М. В. 319 Осциллятор линейный 294, 299, 300 — плоский 300 Ось координатная 52 — числовая 52 Отношение 5, 19, 20 — антисимметричное 20, 22 — включения 7, 20, 66 — неравенства 21, 35, 36, 39 — порядка 21, 35, 53 -----линейного 21, 35, 36, 53 -----частичного 21, 35, 66 — равенства 7, 8, 20 — равномощности 25 — рефлексивное 20 — симметричное 20 — транзитивное 20, 22 — транспонированное 22 — функциональное 21, 22 — эквивалентности 20, 23, 25 Отображение 11, 12, 410. См. также Функция — биективное 16, 23 — взаимно однозначное 16 — инъективное 16, 23 — касательное 426, 493, 512 — линейное 175, 181, 182, 422-424, 433, 441, 490 — непрерывное 148-150, 415, 416, 418 — обратное 16, 18, 196, 440, 489, 490 -----левое (правое) 23 — ограниченное 109, 410, 418 — постоянное 109 — равномерно непрерывное 159, 417, 418 — сюръективное 16, 23 — тождественное 18 — финально ограниченное 110, 410 Падение тел 289 Пара неупорядоченная 9, 27 — упорядоченная 9, 27 Параметр разбиения 326 Параметризация кривой 375, 381 ----- натуральная 381 Пеано (Peano G.) 25, 223, 224, 371 Первообразная 301, 302, 305, 307, 354, 355 — обобщенная 355 — рациональной функции 311, 313 Переменные канонические 487 Пересечение множеств 8, 11 Перестановка членов ряда 94, 265 Период колебаний маятника 382, 383, 385, 396, 402 — обращения 300 — полураспада 287, 298 — функции 188, 269, 363
550 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Плоскость касательная 463-465, 471, 479, 511 ----к поверхности 465, 479, 511, 512, 514 — комплексная 260 Площадь криволинейной трапеции 377, 378 — эллипса 378 Поверхность 462, 479, 506, 507, 511, 517 — минимальная 486 Поглощение излучения 299 Погрешность абсолютная 56-58, 77, 195 — относительная 56-58, 195, 443 Подмножество 7, 27 — пустое 8, 27 — собственное 8 Подпоследовательность 88 Подстановка Эйлера 317, 320 Поле алгебраическое 35 — архимедово 66 — векторное 442 — потенциальное 442, 532 — упорядоченное 66 Полуинтервал 53 Порядок касания 179, 180 — числа 60, 67 Последователь 28 Последовательность 55, 68, 77 — вложенных компактов 410 ----множеств 68, 70 ----отрезков 68, 70, 83 — возрастающая 85 — Коши 83, 262, 411 — монотонная 85 — невозрастающая 85 — неубывающая 85 — ограниченная 79 ----сверху (снизу) 85 — постоянная 79 — расходящаяся 78 — сходящаяся 78 — убывающая 85 — финально постоянная 79 — фундаментальная 83, 262, 411 — числовая 55 — элементов множества 68 Постоянная времени 298 — гравитационная 57 — Планка 57 — Эйлера 145 Потенциал векторного поля 439, 442, 532 — Ньютона 384, 442 — силы 380, 381, 384, 385, 442 Почти всюду 338, 341, 352 Правило Лопиталя 245, 246 Предел интегрирования верхний (ниж- ний) 327, 345, 354 — композиции функций 130, 412 — отображения 410 — по базе 124, 126, 127 — последовательности 77-79, 83, 108 ----верхний (нижний) 89-91 ----частичный 91 — функции 105, 106, 108, 109, 112, 113, 126, 128, 129 Преобразование 12 — Абеля 348 — Галилея 13, 24, 202, 203, 205 — за время t 24 — инволютивное 257, 485 — Лежандра 256, 257, 485-487 — линейное 422, 423 — Лоренца 13, 24, 204, 205 Признак Абеля — Дирихле сходимости интеграла 397 — Вейерштрасса сходимости ряда 97 — Гаусса сходимости ряда 147 — Даламбера сходимости ряда 98, 220 — достаточный условного экстремума 522 — — экстремума 233, 234, 456 — интегральный сходимости ряда 392 — Коши сходимости ряда 97, 99 — монотонности функции 214, 231, 232 — необходимый (достаточный) 2 ----сходимости ряда 93 ----условного экстремума 517, 519, 521, 532 ----экстремума 211, 232, 455 — постоянства функции 214, 231, 232 Принцип Архимеда 50, 51, 66, 71 — Больцано —Вейерштрасса 69-71 — Бореля —Лебега 69, 71 — верхней грани 42, 65 — Коши —Кантора 68, 71 — математической индукции 44 — Ферма 235, 532 Приращение аргумента 175, 176, 426 — функции 175-177, 426 Прогрессия геометрическая 94 Продолжение разбиения 329 — функции 12 Проектирование 14 Проекция 10, 417 — стереографическая 529 Произведение бесконечное 146 — множеств декартово 9, 10, 27, 31 ----прямое 9, 10, 27, 31 — рядов 265, 266 — скалярное 425
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 551 Производная 175, 177, 272, 426 — высшего порядка 205 — логарифмическая 194, 195 — односторонняя 256 — по вектору 438 ----направлению 439 — функции комплексного переменного 272 — частная 428 ----высшего порядка 450, 452 Промежуток многомерный 408 — числовой 53 ----неограниченный 53 Прообраз 16, 22 Пространство векторное 336, 342, 421 — евклидово 425, 426 — касательное 427, 511-514, 529 — конфигурационное системы п частиц 15 — метрическое 404 ----полное 129, 411 — фазовое системы п частиц 15 — R™ 403, 404, 411, 421 — 6] 327, 335, 336, 342 Процесс итерационный 17 Пуанкаре (Рошсагё Н.) 1 Пуассон (Poisson S. D.) 322, 398 Путь 371, 416, 441, 464, 506, 528 — гладкий 371 — замкнутый 371 — кусочно гладкий 372 — простой 371 ----замкнутый 371 Работа 379 — выхода 384 Равенство множеств 7 — функций 12 Радиус кривизны 258 — критический 288 — сходимости степенного ряда 264 Разбиение промежутка 326 ----с отмеченными точками 326 Разложение диффеоморфизма в композицию простейших 499 — многочлена на множители 278 ----по формуле Тейлора 207, 215, 220 — рациональной дроби на сумму про- стейших дробей 279, 280, 309 — функции в ряд Тейлора 218-220, 228, 274, 275 ----по формуле Тейлора, см. Формула Тейлора Размерность поверхности 506-508 — физической величины 444-446 Разность конечная 230 — множеств 8 Ранг отображения 493, 505 — системы функций 505 Распад радиоактивный 287, 298 Распространение функции, см. Продолжение функции Рассел (Russel В.) 6, 28 Расстояние (метрика) 404 — в Rm 404 — между множествами 409 ----точками числовой оси 54 Риман (Riemann В.) 155, 326, 505 Ролль (Rolle М.) 212, 468 Росток функции 169 Ряд 93 — гармонический 94 — расходящийся 93 — степенной 220, 264, 265, 273-275 — сходящийся 93, 263 ----абсолютно 95, 263, 265, 266 — Тейлора 220, 274, 275 — числовой 93 Сахаров А. Д. 535 Свойства непрерывных функций гло- бальные 157, 418 -------локальные 156, 169, 416 Свойство, выполненное финально (при данной базе) 127, 128, 135, 136, 138, 139 — параболического зеркала 184, 185 Секущая 179, 181 Сильвестр (Sylvester J. J.) 458 Символ логический 1, 4, 7 — О большое 138, 141 — о малое 136, 141 Симпсон (Simpson Т.) 367, '368 Синус гиперболический 198, 268 — интегральный 309 — круговой 114, 268 Система счисления 59, 62, 68 ----позиционная 59, 62 — уравнений Гамильтона 487 ----Коши —Римана 505 ----Эйлера—Лагранжа 486, 487 — функций зависимая 498, 505 ----независимая 497, 505 Скорость вторая космическая 385 — мгновенная 171-173, 181, 183, 191 — света 13, 57, 203, 235 Слой 22
552 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Снеллиус (латиниэир. Snellius, Snell van Royen W.) 235 Среднее арифметическое 104, 244, 255 — гармоническое 94, 104, 255 — геометрическое 244, 255 — интегральное 364 — квадратическое 104, 255 — порядка р 104, 255 Стокс (Stokes G. G.) 357 Структура евклидова 424 — логическая математических высказы- ваний 29 Сужение функции 12 Сумма Дарбу верхняя (нижняя) 333, 340 — интегральная 325, 326 ----верхняя (нижняя) 333 — ряда 93 ----частичная 93 Сфера 406, 407, 419, 420, 529 Сходимость несобственного интеграла 386 ----абсолютная 392 ----условная 396 — последовательности 78 — ряда 93 ----абсолютная 95, 97, 263 Сюръекция 16 Таблица истинности 4 — первообразных (неопределенных интегралов) 304 — производных 200 Тангенс гиперболический 199 Тейлор (Taylor В.) 215, 216, 220, 222, 223, 357, 358, 453, 466 Теорема Абеля 265 — алгебры основная 276, 277 - — арифметики основная 47 — Больцано—Коши о промежуточном значении 157 — Валле-Пуссена 168 — Вейерштрасса 85 о максимальном значении 158 — Дарбу 228, 340 — Дедекинда 63, 65 — Кантора 26, 73 ----о равномерной непрерывности 161 — Кантора—Гейне 161 — Коши 214, 215 — Лагранжа 212-214, 224 — Лиувилля 65 — о конечном приращении 212, 213, 448 ----неявной функции 471, 474, 481, 487, 489 ---- ранге 493 ----среднем 213, 447, 448 -------для интеграла вторая 348, 351, 365, 397 ------------ первая 347, 365 — Ролля 212, 468 — сравнения (для несобственных инте- гралов) 393 ----(для рядов) 96 — теории размерности (П-теорема) 446 — Чебышева 169 — Шрёдера—Бернштейна 26, 31 Тождество Эйлера для однородных функций 444 Томсон У. (Thomson W.), лорд Кельвин (Kelvin) 286 Топология 107 Точка в Rm 404 — внешняя 406 — внутренняя 406 — граничная 406 — критическая 456, 532 ----вырожденная 530 ----невырожденная 501, 506 — — седловая 464 — локального максимума 210,211, 232-234, 454, 455, 457 ----минимума 210, 211, 232-234, 454, 455, 457 — неподвижная 24, 167 — перегиба 242, 485 — предельная 69, 70, 407 — разрыва 153 ----второго рода 155 ----монотонной функции 163, 164 ----первого рода 154 ---- устранимого 154 — стационарная 456, 532 — чебышевского альтернанса 169 Трапеция криволинейная 377, 378 Угол между векторами 426 ----кривыми 529 Узел интерполяции 230, 366 Упорядоченность линейная 35, 36, 53 — частичная 35, 66 Уравнение дифференциальное 174, 283, 286, 287, 289-291, 294, 295, 323 —- — гармонических колебаний 294, 295, 299 ----с разделяющимися переменными 323 — Лапласа 466
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 553 Уравнение теплопроводности 466 — Эйлера (гидродинамическое) 439, 443 Уровень функции 442, 479, 517, 521 Ускорение мгновенное 170-172, 183,188, 208, 257 Условие необходимое (достаточное) 2 Условия выпуклости функции 238-240 — дифференцируемости функции мно- гих переменных 427, 429, 449 — интегрируемости достаточные 329-332 ----необходимые 328 -------и достаточные 334, 338, 340, 341 — монотонности функции 214, 231, 232 — экстремума функции 232-234 -------многих переменных 455, 456 Усреднение функции 364, 366 Ферма (Fermat Р.) 10, 211, 235 Фибоначчи (Леонардо Пизанский) (Fibonacci L.) 103 Форма записи комплексного числа алге- браическая 260 ---------тригонометрическая 260, 261 Формула барометрическая 285, 286, 298 — Бонне 352 — Виета 146 — замены переменной в интеграле неопределенном 307 ------------определенном 359, 360 — интегрирования по частям в инте- грале неопределенном 306 ------------несобственном 390 ---------------определенном 357 — интерполяционная Лагранжа 229, 230 ----Эрмита 230 — квадратурная 367, 368 ----парабол 367, 368 ----прямоугольников 367, 368 ----Симпсона 367, 368 ----трапеций 367, 368 — Коши — Адамара 264 — Лейбница 206 — Маклорена 217 — Мещерского 285 — Муавра 261, 270 — Ньютона — Лейбница 324, 356 — Остроградского 319 — Тейлора 216, 223, 453, 456, 467 ----для функции многих переменных 453, 456, 502 ---------------в мультииндексных обозначениях 467 ----локальная 222, 223, 454 ----с остаточным членом в интеграль- ной форме 357, 358, 453, 467, 502 ------------в форме Коши 217, 359 -----------------Лагранжа 217, 224, 230, 359, 454, 467 -----------------Пеано 223, 224, 454 — Циолковского 285 — Эйлера 267 Френель (Fresnel A. J.) 322, 401 Френкель (Fraenkel А.) 28 Функционал 12, 14, 342 Функция 11, 12, 19, 21 — аддитивная ориентированного про- межутка 345, 369, 370 — аналитическая в точке 221, 274 — асимптотически одного порядка с другой функцией 138 ----эквивалентная другой функции 139 — бесконечно большая 136 -------более высокого порядка 136 — бесконечно малая 111, 112, 128, 136 -------более высокого порядка 136 -------по сравнению с другой функцией 136 — вогнутая 238. — возрастающая 134 — выпуклая 238 ----вверх (вниз) 238 — гармоническая 466 — гиперболическая 198, 199 — Дирихле 155, 339, 340 — дифференцируемая в точке 175, 176 — интегрируемая 327 — комплексного переменного 270 -------дифференцируемая 273 -------непрерывная 272 — Лагранжа 518, 519, 522, 527 — логарифмическая 116, 121, 122, 124 — локально однородная 444 — многих переменных 403 -------дифференцируемая 426 -------непрерывная 415 — монотонная 134 — невозрастающая 134 — непрерывная в точке 148, 149, 415 ----на множестве 151, 416 — неубывающая 134 — неявная 200, 208, 472, 474, 480, 481, 487 — обратная 16, 18, 162, 165, 166, 196, 440, 489 — ограниченная 109, 410 ----сверху (снизу) 109
554 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Функция однородная 444 — периодическая 188, 269, 363, 366 — показательная 116, 121, 124 — постоянная 109 — равномерно непрерывная 159, 161, 417, 418 — Римана 155, 166, 339, 340 — силовая 442 — степенная 116, 124 — строго выпуклая 238 — тригонометрическая 373, 375 — убывающая 134 — финально ограниченная 110, 128, 138, 410 ---— постоянная 109, 127 — характеристическая множества 14 — экспоненциальная 121, 186, 267, 290, 291, 293 — sgn (знак) 107 Центр кривизны 258, 530 Цермело (Zermelo Е.) 28 Циклоида 385, 402 Циолковский К. Э. 285 Насть действительная комплексного числа 260 — дробная числа 51 — мнимая комплексного числа 260 — рациональная интеграла 319 — целая числа 51 Чебышев П. Л. 135, 169, 321 Числа Фибоначчи 103 Число алгебраическое 49, 65, 73 — вещественное 33 — действительное 33 — иррациональное 48, 64, 73, 74 — кардинальное 25, 26 — комплексное 259 — натуральное 28, 43, 44 ----по фон Нейману 28, 31 — отрицательное 41 — положительное 41 — простое 47 — рациональное 47, 64, 72 — сопряженное 259 — трансцендентное 49, 65, 73 — целое 46 — е 86, 87, 100-102, 131-133, 269, 291, 292 — тг 49, 146, 269, 368, 372, 374 Числовая прямая 52 Шар 405 — замкнутый 405 — открытый 405 Шварц (Schwarz Н. А.) 353 Шнайдер (Schneider Th.) 50 Шрёдер (Schroder Е.) 26, 31 Эйлер (Euler L.) 86, 145, 259, 266, 267, 292, 317, 320, 322, 395, 398, 443, 444, 486 Эйнштейн (Einstein А.) 13, 421 Эквивалентность асимптотическая функций 139 Экспонента 121, 186, 290-293 — интегральная 322, 402 — комплексная 267-269, 293, 295 Экстремум внутренний 211, 232-234 — условный 506, 516, 517, 522 — функции многих переменных 454-457 Элемент единичный 35, 38 — максимальный (минимальный) 41 — множества 5, 7 — наибольший (наименьший) 41 — нейтральный 34, 35 — нулевой 34, 37 — обратный 35, 38 — противоположный 34, 37 Энергия кинетическая 15, 299, 380, 381 — полная 15, 299, 380, 381 — потенциальная 15, 299, 380, 381 Эрмит (Hermite Ch.) 230 Юнг (Young W.) 236 Якоби (Jacobi С. G. J.) 430 Якобиан 430 — перехода к полярным координатам в Rm 491, 492