Текст
                    В. Босс
Диализ
Краткое
и ясное
1
изложение
предмета
УРСС


В. Босс ЛЕКЦИИ. МАТЕМАТИКЕ Анализ Москва УРСС
ББК22.161я73 Босс В. Лекции по математике: анализ. — М: Едиториал УРСС, 2004. — 216 с. I5ВN 5-354-00773-9 Книга отличается краткостью и прозрачностью изложения, вплоть до объ- объяснений «на пальцах». Значительное внимание уделяется мотивации результатов и укрупненному видению. В первой части дается обширный материал стан- стандартных курсов математического анализа. Во второй, «необязательной», части излагаются — в стиле обзоров и очерков — примыкающие к анализу предметы: аналитические функции, топология и неподвижные точки, векторный анализ. «Высокие материи» рассматриваются на доступном уровне. Книга легко читается. Для студентов, преподавателей, инженеров и научных работников. Издательство «Едиториал УРСС». 117312, г. Москва, пр-т 60-летия Октября, 9. Лицензия ИД №05175 от 25.06.2001 г. Подписано к печати 29.04.2004 г. Формат 60x90/16. Печ. л. 13,5. Зак. № 3-1358/547. Отпечатано в типографии ООО «РОХОС». 117312, г. Москва, пр-т 60-летия Октября, 9. I8ВN 5-354-00773-9 ИЗДАТЕЛЬСТВО НАУЧНОЙ И УЧЕБНОЙ ЛИТЕРАТУРЫ Е-таН: 11К88@11К88.ги Каталог изданий в 1п1ете1: п«р://11К83.ги Тел./факс: 7 @95) 135-42-16 Тел./факс: 7 @95) 135-42-46 Едиториал УРСС, 2004 2518 Ю 21377 78535407738
Оглавление Предисловие 7 Глава 1. Предварительные сведения 9 1.1. Комбинаторика 9 1.2. Бином Ньютона 11 1.3. Многочлены 11 1.4. Комплексные числа 14 1.5. Показательная и логарифмическая функции 16 1.6. Множества 17 Часть I Анализ 19 Глава 2. Последовательности и пределы 20 2.1. Стартовые понятия 20 2.2. Теорема о трех собачках 22 2.3. Критерий Коши 23 2.4. Число е и другие пределы 26 2.5. Леммы Больцано—Вейерштрасса и Гейне—Бореля . . 28 2.6. Предел функции 30 2.7. Непрерывность 33 2.8. Числовые ряды 35 2.9. Гипноз и математика 39 Глава 3. Дифференцирование 41 3.1. Производная 41 3.2. Правила дифференцирования 44 3.3. Зачем нужны производные 46 3.4. Вывод формул 47 3.5. Дифференциалы 49 3.6. Теоремы о среднем 51 3.7. Формула Тэйлора 54
4 Оглавление 3.8. Монотонность, выпуклость, экстремумы 56 3.9. Дифференциальные уравнения 59 3.10. Раскрытие неопределенностей 61 3.11. Контрпримеры 64 Глава 4. Функции п переменных 66 4.1. Пространство п измерений 66 4.2. Подводные рифы многомерности 68 4.3. Предел и непрерывность 69 4.4. Повторные пределы 71 4.5. Частные производные и дифференциал 74 4.6. Дифференциалы высших порядков и ряд Тэйлора ... 76 4.7. Градиент 77 4.8. Теорема о среднем 79 4.9. Векторнозначные функции 79 4.10. Линейный анализ 81 4.11. Эквивалентные нормы 84 4.12. Принцип сжимающих отображений 86 4.13. Неподвижные точки разрывных операторов 87 4.14. Дифференцирование оператора 88 4.15. Обратные и неявные функции 90 4.16. Оптимизация 92 4.17. Множители Лагранжа 95 Глава 5. Интегрирование 99 5.1. Определения и общая картина 99 5.2. Уточнения и формальности 104 5.3. Теоремы о среднем 107 5.4. Приемы интегрирования 108 5.5. Дифференциальные уравнения ПО 5.6. Несобственные интегралы 113 5.7. Интегралы, зависящие от параметра 118 5.8. Двойные интегралы 120 5.9. Кратные интегралы 124 5.10. Механические задачи 126
Оглавление 5 Глава 6. Функциональные ряды 129 6.1. Равномерная сходимость 129 6.2. Степенные ряды 131 6.3. Ортогональные разложения 133 6.4. Ряды Фурье 136 6.5. Интеграл Фурье 139 Часть II Обзоры и дополнения 141 Глава 7. Элементы векторного анализа 142 7.1. Координаты и ориентация 142 7.2. Векторное произведение 144 7.3. Кинематика 147 7.4. Дивергенция 149 7.5. Оператор Гамильтона 153 7.6. Циркуляция 154 Глава 8. От числа к функциональному пространству 159 8.1. Вещественные числа 159 8.2. Проблемы бесконечности 161 8.3. Характеризация множеств 163 8.4. Мера Лебега 167 8.5. Аксиома выбора 170 8.6. Функциональные пространства 173 8.7. Теорема Жордана и парадокс Брауэра 177 Гпава 9. Топология и неподвижные точки 179 9.1. Идеология окутывания 179 9.2. Гомотопные векторные поля 181 9.3. Основные теоремы 182 9.4. Разрешимость уравнений 183 9.5. Ориентация 184 9.6. Индексы и алгебраическое число нулей 186 9.7. Нечетные поля 187 9.8. Собственные векторы 188 9.9. Обратные и неявные функции 189
6 Оглавление Глава 10. Аналитические функции 191 10.1. О загадке комплексных чисел 191 10.2. Дифференцируемость 193 10.3. Элементарные свойства 195 10.4. Контурные интегралы 198 10.5. Интеграл Коши 201 10.6. Регулярность 203 10.7. Аналитическое продолжение 204 10.8. Многозначные функции 206 10.9. Об остальном 207 Обозначения 209 Предметный указатель 211
Предисловие Сложное — и дурак придумает. Михаил Кошкин1* Для изучения одного предмета нужны минимум два учебни- учебника. Этот факт загадочным образом выпадал из поля зрения, хотя, казалось бы, нет ничего очевиднее. Любая спираль обучения на- начинается с двух витков. На первом — происходит знакомство с предметом, которое заканчивается «умением передвигать фигуры» и кашей в голове. На втором — все приводится в определенный порядок. Разумеется, до второй стадии не всегда доходит, но если доходит, то оба процесса тесно переплетаются. Беда в том, что обычные учебники по матанализу ориентиро- ориентированы на первый виток, где требуется «пешее обследование», тогда как для второго нужны книги, обеспечивающие «осмотр с верто- вертолета». Лекции предназначены как раз для таких итераций учебного процесса. Изложение формально начинается с нуля, но какая- то подготовительная работа предполагается выполненной. Первая часть книги — сжатый курс матанализа. Чуть более сотни страниц, но «все есть». Некоторые детали, конечно, опускаются, но это не потери, а приобретения. Сбросив десяток лишних килограммов, человек выглядит лучше, живет интереснее. Так и здесь. Многие подробности мешают видеть суть. И освобождение от балласта, как ни странно, позволяет обсуждать принципиальные вопросы, на которые в толстых учебниках не хватает места. Вторая часть, «необязательная», представляет собой обзоры и дополнения в стиле очерков, что имеет целью дать представление об окрестностях и может служить основой факультативных курсов. Лекции рассчитаны «на всех». На всех, кто так или иначе изучает высшую математику. Это может показаться странным, но ' Автор легендарного танка Т-34.
8 Предисловие здесь излагается общее ядро. Просто, коротко, без лишних деталей, но с обсуждением мотивов, причин и взаимосвязей. А это, как раз, нужно всем. Разумеется, речь о замысле. Об исполнении — судить читателю. Во многих отношениях книга нестандартна, но об этом не име- имеет смысла говорить заранее. Единственное, о чем стоит предупре- предупредить, — нетрадиционное использование петита: для расстановки акцентов, соблюдения баланса частей, отражения смысловых пере- перепадов и т.п. Короче, на мелкий шрифт далее желательно смотреть просто как на элемент пейзажа. Наконец, с благодарностью хотелось бы отметить: все ценное, что содержится в лекциях, принадлежит математическому сообще- сообществу. Все ошибки, само собой, — автору.
Глава 1 Предварительные сведения Далее приводятся в основном сведения по элементарной математике. Что касается теории множеств и комплексных чисел, то здесь затрагиваются лишь самые азы, которые, по крайней мере в части обозначений и терминологии, широко используются в других сферах. Подбор фактов частично определяется потребностями следующих глав. Но главным образом — это попытка эскизно очертить идеологический минимум, необходимый для изучения анализа. 1.1. Комбинаторика 1.1.1. Размещения. Число различных вариантов выбора (с учетом порядка) т предметов из п предметов п\,п2,... , а„ равно Действительно, есть п способов выбрать один предмет, т. е. А*п = п. На каж- каждый выбор первого предмета существует п -1 способов выбора второго (из остав- оставшихся п - 1 предметов) — поэтому А„ = п(п - 1). И так далее. 1.1.2. Перестановки. Число всевозможных перестановок п предметов аи а2, ..., а„ равно «эн факториал» По соображениям удобства принимается 0! = 1. Очевидно, перестановка получается при размещении всех предметов, что и дает АН = п! 1.1.3. Сочетания. Если т предметов из п\,п2,... , а„ выбираются без учета порядка (складываются в мешок), то число различных вариантов (число сочетаний из п по т) равно сг = Всевозможные размещения получаются перестановками элементов в сочета- сочетаниях. Поэтому
10 Глава 1. Предварительные сведения п! что дает формулу для С™, с учетом того, что А% = (п - т)!' Формулы уже доказаны. Случаются попытки доказать их еще раз, что надо приветствовать наряду с объяснением соли анекдотов. 1.1.4. Перестановки с повторениями. Пусть имеется п предметов к типов п\ ... п\ 0,2 . • • О>2 • • . 0>к • • • °>к > п, п2 щ где П\+...+Пк =П. Число различных перестановок этих предметов равно п! В любой перестановке рассматриваемой совокупности предметов, ничего внешне не меняя, можно П\ элементов а! переставить между собой п\\ способами, П2 элементов а^ — п2! способами, ..., пк элементов ак — щ\ способами. Поэтому п^Пг!...^! перестановок из п! — неотличимы друг от друга, что приводит к указанной формуле. Рассмотрим, наконец, еще одну типичную ситуацию. Имеется к типов пред- предметов, число образцов каждого типа — бесконечно. Число различных способов выбора г предметов в данном случае Стандартный пример — десять (типов) цифр, каждую из которых при записи числа можно использовать в любом количестве экземпляров (шестизначных чисел — миллион, 106). Упражнения 1. Доказать: т Гк М Гк+] — Гк+1 2. Сколько различных чисел можно получить перестановкой цифр 1, 3, 7? C!). 3. Сколько есть различных чисел, в записи которых участвуют только цифры 1,3,7? (З3). 4. Сколько есть различных чисел, в записи которых участвуют 1,1, 2, — т.е. две единицы и одна двойка? C).
\ \ 1.3. Многочлены 11 1.2. Бином Ньютона При перемножении п сомножителей число членов вида хп~кук равно С*, поскольку к штук у в п сомножителях можно выбрать числом способов С*. Поэтому (х + у)" = х" + С1хп-]у + С^х-У + ... + С:~> ху»-] + уп Это формула бинома Ньютона, которая часто используется. Полагая х = у = 1, получаем С°п + Схп + С* + ... + С* = 2П. В случае ж = 1, у = -1, имеем Упражнение (х + у + г)п = ^2 Р(Ь, *2, *з)х*'у*»«*), где суммирование идет по /гь &2 Дз, удовлетворяющим условию /?! +к2 + кз = п. 1.3. Многочлены Многочлены важны по двум причинам. С одной стороны, они широко исполь- используются, с другой — служат хорошим тренажером, вырабатывая полезные навыки «общематематического характера». Многолетнее изучение в школе квадратного трехчлена Р2(х) = ах2 + Ъх + с, параболы у = ах2 + Ъх + с и корней квадратного уравнения ах2 + 6ж 4- с = 0, — всегда дает результат. Такой же, как обязательное изучение литературной классики. Если простым вещам учить долго, любую аудиторию можно «привести к общему знаменателю». Даже теорема Виета = -р, превращается в космическую загадку, если в х2 +рх + д = (ж - хх)(х - х2) раскрывать скобки и приравнивать коэффициенты в течение двух-трех месяцев. Школа в этом отношении идет гораздо дальше.
12 Глава 1. Предварительные сведения Другое дело задачи. Тут игра всегда идет на трех-четырех нотах... Когда у двух многочленов есть общий корень или их корни перемежаются? При каких значениях Рг{х) > О в заданной области? И тому подобное. Иногда кажется, что все это имеет отношение не столько к многочленам, сколь- сколько к искусству комбинирования. Однако жонглирование мечом помогает использовать меч в бою. Оперируя многочленами, приходится иметь дело со стандартными приема- приемами — делением многочленов «в столбик», например, ж3 + 2ж2 - ж + 3 \х- 1 ж3-ж2 х1 + Ъх + 2. Ъх2-х Ъх2 - Ъх 2ж + 3 2ж-2 5 Произведенное деление дает тождество ж3 + 2ж2 - ж + 3 = (ж - 1)(ж2 + Зж + 2) + 5. Легко видеть, что в общем случае деление многочлена Рп(х) = жп + ап-\Хп~1 •+•... •+• а\Х •+- а0 A.1) на (ж - с) даст в частном некоторый многочлен фп_1(ж) и некоторое число К в остатке, т.е. что равносильно тождеству Рп(*) = (ж-<:)<?„_,(ж)+Д, полагая в котором х = с, получаем простой, но важный результат: 1.3.1. Теорема Безу. Остаток К при делении Рп(х) на (ж - с) равен Рп(с), т.е. = Рп(с). Таким образом, если с — корень уравнения Рп(х) = 0, то К = 0. В конечном итоге это соображение приводит к разложению Рп(х) = (ж - жО(ж - ж2)... (ж - жп), A.2) где жь ..., хп — корни многочлена Рп(х), которые по основной теореме алгебры всегда существуют — по крайней мере, в комплексной плоскости (см. след. раздел).
1.3. Многочлены 13 Примеры 1. Найти остаток от деления Рп(х) на х2 +рx + ^ = (х - а) (х - Ь). Очевидно, Рп(х) при делении на квадратный трехчлен даст в остатке (в об- общем случае) многочлен первой степени ух + б, т. е. Рп(х) = (х- а)(х - &)<Э„_2(я) + ух + б. A.3) Подставляя в A.3) сначала х = а, потом х = Ь, получаем систему уравнений Г Рп(а) = уа + б, \Рп(Ь)= уЬ + б для определения у и б. 2. Показать, что хт — 1 делится на хп — 1 лмшъ в там случае, когда т делится на п. Пусть т = пк+р, тогда хт — 1 (хп)к — 1 2^ — 1 д , жп - 1 жп - 1 жп - Г Далее надо учесть, что ук - 1 всегда делится на у - 1, 3. Часто встречается разложение на множители следующего многочлена трех переменных: = х3 + Зжу(ж + у) + у3 + г3 - Ъхуг - Зху(х + у) = 4. Раскрытие скобок и приведение подобных в A.2) с последующим сопо- сопоставлением результата с A.1), дает теорему Виета для многочлена п-й степени:
14 Глава 1. Предварительные сведения 1.4. Комплексные числа Комплексные числа (КЧ) при беглом знакомстве создают впечатление сумасшед- сумасшедшего дома. Однако за странным фасадом здесь прячется глубокая рациональная идея, питающая абстрактное мышление. Где остановиться, — каждый решает сам. Но в любом случае начало пути пролегает через обыкновенное знакомство с объектом. 1.4.1. Комплексными числами называются числа вида г = х + гу, где х, у — обыкновенные вещественные числа, а г — так называемая мнимая единица, г2 = — 1. Величину х называют действительной частью, у — мнимой, и пишут Операции сложения и вычитания определяются покоординатным сложением и вычитанием: I 2, ± *2 = (*1 ± Ъ) + %{ I Два КЧ считаются равными, когда равны их действительные и мнимые части. Понятия «больше», «меньше» для КЧ не определены. Правило умножения получается обыкновенным раскрытием скобок. С уче- учетом I2 = -1, это дает Легко проверяется наличие стандартных свойств умножения. Для деления используется несложный трюк избавления от мнимой единицы в знаменателе, опирающийся на факт вещественности произведения гг* = (х + гу)(х - (у) = х2 + у2, У где г = х — гу — сопряженное число. В результате деление — = —\ сводит- %2 *2* Рис. 1.1. Комплексное число ся к умножению Х\х\ в числителе. Указанные способы умножения и де- деления на практике используются редко, по- поскольку есть гораздо более эффективные приемы, основанные на геометрическом представлении КЧ: числу г = х + (у сопо- сопоставляется вектор на плоскости г — {х, у} (рис. 1.1). 1.4.2. Тригонометрическая форма. Полярные координаты (г = \г\ = у/х2 + у2 — модуль, <р — аргумент г), в силу X = Г СО8 <р, У = Г 81П <р,
1.4. Комплексные числа 15 позволяют записать т, в тригонометрической форме = г(со$(р + г зт <р). Неожиданно обнаруживается, что «неуклюжее» умножение имеет прозрач- прозрачный геометрический смысл. При умножении 2\ и г2 модули перемножаются, аргументы складываются. Формула + <р2)] элементарно проверяется1', как и формула деления: -!¦ = - [соз (р, - <р2) + г зт (у?, - %2 Г2 Более того, появляется возможность говорить об извлечении корня, что в алгебраической записи выглядело неподъемной задачей. При к = 0, 1, 2,..., п - 1 получаются п различных корней п-й степени из г ¦2кп ¦ + г зт ¦ I п ) что проверяется обратным возведением в п-ю степень по очевидной формуле Муавра гп = гп(соз гир + г зт пу?) и учетом периодичности синуса и косинуса. 1.4.3. Преимущества ОКОЛЬНЫХ путей. Удача с находкой тригономет- тригонометрической формы комплексного числа — далеко не рядовое событие. Это пример маленького чуда, которое изредка происходит примерно по такой схеме. Большие и малые разделы математики с той или иной долей натяжки можно себе представлять, как изучение некоторого множества А объектов с опреде- определенными в этом множестве операциями. Какие-то операции выполняются легко, какие-то — трудно. Естественно выглядит попытка установить взаимно- взаимнооднозначное соответствие А с каким-либо другим множеством Б, и посмотреть, какие манипуляции в В соответствуют операциям в А. Если действия в В проще операций в А, то задачи можно решать по схеме, изображенной на рис. 1.2. Объекты из А трансформируются в В, там выполняются необхо- необходимые действия, и результат возвращается в А. Но, как говорится, легко сказать... Удачный выбор В всегда событие. А А В Рис. 1.2 Конечно, если знать формулы синуса и косинуса суммы двух углов.
16 Глава 1. Предварительные сведения 1.5. Показательная и логарифмическая функции Графики показательной функции у = ах изображены на рис. 1.3 (при а > 1 и а < 1, разумеется, а > 0). а<\ Рис. 1.3. Показательная функция 1.5.1. Определение. Логарифмом числа у по основанию а называется такое число х = 1о§в у, что у = ах. Другими словами что называют основным тождеством для логарифмов. Иначе говоря, у = ах и х = 1о§о у — взаимно обратные функции, т. е. \у = ах х- На вид — полное равноправие, но логарифм, конечно, воспринимается труднее. Как зубную пасту легче выдавить из тюбика, — так и здесь, проще иметь дело с ах. Ситуация еще усугубляется тем, что вместо х = 1О&, у обычно приходится писать у = 1О&, ж, меняя буквы местами, ибо этикет требует х — для аргумента, у — для функции. Если бы не это, то даже график логарифма не надо было бы рисовать заново. Он уже изображен на рис. 1.3, правда, в обозначениях х = 1оёв у и с нестандартным расположением осей. Если же буквы ж, у поменять местами, и оси привести в обычное положение (поворот на 90° плюс отражение относительно вертикальной оси), то график логарифма будет выглядеть так (рис. 1.4). Рис. 1.4. Логарифм
1.6. Множества 17 Таким образом, график логарифма и график показательной функции — это одна и та же кривая (с точностью до поворота и отражения). То же самое можно сказать и о свойствах этих функций. Свойства лога- логарифма — это свойства показательной функции, выраженные на другом языке. Например, «логарифм произведения равен сумме логарифмов», 1о§а Ъс = 1о§а Ъ + 1о§а с, есть не что иное как аРа1 = аР+1, а 1о§а Ьс = с 1о§а Ь — эквивалент (а^O = а^7. Поскольку зубную пасту вернуть в тюбик не так просто, эти элементарные правила, без привычки, даются не сразу. Логарифмируя тождество а1о8а6 = Ъ по основанию с, получаем 1о§с а = 1о§с 6, откуда 1ов« Ь = что называют формулой перехода к другому основанию. Наиболее широкое распространение имеют десятичные логарифмы и нату- натуральные (по основанию е = 2, 71...), для которых используются специфические обозначения: = 1е ж, = 1п ж. 1.6. Множества Принадлежность элемента а множеству А обозначается как а € А; запись а $ А говорит сама за себя: а не принадлежит А. Факт включения: «А является подмножеством множества Б» записывается как А С В. Для обозначения пустого множества (не содержащего элементов), употребляется символ 0. Суммой или объединением С = Аи В называется множество, состоящее из элементов, принадлежащих хотя бы одному из множеств А, В. Пересечением С — АГ\В называют множество, состоящее из элементов, принадлежащих как А, так и Б. На рис. 1.5 изображены геометрические примеры. ( \ Рис. 1.5
18 Глава 1. Предварительные сведения Для множеств широко используются также операции вычитания и дополне- дополнения: • С = А\В — разность «А минус В» — множество элементов А, не принад- принадлежащих В. • А' = 5\Л1 — дополнение множества А, определяемое как множество элемен- элементов некоторого основного множества 5, не принадлежащих А. В анализе чаще всего приходится иметь дело с простейшими множествами на числовой прямой. 1.6.1. Определение. Множество элементов х, удовлетворяющих неравен- неравенствам а ^ х ^ Ь, называют отрезком или сегментом и обозначают [а, Ь]. Если неравенства строгие, а < х < Ь, то такое множество называют интервалом и обозначают (а, Ь). Слово «промежуток» используют для обозначения и отрезка, и интервала, когда из контекста ясно, о чем речь, либо — не важно, о чем речь. 1.6.2. Определение. Множество точек х, удовлетворяющих неравенству \х - а\ < е, называется е-окрестностью точки а и обозначается (иногда) 1е(а). Разумеется, 1е(а) — это обыкновенный интервал (а - е, а + е). Множество X считается открытым, если каждая его точка х € X внутрен- внутренняя, т. е. входит в X вместе с некоторой своей окрестностью. Любой интервал — открыт. Множество X замкнуто, если оно содержит все свои предельные точки, каковыми считаются точки, в любой окрестности которых есть элементы X. Отрезок — всегда замкнут.
ЧАСТЬ I АНАЛИЗ Час, затраченный на понимание, экономит год жизни. Разговор о двух учебниках для одного предмета имеет смысл уточнить. Мно- Многое зависит от «психологического типа потребителя». Для кого-то предлагаемый текст может быть предпочтителен даже в качестве стартового пособия. Изло- Изложение анализа здесь в принципе самодостаточно, но концентрация содержания несколько высоковата. Кому-то на первых порах больше подходит толстый учебник. Даже если там переливается из пустого в порожнее. Созревание ведь имеет свой ритм. Чтение создает фон. Ошибки, и те не играют особой роли. Доказательства осознают- осознаются частично, поэтому «чуть левее, чуть правее» — результат один, слышится приблизительный звон. Если голова здоровая, фальшивые ноты потом заглохнут. Но так или иначе, всегда наступает момент, когда из читанного, слышанного, перепутанного — начинает что-то проглядывать. Тут уже пухлые тома своей избыточностью и медлительностью только мешают. Для прорыва нужно краткое и ясное изложение общей картины. Мотивация, акценты, что зачем. Ни в коем случае речь не идет о том, что именно так надо преподавать математику. Маятник идет то в одну сторону, то — в другую. Идет влево — хороши детали и топтание на месте. Думы о глобальном не должны мешать разглядыванию отдельных травинок. Пошел маятник вправо — бурелом подробностей не дает видеть целое. Короче говоря, при изучении анализа хорошо иметь под рукой две кни- книги, толстую и тонкую. Порядок их использования зависит от индивидуальных особенностей и внешних факторов1*. ' Важна, например, космическая ситуация. Скажем, в одиночной камере предпочти- предпочтителен трехтомник Фихтенгольца. Времени — прорва, спросить, что не ясно, не у кого. В варианте «завтра экзамен, в голове — чистый лист» — хороши Дэйл Карнеги и димедрол.
Глава 2 Последовательности и пределы Предельный переход — главный инструмент анализа. За обсуждением второсте- второстепенных деталей этот факт иногда теряется. Задачи о пределах числовых после- последовательностей оттягивают на себя внимание, и как-то упускается из вида, что все основные понятия анализа получаются предельным переходом. Производные, интегралы, площади, объемы, функциональные ряды — это все пределы. 2.1. Стартовые понятия Формализация интуитивно ясных понятий обычно воспринимает- воспринимается как неприятность, ибо порождает головоломки. Но виновата не формализация. Впечатление ясности обманчиво. Достаточно взять любое явление и начать всматриваться. Далее отражена процедура «умеренного всматривания» в чис- числовые последовательности ап типа 1 1 1,2, ...,п,... или 1, -,...,-,.... 2 п 2.1.1. Определение. Числовая последовательность ап при п —> оо сходится к пределу а (пишут ап -> а, либо Шп ап = а), если по П->00 любому е > О можно указать такое N, что \<*п — а\ < в для всех п> N. Легендарная «заумность» этого определения (наравне с е, 6-определени- 6-определением непрерывности, см. далее) широко известна. С виду формулировка очень проста, но у многих не укладывается в голове. Словно попадает в зону какого-то слепого пятна. Причем, если «не укладывается», то математикой, говорят, лучше не заниматься. Как бы лакмусовая бумажка... Но это не так. Опыт показывает, что разным людям просто требуется разное время на освоение. Речь, понятное дело, идет не о том, чтобы выучить несколько строчек наизусть. Стремление ап к а можно себе представлять, как приближение изобра- изображающей точки ап к точке а с увеличением «дискретного времени» п. Рис. 2.1
2.1. Стартовые понятия 21 а — е Рис. 2.1. е-коридор дает пример графика поведения ап в случае непрерывного п. Сценарий дис- дискретного п получается фиксацией на кривой отдельных точек, соответствующих п = 1,2,... . Размышления на тему формализации процесса ап -»• а рано или поздно приводят к вопросу «что недопустимо?» и естественному ответу: «ап нельзя разрешать выпрыгивать из какого-нибудь е-коридора {а — е, а + е) сколько угодно раз». Другими словами, какой е-коридор ни взять — ап обязана с некоторого момента в нем оставаться. Но это и есть определение 2.1.1. 2.1.2. Если ап -» а, Ьп -» Ь, ап а и - > - при условии Ьп, Ъ Ф 0. Ьп Ь <4 Перечисленные факты очевидны. Из ап -»• а, 6П -»• Ь следует, согласно определению 2.1.1, что при достаточно больших п величины ап,Ьп мало отли- отличаются от а, 6. Скажем, на миллионные доли. Тогда на те же миллионные доли сумма ап + Ьп отличается от а + 6, что в конечном итоге дает ап + 6П -»• а + 6. Это, собственно, и есть доказательство, если иметь в виду закулисный способ мышления. Остальные факты «устанавливаются» так же. Формалист, конечно, затеет тяжбу. Например, если ап и Ьп от своих пределов отличаются на одну миллионную, их сумма может отличаться от суммы пределов на — две. И вообще, мол, нечего использовать бытовой язык. Тогда, чтобы не утонуть в дебатах, проще «лечь в дрейф». Пусть задано любое е и все ап, Ьп принадлежат (е/2) -окрестности своего предела, соответственно, для п > ^, п > N2. В этом случае все ап + Ьп будут находиться в е-окрестности точки а + Ь для п > тах^х,^}. Если формалист еще и зануда, то придирки на этом могут не закончить- закончиться. А почему-де сумма находится в е-окрестности, если каждое слагаемое — в (е/2) -окрестности? Тут уже, как говорится, проще переспать, чем объяснять, ' Здесь и далее «п -* оо» подразумевается.
22 Глава 2. Последовательности и пределы что не хочется: При этом длина пустякового доказательства начинает зашкаливать, а суть тонет в мелочевке. Таких доказательств в учебниках довольно много. Дело, конечно, не только в формалистах. Автору учебника хочется объяснить так, чтобы «и тете Клаве было понятно». Но «разжевывание» часто дает противоположный результат. > 2.1.3. Определение. Числовая последовательность, имеющая нуле- нулевой предел, ап -> 0, называется бесконечно малой величиной. «Бесконечно малые величины» представляют собой большую неприят- неприятность. Что-либо менять уже поздно, но терминология крайне неудачна. С «величиной» ассоциируется нечто фиксированное, тогда как последо- последовательность ап — это функция дискретного аргумента. Ради экономии в названии «переменная величина» когда-то опустили первое слово. В ре- результате студент теперь имеет дело с «хлопком одной ладони». 2.1.4. Определение. Последовательность ап при п -> оо расхо- расходится (пишут ап -> оо), если по любому М > О можно указать такое ТУ, что \ап\>М для всех п > N. Терминология здесь немного «плавает». Иногда, в случае 2.1.4, говорят о сходимости ап к бесконечному пределу. Иногда добавляют еще два понятия: стремление к минус или плюс бесконечности (пишут ап -> Тоо), если по любому М ^ 0 можно указать такое ЛГ, что ап^М для всех п > N. Еще одна беда — но все же не катастрофа — расходящиеся последовательности называют бесконечно большими величинами. 2.2. Теорема о трех собачках Определение 2.1.1 при доказательстве сходимости само по себе не очень эффективно из-за того, что опирается на знание предела а. Тем не менее, какую-то совокупность задач удается решить в условиях «слабой вооруженности». Как правило, это задачи, где так или иначе угадывается и обыгрывается стремление «чего-то» к нулю. В процессе решения часто используется следующий прием, известный в кулуарах как теорема о трех собачках.
2.3. Критерий Коши 23 2.2.1. Если ап < Ьп < сп при любом п, и «крайние» последователь- последовательности ап, сп сходятся к одному и тому же пределу, то к этому же пределу сходится и Ъп. <4 Если ап, сп сходятся к одному пределу и с какого-то момента все попадают в е-окрестность предельной точки, то Ъп, зажатое между ап и сп, попадает в эту же е -окрестность. Вот и все доказательство. Ответы формалисту — в качестве упражнения. > Примеры 1. Если в разложении п = [1 4- (у/п — 1)]п по формуле бинома Ньютона взять всего лишь одно слагаемое С1(у/п - IJ, получится неравенство откуда 0 < (у/п — IJ < , что по теореме о трех собачках дает п 1 п — 1 2. Учитывая предыдущий результат и непрерывность функции 1О&, х при х = 1 (см. разд. 2.7), получаем 3. 1 + В данном случае хорошо видно, как используется бесконечная малость 1/п и, опять с опережением событий, непрерывность функции у/\ + х в нуле. Доказать: > оо (а > 1), п Упражнения 1 + - + - +...Н юо, 2 3 п Ш > 1. п 2.3. Критерий Коши Пока остается неясным, как быть, если предел «не угадывает- угадывается». Главный инструмент, который позволяет устанавливать сходи- сходимость ап, не опираясь на знание предела, основывается на понятии фундаментальной последовательности.
24 Глава 2. Последовательности и пределы 2.3.1. Определение. Последовательность ап называется фунда- фундаментальной, или последовательностью Коши, если по любому е > О можно указать такое -/V, что кп ~ яш| < $ для любых п, га > N. Иными словами, у последовательности Коши члены с боль- большими номерами не могут сильно отличаться друг от друга. 2.3.2. Критерий Коши. Последовательность ап сходится в том и только том случае, когда она фундаментальна. Это полезный и важный результат. Интуитивно естественный. В одну сторону (если ап сходится, то она является последова- тельностью Коши) — доказывается элементарно. В другую — «с приключениями», уводящими довольно далеко, в теорию ве- вещественных чисел, в дебри которой на первых порах не имеет смысла углубляться 2\ Для понимания существа дела вполне доста- достаточно наивного варианта теории, которым человечество обходилось до конца девятнадцатого века. Действительные числа — это беско- бесконечные десятичные дроби. Вот и вся теория. Известная проблема неоднозначной записи чисел решается, например, в пользу пред- представления конечных дробей в виде периодических 0,6 = 0,5(9) = 0,5999... . Логический «прокол» наивной теории состоит в следующем. Например, у/2 можно вычислять все более и более точно, определяя последова- последовательные приближения: 1, 1,4, 1,41 и т.д. Бесконечная дробь для л/2, которую выписать сразу невозможно, на самом деле является пределом указанной процедуры. Получается замкнутый круг. Пределы опираются на дроби, дроби — на пределы. Выход из положения дают так назы- называемые дедекиндовы сечения множества рациональных чисел, но это не лучший отправной пункт для изучения анализа {ничего сложного, но скучновато, см. гл. 8). «Созрев для Дедекинда», проблему можно рас- рассматривать вместе с какой-нибудь апорией Зенона типа «Догонит ли Ахиллес черепаху». Пока же проще решить, что «догонит», и что бесконечные дроби «даны Богом». 2.3.3. Лемма. Если последовательность ап монотонно возрастает и ограничена сверху, то она сходится. 2* Одна из особенностей системы образования — навязанный сервис. Спрос еще не до- дозрел, но покупать уже заставляют.
2.3. Критерий Коши 25 < Этот интуитивно прозрачный результат в определенном смысле — стержневой. Его доказательство распутывает все осталь- остальное, включая критерий Коши. Уровень строгости, естественно, определяется выбором «теории вещественных чисел». В нашем варианте у растущей и ограниченной последовательности с уве- увеличением п перестает меняться все большее число знаков после запятой. Это последовательно определяет бесконечную дробь а, которая и является пределом ап, ибо ап может отличаться от а лишь в более и более высоких разрядах по мере увеличения п. > Обратим внимание, что стабилизация десятичных знаков имеет место в условиях монотонного роста ап. У сходящейся последовательности ап = 1 + (-1/10) все десятичные знаки «прыгают» все время. Вот еще один важный и часто используемый результат. 2.3.4. Лемма. Пересечение любого бесконечного множества вложен- вложенных друг в друга отрезков /п+1 С 1п, [ап+ь Ъп+{] С [ап, Ьп] при любом п = 1,2,..., длина которых стремится к нулю, не пусто, т. е. имеется точка, принадлежащая всем отрезкам. <4 По условию а, <...< а» <...<&„ <...<&!. Поэтому последовательность ап монотонна и ограничена, и в силу 2.3.3 сходится, ап-> а. Поскольку К = ап + (Ъп - ап) и Ъп - ап -+ 0, то и Ьп -»• а. Точка а в силу ап ^ а ^ Ьп принадлежит всем отрезкам. > ^ Вернемся, наконец, к доказательству критерия Коши. Как уже отме- отмечалось, импликация «если ап сходится, то она является последовательностью Коши» — очевидна. Действительно, в случае ап -> а все ап при достаточно больших п оказываются в сколь угодно малой е-окрестности точки а, и там уже ап от ат не могут сильно отличаться (не более, чем на 2е). Пусть теперь ап — последовательность Коши. Покажем, что она имеет предел. Возьмем произвольную сходящуюся к нулю последовательность б\,..., ек,..., где все ек > 0. И пусть ДГ,,..., ДГ*,... таковы, что |ап — ат| < ел при п, Тогда все ап при п ^ #* принадлежат отрезкам
26 Глава 2. Последовательности и пределы длины которых убывают до нуля при к -> оо. Чтобы воспользоваться леммой 2.3.4, перейдем к последовательности вложенных отрезков 1к С /*, которые строятся по правилу Теперь лемма 2.3.4 гарантирует существование общей точки а у всех ^к, которая и есть предел ап, поскольку 1к стягиваются к а, и все ап € Л ПРИ п^Щ. > Упражнение Для расходящейся последовательности имеет место при любом натуральном к. 2.4. Число е и другие пределы 2.4.1. Число е = 2,718 ... определяется как предел НУ- <4 Покажем, что последовательность хп = A4- 1/я)п монотонно возрастает и ограничена. В разложении A + 1/п)п по формуле бинома Ньютона к-й член очевидно, растет при увеличении п. Кроме того, с увеличением п растет число членов разложения A + 1/п)п. Поэтому хп монотонна. Кроме того, в силу С*A/п)* < \/к\, последовательность хп ограничена, и лемма 2.3.3 гарантирует ее сходимость. > Если часть последних слагаемых в разложении отбросить, то при к ^ п будем иметь неравенство
2.4. Число е и другие пределы 27 Переходя в B.1) к пределу (п -> оо) при фиксированном к, получим неравенство в>1 + Т1 + Ъ + " + ТГ*' справедливое при любом к. Кроме того, очевидно, хп < уп. Теорема о трех собачках в итоге приводит к еще одной полезной формуле для числа е, = 1 + 1 + 1+ +1 6 1! 2! п! B.2) Вот пример «из другой оперы», самостоятельное значение которого «ни- «никакое», но он иллюстрирует возможную технику манипулирования. Рассмотрим варианту3* Хп = п радикалов На каждом шаге (при увеличении п) последнее р в записи хп меняется на Р + у/ру поэтому хп возрастает. Ограниченность легко устанавливается по ин- индукции. Неравенство хп < у/р + 1 верно при п = 1, а в предположении его справедливости для п - 1, оно оказывается таковым и для п: Поэтому лемма 2.3.3 обеспечивает хп -> а. Значение а определяется пере- переходом к пределу в равенстве х\ = р + жп_], что дает для а квадратное уравнение а2 -а-р = 0. > Вернемся к рассмотрению варианты A + 1/п)п. Из установленной мо- монотонности ее возрастания вытекает неравенство A -I- 1/я)п < е, что после логарифмирования дает п 1п A 4- 1/п) < 1, откуда - >1п( 1 + - ) =1п(п+1)-1пп. п \ п/ Суммирование п первых таких неравенств приводит к Лп = 1+2 + 3+*"+п>1п(П+1)' что влечет за собой расходимость последовательности Нп. В случае неопределенности хп/уп типа оо/оо нередко помогает теорема Штольца: 2.4.2. Теорема Штольца. Если последовательность уп монотонно возраста- возрастает и уп-»+оо, то обе последовательности Уп Уп-Уп-\ имеют одинаковый предел (либо обе расходятся). ' Это синоним для числовой последовательности.
28 Глава 2. Последовательности и пределы Это довольно тонкий инструмент. Его доказательство никуда далеко не уво- уводит, но требует определенной виртуозности, и может рассматриваться как до- достаточно сложное упражнение. Теорема Штольца особенно хорошо работает в ситуациях типа следующей: а, + ... + ап ап-> а =Ф> > а. п Результат моментально вытекает из B.4.2), если положить хп = а, -I-... + ап, уп = п. Упражнения 1. ит = 1. 2 Цт ** + 2* + • • • + п* _ 1 п->оо П*+1 ~~ к -|- Г з. ш(У*±Щ = 4л (в)Ь>о). 2.5. Леммы Больцано-Вейерштрасса и Гейне^Бореля 2.5.1. Определение. Пусть щ — произвольная расходящаяся по- последовательность целых чисел. Последовательность аПк называют подпоследовательностью последовательности ап. Упражнение Если ап -> а, то и любая подпоследовательность ащ -> а. 2.5.2. Лемма Больцано—Вейерштрасса. В ограниченной последо- последовательности ап всегда можно выделить сходящуюся подпоследова- подпоследовательность. Это удобный инструмент для проведения рассуждений и доказательств во многих ситуациях. Результат визуально очевиден, поскольку ясно, что у ограниченной после- последовательности должны быть точки сгущения, содержащие в своей окрестности бесконечное число членов ап. Тем не менее, попытка строгого обоснования этого факта может вызвать затруднения. Это, кстати, нормально. Краткость доказа- доказательства или очевидность задним числом вовсе не свидетельствует о его легкости. Поначалу может «не хватать идеи».
2.5. Леммы Больцано—Вейерштрасса и Гейне—Бореля 29 <4 Итак, в силу ограниченности, все ап принадлежат некоторому отрезку 10 = [а, 6]. Разделим /0 пополам и выберем ту его половину /1, которая содержит бесконечно много элементов ап. Затем разделим /1 пополам и выберем ту его половину /2, которая содержит бесконечное число элементов ап. Продолжая процесс до бесконечности, получим бесконечную цепочку вложенных отрезков /оЭ/,Э...ЭДЭ..., B.3) длины которых стремятся к нулю. В силу леммы 2.3.4 все 1к имеют общую точку с. Любая подпоследовательность аПк € /* будет сходиться к с. > Если подпоследовательность аПк сходится, то ее предел называют предельной точкой (или тонкой сгущения) последовательности ап. Наибольшее (наименьшее) значение а* (конечное или бесконечное), для которого можно указать подпоследовательность аПк -> а*, называют верхним (нижним) пределом ап и обозначают, соответственно Итап или Ит ап. Упражнение Найти последовательности, для которых Идеологически с леммой 2.5.2 связан следующий принципиальный результат. 2.5.3. Лемма Гейне—Бореля. Из любого покрытия а отрезка [а,Ь] интер- интервалами можно выбрать конечное подпокрытие6^. < Допустим противное. Разделим [а, Ь] пополам и выберем ту полови- половину, которая не покрывается конечным числом интервалов. Эту половину снова разделим пополам — и так далее. В результате получим цепочку вложенных отрезков B.3), длины которых стремятся к нулю, но каждый сегмент 1к не по- покрывается конечным множеством интервалов из а. В силу леммы 2.3.4 все 1к имеют общую точку с. Точка с принадлежит некоторому интервалу /* € <г, кото- который, начиная с какого-то номера содержит все последующие 1к, что порождает противоречие. > Лемма Гейне—Бореля хорошо работает в тех ситуациях, где эффективна лемма 2.5.2. Оба результата, попеременно, довольно часто используются в ана- анализе, см. например, доказательства теорем 2.7.4, 2.7.6, опирающиеся на лемму 2.5.2. В качестве упражнения соответствующие доказательства полезно провести на основе леммы 2.5.3. 4' Утверждение остается справедливым, если вместо интервалов рассматриваются любые открытые множества.
30 Глава 2. Последовательности и пределы 2.5.4. Определение. Множество X называется компактным, если из любого его покрытия открытыми множествами можно выбрать конечное подпокрытие. Лемма Гейне—Бореля, таким образом, устанавливает компактность любого отрезка [а, Ь]. Вообще говоря, на прямой все это большого смысла не имеет — компактность X означает ограниченность и замкнутость. Ни больше, ни меньше. Достигается, вроде бы, лишь экономия слов. Однако в функциональных про- пространствах понятие компактности выдвигается на передний фронт и работает весьма эффективно. Здесь заслуживает внимания характерная деталь. Эквивалентные на прямой свойства (в данном случае это существование конечного подпокрытия, с одной стороны, и ограниченность плюс замкнутость — с другой) в иной ситуации могут сильно отличаться друг от друга. Такого сорта явления типичны при переходе от вещественной прямой к функциональным пространствам. Именно поэтому большую ценность представляет поиск эквивалентных свойств, которые при переносе в более общие условия рождают продуктивные понятия. 2.6. Предел функции Далее рассматриваются функции /(#), принимающие действи- действительные числовые значения и зависящие от действительного аргу- аргумента х. 2.6.1. Определение. Число А называется пределом функции /(ж) при х стремящемся к а (пишут /(х) -> А при х -> а, либо 1ш1 /(х) = А), если по любому е > 0 можно указать такое 6, х—>а что \/(х)-А\<е при условии \х — а\ < 6. В случае бесконечного а, т. е. х -> оо, конец определения таков: если по любому е > 0 можно указать такое М > 0, что |/(ж) — А\ < е для любого х > М. В связи с переходом от дискретного аргумента п к непрерыв- непрерывному х ситуация, конечно, меняется. Главным образом это связано с возможностью стремления х к конечному пределу, что в случае дискретного аргумента — бессмысленно. Законно и «более человеческое» определение: Число А называется преде- пределом функции /(ж) при х стремящемся к а, если точка /(ж) приближается к А, когда тонка х приближается к а. Определение 2.6.1 представляет собой лишь
2.6. Предел функции 31 более конкретную переформулировку. Уточнение расплывчатого термина «стре- «стремится» неизбежно приводит к варианту типа 2.6.1. Недостатки «человечности» выявляются, когда дело доходит до решения задач. Тогда вдруг выясняется, что формалистика дает в руки удобный инструмент. 2.6.2. Эквивалентное 2.6.1 определение. Число А называется пределом функции /(ж) при ж -> а, если для любой последовательности хп ->а /Ы -> А. <4 Доказательство эквивалентности — легкое упражнение. Импликация «2.6.1» => «2.6.2» очевидна (сводится к протокольной сверке определений, включая 2.1.1). Обратное следование — «2.6.2» =>• «2.6.1» — элементарно доказывается от противного. Но здесь дело иногда упирается в «момент истины», касающийся владения е, #-языком. При владении инструментом все очень просто. Что означает невыполнение «2.6.1»? При некотором е не найдется нужного 6. Другими словами, для любой последовательности дп -> 0 существуют такие хп, что |/(жп) - А\ ^ е9 \хп-а\^дп, но это противоречит «2.6.2». > Определение 2.6.2 весьма полезно на практике. Например, ес- если существование предела установлено, то для его нахождения достаточно определить предел /(ж) для какой-нибудь одной под- подпоследовательности хп. Упражнение При х. -> оо \пх Л ах / 1\х > 0, > оо, ( 1 Н— ) -> е. х х \ х) 2.6.3. Если /(ж) -> А, д(х) -> В при х -> а {или х -> оо), то /(ж) + д(х) -> А + Б, 7/(я) "> 7^, и }{х)/д{х) -> А/В при условии д(х), В Ф 0. Справедливы и другие аналоги утверждений о пределах чис- числовых последовательностей. Теорема о трех собачках, например. Факт существования предела в случае ограниченности и монотон- монотонности /(ж) тоже имеет место, но его формулировку приходится
32 Глава 2. Последовательности и пределы уточнять5) из-за новых обстоятельств. Однако в целом никаких особых трудностей здесь не возникает. Понятно, что в итоге различных понятий предела оказывается довольно много. Если их, не дай бог, воспринимать как разные понятия и укладывать в голове независимо друг от друга — никакого места не хватит. Есть всего одно понятие предела. Одна идея, одна схема. Остальное — вариации. И эти вариации, желательно, чтобы сами выска- выскакивали из головы по мере надобности. Если «не выскакивают» — лучше еще повозить- повозиться с общей идеей. А заглядывать в книжку даже вредно. Рис. 2.2 Общая схема ясна из предыдущего. Что-то от чего-то зависит, «эф от икс», и приближение а; к а влечет за собой приближение / к А, х -> а =Ф- /(ж) -> А. Вариации определяются природой переменных: а, А могут быть в том числе бесконечностями; ж, / — дискретными или непрерывными величинами6*. 2.6.4. Важный пример. Легко видеть (рис. 2.2), что площадь АО АС < площадь сектора О АС < площадь АОВС, т. е. 1 1 1 откуда -1С 81П X < -КХ < -К \% X, 81ПЖ СО8Ж < < 1, X что по теореме о трех собачках дает 81ПЖ х -> 1 при х -» 0. 5* Необходимо ввести понятия пределов слева и справа (когда х приближается к а слева или справа). 6* В принципе, это могут быть векторы, функции и т. п. В зависимости от природы переменных тогда оговариваются меры близости (расстояния) \х — а\, |/ — А\.
2.7. Непрерывность 33 2.6.5. Функция /(ж) в случае /(ж) —> 0 называется бесконечно ма- малой, в случае |/(ж)| -» оо — бесконечно большой. Иногда даже функцию называют бесконечно малой величи- величиной, — и с этим проще смириться, чем спорить. 2.6.6. В случае /(ж) -» 0, д(х) -» 0 и /(ж)/р(ж) -» 0 говорят, что / имеет более высокий порядок малости по сравнению с д, и пишут = о(д), читая «/ есть о малое от д». Например, ж2 = о(х) при х -> 0, (х - 5L/3 = о(х - 5) при х -> 5. 2.7. Непрерывность 2.7.1. Определение. Функция /(ж) называется непрерывной в точке Жо, если /(ж) -> /(ж0) ж0. Функцию, непрерывную в любой точке [а, Ъ], называют непрерывной на [а, Ь]. Рис.2.3. Разрыв Это «прямое» определение соот- соответствует интуитивному представле- представлению о непрерывности, исключая ситуации типа изображенной на рис. 2.3. Для решения задач необходимо что-то более конструк- конструктивное. 2.7.2. Эквивалентное 2.7.1 определение. Функция /(ж) называ- называется непрерывной в точке Жо, если по любому е > 0 можно указать такое 6, что |/(ж) - /(жо)| < е, если \х-хо\<6. 2.7.3. Определение. Функция /(х) называется липшицевой на [а, 6], если существует такая константа Ь, что 1/(*)-/(!/ЖЫ*-2/1 B.4) для любых ж, у € [а, Ь].
34 Глава 2. Последовательности и пределы Липшице вы функции, очевидно, непрерывны. Для |/(ж) - /(у)\ < е доста- достаточно потребовать \х - у\ < е/Ь. В то же время большинство функций на практике Липшице вы, поэтому установление их непрерывности проще всего осуществляется проверкой неравен- неравенства B.4). Например, |зт х - 8Ш у\ = 2 х+У .х-у СО8 81П 81П • х-у 2.7.4. Теорема Вейерштрасса. Непрерывная на [а, Ь] функция ог- ограничена снизу и сверху. < Неограниченность /(ж), например, сверху — означает, что для любой последовательности Мп -> оо можно указать такую последовательность сп Е [а, Ъ], что /(с„) > Мп. Лемма 2.5.2 гарантирует существование у сп сходящейся подпо- подпоследовательности. Чтобы не усложнять обозначений, можно считать сходящейся саму последовательность сп -> с. Тогда, в силу непрерывности, /(сп) -+ /(с), что вступает в противоречие с /(с„) > Мп -> оо. > Упражнения Играть на рояле, говорить, плавать, рисовать, — по книгам не на- научишься. Какую-то часть работы приходится делать самому. Странно, что с математикой — то же самое. 1. Найти (придумать) определения: непрерывности слева и справа (функции в точке); разрывов слева и справа, бесконечного предела функции, /(х) -> оо. 2. Если функция /(ж) непрерывна на отрезке [а, Ъ], и /(а) = А, /F) = В, то для любого С, лежащего между А и В, можно указать точку с € [а, Ь], в которой /(с) = С (теорема Больцано—Коши). Подсказка: сначала полезно убедиться (бесконечным последовательным де- делением [а, Ь] пополам) в существовании такого с € [а, Ь], что /(с) = 0, если А и В имеют разные знаки. X _ 1 3. Нт = 1п а (а> 0). х->0 X A _|_ж)А - 1 4. Нт = Л (Л > 0). х->0 X / <г \ п 5. Ит ( 1 Н— ) = ех. П-+С» V П / ( * Я\" Хх 1. Ит ( соз —V Л 8И1 - ) = е . п->оо\ П П)
2.8. Числовые ряды 35 2.7.5. Определение. Функция }(х), непрерывная на некотором множестве X, называется равномерно непрерывной на X, если по любому е > О можно указать такое б, что 1/(*) -/(УI < *, если \х - у\ < б для любых ж, у Е X. Функции /(ж) = 1/ж и д(х) = \[х на интервале @, 1) не являются равно- равномерно непрерывными. 2.7.6. Теорема Кантора. Функция /(ж), непрерывная на отрезке [а, Ь], ав- автоматически равномерно непрерывна на [а, 6]. «^ В предположении противного для некоторого е не найдется нужного б. Это означает, что для любой последовательности положительных бп -> 0 можно указать такие ж„, у„, что \хп - уп\ < бп, но при любом п = 1, 2,... . По лемме Больцано—Вейерштрасса 2.5.2 из хп можно выделить сходящуюся подпоследовательность. Для простоты, будем считать, что сходится сама последо- последовательность хп, т. е. хп -> с € [а, Ь]. Но тогда и уп -* с в силу жп - уп -> 0. В этом случае |/(жп) - /(упI ^ $ противоречит непрерывности /(ж) в точке с. > 2.8. Числовые ряды Суммы вида 00 ап = ах + ... + ап + ... B.5) п-1 называют бесконечными рядами. Общеизвестный пример — сумма бесконечной геометрической прогрессии 1 2 ||1 1 + д + д + ... = —' |д|<1. 2.8.1. Конечный или бесконечный предел А частичной суммы определяют как сумму ряда B.5). Ряд, имеющий конечную (бесконеч- (бесконечную) сумму, называют сходящимся (расходящимся). Вещественное число, в десятичной записи ао,а]а2..., — это сумма ряда а, а2 а + + +
36 Глава 2. Последовательности и пределы Легко видеть, что бесконечные ряды представляют собой все- всего лишь эквивалентный язык для изучения последовательностей и пределов. Действительно, сходимость ряда означает сходимость варианты Ап. Обратно, сходимость любой последовательности Ьп равносильна сходимости ряда Эквивалентные представления иногда очень эффективны (см. 1.4.3), но выигрыш обычно возникает там, где трансформируется приро- природа изучаемых объектов (переход из алгебры в геометрию, например). В данном случае почти все остается на своем месте, однако выигрыш довольно велик, что дает повод задуматься. 2.8.2. Сходящиеся ряды можно почленно складывать, вычитать и умножать на константу. (>) 2.8.3. Если ряд B.5) сходится, то ап -» 0. ^ Для положительного ряда утверждение очевидно. В общем случае ре- результат может вызывать даже сомнения. Тем не менее, две (разные) последова- последовательности Ап и Ап_1 сходятся к одному и тому же пределу. Следовательно, ап = Ап- Ап-1 -» 0. > Первый этап теории числовых рядов очень прост. Все результаты, имеющие здесь иногда громкие имена, представляют собой несложные переформулировки известных фактов из теории пределов. Они хороши в качестве упражнений. Упражнения 1. Положительный ряд ах + а2 + ... (все ап ^ 0) сходится, если его ча- частичные суммы ограничены сверху, и расходится в противном случае (следствие теоремы 2.3.3 о сходимости монотонной офаниченной последовательности). 2. Теорема сравнения положительных рядов (А): а, +а2 + ..., (Б): Ь,+Ь2 + ... . Если ап ^ Ьп (начиная с некоторого пO* — или же ап+\/ап ^ Ъп+\/Ъп — и ряд (В) сходится, то ряд (А) тоже сходится. Если (А) расходится, то и (В) расходится. 3. Если ап/Ъп имеет конечный строго положительный предел, то оба поло- положительных ряда (А) и (В) сходятся или расходятся одновременно. В этом случае (В) называют мажорирующим радом для (А).
2.8. Числовые ряды 37 4. В общем случае ряд B.5) называют абсолютно сходящимся, если сходится ряд |а!| 4- \а2\ 4-... из абсолютных величин. Любой абсолютно сходящийся ряд сходится (легко следует из критерия Коши 2.3.2). 5. Любой знакопеременный ряд ао - <м + ... + (- 1)пап + ... (все а„ > 0) при условии монотонного стремления ап к нулю — сходится. Поэтому, например, не сходящийся абсолютно ряд 1-1/24-1/3-..., сходится. ^ Подсказка. Частичные суммы Мн = («1 - о*) + (а3 - а4) + ... + (а2*-1 - а2к) монотонно возрастают, поскольку все скобки положительны из-за монотонности убывания ап. С другой стороны, Мк = а, - (а2 - а3) - ... - (а2*-2 - а2к-\) ~ а2к < а,, поэтому А2к сходится. Остается заметить, что А2к+1 = А2к 4- а>2к+\ и ап -> 0. > Приведем два рабочих признака сходимости положительных рядов. 2.8.4. Признак Коши. Ряд B.5) сходится, если и расходится, если а > 1. ^ Доказательство. Для достаточно малого е > 0 — такого, что а+е < 1, — начиная с некоторого п = N, будет ап ^ (а4-е)п. Поэтому ряд B.5) мажорируется сходящимся рядом 2.8.5. Признак Даламбера. Ряд B.5) сходится, если и расходится, если а > 1. В данном контексте очевидна крайняя простота обоих признаков. Тем не ме- менее они охватывают почти все прикладные задачи, а пограничная ситуация с а = 1 лишь изредка всплывает в задачниках для упражнения резервных возможностей организма. При изучении сходимости рядов о признаках Коши и Даламбера полезно вспоминать потому, что в конкретных задачах проблема часто упирается в отсут- отсутствие идей, из-за чего простые вопросы ставят в тупик.
38 Глава 2. Последовательности и пределы оо Пусть, например, ряд B.5) абсолютно сходится. Будет ли сходится ряд ^Г^ пап? Скорей всего, исходный ряд удовлетворяет признаку, скажем, Даламбера. Но тогда и у а < \. пап Примеры 1. Ряд сходится при з > \ и расходится при 0 ^.з ^ 1. Расходимость B.6) при 5=1 уже была установлена в разделе 2.4. Отсюда тем более следует расходимость B.6) при 5< 1. Установим сходимость при 5 > 1. Очевидно, ^ 1 1 к + \)< + B* + 2)*+'"+ Bк+*У К Поэтому а мажорирующий ряд справа сходится, поскольку представляет сумму бесконечно убывающей геометрической профессии (со знаменателем 1/2*"). х х 2. Из теоремы сравнения (упражнение 3), в силу аш —: — —> 1, ряд 00 х п* п* х 8*п ~ сходится и расходится8* при тех же 5, что и B.6). Теоремы сравнения (упражнения 2, 3) сводят многообразие бесконечных сумм к изучению нескольких эталонных рядов, главный среди которых ^^#*- Признаки Коши и Даламбера, покрывающие 90 % задач, работают в тех же самых ситуациях, что и сравнения с суммой геометрической прогрессии. Еще 90 % из «непокрытых» задач решаются сравнением с рядом B.6). 3. Ряд ^"^ 1п A 4- х/п) при любом х > 0 расходится, поскольку X. 8) При большом х первые члены ряда могут иметь разные знаки, но потом знак стабилизируется.
2.9. Гипноз и математика 39 Упражнения ос 1. В случае ап -> а > 0 ряд ^(апж)п сходится при \х\ < 1/а. ^ ХП 2. Ряд 2^ — сходится при любом х (подсказка: признак Даламбера). 3. Ряд ^^ п*жП сходится при любом |ж| < 1 и любом фиксированном к. О дальнейшем развитии теории числовых рядов. На самом деле большую роль в анализе играют не числовые ряды, а функциональные. Но чис- числовые — служат базой, и задачи, которые держатся на прицеле, определяют (X) специфику. Например, повышенный интерес к рядам вида ^ ^ ап6„ может пока- показаться слабо мотивированным, если не знать, что в дальнейшем подразумевается с» переход к изучению рядов ^^ апхп. Достаточно естественными представляются вопросы влияния на сходимость рядов стандартных операций: перегруппировки членов (изменения порядка сум- суммирования), умножения рядов. При этом выясняется, что между абсолютно сходящимися рядами и всеми остальными проходит мощный водораздел. Аб- Абсолютно сходящиеся ряды «беспроблемны». Они допускают любое изменение порядка суммирования. Их можно без предосторожностей перемножать: Х>„ = А, Х> = 1> =» ^2апЬк=АВ, я я п,к независимо от порядка суммирования членов апЬк. Что касается остальных рядов, то там не спасают даже предосторожности. 2.8.6. Теорема Римана. Не абсолютно сходящийся ряд (А) всегда допускает изменение порядка суммирования, при котором сумма (А) оказывается равной любому наперед заданному числу (конечному или бесконечному). 2.9. Гипноз и математика Остановимся, наконец, на принципиальном вопросе о неспособности к матема- математике, который иногда встает при изучении анализа. Проблема имеет, по всей видимости, неожиданное решение. Чем легче человек поддается гипнозу, тем труднее ему дается математика. Причина заключается в следующем. Тройная спираль Эриксона9^ — три истории, вставленные друг в друга — любого вгоняет в гипнотический транс. И это не сказка, а психологический ' Знаменитый американский гипнотизер.
40 Глава 2. Последовательности и пределы прием, простой как молоток и эффективный как уголовно наказуемый «двадцать пятый кадр». В математике нечто подобное происходит само собой. В результате многие попадают в состояние транса задолго до того, как то или иное рассуждение услышано до конца. Транс же хорош для восприятия чувств и настроений, но не логических цепочек. Поясним сказанное. Спираль Эриксона — это хитрый и вместе с тем очень простой трюк. Рассказывается некая история, которая в середине обрывается, и начинает рассказываться вторая история, которая снова не доводится до конца, и повествование переключается на третью историю. Сознание вынуждено держать в памяти все эти половинчатые истории — и у него оказываются «заняты руки». Охрана снята, дорога к подсознанию свободна, слушатель в трансе. В учебнике математики эриксоновы спирали уходят за горизонт. Вот про- простейший пример. Функция /(ж) непрерывна в точке х0, если по любому е > 0 (об /(х) забыто, с потолка появилось е, для него пока неясно, но об этом е > 0 надо помнить, чтобы потом понять конец истории) можно указать такое д (на голову сваливается еще один «персонаж»), что \/(х) - 1(хо)\ < е, если \х - хо\ < д. Все истории сразу заканчиваются, но отключенное сознание уже ничего не слышит. Подсознание слышит, но не понимает. И это — в определении из нескольких строчек. А что взять с доказательств, где сплошь и рядом фрагменты оборванных рассуждений вставлены друг в друга, как матрешки? Сюда можно добавить многословие, испепеляющее территорию 10\ В результате целое не удается охватить ни с высоты птичьего полета, ни с первого этажа общежития. Получается странная вещь. При изобилии «арсенала» каждый остается один на один с задачей формирования ясного представления об изучаемом предмете. От деталей рябит. Что-то вызубрено, что — непонятно. Многие потом напря- напрягаются до старости, но какой резон «давать концерты» на том свете? Хочется продраться сквозь гипнотическую пелену сейчас. Конечно, единый рецепт дать трудно. Но понимание причин — уже полдела. По-видимому, средства надо искать за пределами математики. Повышать психо- психологическую устойчивость, например. Культивировать чувство уверенности. Либо переиначивать книжные схемы в свои собственные, которые при внешней неук- неуклюжести все-таки укладываются в голову. При этом важно, чтобы доказательство стало вдруг понятно укрупненно — не «по кирпичикам», а сразу целиком. ' Не столько потому, кстати, что «краткость — сестра таланта, но мачеха гонорара», сколько по другим причинам.
Глава 3 Дифференцирование 3.1. Производная 3.1.1. Определение. Производной функции у = /(ж) в точке ж называется предел Дж Используется также эквивалентное /'(ж) обозначение й/ и употребляется точка сверху, %(Ь), когда речь идет о функциях вре- времени. Операцию взятия производной называют дифференцированием. Производная /'(ж) — это скорость изменения функции /(ж) при изменении аргумента ж. Когда функция — путь, аргумент — время, производная — это обычная скорость. Действительно, разность з{1 + А1) — з{1), равная пути, пройденному за время Аг, и отнесенная к промежутку времени Д2, — дает среднюю скорость на интервале Д2. При А1 -» 0 получается мгновенная скорость в точке I. На рис. 3.1 изображены два примера. Как хорошо известно, если график зA) — Рис. 3.1
42 Глава 3. Дифференцирование прямая линия, то уA) = з = сош!. В случае тела, брошенного вверх с начальной скоростью г;о, высота меняется по закону зA) = Щ1 — ^2/2, скорость — у(Ь) = Уц — $г. Другую полезную интерпретацию производной дает рис. 3.2, из которого видно, что производная численно равна тангенсу угла наклона касательной к графику /(ж) в точке х /'(ж) = 18 Р. М Геометрически ясно, что ВС/АС = 1§ <р тем точнее определяет х х+Ах Рис. 3.2 Ах Ах чем меньше Аж, — что в пределе и дает Во многих случаях исходное определение легко приводит к вычислению производной. Например, (х2)' = Ш Ах = Нт Bх + Дж) = 2х. Тем не менее, определенная подготовительная работа освобо- освобождает от необходимости при дифференцировании искать непосред- непосредственно пределы. В частности, далее будут вычислены производные большинства элементарных функций. Пока приведем сводку ре- результатов 1) = х\ у = В частности, х'=\, у' = ах 1п а; У = х х (ех)' = х Особая роль числа е при дифференцировании показательной функции — есть та самая причина, которая ставит е в разряд важ- ' Здесь и далее мы избегаем уточнений, ясных из контекста.
3.1. Производная 43 нейших констант. Принципиальная роль показательной функции в «устройстве мира» — это уже другой вопрос. Из приведен- приведенных формул ясно, например, что дифференциальному уравнению у1 = ку удовлетворяет функция у = ах, где а = ек. Аналогично, е появляется при решении любых линейных дифференциальных уравнений, которыми описывается 90%(!) прикладных задач в фи- физике, биологии, экономике и других областях. Функцию ех называют такяй жспонентой. Вместо ех иногда используется обозначение ехрж. Производные тригонометрических функций: (зт ж)' A8*)' = = СОЗ Ж, 1 СОЗ2 Ж ' (соз ж)' = (с!§ж) - 5И1Ж, 1 зт2 ж и обратных тригонометрических функций: (агсзт хI = (агс!§ хI = рис Разумеется, производная в отдель- отдельных точках (и даже во всех) может не существовать. Это, заведомо, име- имеет место, когда функция /(ж) не не- непрерывна или имеет изломы, как на рис. 3.3. В точке излома х = а производная терпит разрыв. В этом случае говорят, что /(ж) при х = а имеет односторонние производные слева и спра- справа — пишут, соответственно, /'(а - 0) и /'(а 4- 0), — которые определяются как предел обычного выражения /(*)-/(*) х- а с той лишь разницей, что в первом случае ж -> а - 0 (ж приближа- приближается к а слева, «к а минус нуль»), во втором — ж —» а4- 0 — справа. Если не оговорено противное, далее предполагается, что про- производная существует везде в области определения /(ж).
44 Глава 3. Дифференцирование 3.1.2. Производные высших порядков. Дифференцируя /'(ж), по- получаем вторую производную /"(ж) функции /(ж). Дифференцируя /(ж) к раз, — будем иметь к-ю производную /^к\х) функции /(ж). Для обозначения второй (к-й) производной используется также запись а2/ /й*/\ —г- I —г ). Когда аргумент — время, популярны точки сверху ', ах1 \ахк ) I = г". Ф Функция /(ж) обычно предполагается столько раз дифферен- дифференцируемой, сколько требуется по контексту. Первичные понятия, как правило, пробегаются вскользь. Мазохистов понять можно — не зная дробей, учить алгебру — большое удоволь- удовольствие. Но у остальных такая же чертовщина получается сама собой. Там, где речь идет о понятиях, разговор обычно короткий, глубин с ходу не видно — поэтому внимание переносится на результаты, где «что-то происходит». Вычисление какого-нибудь предела, например. В результате первичные понятия остаются за бортом. 3.2. Правила дифференцирования Добавление к формулам дифференцирования элементарных функ- функций нескольких простых правил позволяет легко вычислять про- производные в большинстве практических ситуаций. Такие правила можно сосчитать на пальцах одной руки. Скажем, если /(ж) умно- умножается на константу с, т. е. у = с/(ж), то у1 = с/'(ж), что очевидно, с/(ж + Аж) - с/(ж) _ /(ж + Аж) - /(ж) , Дж ~С Дж ^с'^- Далее Правило «производная суммы равна сумме производных» устанав- устанавливается элементарно. Формула дифференцирования произведения доказывается так3): ,1т +,^+1 Дж Дя->о \Дж Дж Дж Если х — скорость, то х — скорость изменения скорости, т. е. ускорение.
3.2. Правила дифференцирования 45 что и дает указанную выше формулу, поскольку Дж Ах Чаще других, пожалуй, используется правило дифференцирова- дифференцирования сложной функции 4) У = /{9(х)) => 2/' =/У- Здесь / дифференцируется «сразу по всему своему аргументу, т.е. по д(х)». Поясним на примерах. Пусть у = зт Ъх. Будем считать /(•) = зт (•), д(х) = Ъх. Диффференцирование синуса (по Ъх) дает созЗж, (Ъх)' = 3, поэтому (зтЗж)' = ЗсозЗж. Другой пример, У=фл- Поскольку (-) = - ( — ) , то у' = --ц-тд(х). < Доказательство правила дифференцирования сложной функции получа- получается в одну строчку: Понятно, что цепное правило дифференцирования сложной функции можно индуктивно продолжить » = /ЫМ*))) =*• у' = Г я' л', и так далее. Формула дифференцирования частного доказывается легко с помощью предыдущих правил. Частное можно считать произведением / и \/д и вычислять производную A/дI как призводную сложной функции (см. выше). Наконец, производная обратной функции. Если для у = /(ж) определена обратная функция х = /~1(у), то у'х 4' Еще говорят, композиции функций.
46 Глава 3. Дифференцирование что легко получается предельным переходом в очевидном равенстве Ах 1 Ау (Ау/Ах)' Но надо иметь в виду, что человек мыслит в «обратном направлении» всегда хуже. Поэтому использование правила х'у = \/у'х часто вызывает затруднения. Осваивать такие вещи лучше всего на примерах. Определим производную аркси- арксинуса, исходя из формулы для производной синуса. Пусть у = 8Ш ж, х = агс8ту. Тогда СО8Ж что дает необходимый результат. При желании буквы ж, у теперь можно поменять местами. 3.3. Зачем нужны производные В плоскости такого вопроса сам собой почему-то возникает раз- разговор о максимумах, выпуклости, асимптотике и вообще изучении поведения функций, — где производные, конечно, играют боль- большую роль. Следующий виток — численные методы. Оптимизация, решение уравнений, неравенств, — почти везде используется диф- дифференцирование. При этом есть, что показать. Даже на самом элементарном уровне. Скажем, итерационный метод Ньютона Хп+1~хп /'(*.)• решающий уравнение /(ж) = 0, в случае /(ж) = х2 — 2 вычисляет у/2, давая последовательные приближения5) _ 1 1 2 хп Казалось бы, ничего особенного, однако дюжина итераций, начиная, допустим, с Хо = 1, дает тысячу(!) верных знаков после запятой. Но все это не главное. Главное в другом. Мир, оказывается, стоит не на трех китах, а на дифференциальном исчислении. ) Здесь /'(х) = (х2 -2)' = 2х.
3.4. Вывод формул 47 Пусть Т обозначает температуру тела, находящегося в сре- среде с температурой То. Как будет проходить процесс нагревания или охлаждения? Жизненный опыт6) подталкивает к «локальной» гипотезе: скорость Т изменения Т пропорциональна разности тем- температур То - Т, т.е. где ^ > 0 — коэффициент пропорциональности. Это простейший вариант дифференциального уравнения (содер- (содержащего производные). На подобного сорта уравнениях базируется вся физика и другие прикладные науки. Как, скажем, движутся ме- механические тела? Один раз такую задачу удалось решить Кеплеру (планеты — по эллипсам), но это ничего не дало для решения дру- других задач. Дифференциальный закон Ньютона (масса на ускорение равна силе), тпх = Р, обеспечил путь к решению любых механических задач. Уравнения электродинамики, диффузии, распространения волн и эпидемий, гидро- и аэродинамики, квантовой механики — дифференциальные. 3.4. Вывод формул 3.4.1. Производная Степенной функции. В случае хп при целом поло- положительном п формула бинома Ньютона дает (х + Ах)п - хп = пхп'1Ах + о(Ах), откуда легко вытекает (хп)' = пхп~1. М В общем случае степенной функции у = хх с произвольным Л Ф О возни чуть больше. Сначала установим вспомогательный факт ^А при «-Ю. Вводя новую переменную з = (I + 1)х - I (очевидно, з -> 0 при I ->• 0) и логарифмируя равенство (\ +1)х = 1 + 5, имеем откуда л 1п A ~ 1~ ' А потом и эксперимент.
48 Глава 3. Дифференцирование в силу того, что (при I -> 0) Теперь легко получаем нужный результат (ж + Дж)-ж A + Дж/ж)-1 А_, %Л у = Ит -1 = Ит - -г- хх ' = ЛжА дх-+о Ах Дх-чо Ах/х 3.4.2. Производная показательной функции. Для у = а* имеем у = Нт = Ьт а — = а 1па, Дх-+0 Дж Дх-+0 Дж поскольку аТ - 1 , > 1п а при г ->• 0, т что следует из ат - 1 (т 1 где ат - 1 = а. 3.4.3. Производная логарифмической функции. Функции х = ау и у = 1о§д ж взаимообратны. Поэтому производная логарифмической функции определяется формулой производной обратной функции. Прямолинейный вывод тоже несложен: , .. 1овв(ж+ Аж) -1оёвж 1 1оёв(Ц-Аж/ж) \о&а е у = 11ГП _ = « 11т _—. = ф Дх-чо Ах х Дх-чо Ах/х х 3.4.4. Тригонометрические производные. Пустьу = 8т х. Тогда, поль- пользуясь формулой для разности синусов, получаем . 31П (х 4- Ах) -$тх ( Ах\ зт (Ах 12) у = Нт =¦ Ит соз I х 4- -г- 1 —-—тгг- = созж, 9 Дх-40 Ах Дх-чо \ 2 / (Аж/2) в силу ^ 1 при г ->• 0, см. B.6.4). Производная косинуса вычисляется аналогично. Производные тангенса и ко- котангенса — по формуле производной отношения двух функций. Производные обратных тригонометрических функций — по формуле производной для обратной функции. На материале данного раздела нет смысла долго задерживаться — обучение все равно требует нескольких проходов. Правда, некоторые педагоги рекомендуют другой способ, который хорош для распростра- распространения в стане врага, — учить монотонно, шаг за шагом. В этом случае удовольствие от учебного процесса растягивается на всю жизнь.
3.5. Дифференциалы * 49 3.5. Дифференциалы Гипотетически рассуждая, в условиях неведения о производных, можно было бы задаться вопросом, когда приращение функции представимо в виде Ау = ААх + о(Ах), C.1) где А — некоторая константа. Ответ очевиден. 3.5.1. Представление C.1) имеет место тогда и только тогда, когда функция / дифференцируема в точке х. При этом А = }'{х). < Допустим, справедливо C.1). Переход к пределу в дает А = /'(ж). Обратно, пусть существует производная /'(ж). Тогда по самому определению производной || - /'(я) = а(Ах) -> О, откуда Ау = /'(ж)Дж 4- а(Аж)Аж, что и означает C.1) при А = /'(ж) > Таким образом, проблема тривиальна, и на этом можно было бы закончить, но традиционно на данном аспекте сфокусировалось слишком много внимания, чтобы его теперь можно было обойти стороной. 3.5.2. Определение. Линейная часть приращения Ау, равная А Ах в представлении C.1), называется дифференциалом функции у = /(ж) и обозначается йу. Следовательно, Ау = йу 4- о(Ах), т. е. приращение Ау равно сумме линейного приращения йу и нелинейной части о(Ах). Полагая для независимого приращения Ах = их, имеем йу = /'(ж) их,
50 • Глава 3. Дифференцирование откуда, собственно, и возникло обозначение производной Самый простой вопрос «почему Ах = их ?» — иногда оставляет чувство недоумения. О наличии проблемы свидетельствует уверенность части населения, что «дифференциал — это очень маленькое приращение». На самом деле их может принимать любые значения. Неразбериху здесь порождают «маленькие дельта», которые были отправной точкой, но потом оказались ни при чем. Определение 3.5.2 говорит следующее. Линейное приращение — назовем его з — функции у = /(ж) вдоль оси у связано с приращением аргумента х — назовем его г — формулой $ = /'(ж)г. Конечно, это слишком громоздко. Поэтому договорились г обозначить через их, 8 — через йу. Тезис о «малости» возникает лишь в том случае, когда речь заходит о формулах приближения. Что касается вопроса «почему Ах = их?», то «как захотели, так и обозначили — оказалось удобно». Обычно при работе с приращениями функций приходится ли- либо употреблять приближенные равенства Ау и /'(ж) Дж (в которых ошибки могут накапливаться по цепочкам), либо — формулы типа C.1), таская из строчки в строчку хвосты нелинейных добавок о(-). Понятие дифференциала освобождает от этих неудобств, позволяя писать для линейных частей приращений абсолютно строгие равен- равенства. Это особенно удобно в более сложных ситуациях. Например, для у — /(ж)#(ж), имеем Это все плюсы. Минусы тоже есть. Они сказываются на этапе обучения. Дифференцируемость обычно определяется как возмож- возможность записи приращения функции в виде C.1). Само по се- себе это не так плохо, но возникает нагромождение определений. Дифференцируемость и наличие производной оказываются разны- разными свойствами. Благоприятный факт их совпадения производит на начинающего неприятное впечатление, ибо он начинает ду- думать, что чего-то не понял. Поначалу действительно не ясно, зачем вводятся дифференциалы. Тот небольшой выигрыш, который они дают, на первом курсе выглядит неубедительно, ибо пока ничего не известно о какой-нибудь дифференциальной топологии, где все это может «выстрелить». Но если присмотреться, то это хорошо «стреляет» и в самых простых ситуациях. Достаточно сказать, что
3.6. Теоремы о среднем 51 появляется возможность обращаться с й//йж, как с обыкновенной дробью. Например, й/ их _ а/ их й1 й1 Скажем, в у = /(ж) производится замена ж = и(т), после которой х становится зависимой переменной. И хотя теперь уже Дж ф их — равенство йу — /'(ж) их сохраняется, в чем легко убедиться используя формулу дифферен- дифференцирования сложной функции: йу = уТйт = уххт йт = ух их. Это простое, но важное свойство называют инвариантностью формы дифферен- дифференциала. Формула для производной йу/йх, допускающая сокращения как в обыкно- обыкновенных дробях (но не буквы <2!), часто оказывается предпочтительнее. Например, в случае параметрического задания кривой, производную у'х с помощью дифференциалов можно вычислить, не восстанавли- восстанавливая зависимости у(х): , = 1 = Ух их = = их х'тйт гр'(т)' 3.5.3. Дифференциалы ВЫСШИХ ПОРЯДКОВ. Вторым дифференциалом й2у функции у = /(ж) называется (первый) дифференциал функции1^ йу = /'(ж) их (как функции ж, но не их), т. е. й2у = <*(/'(ж)) их = (/"(ж) их) их = /'(ж) их2. Дифференциалы более высокого порядка определяются индуктивно, (Ту = /(п)(х) йх\ В отличие от дифференциалов первого порядка, для которых всегда йу = /'(ж) их (инвариантность формы), приведенные формулы для дифференциалов (Г1 (п > 1) справедливы лишь в предположении независимости аргумента ж. Если х = <рA), то 42у = [/М*))К; л2 = [/'(>'(•)]' <и2 = (Г • (<р'J + /' • /) й12 = /" их2 + /' й2х. 3.6. Теоремы о среднем Когда весь курс анализа забывается, в памяти остается одна теорема: > Но не квадратичная часть приращения Ау\
52 Глава 3. Дифференцирование 3.6.1. Пусть /(ж) в точке х = а дифференцируема и принима- принимает локально максимальное значение, т. е. /(а) ^ /(ж) для всех х из достаточно малой окрестности точки а. Тогда /'(а) = 0. < Результат .очевиден с разных точек зрения. В точке максимального удаления скорость обнуляется — надо остановиться, чтобы двинуться обратно. Другой вариант. Геометрически понятно, что касательная к локальному максимуму (рис. 3.4) должна быть горизонтальна Третий вариант. В предполо- предположении противного, /'(а) Ф 0, — например, /'(а) > 0, линейная (самая большая при малом Ах) часть приращения {'(а)Ах > 0 при Ах > 0, Рис. 3.4 т.е. На + Ах) >/(а) при достаточно малых Ах > О, что противоречит наличию локаль- локального максимума в а. > Обратное, разумеется, неверно. У ж3 производная (Зж2) в нуле — нуль, но — никакого максимума (в нуле у ж3 — точка перегиба). 3.6.2. Теорема Ролля. Пусть /(ж) дифференцируема на [а, Ь] и /(а) = /F). Тогда есть точка % 6 [а, Ъ], в которой /'(^) = 0. «* Из /(а) = /(Ь) вытекает, что /(ж) на [а, Ь] имеет или минимум, или максимум. Далее решает ссылка на предыдущую теорему. > 3.6.3. Теорема Лагранжа. Пусть /(ж) дифференцируема на [а,Ь]. Тогда есть точка % Е [а, 6], в которой № - На) Ь-а Последнее равенство чаще записывают в виде подчеркивая способ выражения Д/ с помощью умножения Аж на «среднюю скорость роста» /'(О-
3.6. Теоремы о среднем 53 «* Для доказательства введем вспомогательную функцию ш(х) = /(ж) — кх, которая при к = — удовлетворяет условию ш(а) = ш(Ь). Доказательство о — а завершает применение к ш(х) теоремы 3.6.2. Для некоторого ^ € [а, Ь] будет «'«) = ЛО-* = о. > 3.6.4. Теорема Коши. Пусть /(ж) и д(х) дифференцируемы на [а, Ъ] и д'(х) Ф О в промежутке [а,Ь]. Тогда есть тонка % 6 [а,Ь], в которой /(Ь) - /(а) _ /'(О 9(Ь)-д(а) д>@' < Доказательство можно опять получить сведением к теореме Ролля с по- помощью функции ш(х) = Нх)-кд(х), которая при к = —— 7— удовлетворяет д(Ь) - д(а) условию ш(а) = ш(Ь). Точка ^ € [а, Ь], в которой «'@ = /'@ - кд'(О = О, дает «то, что нужно». > Заметим, что теорему Коши можно рассматривать, как теорему Лагранжа, переведенную на другой язык. Если под и = /(ж), V = д(х) подразумевать пара- параметрическое задание функции и(у), то в силу (см. разд. 3.5) и'(в) = '' где в = д@, теорема Коши утверждает где а =д(а), р =д(Ь). Из теоремы Коши вытекает результат, который потребуется в следующем разделе. 3.6.5. Лемма. Пусть функции /(х) и д(х) дифференцируемы п + 1 раз в некоторой окрестности тонки а, и обращаются в этой тонке в нуль вместе со своими п производными, принем для х Ф а из этой окрестности Тогда существует точка % 6 [а? 6], в которой /(*) /»+'>(о
54 Глава 3. Дифференцирование < Если /(а) = д(а) = О, то теорема Коши в применении к промежутку [а, х] (или [ж, а], если х < а) гарантирует существование такого ^ € [а, ж], что /(*) _ /'(О <?(*) 9'@' Применим теперь этот факт к /'@/#'@> и так — п Раз- > Упражнение Если /(ж) дифференцируема на [а, Ь], то /'(х) принимает все промежуточ- промежуточные значения между /'(а) и /'(&) (теорема Дарбу). 3.7. Формула Тэйлора Кульминационным моментом дифференциального исчисления обычно представляется следующий факт. 3.7.1. Формула Тэйлора. Пусть функция /(ж) п+1 раз дифферен- дифференцируема в некоторой окрестности тонки а. Тогда для ж, достаточно близких к а, справедлива формула /(*) = /(а) + Ш-(х - а) + ... + 1—^{х - а)" + о((х - а)п). 1 • IV» <4 Легко видеть что аппроксимирующий полином Рп(х) = /(а) + ^-(х - а) + ... + ^-(х - а)" имеет в а те же производные (до п-й включительно), что и /(ж), — поэтому функции ф) = /(*) - Рп(х), х1>(х) = (х-а)п+' удовлетворяют условиям леммы 3.6.5, применение которой дает ф) = у<"+|>@ Очевидно, Поэтому Лх)-Рп(х) (ж-о)п+'
3.7. Формула Тэйлора 55 что и требуется, поскольку ^1Ш(х-а)п^=о((х-аП > Если функция /(ж) бесконечное число раз дифференцируема, скажем, в нуле, то велик соблазн представить ее в виде бесконеч- бесконечного ряда Тэйлора Вопрос в том, имеет ли смысл равенство C.2). Многочислен- Многочисленные оценки малости «хвоста» ряда Тэйлора (остаточного члена) /(ж) - Рп(х) ничего не дают. Качество приближения /(ж) по- полиномом Рп(х) улучшается с ростом п, но окрестность, где это происходит, может уменьшаться до нуля. Поэтому для знака ра- равенства в C.2), вообще говоря, нет оснований. Ряд Тэйлора может расходиться или сходиться к другой функции. Например, для функции /(ж) = е~1/х , доопределенной в нуле по непре- непрерывности (/@) = 0), все производные /(п)@) = 0. Поэтому ее ряд Тэйлора C.2) сходится к другой функции, тождественно равной нулю. Тем не менее для многих функций представление C.2) справедливо, причем не в малой окрестности, а на довольно широких областях и даже на всей числовой прямой. Например, представления хъ х2 справедливы при любом х € (-оо, +оо). Именно глядя на эти ряды, как гласит легенда, Эйлер открыл свою знаме- знаменитую формулу е1<р — сов <р + г вт (р. Так или иначе, но в теории функций комплексного переменного (см. гл. 10) устанавливается, что ряды Тэйлора, с которыми приходится иметь дело на прак- практике, сходятся в обширных областях. Поэтому аскетическое сужение уровня притязаний классического анализа оказывается «бесконечно большой перестра- перестраховкой».
56 Глава 3. Дифференцирование Вот еще несколько рядов у уу + ..., (|я| < 1), = 1 + х + х2 + хъ + ..., (|ж| < 1), 1 — х Ради справедливости все же надо подчеркнуть, что тэйлоровская тематика ориентирована на изучение особенностей поведения функции в точке, — и там ограничение поля зрения малыми окрестностями как раз естественно. Если бы главная задача состояла в аппроксимации (приближении) функций на больших промежутках, то можно было бы вообще заходить с другого конца. 3.7.2. Теорема Вейерштрасса. Для непрерывной на [а,Ь] функции }{х) и любого е > О всегда можно указать такой полином Рп(х), что \/(х) - Рп(х)\ < в для любого х € [а, Ь]. Это знаменитый результат, но уже из другой области и для других целей. Рав- Равномерную аппроксимацию /(ж) на [0, 1] (при п —> оо) обеспечивают, например, полиномы Бернштейна: *=о 3.8. Монотонность, выпуклость, экстремумы При изучении поведения функции дифференцирование работает весьма эффективно. Основу составляют несколько простых сообра- соображений, которые позволяют решать сложные задачи. В этом, кстати, нет противоречия. Элементарные причины могут порождать весьма замысловатые последствия. Даже такой простой факт, как 3.8.1. Яя) = 0 ^ /(ж)еесоп81, может приносить плоды. Дело в том, что банальности в жизни тщательно замаскированы. Например, для какого-нибудь сложно доказуемого тождества /(ж) = д(х) проверка /'(ж) = д'(х) может оказаться совсем легкой. Тогда остается убедиться лишь в равенстве /@) = #@) — и задача решена.
3.8. Монотонность, выпуклость, экстремумы 57 Докажите тождества агсзш х + агссоз х = —, \о$а х = A + 1О&, Ь) 1о§а6 ж. (>) 3.8.2. Функция /(ж) монотонно растет, если /'(ж) ^ О, и убывает — если /'(ж) < 0. Тоже совсем прозрачный результат. Скорость изменения по- положительна — функция растет, отрицательна — убывает. Строго положительна — строго растет и т. д. Характер роста /(ж) играет важную роль во многих задачах. В случае /'(а) = 0, например, полезно выяснить поведение произ- производной /'(ж) в окрестности точки а. 3.8.3. Если /'(а) = 0 и слева от а производная положительна, справа — отрицательна, то у /(ж) в а — максимум. Наоборот — минимум. Производная сохраняет знак — точка перегиба, как у ж3 в нуле. Решение десятка-другого примеров здесь перевешивает любые пояснения. 3.8.4. Если /@) ^ 0 м /'(ж) ^ 0 для ж ^ 0, то /(ж) ^ 0 при любом На уровне общей схемы факт вроде бы не стоит упоминания. На практике — хорошо работает. Докажем, например, неравенство хъ 8111 X ^ X —. 6 Дифференцируя, получаем соз х ^ 1 - ж2/2, что не вполне ясно. Но тот же ре- рецепт можно применить еще раз. Новое дифференцирование дает - зт х ^ -х, т. е. X ^ 8Ш ж. Кому известно такое неравенство, на этом заканчивает. Кому — не из- известно, может снова повторить процедуру, получая 1 ^ соз х, чему полагается быть известным. Теперь движение в обратном порядке (разумеется, с проверкой на каж- каждом шаге соответствующего неравенства в нуле) решает исходную задачу. > Докажите неравенство сг$ 2х - с\$ х 4- 1 < 0 при 0 < х < п. (>) Еще одна полезная категория мышления — выпуклость. Функ- Функцию называют выпуклой, когда ее график выглядит, как на рис. 3.5 а, и вогнутой — в случае, изображенном на рис. 3.55.
58 Глава 3. Дифференцирование Рис. 3.5 3.8.5. Выпуклая функция с увеличением х растет все быстрее, т. е. скорость /'(ж) возрастает {ускорение /"(ж) положительно). Вогнутая функция, наоборот, с увеличением х растет медленнее. Из рис. 3.5 геометрически ясно, что вертикальный луч, идущий вверх из любой точки с 6 [а, Ь], пересекает сначала график /(ж), потом отрезок АВ, что можно записать как при любых неотрицательных р и }, удовлетворяющих условию р+</ = 1. Это называют неравенством Иенсена и обычно принимают за определение выпуклой функции, а монотонность производной уже выводят как следствие. Вообще говоря, такую выпуклость часто путают с вогнутостью, потому что мало кому интересно знать, откуда на графики смотрел Иенсен, снизу или сверху. Поэтому, во избежание недоразумений, многие предпочитают говорить о выпуклости снизу или о выпуклости сверху. В любом случае каждый понимает, о чем речь, но поручиться за Иенсена не всегда может. Исходное определение понятия выпуклости таково. 3.8.6. Определение. Геометрическая фигура (тело) выпукла, если вместе с любыми двумя точками содержит отрезок их соединяющий. Функцию обычно считают выпуклой, если она имеет выпуклый надграфик, представляющий собой множество точек (х,у), удовлетворяющих неравенству Достаточно очевидна и возможная роль второй производной /"(ж) (ускорения). Как уже отмечалось, /"(ж) ^ 0 влечет за со- собой выпуклость /(ж) на соответствующем участке, /"(ж) < 0 —
3.9. Дифференциальные уравнения 59 вогнутость. Таким образом, точки, в которых /"(ж) обращается в нуль и меняет знак, определяют смену выпуклости на вогнутость (либо наоборот) и классифициру- классифицируются как точки перегиба. Рис. 3.6 демонстрирует более общий слу- случай, чем ж3. Поскольку в окрестности ло- локального минимума функция вы- выпукла, максимума — вогнута, то знак второй производной при ус- условии /"(ж) Ф О однозначно оп- определяет ситуацию. X Рис. 3.6 3.8.7. Если /'(а) = 0 и /"(а) > 0 (/"(а) < 0), то /(ж) в точке а имеет локальный минимум (максимум). Пример Точильное колесо радиуса К, погруженное нижней половиной в воду, вра- вращается с угловой скоростью ш. На какую максимальную высоту забрасываются брызги? «* Фиксируем на ободе коле- колеса некоторую точку А (рис. 3.7). Ее координата у меняется по закону Брызги, срывающиеся с колеса в точке Л у взлетают на высоту У2 К2 У г, ¦ = У+ — = К81П<р 2# 2 СО8 где <р = шг. В точке максимума производная Н по <р должна быть равна нулю, дУ — = К СО8 (р - ^ а<Р 28 2 СО8 (р 8111 (р = 0, Рис. 3.7 откуда либо соз (р = 0, либо 81П (р = %/(Кш2). > 3.9. Дифференциальные уравнения Многие прикладные задачи описываются линейными дифферен- дифференциальными уравнениями с постоянными коэффициентами вида ах + рх + 7# = 0. C.3)
60 Глава 3. Дифференцирование Легко убедиться, что если Х\(Ь) и Х2Ц) — решения C.3), то С\Х\{1) + С2Х2Ц) — тоже решение. При подстановке в C.3) х = ем, в силу • \л^ ** \ Л получается (после сокращения на ем) квадратное уравнение C.4) относительно А. Поэтому, если C.4) имеет действительные корни Аь А2, то х{1) = СхеХхг + С2еХ2г C.5) будет решением C.3) при любых константах С\,С2, значения которых могут быть определены то ли из начальных условий х@) = жо, х@) = у0, то ли из граничных условий типа Оговорка насчет действительности корней Аь Аг не принци- принципиальна, поскольку все остается в силе и в случае комплексных корней, но при этом нужна готовность манипу- манипулировать формулой Эйлера е%{? = соз (р + г&имр. Можно обойтись также без выхода в комплекс- комплексную плоскость, опираясь на первоначальный по- поиск решений в виде ы = С{е либо, что* эквивалентно, С2е аг Рис. 3.8 Константы определяются аналогично пре- предыдущему, из начальных или граничных усло- вий. Пример Веревка длины I перекинута через блок (рис. 3.8). В начальный момент один из свисающих концов длиннее другого на К. Найти х в момент I. Трение отсутствует.
3.10. Раскрытие неопределенностей 61 При плотности веревки (на единицу длины) равной д вес длины х будет 0$х, а масса всей веревки д1. Закон движения (Ньютона) принимает вид . 1 - - * д1-х = д^х, т.е. х = —- ж. Подстановка ж = СеА', в итоге приводит (с учетом начальных условий х@) = Л, ж@) = 0) к результату 3.10. Раскрытие неопределенностей 3.10.1. Неопределенностью 0/0 называют ситуацию, в которой ищется предел отношения }(х)/д(х) стремящихся к нулю функций (при х -> а). Если у обеих функций в точке а существуют конечные произ- производные /'(а), #'(а),то д(х) = д(а)(х - а) + о(х - а), поскольку /(а) = д(а) = 0. Поэтому /(х) /'(а) + /! где д(х) д'(а) + А9 х-а что, при условии неравенства нулю хотя бы одной из производных /'(а), д'(а), — влечет за собой справедливость правила Лопиталя: шп тг = ТУТ* д(х) д'(а) В случае /'(а) / 0, ^'(а) = 0, предел бесконечен. Маленький пример: Нш х->0 1п( 1/A 1 ^ Идея Лопиталя работает в более широких условиях. Если / и а в точке О обращаются в нуль вместе со своими к - 1 производными, и /(*^(а) (или д^(й)) — первая ненулевая производная, то ряды Тэйлора / и д начинаются С к-х членов. Поэтому
62 Глава 3. Дифференцирование Случай бесконечного а не исключается. Надо лишь отношение производных заменить их пределом8) (разумеется, в предположении, что он существует): и» м = „т т. х->оо д(х) х->оо д'(х) При доказательстве замена переменной I = 1/х сводит ситуацию к предыду- предыдущей. > Доказательство правила Лопиталя с использованием разложений Тэйлора, /(ж) = /'(а) + о(-), д(х) = ... требует, вообще говоря, чтобы /и(/в точке а были два раза дифференцируемы. И на первом этапе обучения это проще пред- предполагать, тем более, что все примеры в задачнике удовлетворяют этому условию. С другой стороны, можно обойтись существованием одной производной, причем доказательство так же просто. В силу /(а) = д(а) = О /(*)-/(*) /(*) = х-а = д(х) д(х) - д(а) ' х-а что после перехода к пределу (х -> а) сразу дает «то, что нужно». Такой способ даже выглядит в каком-то отношении предпочтительным. Но он влечет за со- собой необходимость принятия требования д'(а) ф О, которое в первом случае не обязательно (а это, кстати, солидный процент задач). Но речь сейчас не о процентах, а о большом ветвлении вариантов и уточ- уточнений, которое возникает во многих математических направлениях. В данном случае «виновато» слишком либеральное определение производной, которое счи- считает дифференцируемыми (в нуле) функции типа х2 вт A/х). Скверная природа таких функций портит (или украшает — кому как больше нравится) столбовую дорогу анализа бесконечными закоулками. Если бы не это, — курс Фихтенгольца был бы намного тоньше. 3.10.2. Неопределенностью оо/оо называют ситуацию, в которой ищется предел отношения ${х)/д{х) стремящихся к бесконечности функций {при х —> а). Правило Лопиталя работает и в этом случае, принимая следу- следующий вид. 3.10.3. Если /(х),д(х) -) оо « существует предел отношения Г(х)/д'(х),то ^ Нетрудно сообразить, что это аналог теоремы Штольца B.4.2).
3.10. Раскрытие неопределенностей 63 Неправильное доказательство. Естественной выглядит идея свести не- неопределенность оо/оо к предыдущему случаю: что после сокращения на Ит(//р) и «переворачивания дробей» вроде бы дает желаемое. Главный (но не единственный) порок рассуждения здесь состоит в использо- использовании предела Ит (//</), существование которого надо еще доказать. Тем не менее, идея вполне здравая, и ее можно доработать (в качестве упражнения). Вообще доказательство трудных и неясных утверждений даже целесообразно начинать с макимально простых идей, не обращая внимания на ошибки реализации. Это, как правило, дает понимание общей картины. Недоделки устранять можно потом. На практике встречаются неопределенности и других видов, но они легко сводятся к уже рассмотренным. Скажем, 0 ° О-оо <=> —— <=> -. 1/оо О В ситуациях «0°, оо°, I00» выручает логарифмирование. Вместо р рассматривается что во всех перечисленных случаях дает неопределенность вида О-оо. Ситуация «оо-оо» предлагается в качестве упражнения. Примеры 2 1. Ит \ = Ит V ^' = Пт г-*— = 3. / 1 (/ \у х->1 1 Ъ/х 2. Нт = х->о х 1 Х=0 3. Во многих случаях наиболее эффективно непосредственное использова- использование формулы Тэйлора. Например, *-ап* х-х+-+о(х) з 1 Ит 7 = Ит — т = ^г = ^ 2 Ит 7 = Ит 5 ч— т = ^г х->о х2 х-^о х2 хъ . Зч х2 3! 1A + )+— Ж~Т + Т + °^Х ' ~ Х + Т
64 Глава 3. Дифференцирование 3.11. Контрпримеры Дифференцируемая функция обладает свойством Коти: ее производная принимает все промежуточные значения (теорема Дарбу). Это гарантирует, что разрывная функция 8щп х не может быть производной, т. е. невозможно /'(х) = 8щпж, если /(ж) дифференцируема. Ощущение банальности этого факта подталкивает к выводу, что в случае дифференцируемости /(ж) на [а, Ь] производная /'(ж) обязана быть непре- непрерывной функцией. Да и свойство Коши представляется эквивалентом непре- непрерывности. Это неправильно. Производная везде дифференцируемой функции9^ /(ж) = ж2 8Ш A/ж), равная нулю при ж = 0 и /'(ж) = 2Ж 8111 СО8 — При X фО, X X разрывна в точке ж = 0 (но обладает свойством Коши). Рассмотренный пример в каком-то смысле задает эталон возможных непри- неприятностей в дифференциальном исчислении. При ориентации «диверсии» на точку ж = 0 ядром замысла обычно является произведение двух функций, одна из ко- которых подходящим образом обнуляется в нуле, а другая, типа 8тA/ж), быстро колеблется, «ускоряясь» по мере приближения к ж = 0. Если интенсивности ко- колебаний не хватает, то вместо 8т A/ж) берется что-нибудь вроде 8т A/ж*), к > 1. Скажем, везде дифференцируемая функция /(ж) = ж2 8ш — ж имеет неограниченную разрывную в нуле производную, /'@) = 0 и /(ж) = 2Ж 8Н1 — СО8 -г При Ж ф 0. X1 X X1 Функция /(ж) = ж 4- ж2 8ш A/ж2) имеет производную /'@) = 1, но не мо- монотонна в окрестности нуля. А функция /(ж) = 2ж2 + ж2 8т A/ж2) имеет в нуле строгий минимум и равную нулю производную, но ее производная в сколь угодно малой окрестности нуля принимает, как положительные, так и отрицательные значения (сколь угодно большие). Такие примеры реабилитируют многие на вид малополезные предосторож- предосторожности и придают иную окраску тривиальным доказательствам. Другая проблема — сама дифференцируемость. Воображение предлагает обычно в качестве непрерывных гладкие функции. В крайнем случае — с одним или несколькими изломами типа |ж|. Тем не менее, большинство (в некотором смысле) функций не дифференцируемы. Исторически первый пример нигде 9) Здесь и далее функции доопределяются по непрерывности. В данном случае /@) = 0, поскольку /(ж) -> 0 при х -> 0.
3.11. Контрпримеры 65 не дифференцируемой функции построил Вейерштрасс, показав, что таковой является 00 у(х) = У)Гспсов(тпжх), C.6) п=0 где целое т нечетно, 0<с<1итс>1 + Зтг/2. В свое время это был выдающийся трюк, сильно изменивший математи- математическое мировоззрение. Теперь, конечно, другие времена. Многое прояснилось, давние находки поблекли — и уже не так интересно разбирать, почему ь(х) не дифференцируема. Поэтому сегодня мимо у(х) можно пробежать, слегка оглянувшись и не вникая в детали. Однако без эмоций процесс обучения теряет эффективность — и потому иногда имеет смысл загнать себя в позу заблуждения, разобрать пример C.6), а потом искренне ахнуть. Детали можно найти в любом толстом учебнике.
Глава 4 Функции п переменных 4.1. Пространство п измерений В случае функциональной зависимости переменные х\9...9хп называют координатами, комплект х = {х\, ..., хп} — вектором. Для векторов х = {хи ..., хп}, у - {уи ..., уп} обычно вво- вводятся операции: умножение на скаляр А: Хх = {Хх{,...,\хп}, сложение/вычитание: и скалярное произведение, с помощью которого задается длина вектора (норма), В некоторых ситуациях, чтобы подчеркнуть, что речь идет о векторах, при записи используется полужирный шрифт, х = {Х[,... ,хп}, и специальное обозначение (х,у) для скалярного произведения векторов хну. 1де ясно, о чем речь, скалярное произведение обозначается максимально просто, ху. Множество векторов, на которых введены перечисленные опе- операции, называют п -мерным евклидовым пространством и обозна- обозначают Еп. При п = 2, 3 умножение на число растягивает (|Л| > 1) или сжимает (|Л| < 1) вектор, не меняя направления при Л > 0, и меняет его на противоположное при
4.1. Пространство п измерений 67 Рис. 4.1 А < 0. Сложение соответствует обычному правилу сложения векторов по пра- правилу параллелограмма, эквивалентом которого является правило треугольника. Преимущества последнего становятся очевидны при сложении нескольких век- векторов (рис. 4.1): каждый следующий слагаемый вектор приставляется началом К концу предыдущего — замыкающий вектор дает сумму. Вычитание выводится из сложения: Ь — а определяется как вектор, который в сумме с а дает Ъ. Этому соответствует простой геометрический трюк: начала а и Ь совмещаются, а концы соединяются отрезком, направленным к Ь, что и дает разность Ь - а. Описываемые манипуляции подчеркивают то очевидное обстоятельство, что в данном случае используется идеология свободных векторов, которые подразу- подразумеваются незакрепленными. Другими словами, векторы, имеющие одинаковую длину и одинаковое направление, считаются одним и тем же вектором. Все, что сказано пока — по части геометрической интерпретации — ни- никакого существенного значения для случая п > 3 не имеет. Можно, конечно, говорить об п-мерном пространстве (благо, все операции определены для любо- любого п), но это не выходит за рамки малосодержательной условности. Кардинально меняет ситуацию понятие скалярного произ- произведения. Разумеется, это происходит посте- постепенно. Шаг за шагом выясняется, что малые выгоды влекут за собой большие последствия. Процесс в целом приватизирован линейной ал- геброй, однако первоначальный этап остается всеобщим достоянием. 2 На плоскости скалярному произведению соответствует перемножение длин векторов на косинус угла между ними ^ (рис. 4.2), ч» - * Ух Рис. 4.2 ЧТО легко проверяется. Полезна также еще одна интерпретация: скалярное про- произведение х • у есть произведение длины х на проекцию вектора у на вектор ж, т.е. ^ Из-за четности косинуса и периодичности, со$Bтг-у?) = со$у?, не важно, как измеряется угол.
68 Глава 4. Функции п переменных В общем случае такая интерпретация может быть сохранена благодаря известному неравенству Коши—Буняковского, х • у ^ ||ж|| • ||у||, т. е. ххух + ... + хпуп ^ у/х] + ... + х\ которое дает возможность определить косинус угла между векторами при любом п, х-у сову? = 1МНМГ В результате векторы х, у определяют как ортогональные, если их скалярное произведение равно нулю, х-у = 0. Важная роль ортогональности заключается в том, что с ее помощью опреде- определяется понятие плоскости, как множества векторов х, ортогональных некоторому вектору а, задающему плоскость2\ а-ж = 0, т.е. а,ж, +... + а„жп = 0. D.1) Кстати, введенное понятие ортогональности реально не нуждается в каких- то неучтенных аналогиях с визуальным опытом в физическом мире. Плоскость Р (линейное подпространство) может быть определена как множество, содержащее вместе с любыми векторами ж, у € Р их сумму ж+у и прямую Лж вместе с любым вектором ж. Легко видеть, что этому условию удовлетворяет множество решений ж уравнения D.1). Говорят, что множество векторов {ж1,..., ж*} линейно зависимо, если суще- существуют такие коэффициенты Л),..., Л*, не все равные нулю, что Л,ж! + ...+ А*ж* = 0. Коллинеарные векторы3*, например, — всегда линейно зависимы. Линейно независимое множество {е1,..., еп} называют базисом, если любой вектор ж можно представить в виде линейной комбинации Стандартный базис Кп: е1 = {1,0,..., 0}, е2 = {0,1,..., 0}, ..., еп = {О, О,..., п}. Число п векторов, составляющих базис (и не зависящее от выбора послед- последнего), определяет размерность пространства. 4.2. Подводные рифы многомерности Говорить о неожиданностях и контрпримерах, как о главной осо- особенности математики, — нереалистично. Наоборот, в повседнев- повседневной практике приходится сталкиваться в основном с интуитивно ожидаемыми и понятными вещами. ' При условии ||а|| = 1 вектор о называют нормалью плоскости. ' Коллинеарными называют векторы, лежащие на одной прямой, т. е. векторы, которые одинаково или противоположно направлены.
4.3. Предел и непрерывность 69 Но езда проторенными дорогами имеет свои побочные эффек- эффекты. Иллюзия безопасности ведет к потере бдительности. Функции нескольких переменных — как раз тот объект, где необходима осторожность. Возьмем обыкновенное понятие разрыва. При наличии не- нескольких переменных аномалии возникают очень легко. Рядовая функция {#1#2 / Л -2 л> если яьж2^0; хх+х2 D2) О , если х\ = Х2 = О имеет разрыв в нуле, причем, с точки зрения обыкновенного жизненного опыта — довольно экзотический: • Предела у /(ж) при х = (х\, ж2) -> 0 нет, но при стремлении х к нулю вдоль любой прямой х\ = кх2 значение /(ж) имеет предел к/(\ + к2), зависящий от к. • Несмотря на разрыв, при любом фиксированном ж2 (в том числе нулевом) функция <р{х\) = /(жь соп$1) — непрерывна4). Разумеется, контрпримеры — штука приятная. Но когда их слишком много, то это уже из оперы «хорошая болезнь склероз» (ничего не болит, и каждый день новости). Многочисленные «неожиданности» в области функций п переменных дают повод задуматься о причинах «новостей». 4.3. Предел и непрерывность Пока речь идет о функциях и = /(хь ..., жп), принимающих чис- числовые значения. 4.3.1. Определение. Число А называется пределом функции и — /(ж) при х стремящемся к а (т. е. /(ж) -> А при х -> а), если по любому е > 0 можно указать такое д, что \/(х)-А\<е, если ||ж-а||<<У. Легко видеть, что вся разница с определением 2.6.1 предела функции одной переменной заключается в замене меры близости: 4) Забегая вперед, можно добавить, что функция }(х) имеет частные производные всюду, в том числе в нуле, т. е. в точке разрыва!
70 Глава 4. Функции п переменных |ж - а\ на ||ж — а||, — поскольку ж и а теперь не числа, а векторы. Все остальные определения претерпевают аналогичные изменения. Стремление х -> а в многомерном случае означает ||х - а|| -* 0, что, в свою очередь, равносильно одновременному выполнению п условий |ж, - а,| -»0. Соответственно, в определении 4.3.1 неравенство \\х - а\\ < 6 можно было бы заменить п неравенствами |ж* - а*| < Я. 4.3.2. Определение. Число А называется пределом функции и = /(ж) при ж -> оо, если по любому е > 0 можно указать такое М > О, что |/(х) - А\ < е, как только \\х\\ > М. Вместо А = Ит /(ж) чаще используют обозначение х*°° А= Ит /(ж). |||| В частном случае функции и = /(п, т) двух переменных, при- принимающих дискретные значения га, га = 1,2,..., возникает стан- стандартная на практике ситуация числовой последовательности иПчГП, элементы которой нумеруются двумя параметрами. 4.3.3. Определение. Число А называется пределом числовой после- последовательности иПуГП при п, т -» оо, если по любому е > 0 можно указать такое М > 0, что \иПуТП — А\ < е, если пит больше М одновременно. Вернемся теперь к общей ситуации и = /(ж), где жЕДп. 4.3.4. Определение. Функцию /(ж) называют непрерывной в точке х = а, если }(х) -> /(а) л/ш ж -> а, I/ непрерывной на множестве X, если она непрерывна в любой точке X. Вариант е, ^-определения отличается от одномерного лишь за- заменой модуля нормой. 4.3.5. Эквивалентное 4.3.4 определение. Функция /(ж) называ- называется непрерывной в точке ж = а, если по любому е > 0 можно указать такое д, что |/(ж) - /(а)| < е, если ||ж-а||<*.
4.4. Повторные пределы 71 4.3.6. Определение. Функция /(х), непрерывная на множестве X, называется равномерно непрерывной на X, если по любому е > О можно указать такое 6, что /(уIг> если для любых ж, у Е X. Аналогия с одномерным случаем сохраняется не только в части определений, но и результатов. Такую же роль играют последовательности Коши (модуль меняется на норму, слова — те же). Точно так же, если установлено существование предела /(ж) -> А при х -> а, то /(ж*) -> А на любой подпоследовательности Хц -> о. И так далее. Упражнения 1. Если функция и = /(ж) определена и непрерывна в связной области X, и принимает в двух точках х] = (ж|, х\) и х2 = (ж?, Жг) значения разных знаков, то существует точка ж* € X, в которой /(ж*) = 0. 2. Из любой ограниченной последовательности ж* можно извлечь сходящу- сходящуюся подпоследовательность (лемма Больцано—Вейерштрасса, см. 2.5.2). 3. Непрерывная на ограниченном замкнутом множестве функция и = /(ж) ограничена снизу и сверху (теорема Вейерштрасса, см. 2.7.4). 4. Функция /(ж), непрерывная на ограниченном замкнутом множестве X, автоматически равномерно непрерывна на X (теорема Кантора, см. 2.7.6). 4.4. Повторные пределы Повторные пределы в вопросах сходимости служат основным ис- источником головной боли. При этом в качестве мотивировки часто выдвигается ложная причина 5\ Дескать, предел удобно вычислять последовательно. Сначала по одной переменной, потом — по дру- другой. Но повторные пределы не всегда равны. А если равны, то нет гарантии, что они совпадают с искомым, как говорят, двойным пределом. Вот пример, в котором повторные пределы могут не совпадать: ах + су а ах + су с \\т \\т — = -, \\т \\т — = -. х-+о у->о Ьх + йу Ь у-*о х->о Ъх + ау а О настоящих причинах см. далее.
72 Глава 4. Функции п переменных У функции /(ж, у) = Ж8тA/у) при (ж -> 0, у -> 0) существует двойной предел, но только один из повторных. А у функции D.2) в нуле существуют и равны оба повторных предела, но двойного — вообще нет. Богатую палитру возможных неприятностей несколько скра- скрашивает следующий результат. 4.4.1. Теорема. Если функция /(х,у) при х -> а, у -» Ь имеет (двойной) предел А (конечный или бесконечный), и при любом у из некоторой окрестности точки Ь существует предел Нт }(х,у), то существует Ит Ит /(ж, у) = А. у->Ь х->а Другой повторный предел, как следует из приведенного выше примера, может не существовать. Если, однако, в дополнение к условиям теоремы, при любом х из некоторой окрестности точки а существует предел Ит/(ж,у), то оба повторных предела у->ь существуют и равны двойному. М Доказательство теоремы несложно. По е > 0 можно указать такое 8 > О, что ! где д(у) = Ит /(ж, у). Поэтому Итд(у) = А. > Нетрудно сообразить, что теорема 4.4.1 никакого особого выигрыша при вычислении предела не дает, поскольку, если уж существование двойного предела установлено, то его обычно проще найти, полагая х = у и вычисляя предел6) /(ж, х). Повторные пределы вообще могут показаться надуманной вещью (для за- задачника). Но это не так. Важная роль повторных пределов в анализе проявляется в завуалиро- завуалированном виде. Есть такие понятия как производная, интеграл (гл. 5), в которых от предельных переходов, лежащих в истоках, на поверх- поверхности ничего не остается. А вот изменение их порядка — часто требуется, что и упирается, по сути, в равенство повторных пределов. Можно ли менять порядок дифференцирования, дифференцировать ин- интеграл по параметру под знаком интеграла, — это вопросы равенства повторных пределов. 6^ Либо подыскивая более выгодную, с точки зрения вычислений, связь между х и
4.4. Повторные пределы 73 Допустим, последовательность функций /п(ж) поточечно сходится к функ- функции /(ж), т.е. /п(ж) -> /(ж) при каждом фиксированном ж. В качестве /п(ж) Х>0ычно выступают частичные суммы какого-либо ряда ^^ Здесь возникают стандартные вопросы наследования функцией /(ж) тех или иных свойств функций /п(ж). Например, непрерывна ли /(ж) в точке ж0, если ,Д(ж) непрерывны в ж0? Легко видеть, что положительный ответ эквивалентен равенству Ит Ит /п(ж) = Ит Ит /п(ж). * Х-*Х() П-400 П-400 Х-*Х() В этом случае вопрос равенства повторных пределов имеет самостоятельное Значение, а проблема существования двойного предела даже не возникает. Ключом к решению в такого рода задачах является, как правило, та или иная разновидность равномерной Ьсодимости. 4.4.2. Определение. Последовательность функций /п(ж), поточечно сходя- сходящихся к /(ж) для любого ж 6 X, сходится равномерно, если по любому е > О можно указать такое N. что |Д(*) - /(*)| < е дм всех п> N и х € X. Идея равномерной сходимости может принимать разные облики. Поэтому важно ощущать саму идею, чтобы не запоминать слишком много определений. Вместо дискретного параметра п, например, может фигурировать непрерывный у, а вместо /п(ж) -)• /(ж) при п -)• оо — предельный переход /(х,у)->(р(х) при у^у0. 4.4.3. Теорема. Если последовательность непрерывных функций /п(ж) сходится К /(ж) равномерно на замкнутом ограниченном множестве X, то функция /(ж) •непрерывна на X. Доказательство. Сходимость /п(ж) к /(ж) означает /(ж) = /п(ж) + у?п(ж), где 1рн(х) равномерно стремится к нулю. Поэтому 1/(») - Пу)\ < 1Д(«) - Д(уI + Ы*I + ЫуI- Теперь по заданному е > 0 можно так выбрать п, что (в силу равномерного стремления <рп(х) к нулю) ЫI < для любого г € X. Затем для выбранного п можно указать такое 6 (в силу непре- непрерывности функций /п(ж)),чтоиз |ж-у| < 6 будет следовать |/п(ж) - /п(у)| < г/3, И в итоге |/(ж) - /(у)| < е. > Последовательность /п(ж) = хп при любом фиксированном ж € (О, 1) схо- сходится к 0, при ж = 1 — к 1. Иными словами, последовательность функций хп на [0,1] поточечно сходится к разрывной функции.
74 Глава 4. Функции п переменных Причина такой «неприятности» заключается в существенно различной ско- скорости сходимости хп при разных х (в неравномерной сходимости). Вот еще один общий результат (близкий по духу к теореме 4.4.1), который удобен на практике. 4.4.4. Пусть при любом х из некоторой окрестности точки а существует предел Нт/(ж, у) = ф(ж), а при каждом у из окрестности Ь существует предел у-+Ь Нт /(ж, у) = тр(у). Если при этом /(ж, у) стремится к <р(х) равномерно по ж, то оба повторных предела существуют и равны друг другу. (>) 4.5. Частные производные и дифференциал Для лучшей обозримости формул ограничимся случаем функции двух переменных 4.5.1. Определение. Частной производной функции и = /(ж, у) по х в точке (ж, у) называется предел = 11Ш 11Ш дх Дж-ю Дж Для д//дх используется также ряд эквивалентных обозначений ди/дх, и'х, Юхи. Аналогично определяется и1у. Таким образом, частная произ- производная — это обыкновенная производная по выбранной переменной, когда другие переменные фиксированы. Само по себе частное диффе- дифференцирование ничего нового по сравнению с обычным дифферен- дифференцированием не представляет. Примеры -, Зи -) ди и = ху =^ — = у , — = 2ху\ дх оу _ Т , _ К , _ Т ж = $т(о;2 + у>) =>• х\ = ш€о$(ш1 + <р), х<р = < Роль и специфика частных производных выявляется, когда речь заходит о полном приращении функции Аи = /(ж + Дж, у + Ау) - /(ж, у).
4.5. Частные производные и дифференциал 75 к Очевидно, откуда ясно, что Аи = И, как следствие, Ах /'х(х, у + Ау)Ах | Ау ,у)А Аи = , у)Ах D.3) НО при условии, скажем, непрерывности производной /'х в окрестности (ж, у), что Обеспечивает /'х(х, у + Ау) -> /Цж, у) при Ау -> 0. 4.5.2. Теорема. Если функция и = /(ж) имеет непрерывные в окре- окрестности тонки х = {х\,..., хп} частные производные, то справед- справедлива формула приращения D.4) Требование непрерывности частных производных, вообще го- говоря, не обязательно. Но так или иначе, просто наличия производ- производных, как в одномерном случае, уже недостаточно. 4.5.3. Определение. Функция и = /(#), полное приращение кото- которой представимо в виде D.4), называется дифференцируемой в точке Х={х\9.. .,хп}, а линейную часть приращения D.4) называют полным дифференциалом и записывают в виде D.5) Дополнительная характеристика «полный» здесь появляется В связи с тем, что выражения /^.(ж)йж, трактуются как частные дифференциалы1^. О пользе дифференциалов см. разд. 3.5. Правила частного дифференцирования обычны. Производная суммы равна сумме производных и т. д. Особо надо сказать о дифференцировании сложной 7) Есть и другая причина. В термодинамике, например, изучаются дифференциальные выражения ^ ^(я) &%%, не являющиеся полными дифференциалами.
76 Глава 4. Функции п переменных функции (композиции функций). Здесь может возникать ситуация изменения размерности. Например, функция двух переменных и = /(ж, у) может рассмат- рассматриваться на параметрически заданной кривой {хA),уA)} как функция одной переменной I. После перехода к пределу в Аи _ /(ж + Аж, у + Ау) - /(ж, у + Ау) Аж /(ж, у + Ау) - /(ж, у) Ау А?~ Аж А*" Ау А*' получаем В общем случае и = /(ж,,..., жп), ж, = ж,(уь ... ,уго), D.6) Однородные функции. Таковыми называют функции, удовлетворяющие тождеству /(*жь...,*жп) = Г/(жь...,жп). D.7) Величину т считают степенью однородности. Однородные функции довольно широко распространены. Примеры: Дифференцирование D.7) по I с учетом D.6) приводит к что при I = 1 дает формулу Эйлера ь... ,жп) D.8) 4.6. Дифференциалы высших порядков и ряд Тэйлора Частные производные можно снова дифференцировать, получая частные произ- производные все более высокого порядка. Например, для и = жу2 имеем д2и д ди _ Ох2 ~ Охдх~ ' д2и дхду д_ди_ дхду д2и _ д ди _ ду2~ дуду~ ' д2и д ди = 1Г1Г=2У- Факт совпадения смешанных производных (последняя строчка) — вещь харак- характерная, хотя и необязательная. Равенство д2и _ д2и дхду ~ дудх
4.7. Градиент 77 по своей природе является равенством повторных пределов и попадает в сферу действия теоремы 4.4.1. Справедлив следующий общий результат. 4.6.1. ТвОремЭ. Если функция и = /(Х|,...,хп) имеет в области X непре- непрерывные производные до т-го порядка включительно, то любая т-я смешанная производная дти не зависит от порядка дифференцирования. (>) Если говорить о дифференциалах высших порядков, то идеологически нового здесь ничего нет. Дифференциал от дифференциала дает второй дифференциал: в итоге — Общая формула такова: где суммирование а ведется по всем т\ + ... 4- тпп = т. Соответственно, разложение Тэйлора получается таким: что в самостоятельном доказательстве не нуждается, поскольку может быть получено разложением Тэйлора в нуле функции «одной переменной <р(т) = /(ж 4- тАг/), где Ах = 4.7. Градиент Каждая область нуждается в подходящих категориях мышления. Изучение функ- функций большого числа переменных на базе скрупулезного покоординатного опи- описания — это рытье котлована зубочисткой. Внутреннюю жизнь пространства п измерений определяют укрупненные понятия, разглядывание которых под мик- микроскопом не позволяет видеть панораму. С координатных представлений можно Начинать, но затем надо подниматься на уровень укрупненного манипулирования. Одним из инструментов следующего уровня является как раз градиент. Производная функции и = /(ж, у) вдоль направления единич- единичного вектора з = {зх, зу} равна * и' и' Кх + в3у + в3^8 + 8
78 Глава 4. Функции п переменных Вектор дП ' ду) называют градиентом функции /. Для градиента используют так- также обозначение V/ (читается «набла эф»). Из D.9) следует, что производную по направлению з можно записать как скалярное произведение ^ = 5-§гаё/. D.10) Максимум D.10), в силу $-§гаё/ = сов^ • ||§гас1/||, до- достигается, когда (р = 0 (т. е. единичный вектор з совпадает по направлению с градиен- градиента*1 / УА' том) и равен, соответствен- соответственна 11^/11 • Таким образом, градиент V/ — это век- вектор скорости максимально- максимального роста функции /. Сле- Следовательно, в каждой точ- точке поверхности /(ж, у) = = сопв! градиент V/ пер- перпендикулярен этой поверх- поверхности (направлен по нор- нормали). Таким образом, касательная плоскость — проходящая че- через точку {жо, уо} — к линиям постоянного уровня функции и = /(ж, у), описывается уравнением (на рис. 4.3 это пунктир- пунктирная прямая) Рис. 4.3 Если интерес представляет касательная плоскость к поверхно- поверхности графика функции и = /(ж, у), то это сводится к предыдущему случаю рассмотрением функции V = и - /(ж, у) трех переменных. Ее градиент 0ж' ду}' Поэтому касательная плоскость к поверхности и = /(ж, у) в точке {и(ь #о> Уо} определяется уравнением '-^-(У-Уо)-
4.9. Векторнозначные функции 79 Отталкиваясь от двумерного случая, легко записать касатель- касательные плоскости в общем случае и = /(ж), ж Е Кп. Причем, по упо- упомянутым в начале раздела причинам, делать это надо в векторных обозначениях. Уравнение касательной плоскости вйпк поверхности посто- постоянного уровня в точке жо: (ж - ж0) = 0. Уравнение касательной плоскости в Нп+1 к поверхности гра- графика и = /(ж) в точке {щ, жо}, ^о = /(ж0): и-щ = Для обживания территории Нп очень полезно переписать фор- формулы предыдущего раздела в векторном виде. Например, формула конечного приращения в векторных обозначениях приобретает вид 4.8. Теорема о среднем Применение теоремы Лагранжа 3.6.3 к функции скалярного аргу- аргумента (р(т) = /(ж + т(у - ж)) дает »/(*) (у,- - яг,-) = (у - х), где г = ж + <% - ж) при некотором О € @,1). Таким образом, 4.9. Векторнозначные функции Довольно часто в приложениях приходится рассматривать сово- совокупности функций У\ = !\{хх,...,хп), D-11) Уп = /п{хи...,хп),
80 Глава 4. Функции п переменных которые вектору х = {х\,... ,хп} сопоставляют вектор у = {уь--чУп}- Примером может служить частица, имеющая ско- скорость у = {уь!/25Уз}5 функционально зависящую от положения х = {хьж2,хз}. Громоздкое описание D.11) обьино заменяют на у = /(*), и говорят, что оператор / отображает х в у, называя / также отображением или функцией, и считая ж и у векторами одного и того же пространства8) Еп, Замена «длинной простыни» D.11) коротким описанием у = /(ж) — оче«ь важный шаг, характерный для матема- математики вообще. Внешняя сторона дела здесь сводится к сте- стенографическому трюку — и говорить вроде бы не о нем. Но главное заключается не в том, что экономится место и перестает рябить в глазах от формул. Главное в том, что возникает новая категория мышления, а для этого — помимо декларации на бумаге — должно «щелкнуть в го- голове», что само по себе не происходит. Требуются извест- известные усилия — иначе не получается. Сколько про матрицы ни читай — нужно время, чтобы они {матрицы) нача- начали восприниматься как нечто структурно единое, И это, кстати, нормально. Инстинкт не дает ходу скороспелым абстракциям. Иначе голова окажется полна обобщениями, которые цитрамоном не лечатся. Что касается теории пределов и непрерывности таких век- торнозначных функций /, то в обычных определениях модули меняются на нормы — вот и вся разница. Об этом уже говорилось в разделе 4.4, но там соответствующая замена происходила лишь наполовину, поскольку функция векторного аргумента сама оста- оставалась скалярной. Теперь метаморфоза полная. Для иллюстрации приведем две дефиниции. 4.9.1. Определение. Вектор А называется пределом отображения /: Кп -> Кп при х стремящемся к а (т. е. /(ж) -> А при х -> а), если по любому е > 0 8) Несмотря на то, что переменные х, у имеют обычно разный физический смысл, их можно считать векторами одного пространства в рамках общей системы измерений.
4.10. Линейный анализ 81 можно указать такое 8, что если ||*-а||<*. 4.9.2. Определение. Оператор /: Кп —> Кп называют непрерывным в точке х — о, если по любому е > 0 можно указать такое 6, что ||/(*)-/(а)||<е, если ||*-а||<<$, и непрерывным на множестве X, если он непрерывен в любой точке X. 4.10. Линейный анализ Линейная функция (скалярная) у = ах = а{Х1 принимает постоянные значения а • х = /? на «плоскостях» парал- параллельных плоскости а • х = 0. Дей- Действительно, из аи = следует а (м - г;) = 0, Рис. 4.4 Т. е. вектор и — у параллелен плос- плоскости а • х = 0 (рис. 4.4). Такие «плоскости» называют гиперплоскостями9^', чтобы под- подчеркнуть, что они не являются линейными пространствами, кото- которым положено вместе с векторами содержать их сумму. Другими словами, гиперплоскость — это плоскость, не проходящая через на- начало координат. Важную роль в анализе играет понятие линейного оператора, сопоставляющего вектору х = {х\9... 9 хп} вектор у = {уь ..., уп} по правилу: У\ = у2 = Уп = вп1 ^ А иногда — и просто плоскостями, допуская вольность терминологии.
82 Глава 4. Функции п переменных Таблицу коэффициентов А = называют матрицей, и коротко пишут у = Ах. Линейный оператор характеризуется двумя свойствами: АХх = ХАх, А(х + у) = Ах + Ау, которые в данном случае очевидны. Ниже приводятся некоторые сведения о матрицах, но надо иметь в виду, что знакомиться с этой кухней необходимо в рамках курса линейной алгебры. Не потому, что там говорится нечто эксклюзивно дополнительное, а потому, что всему свое место. Умножение матрицы на скаляр 7 и сложение А = [о|;] и В = [6|;] опреде- определяются так: 7 7« у у Перемножение А и В дает матрицу С — АВ с элементами п ]С <4Л2> Правило умножения матриц возникает автоматически, если на матрицы смотреть как на линейные операторы. Вектор х под действием оператора В переходит в г = Вх, а вектор г под действием оператора А переходит в у = Ал. Результирующее преобразование х в у определяется матрицей С = АВ с эле- элементами с1;, формула вычисления которых D.12) определяется обыкновенным приведением подобных. Матрица Ат с элементами о^ = о;| называется транспонированной к А. Обратной к А называют матрицу А~х такую, что где I — так называемая единичная матрица, 1= определяющая тождественное преобразование 1х = х. Иногда используют обо- обозначение / = <иа&{1,..., 1}. Единичный куб, построенный на векторах (ребрах) е' = {1,0,...,0}, е2 = {0,1,...,0}, ..., еп =* {0,0,... ,п},
4.10. Линейный анализ 83 под действием матрицы (оператора) А — [о|;] переходит в параллелепипед, построенный на вектор-столбцах А(п)_ I , . . . , А — Объем этого параллелепипеда назовем коэффициентом искажения объема матрицы А, и обозначим 6(А). С тем же коэффициентом искажения объема происходит преобразование Любого тела п. Действительно, п можно разбить на N мелких кубиков (со сто- стороной е и объемом еп), и тем самым сколь угодно точно приблизить объем п величиной N • еп. Каждый кубик под действием матрицы А перейдет в паралле- параллелепипед объема 6(А) • еп. Поэтому ясно, что матрица А искажает объем любого тела в 6(А) раз. Коэффициент искажения объема с точностью до знака равен детерминанту 9 определяемому как да А = ^(-1)'ИаИ1)аМ2)... ам{п), D.13) где а = {<тA),..., <т(п)} пробегает множество п! перестановок чисел {1,..., п}, а 1(а) обозначает число транспозиций (перемен местами какой-либо пары чисел) в <т. Определения типа D.13) раздражают значительную часть населения, которая, безусловно, права в естественном стремлении к наглядности. Если бы не знак, то определение детерминанта как коэффициента искажения объема было бы предпочтительнее. Но даже факт равенства |<1е1Л| = для ориентации в детерминантах дает, пожалуй, больше, чем формальное опре- определение D.13). Например, для коэффициента искажения объема очевидно 6(АВ) = {(А)8(В), откуда сразу следует |де*АВ| = \дехА\ • |ёе*В|, хотя, как известно, модули можно опустить: дех АВ - дех А деХ В. Детерминанты в линейном анализе играют важную роль в первую очередь потому, что позволяют отличить вырожденную матрицу, для которой дехА — 0, ОТ невырожденной (дехА^О). Вырожденная матрица А: • не имеет обратной А~х; • сплющивает объемы (до нуля)', • любые п линейно независимых векторов переводит в линейно зависимые векторы; • имеет (обязательно) линейно зависимые вектор-строки и линейно зависимые вектор-столбцы;
84 Глава 4. Функции п переменных • приводит к уравнению Ах = Ь, которое не решается при Ь ф О, а при 6 = 0 — имеет бесконечно много решений. Вообще Ах = 0 представляет собой п равенств Ащ • х = 0, где Ащ — 1-я вектор-строка. Каждое уравнение Ащ • х = 0 описывает (п - 1)-мерную плоскость с вектором нормали Ащ. Когда плоскости (нормали) находятся, как говорят, в ситуации общего положения, что определяется условием йехА ф 0, то они пересекаются в единственной точке (в нуле). Если плоскости сдвигаются (параллельно самим себе), Ащ • х = &,, то факт пересечения в единственной точке остается, откуда следует существование и единственность решения Ах = Ь при любом Ь. 4.11. Эквивалентные нормы Норма может определяться не только как ||ж|| = у/(х,х). Вооб- Вообще нормой вектора х € Яп называют положительное число ||ж||, удовлетворяющее следующим требованиям: 2. \\х + у\\ < ||ж|| + \\у\\ (неравенство треугольника); 3. ||аж|| = \а\ • ||ж|| для любого а е (-сю, оо). Всякая норма порождает метрику р(х9 у) = \\х - у\\. Помимо евклидовой нормы 1 / \ / \ \ / \ \ \ \ / ^ / х2 \ / \ / \ \ / / \ ч / N1 = часто используются еще две нормы: ||ж||т = тах|ж,-| Рис. 4.5 = Е 1=1 |ж|| В плоском случае единичные шары для этих норм, (квадрат) и ||ж||| < 1 (ромб), изображены на рис. 4.5. Норма однозначно определяется указанием единичного ша- шара, в качестве которого может быть «назначено» любое выпуклое центрально-симметричное тело. Многообразие норм обеспечивает удобства. Выбор нормы «под задачу», как правило, существенно облегчает решение. Основу сво- свободного манипулирования нормами дает следующее утверждение.
4.11. Эквивалентные нормы 85 4.11.1. В Кп все нормы эквивалентны (с точки зрения сходимости), т. е. для любых двух норм || • || 1, || • |Ь можно указать такие константы а и /?, что при любом х е Яп. <4 Для доказательства уместно вспомнить, что норма однозначно опреде- определяется заданием единичного шара. Функция (р(х) = ||я||| на множестве ||ж||2 = 1 достигает своих минимального G > 0) и максимального F > 0) значений 10\ Поэтому 711*112 <1М||^ОД|2 при любом х € Кп. > В силу 4.11.1 сходимость по одной норме эквивалентна сходи- сходимости по любой другой норме (речь только об Кп\). Поэтому для решаемой задачи можно выбирать наиболее подходящую норму без всяких предосторожностей. Нормой матрицы А называют положительное число ||Л||, удовлетворяющее тем же самым условиям 1-3, если в них векторы заменить на матрицы. Поскольку матрицы — это по существу линейные операторы в Кп, до- дополнительно необходимо согласование норм векторов и матриц, чтобы была возможность оценки образов Ах. Норма матрицы ||Л|| называется согласованной с нормой вектора ||ж||, если для любых А и х \\Ах\\ ^ \\А\\ • ||х||, и для любых матриц А и В выполняется неравенство \\АВ\\ ^ ||Л|| • ||В||. Чтобы неравенство ||л4ж||^||л4||-||ж|| давало хорошую оценку, оно должно быть неулучшаемо. Это мотивирует выделение в самостоятельное понятие подчиненной нормы матрицы: ||-А|| = тах ||.Ах||. 11*11=1 Нормам || • ||т и || • ||; подчинены, соответственно, п = тах У^ |о|;| (строчная норма), ||Л||/ = тах ^Г^ |о|;| (столбцовая норма). Евклидовой норме подчинена так называемая спектральная норма матрицы, равная квадратному корню из максимального модуля собственного числа мат- матрицы АТА. С вычислительной точки зрения это не совсем удобно — поэтому 10) В бесконечномерных пространствах это не так.
86 Глава 4. Функции п переменных в «евклидовом случае» чаще используют согласованную норму где суммирование идет по всем %,у. Упражнения Если ||х|| — некоторая норма, аМ- невырожденная матрица, то ||ж||м ЦМ»!! — также норма. 1. Норма матрицы, подчиненная норме ||ж||м, определяется как = \\М'1АМ\\. 2. В случае М = <Иа&{/л\,..., /лп}, ^ > О, 1 1 Ы\тм = тах —|ж,|, \\А\\тМ = тах — 1 & » м 4.12. Принцип сжимающих отображений Ряд принципиальных математических проблем сводится к разрешимости уравне- уравнения х = /(х) (хеХ). D.14) Точку х*, удовлетворяющую D.14) называют неподвижной точкой операто- ра/. Пару (X, р), где р(х, у) = ||ж - у||, называют полным метрическим простран- пространством, если любая последовательность Коши сходится. Другими словами, (X, р) полно, если из р(хп, хт) -> 0 вытекает существование предела у последователь- последовательности хп. 4.12.1. Отображение /, действующее в метрическом пространстве (Х,р), на- называется сжимающим (сжатием), если существует такое Л < 1, что Р(/(ж),/(у))^Лр(ж,у) для любых х,уеХ. D.15) 4.12.2. Всякое сжимающее отображение /, действующее в полном метрическом пространстве, имеет неподвижную точку х*, которая единственна. Последователь- Последовательные приближения ж*+1 = /(ж*) сходятся к х* независимо от х°. М Доказательство несложно. Покажем, что любая последовательность ж*, определяемая итерационной процедурой ж*+| = /(ж*), является последователь- последовательностью Коши. Очевидно, Их" - хт\\ ^ \\хп - /(*"
4.13. Неподвижные точки разрывных операторов 87 \\хп - хт\\ ^ \\фп)\\ + Х\\хп - хт\\ + ||у>ЮН, где у?(ж)=р(ж,/(ж)). Следовательно, Здесь мы воспользовались тем, что (р(х) на любой последовательности = /(ж*) убывает до нуля, поскольку у>(ж*+1) ^ \<р(хк), что вытекает из D.15). Остается заметить, что пространство (X, р) полно. Поэтому ж* -+ х*. В силу D.15) оператор / непрерывен. Следовательно, ж* = /(ж*). Двух неподвижных точек быть не может, благодаря тому же неравенству D.15). > Замечание. Принцип сжимающих отображений 4.12.2 остается в силе, если метрика р(х, у) определяется не обязательно с помощью нормы. 4.13. Неподвижные точки разрывных операторов Оператор /(ж) = {^(ж),..., /п(ж)}, действующий в Нп, называют монотонным, если все /,(жь ..., жп) монотонно возрастают (по каждой координате ж;). Вообще говоря, монотонность определяется более универсальным способом на базе полу- полуупорядоченности. Последнюю удобно вводить с помощью конусной идеологии. Замкнутое выпуклое множество К С Кп называется конусом, если ж € К, х Ф О влечет за собой -ж $ К и ах € К при а ^ 0. Простейший пример конуса — неотрицательный ортант К+ (множество точек х € Кп с неотрицательными координатами). Конус К позволяет ввести полуупорядоченность: ж ^ у, если ж - у € К. Монотонность /(ж) теперь означает, что /(«) ^ /(У)» если ж ^ у. Запись ж ^ п интерпретируется как ж ^ у, где у — любой элемент из множества п. При этом ж считается верхней гранью О. В случае К — Щ\. любое ограниченное множество п имеет точную верхнюю грань п) аир п. 4.13.1. Принцип Биркгофа—Тарского. Если монотонный оператор / ото- отображает в себя некоторое ограниченное замкнутое множество М, и существует точка ж0 € М, которая идет вперед, т. е. /(ж0) ^ ж0, то у / на М существует неподвижная точка х*, Уникальность этого результата заключается в том, что непрерывность / не предполагается (!) — хотя, казалось бы, возможность переопределения /(ж) в любых точках (коль разрывы допускаются) позволяет ликвидировать все реше- решения уравнения /(ж) = ж. Однако нельзя нарушать монотонность /(ж) — и это меняет дело. 11'То есть наименьшую точную грань. Другими словами, если и ^> Г2, то п ^ 8ирГ2 ^ и.
88 Глава 4. Функции п переменных Доказательство. Обозначим через О множество тех элементов х € М, кото- которые идут вперед, т. е. /(ж) ^ х. В силу /(ж0) ^ ж0 множество О не пусто. В наиболее распространенном случае К = К+ неподвижной точкой будет г = зирО. Действительно, из2^ж(ж€П)и монотонности / следует /(г) ^ /(ж) ^ ж. Это говорит о том, что /(г) — одна из верхних граней п. Но тогда /(г) ^ г (поскольку г — наименьшая верхняя грань), а значит г € Г2. С другой стороны, в силу монотонности /, что влечет за собой /(г) € П, но тогда /(г) ^ 2. Два противоположных неравен- неравенства дают /(г) = 2. Для произвольного конуса Л" доказательство ненамного сложнее, но там приходится ссылаться на так называемую лемму Цорна х2\ которая опосредованно гарантирует существование в п максимального элемента, т. е. такого элемента ж* 6 О, что ж ^ х* для любого х е п, х Ф х*. Если такой элемент х* е п существует, то /(ж*) бПв силу /(/(ж*)) ^ /(ж*), но тогда из максимальности х* вытекает /(ж*) = ж*. > 4.14. Дифференцирование оператора Оглядываясь назад, можно отметить, что дифференцируемость до сих пор сводилась к возможности линейной аппроксимации Д/ = А-Дя? + о(||Дя?||) D.16) приращения функции /(ж) в окрестности рассматриваемой точки. В одномерном случае А было численным коэффициентом, равным /'(ж). Для функции п переменных внешне все осталось тем же самым. Даже А = /'(ж), но /'(ж) стало вектором (градиен- (градиентом), а произведение в D.16) — скалярным. Для оператора /(ж), действующего вйп,т. е. /(*) = {/!(*),...,/„(*)}, тоже ничего не меняется, внешне. По-прежнему А = /'(ж), но те- теперь /'(ж) — это матрица размера пх п9 '«-К!- которую называют производной Фреше, или матрицей Якоби{3\ Плюс к тому, в /'(ж) • Ах подразумевается умножение матрицы на вектор. 12^ См. например, Колмогоров А.Н., Фомин С. В. Элементы теории функций и функцио- функционального анализа. 13) Вообще говоря, могут рассматриваться отображения / из Яп в Ят при п ф т. В этом случае матрица Якоби будет иметь размер т х п.
4.14. Дифференцирование оператора 89 Короче говоря, интерпретация меняется, форма — прежняя, Д/= /'(*)• Дя + о(|М|). D.17) Обратим внимание, что ничего нового(!) — по сравнению со случаем скалярной функции п переменных — здесь нет. Ска- Сказанное является не информированием с необходимостью последу- последующего обоснования, а констатацией ранее установленных фактов В новых условиях. Действительно, у = /(ж) в данном случае пред- представляет набор п скалярных функций у, = /,(ж), для каждой из которых по теореме 4.5.2 Объединение п таких неравенств в одну формулу D.17) никакого нового содержания не привносит, за исключением стенографиче- стенографического. Просто для краткости используется матричный язык. Другое дцело, что язык — вещь продуктивная. Таким образом, формула D.17) не нуждается в обосновании. Единственное, что надо отметить, для справедливости D.17) не- необходимо выполнение каких-то дополнительных условий типа не- непрерывности частных производных (см. теорему 4.5.2). 1 В качестве небольшой выгоды использования матричного языка отметим Пока, что умножение матриц Якоби сводит громоздкое дифференцирование сложной функции у = 1(д(х)) в одну строчку Ух = /д' 9х вместо п2 равенств 4.14.1. Теорема О Среднем. Пусть оператор / непрерывно дифференцируем, I в некоторой норме \\/'(г)\\^Х на отрезке, соединяющем точки х и у. Тогда 11/(*)-/МН<А||*-|г||. D-18) Доказательство. Разобьем отрезок г = тх + A - т)у, соединяющий ж и у, точками г{ на малые участки (полагая г^ — х,г1^=у).Ь силу D.17) где Д/, = /(^1+1) - /(я,). Отсюда ясно, что для любого е > 0 можно выбрать настолько мелкое разбиение, что
90 Глава 4. Функции п переменных Но тогда н/(*) - ш\ = IIЕ Л/«||< Е ндлII < (л+*> Е нд*н ^ I I I * Окончательный вывод дает предельный переход е -> 0. > Теорема 4.14.1, конечно, выпадает из предыдущего ряда теорем о среднем, но в большинстве случаев эти теоремы нужны как раз для оценок типа D.18). Поэтому потеря свойства /(*)-/(!/) = /'(*)(*"!/) при переходе к операторам большой беды не представляет. 4.15. Обратные и неявные функции Изучение многих задач часто упирается в принципиальный во- вопрос локальной обратимости отображения у = /(ж) в некоторой окрестности п рассматриваемой точки {а, 6}, а = /F). Другими словами, в вопрос существования такой функции х = 1~{(у)9 что Н/~1(у)) = У>что еи*е можно назвать однозначной разрешимостью в п уравнения у = /(ж). Без ограничения общности будем считать далее а = 6 = 0, чего всегда можно добиться заменой координат и = у - а, V = х -Ъ. 4.15.1. Теорема. Пусть оператор /, действующий в Дп, непре- непрерывно дифференцируем в окрестности нуля, /@) = 0 и матрица Якоби /'@) невырождена. Тогда в некоторой окрестности точки 0 оператор / обратим. Доказательство. Исходному у=/(ж) эквивалентно уравнение х = Ф(ж,у) с оператором 1 имеющим в нуле нулевую производную Фреше, Поскольку матрица Ф'х@, у) нулевая (при любом у), а сама производная Ф'х(ж, у) непрерывна и не зависит от у, то при некотором е > 0 в шаре ||х|| ^ е можно обеспечить такую малость элементов Ф'(ж, у), что ||Ф'(*,»)||<А<1. Поэтому (теорема 4.14.1) в шаре ||х|| ^ е оператор Ф(ж, у) сжимает с коэффици- коэффициентом Л при любом у, причем, в силу Ф@,0) = 0 и той же теоремы 4.14.1, Ф(ж, 0) переводит шар ||х|| ^ е в шар меньшего радиуса Хе. Это, в совокупности с не- непрерывностью по у, гарантирует, что при малых у (из некоторого шара ||у|| ^ 6) оператор Ф(ж, у) переводит шар ||х|| ^ е в себя. Далее остается применить теоре- теорему 4.12.2, которая обеспечивает единственную разрешимость уравнения у = /(ж) в окрестности {||ж|| ^ е, \\у\\ ^6}. >
4.15. Обратные и неявные функции 91 Вопрос. Где в доказательстве использована невырожденность /'@)? Визуальная интерпретация теоремы 4.15.1 довольно прозрачна. В одномер- одномерном случае невырожденность /'@) Ф 0 означает монотонность линейной аппрок- аппроксимации у = /'@)ж, которую в малой окрестности не может нарушить нелинейная добавка о(х). Монотонность же, в свою очередь, обеспечивает взаимную одно- однозначность функции. При п > 1 о монотонности речь не идет, но она и не нужна. Невырожденность работает иначе, обеспечивая ситуацию общего положения для аппроксимирующих плоскостей, что дает единственную разрешимость линейных уравнений у = /'@)ж при любом у. Нелинейная добавка о(||ж||) слишком мала (в достаточно малой окрестности), чтобы ощутимо изогнуть эти плоскости. Локальной обратимости / в каждой точке Кп, конечно, недостаточно для гло- глобальной обратимости. Последнюю обеспечивает простое дополнительное условие )|| = оо. D.19) 1йп | ||х|Ноо Доказательство соответствующего факта (теорема 9.9.1) приводится далее, но его полезно осознавать качественно. Образ /(В) некоторого шара В можно себе представлять как результат пластической деформации, которая не может привести к образованию складок — иначе в местах изгибов нарушалась бы локальная взаимная однозначность. Плюс к этому, в силу D.19) отображение / не может переводить слишком далекие точки В ограниченные заранее области. Поэтому, какую область X заранее ни взять, Граница /(В) будет лежать вне X. А поскольку из-за локальной обратимости / образы внутренних точек В не могут стать граничными точками /(В), то /(В) будет накрывать X, что означает разрешимость /(ж) = у при любом у € X, а значит и при у € Кп, в силу произвольности X. Многократно накрывать X образ /(В) тоже не может, иначе складки были бы где-то за пределами X. Рассмотрим функцию у = /(ж) У\ = х{ Уп-1 = а Уп = хп Матрица Якоби /'(*) = 0 \о Пример с компонентами + (р\(х2,.. + <р2(х3,.. ~дх~г 1 ... 0 .. дх~п . 1 )
92 Глава 4. Функции п переменных в данном случае имеет нули под диагональю, поэтому вычисление детерминанта по формуле D.13) совсем просто: Следовательно, /'(ж) везде невырождена, и /(ж) локально обратима при любом ж и любых (р<. Для глобальной обратимости у = /(ж) необходимо и достаточно выполнение условия D.19), которое также имеет место независимо от того, каковы функ- функции у?,. (>) Если в некоторой окрестности П точки (ж0, т/о)> Для которой Ф(ж0, Уо) = О, векторное уравнение и* Ф(я, У) = О однозначно разрешимо относительно ж, то говорят, что Ф(ж, у) = 0 определяет в п неявную функцию ж (у). 4.15.2. Теорема О неявной функции. Пусть Ф(ж0, у0) = 0; отображение Ф(ж, у) непрерывно по совокупности переменных и непрерывно дифференцируемо по ж в некоторой окрестности (ж0, т/о)> о производная Фреше Ф'х(ж0, у о) невырождена. Тогда уравнение Ф(ж, у) = 0 задает в некоторой окрестности точки (жо, т/о) неявную функцию ж(у), которая непрерывна. 4 Доказательство почти не отличается от доказательства предыдущей тео- теоремы. Надо лишь в качестве Ф(ж, у) взять Ф(ж, у) = х - К(ж0, Уо)]Ф(ж, у). > 4.16. Оптимизация Допустим, функция и = /(ж) имеет локальный максимум в нуле (/(ж) < /@) для ненулевых х из некоторой окрестности точки 0). Тогда функция одной переменной тоже имеет локальный максимум в нуле. Поэтому, в силу теоре- теоремы 3.6.1, все частные производные д{@)/дх{ обязаны быть нулевы- нулевыми, и, абстрагируясь от конкретики, можно утверждать следующее. 4.16.1. Если /(ж) в точке х = а дифференцируема и принимает локально экстремальное (максимальное или минимальное) значение, то У/(а) = 0. 14) Имеется в виду Ф: ЯпхЯт->Кп.
4.16. Оптимизация 93 Рис. 4.6 В двумерном случае линии постоянного уровня функции ц = /(жь Х2) в районе локального максимума выглядят примерно как на рис. 4.6. Замкнутые контуры стягиваются к центру, в кото- котором градиент «вынужден» быть направлен сразу во все стороны, что возможно лишь при его обнулении. Еще один аргумент: при ненуле- ненулевом градиенте всегда можно сдвинуться вдоль градиента, увеличивая значение функции х5\ Идея малых смещений (шевелений) продуктивна во многих задачах. Что- Чтобы понять ситуацию, имеет смысл пошевелиться (мысленно). С какой силой Р вода давит на боковую стенку аквариума? Виртуальное вдавли- вдавливание стенки на величину Ах поднимает уровень воды на АД. Допустим, ДЛ = а • Аж, вес воды — Р. Тогда приравнивая работу Р • Дж увели- увеличению потенциальной энергии Р • ДЛ/2, находим Р = Ра/2. Такая же история с локальной оптимизацией. В точке х максимум или нет ? Про- Пробуем шевелиться. Смещаемся по градиенту — /(ж) растет, значит — не максимум. Точки, в которых градиент обращается в нуль, называют кри- тинескими. Их многообразие, разумеется, не исчерпывается экс- экстремумами. ?, Как и в одномерном случае, где оптимум можно было оцени- оценивать по знаку второй производной, в общей ситуации тоже можно судить о характере критической точки по квадратичной части В разложении Тэйлора. Если второй дифференциал (называемый гессианом) положительно определен, т. е. ^^] > 0 при Ах Ф О, . . С/Х^иХ* ' На этой идее основаны градиентные методы поиска экстремальных точек. Движение ПО градиенту или под острым углом к градиенту увеличивает значение целевой функции.
94 Глава 4. Функции п переменных то в критической точке а — минимум (ибо в малой окрестности а будет /(а+Ах) > /(а)). В случае отрицательной определенности — максимум. При вырождении матрицы Гессе а2/ дх{дх1 ситуация принципиально усложняется. В скалярном случае о ха- характере критической точки можно судить по первому ненулевому члену ряда Тэйлора. Широко распространен миф, что для функций п переменных дело обстоит аналогичным образом. На самом деле это не так. Вопрос исчерпывающе решается в теории катастроф. В задачах оптимизации встречается много неожиданностей. Вот простая ловушка. Рассечем график функции двух переменных г = <р(х,у) вертикальной плоскостью, проходящей через нуль. Допустим, в любом сечении получается кривая, имеющая минимум в нулевой точке. Обязана ли в этом случае функция ср(х, у) тоже иметь минимум в нуле? Интуиция, воспитанная на простых примерах, дает положи- положительный ответ, но это неправильно. Пусть, например, г = <р(х, у) = (у- х2)(у - 2ж2). На любой прямой у = ах (а Ф 0) функция ф(х) = (р(х, ах) = а2ж2 - Зах3 + 2х4 принимает в нуле локально минимальное значение, поскольку ф"@) = 2а2 > 0. На прямых х = 0, у = 0 — тоже минимум. Тем не менее в сколь угодно малой окрестности нуля <р(х,у) прини- принимает не только положительные, но и отрицательные значения (для у = Cх2, 1</?<2). > Существенный интерес нередко представляет вопрос о гло- глобальных экстремумах. В одномерном случае локальный минимум при отсутствии других критических точек является одновременно глобальным минимумом. В общем случае это не так. Вот соот- соответствующий контрпример. Возьмем два бесконечных шнура АВ и СВ (рис. 4.7) и вытянем их по линиям уровня г = 1. Далее, приклеим к шнурам плоскую пленку и деформируем ее следую- следующим образом. Ниже АВ продавим пленку до минимума в точке О.
4.17. Множители Лагранжа 95 -1 , О 1 Рис. 4.7 Между АВ и С В — вспучим (чем левее, тем г больше). Выше СИ — образуем покат в минус бесконечность. Если теперь пленку принять за график функции г = <р(х,у), то по рисунку линий постоянного уровня легко понять, что единственная критическая точка — локальный минимум, но глобального минимума нет. Упражнение Если функция (р(х) имеет в точке х* локальный минимум, и 1ш1 \\<р(х)\\ = оо9 ||х|Ноо то в х* достигается глобальный минимум <р(х). 4.17. Множители Лагранжа Практические задачи оптимизации чаще всего имеют характер по- поиска условного экстремума, т. е. максимизации некоторой целевой функции /(ж) при тех или иных дополнительных ограничениях. Рассмотрим сначала ситуацию, в которой ограничение задается одним уравнением д(хи...,хп) = 0. D.20) Если точка х находится на поверхности д(х) = 0, то в направлении плюс/минус градиента Чд(х) двигаться нельзя — иначе точка х сразу сойдет с поверхности д(х) = 0, и условие D.20) нарушится (рис. 4.8 а). Можно смещаться в касательной плоскости (на бес- бесконечно малую Ах), т.е. перпендикулярно \?д(х). Если градиент У/(ж) не коллинеарен У</(ж), т.е. не совпадает по направлению с ±Чд(х), то у У/(х) есть составляющая в касательной плоскости
96 Глава 4. Функции п переменных Рис. 4.8 к д(х) = О, вдоль которой можно сдвинуться и увеличить тем самым значение /(ж). Этой последней возможности «сдвинуться и увеличить значе- значение /(ж)» нет в единственном случае, когда градиенты коллине- арны: у/(ж) = АУ#(ж) при некотором А Ф О, D.21) тогда в точке ж происходит касание поверхностей д(х) = 0 и /(ж) = Р (рис. 4.8 б) и достигается (возможно) условный макси- мум 16) Правило поиска, к которому мы пришли, заключается в сов- совместном решении D.21) (а это п скалярных уравнений, поскольку градиент — вектор) с уравнением D.20). На практике это оформ- оформляется немного иначе. Задача на условный экстремум /(ж) -> тах, д(х) = 0, D.22) заменяется равносильной оптимизацией лагранжиана по ж при надлежащем выборе А. В итоге все сводится к решению системы п + 1 уравнений: д(х) = 0 и д/(ж) дд(х) . - А =0, г = 1,..., п, относительно п + 1 неизвестных Жь...,жп, А. Коэффициент А называют множителем Лагранжа. ^ Условие D.21), таким образом, необходимое.
4.17. Множители Лагранжа 97 Что касается достаточных условий, то вопрос перепасовывает- ся лагранжиану. Если Ь(х, А) в найденной критической (говорят еще, стационарной) точке принимает локально максимальное (ми- (минимальное) значение по х, то это же можно сказать об /(ж) при условии д(х) = 0. Пример Решим задачу п п ]Г г|Л/ж~ -> тах, ^2 ж« = х> 1=1 1=1 которую можно интерпретировать как оптимальное распределение ресурса X по п ячейкам с эффективностью г^^/х1 от использования ресурса в количестве ж,. Действуя по регламенту, получаем: 1=1 1=1 Решение последней системы уравнений дает оптимальное распределение ресурса: Итоговая формула получается в результате бесхитростного решения выше- вышестоящей системы уравнений — и нуждается по этой причине в обосновании того, что найден действительно максимум. В первую очередь требует проверки возмож- возможность более эффективного решения на краю области. Такая возможность исключе- исключена, так как производная в нуле любой функции г,у^ж7 бесконечна и, следователь- следовательно, у каждой ячейки в нуле бесконечна скорость роста эффективности. Поэтому какое-то количество ресурса всем надо давать — иначе заведомо можно получить выигрыш, передав малую часть ресурса той ячейке, которая ничего не получила. Таким образом, решение должно лежать внутри рассматриваемой области и обязано улавливаться методом множителей Лагранжа. Поскольку «метод» других стационарных решений не обнаружил — на этом можно ставить точку. Рассмотрим теперь ситуацию двух ограничений д\(х) = 0 и 02(#) = 0- Как уже отмечалось в начале раздела, чтобы оста- оставаться на поверхности д(х) — 0, можно двигаться только пер- перпендикулярно градиенту Чд(х). В данном случае надо оставаться на обеих поверхностях одновременно, чего можно достичь, смеща- смещаясь перпендикулярно как Уд\(х), так и У^(^)« Другими словами, двигаться можно лишь перпендикулярно плоскости, проходящей
98 Глава 4. Функции п переменных через оба градиента. Если градиент целевой функции У/(х) лежит вне этой плоскости, то у него есть составляющая в разрешенном на- направлении, и значение /(ж) можно улучшать. В противном случае, = Х\^д\(х) + \2"Уд2(х) при некоторых Аь Аг ф О, разрешенных направлений нет, и точка х -— кандидат на решение. Общий случай рассматривается аналогично. Задача на условный экстремум /(ж) -+ шах, дх(х) = 09 ..., дт(х) = 0, D.23) заменяется оптимизацией лагранжиана ]=\ по х при надлежащем выборе Аь ... 9 Ат.
Глава 5 Интегрирование 5.1. Определения и общая картина 5.1.1. Определение. Операция, обратная дифференцированию, на- называется интегрированием. Функцию Р(х) -*- такую, что Р'(х) = /(ж),равносильно <1Р{х) = /(ж) их, — называют первообразной функ- функции /(ж) и/ш интегралом от /(ж). ^Ь?2/ ^(ж) с указанными свой- свойствами существует лишь на [а, Ь], то говорят, что функция /(ж) интегрируема на [а, Ь]. Если ^(ж) — первообразная /(ж), то и Р(х) + С — первооб- первообразная /(ж), поскольку производная константы С — нуль. Таким образом, первообразная определена с точностью до константы. 5.1.2. Определение. Совокупность всех первообразных /(ж) назы- называют неопределенным интегралом и обозначают / Имея перед глазами таблицу производных элементарных функ- функций, сразу можно выписать некоторые интегралы. Например, хх 6.x = А+1 А+1 + С а* их = -— + С (а > 0, о ф 1). та Добавление константы Г их Г их УЖ ^ 1 ¦+¦ • / 81П Ж д,Х = ~ С далее СО8Ж, опускается. §ж / ' У уТ соз хйх = 1х - ж2 8Н1Ж. агс8ш ж,
100 Глава 5. Интегрирование Все формулы элементарно проверяются дифференцировани- дифференцированием — производная правой части должна быть равна подынтеграль- подынтегральному выражению. Интересно, что дифференцирование не выводит из области элементарных функций, тогда как интегралы, например, 8Ш2 . Г Ах * / / не выражаются через элементарные функции. 5.1.3. Важная интерпретация. Если 8(х) обозначает площадь под графиком у = /(х) в промежутке от некоторого а до текущего значения х (рис. 5.1), то Ах равносильно Л8{х) = /(ж) их. Действительно, из рис. 5.1 геометрически ясно Д5 = 8(х + Ах) - 8(х) = /(ж)Дх + о(Да?), что влечет за собой 5'(ж) = /(ж). ^ Поскольку «геометрическая ясность» — это все же опора на интуицию, дадим более аккуратное доказательство. Обозначим через ^пип и ^тах наимень- наименьшее и наибольшее значения функции /(ж) на отрезке [ж, х 4- Ах]. Очевидно, площадь Л5 заключена между площадями (прямоугольников) 6™ А я и (тахЛг, поэтому Д5 При Аж -4 0, в силу непрерывности /(ж), и->/(*). и?->/(*). Но тогда по теореме «о трех собачках» А5/ Аж -> /(ж), т. е. 8 '(ж) = /(ж). >
5.1. Определения и общая картина 101 Таким образом, площадь 8(х) под графиком у = /(ж) — это первообразная функции /(ж). Изменение точки отсчета а добавляет к 5(х) константу. От любой другой первообразной Р(х) функ- функция 8(х) отличается на постоянную величину, поэтому всегда 8(Ь)-8(а)=,Р(Ь)-Р(а), что численно равно площа- площади под графиком у = /(ж) на промежутке [а, 6]. Если /(ж) на [а, Ь] меняет знак, то из построения ясно, что площади фигур между гра- графиком и осью х засчитыва- ются со знаком «плюс» там, где /(ж) > 0, и — со зна- знаком «минус» там, где /(х) < 0 (рис. 5.2). Рис. 5.2 5.1.4. Определение. Разность Р(Ь) -Р(а), где Р(х) — первооб- первообразная /(х), называется определенным интегралом функции /(х) в промежутке от а до Ь и обозначается как В случае переменного предела интегрирования 1) ^Переменная интегрирования (немая переменная) изменена на I, чтобы избежать х некорректной записи / /(хLх.
102 Глава 5. Интегрирование Заметим, что разность Р(Ь) — Р(а) часто записывают в виде Примеры 1. Площадь под синусоидой I 81 8111 X б,Х = - СО8 ж|* = 2. 2. Площадь под экспонентой (на [0,1]) { х _ г|1 _ / 1о 3. Длина дуги. На рис. 5.3 Дз обозначает длину дуги кривой у = /(ж) между точками А и В. Из прямоугольного треугольника АВС Поэтому из = у/\ 4- у72 (/ж. Интегрирование дифференциала <Ь от а до 6 дает формулу вычисления длины дуги на любом конечном участке. Тестовый пример — длина ск окружности х2 + у2 = К2. На верхней полуокружности X В результате их -я -я Нельзя сказать, что формула о = [ сколько-нибудь часто применяется на практике, но это фрагмент общей идеоло- идеологии. В фундаменте всегда есть кирпичи, на которые почти нет нагрузки, — но без них не обойтись. 4. Рассмотрим еще один пример, где важен не результат, а метод. Площадь круга радиуса К можно представлять как сумму площадей тонких колец радиуса г
5.1. Определения и общая картина 103 (рис. 5.4) и толщины Аг. Площадь кольца (слоя) в первом приближении, оче- очевидно, равна 2тггАг. Это определяет дифференциал площади круга 6,8 = 2тгг 6т при разбиении на кольцевые слои, что позволяет вычислить площадь круга к Такого рода способы широко распространены при вычислении различных ха- характеристик геометрических тел. Теория площадей, например, строится на базе покрытия плоских фигур мелкими квадратиками с последующим предельным переходом. Метод хорош своей универсальностью, но в конкретных случаях существуют более экономные приемы, использующие специфику задачи. При из- известной формуле длины окружности разбиение круга на квадратики выглядело бы издевательством. у = 1п х Рис. 5.4 Рис. 5.5 5. В русле предыдущего примера определим площадь поверхности враще- вращения2* при вращении кривой у = /(ж) вокруг оси х. Малый элемент длины дуги 6з вращается вокруг оси х на расстоянии у = /(ж). Поэтому площадь, описываемая элементом 6з при полном обороте, равна 68 = 2жу6з = 2тгу\/1 +у'2йх, что после интегрирования в тех или иных пределах дает желаемый «криволиней- «криволинейный» результат. Вращение полуокружности, например, порождает сферу, площадь которой можно вычислить по найденному рецепту: их = 4тгД2. ' = 2тг I уу/\ 4- у12 6х = 2тг I у/в2^ -я -я ^ 2 б. Формула Стерлинга. Сумма 1п п! = 1п 1 4-... 4- 1п п равна сумме площа- площадей заштрихованных прямоугольников (рис. 5.5), и может быть приближенно 2' Мы стараемся делать вид, что все предельно просто, но здесь есть подводные камни, см. «парадокс Шварца».
104 Глава 5. Интегрирование заменена площадью под кривой 1п х. Поэтому 1п п! ~ / 1пх их = (х 1п х - х)\" ~ 1п ( - ) , 1 т. е. п! ^ (п/е)п. Прибавление площадей выступающих над кривой 1п х треуголь- треугольников приводит к более точному результату Упражнения 1. Зная площадь сферы, найти объем шара. Показать: 2. 1[/(х)±д(х)]ах = I Лх)Лх± I д(х)<1х. 3. [ а/(х) их - в / /(ж) Ах. 4. Ь а 5. I }{х)йх = - I }(х)йх. ь ь ь 6. [ к/(х) ах = к [ /(х) ах. а а ъ ь ь 7. У [/(*) ± д(х)} Лх = I /(х) Лх ± I д(х) их. а а а Ь с Ъ 8. I /(*) лх = I Лх) ах + 1 /(*) ах. Ь 9. //(ж)<*О0, если 5.2. Уточнения и формальности Слабое звено предыдущего раздела — использование понятия пло- площади, которое не было строго определено. С другой стороны, упоминание площади адресовалось лишь к визуальному чутью
5.2. Уточнения и формальности 105 и никак не затронуло данные определения. Тем не менее, есть одна принципиальная особенность, которая требует оговорок. Данное выше определение 5.1.4 нестандартно. Стандартное определение опирается на другую схему. Про- Промежуток [а,Ь] разбивается на п отрезков [ж,-,Х{+{] длины Да;,, где Хо = а, хп = Ь (рис. 5.6). На каждом г-м отрезке выбирается произвольная точка &, и рассматривается сумма п-\ 1=0 5.2.1. Эквивалентное 5.1.4 определение. Предел суммы а при стремлении к нулю максимальной длины Аж, называется определен- ь ным интегралом /(х) от а до Ь и обозначается / /(ж) Лх. а Из определения 5.2.1 сразу вытекает свойство аддитивности: Уточнения требует существование предела, а также его не- независимость от характера стремления Аж, к нулю и от выбора точек &. С этой целью на каждом промежутке [ж*, 2^+1] берутся точная нижняя га* и точная верхняя М, границы /(ж), и вводятся
106 Глава 5. Интегрирование в рассмотрение две суммы Дарбу (нижняя и верхняя) п-1 п-1 1=0 1=0 В силу з<<7<5' (поскольку га,^/(&)<М*) очевиден следующий результат. 5.2.2. Для существования определенного интеграла необходимо и до- достаточно 8 — з —> 0. Таким образом ответственность определения 5.2.1 за существо- существование предела перекладывается на плечи сумм Дарбу. В непрерыв- непрерывном случае такое «провисание» доводится до логического конца: ь 5.2.3. Если функция /(ж) непрерывна на [а, Ь], то интеграл 1/(х) их существует. ~ < Здесь выстреливает теорема 2.7.6 Кантора, гарантирующая равномерную непрерывность /(ж). Это означает, что по любому е > 0 можно указать такое 6 > 0, что Дх, < 6 => М{\ - т\ < е, откуда п-1 п-1 ^2(М{ - Шг)АХг < в ]Г Ах( = в(Ь - а), 1=0 1=0 что дает 5 - 5 -> 0. > Понятно, что в случае кусочной непрерывности /(ж) (конеч- (конечного числа разрывов) результат 5.2.3 остается в силе, поскольку О С\ С,+ | О где С{ — точки разрыва. Если теперь рассмотреть интеграл X Ф(х) = [ /(«),
5.3. Теоремы о среднем 107 как функцию верхнего предела, то х+Ах ДФ = Ф(х + Ах) - Ф(х) = / /(*) A1 = /@Д« + что приводит к Ф'(ж) = /(ж) (т. е. Ф — первообразная) и уста- устанавливает в конечном итоге эквивалентность определений 5.1.4 и 5.2.1. > Отметим наконец, что в случае существования интеграла ь I }{х)йх в указанном выше смысле функция /(ж) называется интегрируемой по Риману, а сам интеграл — интегралом Римана. 5.3. Теоремы о среднем При манипулировании определенными интегралами нередко тре- требуются оценки в виде неравенств. Вот очень простой, но часто используемый факт. 5.3.1. Теорема о среднем. Если т < }(х) < М на [а, &], то (Ъ - а) < Г /(ж) их < М(Ь - а). < При опоре на определение 5.1.4 доказательство сводится к ссылке на теорему о среднем Лагранжа 3.6.3. Если исходить из определения 5.2.1, то доказательство также элементарно. > 5.3.2. Пусть на [а, Ь] функция д(х) знакопостоянна и га < /(ж) ^ М. Тогда ь ь 1(х)д(х)Ах = р ] д(х)Ах при некотором /х € [га, М]. (>)
108 Глава 5. Интегрирование 5.4. Приемы интегрирования Техника интегрирования опирается на знание простейших интегра- интегралов и некоторые специальные приемы. Кое-что уже упоминалось в разделе 5.1 в качестве упражнений. Далее рассматриваются неко- некоторые стандартные способы интегрирования. 5.4.1. Линейная замена переменной. Если Р(х) — первообразная функции /(ж), то /1 /(ах + Ь) их = -Р(ах + Ь). а При некотором навыке надобность в запоминании таких правил отпадает, ибо их проще выводить по мере надобности, чем «носить с собой». Формула проверяется обыкновенным дифференцированием: Вот несколько примеров ее применения. Напомним, что для неопределен- неопределенного интеграла мы ограничиваемся записью одной первообразной. х + а Г их _ 1 Г их _ 1 ^ ] х2 + а2 а2 У 1 + (х/аJ а а' 81П кхйх = —- соз кх, 5.4.2. Общая замена переменной. Если Р(х) — первообразная функции /(ж), то Другой вариант записи того же факта: 1 Пд(х))ад(х)=Р(д(х)). Это «вывернутое наизнанку» правило дифференцирования сложной функции. Но если «прямой вариант» при дифференци-
5.4. Приемы интегрирования 109 ровании работает автоматически, то здесь требуется изобретатель- изобретательность. Каждый раз при интегрировании / Н(х) их вопрос упира- упирается в подбор представления с легко интегрируемой функцией /(•), что находится в сфере изобретательской деятельности. Приведем несколько иллюстрирующих примеров. хйх 1 Г их2 Г = ; Здесь можно произвести замену х2 — I, взять интеграл / -—— и потом вернуться к переменной ж, получив Ф(х) = A/2)агс1ёж2. Разумеется, промежу- промежуточную переменную можно «держать в голове», не записывая. Совсем простая ситуация: / 81П5 X С08 Х&Х—\ 81П5Ж й 8111 X = - 81П* X. , В] все Конечно, в приведенных примерах замена переменной «сама напрашивает- напрашивается». Везет не всегда. Не так легко, например, додуматься, что проблему взятия /Ах —=== решает замена I = у/\ 4- х2 + х. Возведение 1-х = %/1 4- х2 в квадрат дает откуда 5.4.3. Интегрирование по частям. Коротко: и Aу = иу - V Ли, т.е. /Г и(х) д,у(х) = и(х)у(х) - / у(х) йи(х). Опять «выворачивание наизнанку», но уже правила диф- дифференцирования произведения. Если учесть йу(х) = у'(х) <1х и йи(х) — и'(х) их, то дифференцирование I ийу = иу — / у Ли приводит к обычной формуле дифференцирования произведения.
110 Глава 5. Интегрирование Примеры ж аЧп ж = х\пх- I Ах = х 1п х - х. откуда 1. / 1п х их = х 1п х - I 2 2. I X СО8 X их = / Ж (/ 8Ш Ж = Ж 8111 Ж - / 81П Ж О*Ж = Ж 8111 Ж + СО8 Ж. /_ / Г Л2 — Т2 — Л2 V сг - ж2 (/ж = ху/ог - ж2 - / —. (/ж = У V а2 - ж2 /г- г Г /~- г 2 Г ЛХ = ху« -ж / \ о. — х аж 4-а / —з 1 1 у/а2 - ж2 г , ж /-г г а . ж - ж2 их = - л/а2 - х2 4- — агсзш —. 2 2 а Круг задач в области интегрирования различных функций до- довольно широк. Но все они имеют к матанализу весьма отдаленное отношение в том смысле, что мало связаны с пониманием суще- существа интегрирования. Скорее, это упражнения в сфере «ловкости манипулирования» — так же, как, скажем, избавление от ирра- иррациональности в знаменателе, которое к природе иррациональных чисел никакого отношения не имеет. Рядовой стиль манипулирования при взятии интегралов примерно таков: ах Г (/(ж/2) /*со8(ж/2) ф/2) 8ШЖ ~~ У 81П (ж/2) СО8 (ж/2) ~~ / 81П (ж/2) СО82(ж/2) ~~ Ж -I = 1п ж2-а2 2а\х-а — )(/ж=~ х + а) 2а Ч(х/2) Aп |ж - а\ - 1п |ж 4- а\) = ж -а Та' ж 4- а 5.5. Дифференциальные уравнения Теория дифференциальных уравнений начинается с рассмотрения простейших ситуаций, в которых решение задачи получается обык- обыкновенным интегрированием. Например, (II
5.5. Дифференциальные уравнения 111 х х <1х <1х Г Лг щ Щ х@) О В том и другом случае видно, что помимо интегрирования надо задать х в начальный момент (если I время). Во втором случае особенно важно взять интеграл (чтобы довести дело до конца). Если, например, Р(г) — первообразная функции 1/Л(г), то в итоге получается что неявно задает решение х(г). Можно действовать также несколько иначе, используя в при- приведенных выкладках неопределенные интегралы (вместо опреде- определенных). Тогда после интегрирования получаются формулы с кон- константами С, значения которых можно определять из начальных условий. Остывание чайника описывается уравнением где ^ > 0 — коэффициент, характеризующий теплоотдачу, Т(Ь) — температура в момент времени I, То — температура среды. Действуя по второй схеме, получаем3* что дает (с учетом Т > То) То-Т Го - То) = & =* ТA) = То + (Г@) - То)е* Го При использовании неопределенных интегралов получилось бы Откуда, полагая I — 0, имеем С — 1п (Т@) - То). Итог, естественно, тот же. Реактивное движение. Пусть в неподвижной системе координат в неко- некоторый момент времени масса ракеты равна М, скорость — V. Через малый промежуток времени Д2 скорость ракеты увеличится на Аи, масса уменьшится на АМ, причем АМ будет иметь некоторую скорость V. *' Интегрировать по Г до Г, вообще говоря, некорректно (так же, как суммировать по л до п). Для «немой» переменной суммирования или интегрирования положено выбирать другую букву, но часто удобнее пользоваться той же.
112 Глава 5. Интегрирование Закон сохранения количества движения Му = (М- АМ)(у + Ау) + АМ V после деления на АМ и перехода к пределу при АМ -» 0 приводит к уравнению ё,М о *1Г где Т^ = V — V — скорость истечения газов. Интегрирование последнего уравнения приводит к = /йу = -V, ( ^ = -^ 1пМ + С. Константа С определяется, например, из условия М = Мо при V = 0, что дает V = У81п (Мо/М), откуда следует формула Циолковского М ' Инвариантное погружение. Тело, брошенное вертикально вверх, при нали- наличии силы сопротивления воздуха тп(}(у) описывается дифференциальным урав- уравнением ту = -т# — т/3(у), т. е. *> = -*-/?(</). E.1) Интегрирование E.1) определяет скорость V как функцию времени, после чего можно решать те или иные сопутствующие задачи. Вычислять, например, максимальную высоту Л(ио), на которую поднимется тело при начальной скоро- скорости Уо. Но это в принципе, ибо, как говорится, легко сказать. Интегрирование E.1) * =ь + с, дает4) что лишь неявно определяет уA). В то же время естественно желание иметь формулу для Н(уо) , минующую решение посторонних задач. Для этого приходится «заходить с другого конца». Тело, летящее вверх со скоростью V, за время Д2 поднимается на высоту АЛ = уА1 и теряет в скорости Ау = (# + /3(у))А1. Если зависимость Н(у) максимальной высоты от начальной скорости существует, то обязано выполняться соотношение Н(у) = АЛ + Н(у - Ау) + о(), E.2) т. е. Н(у) = уАг + Л [V - (# + Р(у))А1\ + о(-), или, равносильно, Н(у) = уА1 + Н(у) - Ы(у) Константа С определяется начальными условиями, 1>@) = 1>о-
5.6. Несобственные интегралы 113 Отсюда у6,у Г у Лу При р(у) = 0 получается известный результат Н — Функциональные уравнения типа E.2) многократно обыгрывались в разных контекстах. В том числе в контексте инвариантного погружения кон- конкретной задачи в семейство задач, где начинают «звучать» молчавшие до этого связи. В приведенном примере это всего лишь переход от фик- фиксированного у0 к переменному. Идея, на первый взгляд, не бог весть как значительна, но она меняет направление мысли. Беллмана такая идея привела к созданию динамического программирования. На той же почве произрастает изящный метод освобождения жестких связей в механике (принцип виртуальных перемещений). 5.6. Несобственные интегралы ь Понятие определенного интеграла / }{х)д,х естественным об- / }{х) а разом обобщается на случаи неограниченного промежутка [а, Ь] и неограниченной функции /(ж). 5.6.1. Несобственный интеграл функции5^ /(х) от а до оо опре- определяется как предел (конечный или бесконечный) E.3) Если предел конечен, то говорят, что интеграл E.3) сходится. Если бесконечен, то — расходится^. Аналогично определяется интеграл а а 1(х)Aх= \хт I $(х)<1х. E.4) -оо А 5' Определенной и интегрируемой на любом отрезке [а, Л]. 6' Если предел вообще не существует, как, например, в случае / 8т х Лх, то иногда тоже говорят, что интеграл расходится. Когда значение нижнего предела а не играет роли (как в данном случае), его просто опускают. 00 / 8т
114 Глава 5. Интегрирование Наконец, если существуют оба интеграла E.3) и E.4), то /(*) ах = I !(х) ах +1 /(*) ах. Примеры А г ах х1~р 1. При р ^ в случае р — 1 В результате при Л -> оо имеем 00 2-У т 3. По закону гравитационного притяжения Мт где М — масса Земли, К — расстояние до центра Земли тела массы т. Если потенциальную энергию бесконечно удаленного от Земли тела считать нулевой, м(оо) = 0, то, интегрируя работу Е аК по удалению тела в бесконечность, получаем л Мт = -7" Вторая космическая скорость у^ (позволяющая улететь в бесконечность) определяется из условия Мт и(оо) - и(Ео) = 7-д- = где Ко — радиус Земли.
5.6. Несобственные интегралы 115 4. В момент г = О двигатель лодки выключается. Какое расстояние лодка пройдет по инерции, если скорость в момент выключения — гг0, а сила сопротивления воды пропорциональна скорости, Р = -$у ? Интегрирование уравнения движения, йу дает V то Константа определяется из условия у@) = у0. В итоге т Окончательно, = / »Л= —^- 5. При вращении графика кривой у = 1/ж в диапазоне A, оо) вокруг оси х образуется тело вращения (рис. 5.7), объем которого определяется по формуле У = к Ах получаемой как результат предельного суммирования объемов колец радиуса у = 1/х и толщины Дж (АУ — тгу2Аж). У=1/х х >- АХ Рис. 5.7 Интересно, что объем тела ограничен, но вертикальное плоское сечение, (X) проходящее через ось ж, имеет бесконечную площадь (!) 8 = 2 I — = оо. от положи- 6. Часто думают, что для сходимости интеграла / /(ж) 6.x тельной функции /(х) требуется /(ж) -> 0 при ж -> оо. Это, правда, больше психологический вопрос, чем математический.
116 Глава 5. Интегрирование На самом деле, если /(ж) равна нулю вне треугольных пиков (высотой 2 и шириной осно- основания 1/п2) в районе целочисленных аргументов (рис. 5.8), то 7 1 = ]Г—<оо. Принципиальный вопрос в приложе- Рис. 5.8 ниях: сходится ли несобственный инте- интеграл? Многие результаты в этом направ- направлении перекликаются с признаками сходимости числовых рядов. 00 Особую роль играют абсолютно сходящиеся интегралы I }(х)йх, оо 3 сходящиеся вместе с / \}(х)\Ах. Соответственно, повышенное внимание уделяется интегралам от положительных функций. Вот несколько простых фактов, доказательство которых может быть использовано в качестве упражнения. 1. Если 0 < /(ж) ^ д(ж) при достаточно больших ж, то 00 00 сходимость I д(х) их => сходимость I /(х) их, расходимость I /(ж) их 2. Если существует конечный предел расходимость у я(х) ах. Шп Щ- = М > О, «-к» д(х) то оба интеграла сходятся или расходятся одновременно. Пусть теперь функция /(х) определена на [а, 6), интегрируема на любом отрезке [а, с] С [а, Ь) и уходит в бесконечность при х -> Ь - 0, т. е. при х стремящемся к Ь слева.
5.6. Несобственные интегралы 117 5.6.2. Несобственный интеграл о / ЦХ)ЛХ= 1Ш1 / ^ с-+ь-о ^ функцииу уходящей в бесконечность при х -> 6 - 0, определяется как предел (конечный или бесконечный) E.5) Как и в предыдущем случае, если предел конечен, то говорят, что интеграл E.5) сходится. Если бесконечен (или не существует), то — расходится. В указанных выше условиях точку Ь называют особой. Из кон- контекста, надо полагать, ясно, что представляет собой несобственный интеграл, если особой является «левая» точка а, обе, а и 6, либо некоторая точка внутри отрезка [а, Ь]. Примеры 17- *' 1-. 1. При р ф 1 в случае р = 1 В результате при с ~> 0 4- 0 имеем I-/ = - 1пс. I 2. / \пх<1х = (х\пх - ж)|0 = -1. Минус — следствие того, что интеграл о учитывает площади, лежащие ниже оси х> как отрицательные.
118 Глава 5. Интегрирование '¦/ = агс8ш 1 - агс81П 0 = -. 2 агс8ш 1 агс81П 0 1 — х2 2 о \. I 1% X 6.Х = - / 4. I Х&хйх = - I = - 1п со8Ж|п = оо. созх о о 5.7. Интегралы, зависящие от параметра В прикладных задачах приходится рассматривать функции, возни- возникающие в результате интегрирования. Например, ь Ф(у) = 11{х,у)йх. E.6) Поскольку интегрирование обладает улучшающими свойства- свойствами (из интегрируемой функции делает непрерывную, из непре- непрерывной — дифференцируемую), то многие манипуляции с Ф(у) можно менять местами с операцией интегрирования при довольно свободных предположениях относительно функции /(ж, у). Вот простые и легко доказываемые факты. 5.7.1. Если равномерно7^ по х, то ь а ь ь \\т I /(ж, у)Ах= I 1тг /(ж, у) их, (>) У->Уо^ 3 У-+УО 5.7.2. Пусть функция }{х,у) и частная производная д$(х,у)/ду непрерывны в прямоугольнике [а,Ь] х [с, Л]. Тогда 7' Равномерная сходимость по г в данном случае означает: по любому е > 0 можно указать такое <5, что |/(ж, у) — <р(х)\ < е при любом ж, как только \у — #о1 < 6-
5.7. Интегралы, зависящие от параметра 119 при любом у € [с, й], **/ио в случае зависимости верхнего предела интегрирования от у дополняется равенством ч>(у) ч>(у) а а где имеется в виду <р(у) Е [а, 6]. (>) 5.7.3. Если функция 1(х,у) непрерывна в прямоугольнике [а,Ь] х [с,0\, то а ь ь & /(ж, у) Ах = I их I /(ж, у) ау. (>) с а ас Выдвигаемые требования к /(ж, у) не выглядят слишком жест- жесткими, но и они могут быть ослаблены. Выходит, что интегриро- интегрирование для стандартных операций анализа не воздвигает больших преград. Предельные переходы могут свободно проникать «сквозь интеграл» снаружи внутрь, и наоборот. Проблема усложняется при переходе к несобственным интегралам, где приходится опираться на дополнительное условие равномерной сходимости интегралов. В случае оо А х, у) ах = 1ип / /(ж, у) ах E.7) А-+(x>^ а а это означает равномерную сходимость E.7) по у, т.е. по любо- любому е > 0 можно указать такое В, что при А > В выполняется неравенство оо А /(ж, у) ах- / /(ж, у) ах <е у для любого у из рассматриваемой области У. Для несобственных интегралов на конечном промежутке типа E.5) ключевым также оказывается условие равномерной сходимости интегралов, определяемое по аналогии с предыдущим. Выполнение соответствующих условий приходится проверять отдельно, либо «в лоб», либо опираясь на различные достаточные
120 Глава 5. Интегрирование признаки. В более сложных случаях используется так называемая теорема Арцела, но это уже инструмент из «другой оперы». Контрпримеры Рецепт, взятый сам по себе, всегда представляет определенную опасность. Необходим фон, намечающий границы... Для теорем — это контрпримеры. при условии 0 ^ х ^ у; при условии у ^ х ^ 1. ° В случае /(О, у) = 2/у 1 1 Ит / /(х,у)<& = 1, / Ит /(ж, у) их — 0. у-ю ^ 3 у-^о 2. Рассмотрим функцию /п(ж), равную 1/п при условии О^г^пи нулю для х > п. Очевидно, последовательность функций {/„} равномерно сходится к нулю на [0, оо), но Ит / /п(ж) их — 1. п-юо ^ Упражнение Пусть /(ж, у) — \/у2 в области А (рис. 5.9), ж, у) — -1/х2 в области В и /(ж, у) = 0 я на границе А и В. Тогда 11 ж, у)йхАуф /(х, у) Ау Ах. 1 5.8. Двойные интегралы Рис. 5.9 Объем V цилиндрического тела (рис. 5.10), стоящего на основа- основании В в плоскости ху и ограниченного в направлении г поверх- поверхностью г = /(ж, у), можно приблизить суммой E.8)
5.8. Двойные интегралы 121 которая представляет собой сумму объемов вертикальных столбиков высотой /(ж,, $/,), стоящих на малых квадратиках с площадью Ах(Ау(. Величины е, 6 обозначают максиму- максимумы |Аж,-|,|А^|. Предел У(е, 6) при измельчении разбие- разбиения фигуры В называется двойным интегралом функции }{х,у) по области В и обозначается {(х,у)<1х<1у= Ит У(е,6). 60 Заодно получается интерпретация двойного Рис. 5.10 интеграла как объема, заключенного под гра- графиком г — /(ж, у). Короче говоря, все развивается по образцу определенного интеграла от функции одного переменного, с той разницей, что промежутки заменяются плоскими фигурами. Совер- Совершенно аналогично вводятся суммы Дарбу и т. п. Принципиальная тонкость заключается в допуске к рассмотрению только квадрируе- мых областей В, которые характеризуются тем, что ограничены кон- контуром, имеющим нулевую площадь. Площадь кривой, в свою очередь, определяется (упрощенно говоря) как предел суммы покрываю- покрывающих кривую квадратиков при бесконечном их измельчении. Для простых областей В никаких проблем не возникает. Более того, придумать «проблемную» область В — сложная задача. Если г — /(ж, у) = 1, то где 8в — площадь фигуры В. Таким образом, двойной интеграл может использоваться для вычисления площадей. Что касается возможного диапазона обозначений, то вместо произведения дифференциалов их д,у иногда пишут дифференциал площади A8, вместо // — просто / , если из контекста ясно, о чем идет речь. Наконец область В может заменяться ее описанием типа х2 + у2 < 1. Сведение двойного интеграла к повторному. Практически — это единственный метод вычисления двойного интеграла, заслужива-
122 Глава 5. Интегрирование ющий внимания. Снова всплывает теория повторных пределов. Другое дело, что в случае непрерывных функций /(ж, у) и про- простых ограниченных областей В никаких проблем не возникает. Например, в условиях прямоугольной области повторные инте- интегралы из утверждения 5.7.3 оказываются равны как раз двойному интегралу л ь ь й II /(*> у) йхйу= I Ау I /(ж, у)Лх= I их I /(ж, у) йу, [ауЬ]х[с4] с а ас что представляет собой не что иное, как равенство повторных пределов двойному для аппроксимирующей суммы E.8) У(е, 6). Двойные интегралы, естественно, могут рассматриваться и на бесконечных областях, но тогда уже встают вопросы равномерной сходимости интегралов (см. пред. раздел). Рассмотрим теперь область I), изображенную на рис. 5.11. По у она ограничена кривыми у = а(х) и у = C(х), переменная х меняет- меняется в прежних пределах, от а до Ь. Опять-таки, если все фигурирую- фигурирующие функции непрерывны, то, оче- очевидно, Рис. 5.11 ]] /(ж, у) йхЛу = у их I /(ж, у) Aу. Другой повторный интеграл использовать проблематично из-за то- того, что описание граничных точек В дает неоднозначные функции ж от у. В общем случае выход из поло- положения подсказывает рис. 5.12. Отрезок [а, Ь] подразделяется на промежутки, в пределах которых область В мож- можно покусочно описывать с помощью ограничений по у некоторыми кри- кривыми типа у = а(х) иу = /?(ж). Рис.5.12
5.8. Двойные интегралы 123 Упражнение Площадь круга ж2 4- у2 ^ Я2 (рис. 5.13) я у/я2-х2 я = I ах I йу = 2 / л/Д2 - х2 с1х = тгД2. Замена переменных. При вычислении двойных интегралов довольно часто эф- Рис. 5.13 фективным инструментом оказывается взаимно-однозначная заме- замена переменных {х, у} = 0& г)) = {х(Ь V), у& V)}, E.9) упрощающая или область Б, или функцию /(ж, у). Например, в полярных координатах {г, ^}, {Ж = Г СО8 ^?, У = Г 81П ^, круг ж2 + у2 ^ Л2 оказывается прямоугольником [О, Я] х [0, 2тг). Функция /(ж, у) меняется при этом на /(г со8^>, г 8т^). Остается вопрос о со- соотношении дифференциалов площади их йу и йг д,у>. Коэффициент искажения объема — в данном случае площади — в малой окрестности точки {г, <р} опре- определяется величиной (см. разд. 4.10) |с1е1:0'(г, (р)\ = г, /дх дх\ Следовательно, И \дт д,хд,у= -гвт<р\ гсовср) = тгД2, о о что с вычислительной точки зрения проще прямолинейного взятия интеграла, использованного выше. В общем случае замены E.9) формула перехода к новым пере- переменным такова , у) Лх йу = , г,), у($, г,)) |<1е( <?({, г))\ 'ху E.10)
124 Глава 5. Интегрирование Сопоставление с правилом замены переменной в определенном интеграле E.11) где а = ж(а), Ь = ж(/3), обнаруживает принципиальную разницу. Очевидно, |ж'(^)| является коэффициентом искажения длины, но знак модуля в E.11) отсутствует. Причина заключается в том, что промежуток интегрирования в E.11) ориентирован (а <Ь либо а > Ь), и от этого зависит знак интеграла. Двойной же интеграл опре- определялся пока на неориентированных областях. Однако возможен другой подход. Области придается ориентация заданием направления обхода ограничивающего контура — положительного или отрицательного. Соответственно, площади ори- ориентированной области приписывается знак плюс или минус При этом в формуле замены переменных модуль с детерминанта снимается. 5.9. Кратные интегралы Тройной интеграл по области В от функции и = /(ж, $/, я) опре- определяется как предел /// }{х,у,г)йхйуйг= Ит У(е,6, и), 333 еД^-И) где У(е, б,и) = а е, 6, V обозначают максимумы |Аж,|, |Д$/,|, |Д2,*|. Аналогия с двойным интегралом полная. Область И под- подразделяется на малые кубики (со сторонами |Дж*|, |Ду;|, |Д^|), и в качестве отправной точки рассматриваются суммы E.12), ко- которые, например, можно рассматривать как естественные оценки (приближения) массы тела В с плотностью распределения масс /(я,2/,г)- Дальнейшее развитие теории (в том числе интегралов большей кратности) идет по тому же пути, что и двойных интегралов. Суммы Дарбу, повторное интегрирование, несобственные интегралы и т. п. Замена переменных происходит по той же самой формуле E.10), если отвлечься в E.10) от количества переменных. Объемы П-мерных тел. В описании стандартных п-мерных тел обычно фигурирует некий характерный размер а, входящий в неравенства вида <р(х, а) Функции <р, как правило, однородны, т.е. <р(тх, та) = тк(р(х, а),
5.9. Кратные интегралы 125 что позволяет с помощью замены х = ^а перейти к рассмотрению «единичных» тел (а = 1). При вычислении объема это приводит к формуле \У(д) = аяУA),\ E.13) поскольку с1е1 х'^ = ап и V. П Таким образом, объем п-мерного куба со стороной а равен У(а) = ап. В более сложных случаях обычно применяется индукция по размерности пространства. Например, для вычисления объема Тп(Н) п-мерного симплекса: ж, 5* 0,..., хп 5* 0; ж, + ... + хп ^ Л, к цели быстро ведет преобразование • /" *^ Ч = у^п у...у *...| где все (,) 0 и в силу E.13). Учитывая теперь, что Т](\) = 1, последовательно приходим к ТпA) = 1/п!. Окончательно При вычислении объема Вп(г) п-мерного шара х] + ... + х2п^г2 работает аналогичный трюк, п-1 ж/2 У' -1 0 В итоге преодоления рутины для четной и нечетной размерности простран- пространства получается:
126 Глава 5. Интегрирование 5.10. Механические задачи Вращение И моменты инерции. При вращении механического тела вокруг некоторой фиксированной оси с переменной угловой скоростью ш(Ь) = фA) каждая частица массы Аш,, находящаяся от оси на расстоянии г,, движется со скоростью V, = г,ы и ускорением V, = г, о; = Г{ф. Умножая закон движения каждой частицы Дт,-#,- = Рг на г,- и суммируя по г, после перехода к пределу при АтПг -> 0 получим где М — результирующий момент действующих сил, / — момент инерции тела, представляющий собой интеграл / г2 Ат, в котором суммирование производится по объему тела. у Найдем моменты инерции некоторых стандартных тел. 1. Однородный стержень длины /. Ось вращения проходит перпендикулярно стержню через его конец (рис. 5.14) Элемент длиной д.т имеет массу 6т = т д.г/1. Поэтому Aт о Рис. 5.14 Рис. 5.15 2. Обруч при условии, что ось вращения проходит через центр и лежит в плоскости обруча (рис. 5.15). Из соображений симметрии ясно, что моменты инерции относительно пер- перпендикулярных осей ж, у равны, /х = /у, где 1х—х2 дт, 1У — I у2 6т, = Зх + 1у = I [х] + у]) 4т= [ К2с1т = тК2, откуда 2/
5.10. Механические задачи 127 что дает тК2 3. Однородный диск радиуса К. Ось проходит через центр перпендику- перпендикулярно плоскости диска (рис. 5.16). Выделим из диска обруч радиуса г и бесконечно малой ширины йт. Его масса (8 — площадь) д,8 Ъ дг Поэтому тК2 Рис. 5.16 4. Однородный диск радиуса К относительно диаметра (рисунок тот же, но теперь ось лежит в плоскости диска). Момент инерции выделенного обруча (рис. 5.16) относительно диаметра равен д.1 = Aтг2/2. Отсюда я я тК2 5. Теорема Штейнера. Если момент инерции /0 относительно оси, проходя- проходящей через центр тяжести тела, известен, то момент инерции /д относительно параллельной оси, отстоящей от первой на расстоянии а, определяется формулой Подстановка в/= I г2 йт значения (рис. 5.17) г = го + а =» г2 = Го + а2 + 2г0 • а, с учетом / г0 йт = 0 дает нужный результат. О Рис. 5.17
128 Глава 5. Интегрирование Рис. 5.18 6. С каким ускорением полый цилиндр радиуса К скатывается с наклонной плоскости (рис. 5.18)? Уравнение моментов относительно мгновенной оси вращения (точки в данном случае имеет вид аъ В силу V = шК и 1^ = 2тК2, ускорение цилиндра получается равным V = -# 81П а. ^ Момент силы трения в этом случае нулевой.
Глава 6 Функциональные ряды Представление функций в виде бесконечных сумм, /(ж) = со<ро(х) + с{<р{(х) + ... + сп<рп(х) + ..., F.1) играет в анализе важную роль. По аналогии с конечномерным случаем функциональные ря- ряды F.1) интерпретируются обычно как запись /(ж) в координатной форме, сп — п-я координата, (рп(х) — направляющий вектор п-й оси. Постепенно выясняется, что за этим стоит гораздо больше, чем просто внешнее сходство. Принципиальной особенностью разложений F.1) является воз- возможность приближения функций /(ж) частичными суммами /п(ж) = СО(ро(х) + ... + Сп(рп(х). Вопрос сходимости /п(ж) -> /(ж) обычно подменяют вопросом стремления к нулю хвоста ряда съ(рк(х) -» 0 при п -» оо. F.2) к=п+\ Но F.2) влечет за собой сходимость /п(ж) лишь к некоторой функ- функции, к «эф ли от икс?» — это уже другая задача. Дело в том, что проблемы нет, когда само разложение F.1) служит определени- определением /(ж). Если же /(ж) определяется как-то иначе, то необходимо еще обосновать, что правая часть F.1) сходится именно к /(ж). 6.1. Равномерная сходимость Под равномерной сходимостью ряда 00 2^спу?п(ж), F.3) п=0
130 Глава 6. Функциональные ряды в соответствии с определением 4.4.2, подразумевается равномерная сходимость к нулю его хвоста F.2) на рассматриваемом отрез- отрезке [а, Ь]. Равномерной сходимостью ряда на бесконечной (либо неза- незамкнутой) области X будем называть его равномерную сходимость на любом ограниченном замкнутом подмножестве X. 6.1.1. Теорема. Пусть все функции <рп(х) непрерывны на отрезке [а,Ь] и ряд F.3) сходится равномерно. Тогда его сумма /(ж) — непрерывная функция. Результат сразу следует из теоремы 4.4.3. > 6.1.2. Теорема. Пусть функции (рп(х) непрерывны на [а,Ь], и ряд F.3) сходится равномерно. Тогда ряд F.3) можно почленно интегри- интегрировать, т. е. интеграл от суммы ряда /(ж) равен ^ Доказательство элементарно. Из равномерной сходимости к нулю хво- хвоста ряда следует стремление к нулю интеграла хвоста ь п ь (х) йх-^2,ск I <рк(х) их -» О и а при п ~> оо. > 6.1.3. Теорема. Пусть функции (рп(х) непрерывно дифференциру- дифференцируемы на [а,Ь], и равномерно сходится как ряд F.3), так и ряд, составленный из производных: п=0 Тогда почленно продифференцированный ряд F.4) сходится к произ- производной /'(ж), т.е. Отсюда вытекает, что равномерно сходящийся ряд можно почленно интегри- интегрировать без всяких дополнительных условий. Для почленного дифференцирования
6.2. Степенные ряды 131 условия нужны, но они естественны: взятие производных не должно нарушать равномерную сходимость ряда. Доказательство последней теоремы моментально вытекает из предыдущей. В предположении противного интегрирование F.4) вступало бы в противоречие с теоремой 6.1.2. > 6.1.4. Если \сп<рп(х)\ < Ъ при любом хеХ, 00 и числовой ряд ^Oп сходится, то ряд F.1) на X сходится равно- равномерно. Доказательство совсем просто. > 6.2. Степенные ряды Фундаментальную роль в теории степенных рядов спхп F.5) п=0 играет следующий простой результат. 6.2.1. Если ряд F.5) сходится при каком-то х = г, то при условии \х\ < \г\ он сходится абсолютно, а при \х\ < \г - е\ еще и равномерно {при любом малом е > 0). 4 Если все слагаемые положительны, результат абсолютно прозрачен. В случае произвольных знаков вывод может показаться даже неожиданным. Тем не менее... Из сходимости Со + С\Г + с2г2 + ... вытекает спгп -> 0, а значит и ограни- ограниченность: \спгп\ < М. Поэтому для |ж| < \г\ будет <МЦг <00> п=0 что обеспечивает абсолютную сходимость. Эта же выкладка в паре со ссылкой на утверждение 6.1.4 дает требуемую равномерную сходимость. > Из 6.2.1 сразу следует, что область сходимости степенного ряда — это всегда промежуток (-К,К), в котором ряд сходится, причем всегда абсолютно, а на любом сегменте [-г, г] С (—В, Е) — равномерно. п=0 п=0
132 Глава 6. Функциональные ряды В результате можно гарантировать, что на (-Я, Я) степенной ряд сходится к непрерывной функции, и его можно почленно интегри- интегрировать и дифференцировать. Ч Необходимая (по теореме 6.1.3) равномерная сходимость на [-г, г] С 00 (-Д,-К) почленно продифференцированного ряда ^^сппхп~1 следует из того, что этот ряд мажорируется (при любом 5 Е (г, К)) числовым рядом п-\ •"-¦ который, в свою очередь, в силу п (г/з)п 1 -> 0 сходится вместе с ^2 сп«п- > Радиус сходимости Я может быть конечным *) или бесконеч- бесконечным. Что касается сходимости ряда на концах промежутка (-Я, Я), то ситуации могут быть разные (встречаются все мыслимые). Примеры 1. Ряды е* = 1+*+^ + ... + ^ + ..., F.6) 8ШЖ-Ж 3!+*-- + ^ 1> Bп+1)!+*-- (Ь*/; сходятся при любом ж, что моментально выводится как из признака Коши 2.8.4, так и из признака Даламбера 2.8.5. 2. Те же признаки Коши и Даламбера легко позволяют установить сходи- сходимость степенных рядов 1 - - -2,3 = 1 + х + х2 + ж3 +..., F.8) 1 — х ъ х5 + ..., F.9) х2 хъ х5 но уже при |ж| < 1. Во всех перечисленных случаях признаки Коши и Даламбера позволяют точно уловить границы сходимости, т. е. заодно определяют радиусы сходимости рядов, что в каком-то смысле закономерно. В общем случае радиус сходимости ряда F.5) вычисляется с помощью верхнего предела по формуле К'1 = 11т у\сп\. п-юо В том числе нулевым, когда ряд сходится только при х = 0, например, ^ ппхп.
6.3. Ортогональные разложения 133 (!) Важно заметить, что в приведенных примерах установлено лишь то, что касается сходимости непосредственно рядов. Левые же части формул F.6)-F.9) никакого обоснования пока не имеют. Ряд х — хъ /3! +... сходится, но — к сину- синусу ли от ж, определяемому с помощью прямоугольного треугольника? Разложение Тэйлора на действительной прямой ни в коей мере это не подтверждает, что уже обсуждалось в разделе 3.7. Строгое и красивое обоснование подобного рода фактам дается в теории аналитических функций (гл. 10), где загадочные вещи из теории рядов становятся прозрачны. Разумеется, свет клином на аналитических функциях не сходится, но «обыкновенное» доказательство формул типа F.6)-F.9) создает впечатление, что столбовая дорога остается где-то в стороне. Кустарные методы здесь выглядят примерно так. Сумма убывающей геометрической прогрессии 1 жп+| Оп = 1 + Х + X2 + ... + ХП = 1 — х при п -> оо дает F.8). Некоторые ухищрения с предельным переходом позволяют установить F.6). Равенство F.9) выводится почленным интегрированием ряда — = 1 - ж + ж2 - ж3 + ..., 1+ж /их = 1п A + х). И так далее. о 6.3. Ортогональные разложения Назовем F.10) скалярным произведением функций / и д. Поначалу это может показаться странным, но F.10) действительно опреде- определяет операцию, которая удовлетворяет обычным свойствам скалярного произве- произведения. Аналогия с конечномерным случаем на этом не заканчивается. Функции считаются векторами, а равенство F.1) — их координатным представлением. Конечно, здесь не все так просто, как выглядит, но будем пока придерживаться оптимистической ноты. Систему векторов (базис) .^пМ-} F.11)
134 Глава 6. Функциональные ряды назовем ортогональной, если о (<Рп,<Рт) = I (рп(х)(рт(х) 4х = 0 при тфп, F.12) и ортонормальной, если дополнительно |/2 F.13) В случае ортонормальной системы F.11) — умножая F.1) на <рп(х) и инте- интегрируя от а до Ь — получаем / Я*)<Рп(х) Ах = ^2ск / что с учетом F.12) и F.13) дает формулу для определения коэффициентов сп (координат /(ж)) F.14) Теорема Пифагора в рассматриваемой ситуации п=0 F.15) называется равенством Парсеваля. Из F.15) следует, что разложение F.1) любой интегрируемой с квадратом функции имеет коэффициенты сп ->• 0. Примеры В приложениях широко используются различные ортогональные системы. Например, известная тригонометрическая система 1, СО8Ж, 5ШЖ, ..., СО8ПЖ, ВШПХ, ..., F.16) ортогональная на [-тг, тг] 2\ служит основанием для знаменитых рядов Фурье. Ортогональность F.16) легко проверяется, например, I со8 пх со» кхАх — - II п + к п- к СО8 X + СО8 X Л 4х = о при п фк. ' Либо на любом другом промежутке длины 2тг.
6.3. Ортогональные разложения 135 Нормирование^ F.16) дает ортонормальную систему: 1 созх $шх созпх 8т пх Достаточно широко используются ортогональные на [—1,1] полиномы Ле- жандра^ 1 Ах2-!)" П(Х'" 2»п! их» • Конечно, есть резон задаться вопросом, не идет ли речь о воздушных зам- замках. Во-первых, задание скалярного произведения с помощью F.10) порож- порождает новую меру близости — норму F.14) — и предельные переходы теперь выводят за пределы пространства непрерывных функций. В результате приходится допускать к рассмотрению совершенно новые объекты — так называемые функции из Ь2, — которые довольно непривычны и требуют привлечения нестандартных инструментов (интегрирования по Лебегу). Во-вторых, используемые ортогональные системы должны быть полны — в том смысле, что любую функцию можно представить в виде F.1), — для проверки чего нужен инструмент. Поставленные проблемы удовлетворительно решаются, но уже в рамках другой дисциплины — функционального анализа. В то же время «инструменталь- «инструментальная» часть ортогональных рядов существенна для классического анализа. Поэтому затронутая тематика исторически застряла на полпути. В своей основе она излага- излагается в рамках «классики», но при этом обходятся стороной некоторые острые углы. Пространство 2^2[а, 6] — это пространство функций /(ж), для которых существует интеграл от /2(ж), и скалярное произведение определяется по фор- формуле F.10). К необходимости такого определения однозначно подталкивает все, что сказано по поводу ортогональных разложений. В то же время, если подра- подразумевается обыкновенное интегрирование, то данное определение Ь2 внутренне противоречиво, поскольку фундаментальные по норме F.13) последовательности могут сходиться к неинтегрируемым по Риману функциям. То есть — к функциям, норма которых не определена из-за невозможности интегрирования. Ситуация в свое время была не из легких. Выход из положения нашел Лебег, разработавший более общую теорию интегрирования. Интегралы Лебега и Римана совпадают, если оба существуют. Причем инте- интеграл Лебега — кроме «спокойствия души» — ничего не дает, и в части вычислений о нем можно даже не упоминать. Принципиальную важность имеет сама возмож- возможность интегрирования по Лебегу. Это сводит концы с концами. Примерно как иррациональные числа. В приближенных вычислениях они не используются, но, заделывая бреши, превращают вещественную прямую в нормальное игровое поле. ' Умножение <рп на подходящие множители, чтобы выполнялось условие F.13). 4) Популярны также ортогональные на [-1,1] полиномы Чебышева Тп(х) = со$ п агссоз х, но там в основе лежит иначе определяемое скалярное произведение.
136 Глава 6. Функциональные ряды Интеграл Лебега в стандартных курсах анализа, если и упоминается, то вскользь, а его теория5* не излагается. Полнота ортогональных систем — это тоже проблема функционального анализа — и пытаясь расставить все точки над 1, можно увязнуть на другой терри- территории. Но в общих чертах здесь многое понятно. Решающую роль играют аппрок- симационные теоремы Вейерштрасса. Одна такая теорема 3.7.2 уже упоминалась: Для непрерывной на [а, Ь] функции /(ж) и любого е > О всегда можно указать такой полином Рп(х), что |/(ж)-Рп(ж)| <е для любого ж е [а, Ъ]. F.17) Аналогичное утверждение имеет место для функций из Ь2 с заменой нера- неравенства F.17) на ||/(ж) - Рп(ж)|| < е, где норма определяется равенством F.13). Поэтому система {1, ж, ж2,...} — полна в Ь2, равно как и любая ее ортогонализа- ция, сохраняющая возможность разложения F.1) с любыми коэффициентами. Это сразу устанавливает полноту полиномиальных систем (Лежандра, Чебышева и др.). Остается заметить, что «история» почти дословно повторяется для триго- тригонометрических полиномов, что гарантирует полноту систем, лежащих в основе рядов Фурье. Упражнение Коэффициенты Сп, обеспечивающие минимум >тт, F.18) *=о определяются формулой F.14). Оптимальность коэффициентов сп с точки зрения F.18) плюс полнота системы {<рп(х)} — это как Раз та комбинация, которая позволяет гарантировать, что разложение F.1) сходится именно к /(ж), если сп считаются по формулам F.14). Подразумевается, конечно, сходимость в среднем, т. е. по норме Ь2. 6.4. Ряды Фурье Рядами Фурье называют различные вариации разложения функ- функций по ортогональным тригонометрическим системам 6), например, по FЛ6), т.е. {1, со8ш;,ьтпх} (п=1,2,...). 5) Совпадающая по своему «философскому» значению с теорией дедекиндовых сечений вещественных чисел. 6* Только по синусам, только по косинусам и др. Рядами Фурье называют также разло- разложения вообще по ортогональным системам.
6.4. Ряды Фурье 137 Нормализация и подсчет коэффициентов разложения по фор- формуле F.14) в этом случае приводят к представлению 00 Пх) = у + Х!/(ап С08 пх + ^п 8*п пх) (-7Г <х <ж), F.19) где 1 /* 1 Г ап = — / /(х)со$пхс1х, Ьп = — / /(ж) з тг У тг У Разложение F.19) можно представить в эквивалентной форме 00 п=0 при очевидном пересчете коэффициентов. Упражнения Проверить справедливость разложений: П=1 Представление F.19) легко переносится (с помощью замены переменных) на функции, заданные на произвольном отрезке. Например, в случае [-/, /] п=1 где /(Ж) = у + 2^ ( ап СО8 — Ч- 6„ 81П — ) , F.20) п=1 ^ ' о. = уУ/(Осов^Л, 6„=уУ/(<)8ш^(й. F.21) Частичная сумма п »(*)=Т + 2>*со$ х+ *ип х) сходится к /(ж) — но только в среднем, т. е. по норме Ь2.
138 Глава 6. Функциональные ряды Другие вопросы тоже легко решаются в Ь2. Причина понятна. Идеология, формулы подсчета коэффициентов — все проистекает из Ь2. Никто, тем не менее, не запрещает интересоваться, как обстоят дела в слу- случае непрерывных либо кусочнонепрерывных функций. Тут, конечно, приходится городить новый огород, потому что хозяйство прибыло из 2/2, а его насильно ак- акклиматизируют в других условиях. Все меняется с первой строчки. Знак равенства в F.19) трансформируется в «~», потому что теперь не ясно, куда ряд сходится. Потом, конечно, выясняется, что — «более-менее, куда надо», но с оговорками. Чтобы в точке х ряд сходился к /(ж) — накладывается, например, условие Дини: сходимость интеграла при некотором е > 0. В местах разрывов ряд сходится к полусумме значений функции слева и справа. А разрывов не удается избежать даже в «непрерывном случае» по той причине, что ряд, если уж сходится на [—/,/], то в силу собственной периодично- периодичности он сходится на всей оси — к функции, периодически продолженной с [-/,/] на (-оо, оо). Периодическое же продолжение /(ж) обязательно порождает разры- разрывы, если /(-/) Ф /(/). Поэтому на краях промежутка [-/,/] сходимость «специ- «специфическая». Зато, если /(-/) = /(/), то среднее арифметическое частичных сумм п+1 сходится равномерно к /(ж) на всей оси {теорема Фейера). Затем возникает проблема равномерной сходимости в обычном смысле. Затем — изучается характер убывания коэффициентов. Потом — особенности. Далее — почленное интегрирование и дифференцирование. Теория начинает занимать тома, но это имеет свои плюсы. Здесь, может быть, имеет смысл приоткрыть завесу над прикладной зна- значимостью математики. Неписанный этикет, который циники называют мошенничеством, предписывает напоминать о важности любой теоремы, большой или маленькой, правильной или неправильной. Для открытия фи- финансирования это действительно важно — но в том нет никакой беды, ибо так устроен мир. Более того, в том заключена мудрость, посколь- поскольку от науки требуется не эффективность1^, а незатухающее тление. Главная проблема — чем-то занять ученых. Не так важно чем, но — по специальности. Пусть доказывают ненужные теоремы, публикуются и спорят. Это поддерживает квалификацию и не дает увлечься коммер- коммерцией. В противном случае ученые выведутся, и станет ясно, что «были нужны», а новых негде более взять. Поскольку мир устроен достаточно мудро, математики постоянно заняты. В результате каждая дисциплина содержит кое-что «лишнее». С другой стороны, присмотришься к человеку — тоже... необязательные детали. Но убери их — и человека нет.
6.5. Интеграл Фурье 139 Что касается рядов Фурье, то они, конечно, очень сильно разрослись. Тому, однако, есть серьезная причина — особая роль гармонических колебаний, каковыми называют обыкновенные синусоиды хA) = Аъ\п{2™1 + 6), F.22) где А — амплитуда, V — частота^, 6 — сдвиг по фазе. График зависимо- зависимости амплитуды гармоник F.22) от частоты — в разложении /(г) — называют спектром /(г). Синусоиды в этом мире служат решениями линейных дифференциальных уравнений — и в этом их главное предназначение. Линейные дифуры, со своей стороны, удовлетворяют принципу суперпозиции, что поднимает роль гармо- гармонических колебаний еще выше. Если, например, Х\(Ь) и Жг@ — решения дифференциального уравнения *-* = /(*), F.23) соответственно, при /(г) = /\(г) и /(г) = /г@> то х\A) + Х2^) будет решением того же дифура при /(г) = /\(Ь) + /г@- Поэтому разложение /($) в ряд Фурье сводит F.23) к совокупности однотипных дифуров с гармонической правой частью. При этом свойства спектра определяют резонансные, фильтрационные и другие явления. В миниатюре это дает намек на возможности гармонического анализа. 6.5. Интеграл Фурье Ряд Фурье — это обязательно периодическая функция. При увеличении периода 2/ в F.20) спектр /(г) все плотнее заполняется гармониками с круговыми частотами: ж 2п пж отстоящими друг от друга на Аш = п/1. В предположении абсолютной интегрируемости /(г) , |/(<)| «й < оо, F.24) предельный переход в F.20) при / ->• оо заменяет суммирование интегрированием: /(х) = / (в„, со$и/а: + Ьш &тшх) бы, F.25) где аш,Ьш получаются предельным переходом — > аш, — >ЬШ при Аш ->• 0 (т.е. при / ->• оо), ' Чтобы избавиться от утомительного написания 2тг, используют круговую частоту
140 Глава 6. Функциональные ряды что дает 00 00 = - I /(*) СО8 (лI (И, Ъш = - Г F.26) Коэффициент а0 при I -> оо пропадает в силу F.24). Подстановка F.26) в F.25) после использования формулы косинуса разности двух углов приводит к F.27) что, собственно, и называют интегралом Фурье. Формулы F.27) и F.25) эквивалентны. Первая — более прозрачна понятий- понятийно. Вторая — маскирует содержание, но компактна. Проделанные манипуляции дают правильный результат лишь в тех или иных дополнительных предположениях. Например, F.27) в точке х обеспе- обеспечивается выполнением условия Дини. Если в F.27) /(ж) слева заменяется /(ж + 0) + /(ж-0) , то формула становится верной в довольно свободных на предположениях.
ЧАСТЬ II ОБЗОРЫ И ДОПОЛНЕНИЯ Без пассивной части словарного запаса, активная — перестает работать. Материал второй части не входит в стандартные курсы математического ана- анализа, но отвечает естественной потребности понимания места изучаемого предме- предмета, для чего необходимо расширять представления. Поэтому концентрированные зарисовки окрестностей могут оказаться интересны сначала для преподавателей и, как следствие, для факультативных курсов. Изложение непрофильных разделов математики «по верхам, но без переупрощений», изложение в стиле обзоров, очер- очерков, — наверняка, станет общепринятым (из-за информационного переполнения всей нашей жизни). Разумеется, ужать десятикратно предмет, «не выплеснув с во- водой и ребенка», не так просто. Здесь это уже сделано по некоторым направлениям, примыкающим к анализу. Где можно быстро ознакомиться, скажем, с ТФКП? Не овладеть, а разобрать- разобраться, почувствовать фарватер. Может быть, нигде, но гл. 10 написана именно с этой целью. На 15 страницах там изложено ядро теории аналитических функций — и при наличии определенной математической зрелости схватить главную нить можно в один присест. На эту тему есть, конечно, замечательная книга Титчмарша «Теория функций», но для ее освоения требуется намного больше времени и сил, что «на первой итерации» в условиях вторичной потребности —- неодолимо. Короче говоря, далее предпринимается попытка узаконить обзорный стиль в учебной литературе. В широком диапазоне. От близкого к поверхностной популяризации, в гл. 8, до почти строгого описания предмета в гл. 7, 10, включая интуитивные способы изложения (гл. 9).
Глава 7 Элементы векторного анализа Начинать изучение векторного анализа имеет смысл в пространствах размерности два или три, где помогает наглядность. 7.1. Координаты и ориентация Когда речь идет об изучении функции и = /(х\,... ,хп), где и, скажем, производительность химического реактора, а Х\,..., хп — температуры, давления и концентрации реагентов, — то никакого пространства еще нет. Есть функция и аргументы. Переменные, параметры — что угодно, но никакой геометрии. Пространство возникает как виртуальный инструмент, когда значения х\9...9хп мысленно откладываются по осям некоторого вспомогательного (фиктивного) пространства. Безусловно, затея с геометрией имеет смысл лишь в том случае, когда она хоть что-то дает. Простоту вычислений, идею доказа- доказательств или хотя бы вдохновение. Как ни странно, она дает все. Хотя, если вдуматься, тут нечему удивляться. Просто большин- большинство естественных вопросов (разрешимость, оптимизация, нера- неравенства) имеют определенный геометрический смысл. В результате аморфные алгебраические факты приобретают наглядную интер- интерпретацию, а химический реактор получает осмысленное описание в п-мерном пространстве. Поскольку способ введения в задачу пространства — обыч- обычно «координатный», сразу же возникает вопрос, а не играет ли роли выбор осей координат, и если играет, то как этим лучше распорядиться. В большинстве ситуаций наиболее удобны ортогональные сис- системы координат со взаимно перпендикулярными осями. На рис. 7.1 изображены две такие системы с осями (х, у, г), по которым направлены единичные орты (\,}, к).
7.1. Координаты и ориентация 143 (правая) 1 X (левая) Рис. 7.1 Правая/левая система координат характеризуется тем, что при вращении по кратчайшему пути от х к у буравчик движется по направлению г — для правой системы, и в противоположном — для левой. Если оси неортогональны, то буравчик движется под острым углом, соответственно, к г либо -2. С ориентацией системы координат обычно ассоциируют ори- ориентацию пространства. Из-за пресловутого буравчика ясно, что это так или иначе связано с вращением. Ориентация плоскости, напри- например, может быть задана фиксацией направления обхода контуров (по часовой стрелке или против*)). Некоторые думают, что правая и левая системы координат даны Бо- Богом, но для определения пользуются ссылками на буравчик и часовую стрелку. Другого пути, кстати, нет. «Наличие винта» в устройстве физического пространства — это уже совсем другой вопрос. Не зало- заложил ли Создатель асимметрию пространства до производства што- штопора? Дело ведь в том, что малый процент, скажем, леворуких людей обязан иметь свою причину. Это может быть, например, вращение Земли, действующее как-нибудь опосредованно. Но тогда наступает черед вращения планет. И так далее, пока не выяснится, есть ли асимметрия в природе вещей, либо только в региональных отклонениях. Проблема ориентации возникает также для искривленных поверхностей, где она приобретает несколько иную окраску. Поначалу кажется, что аналогично плоскому случаю ориентацию можно задать, фиксировав направление обхода контуров. Но вопрос «откуда смотреть?» — здесь становится сложным, а иногда и неразрешимым. Проблема упирается в разграничение внешней и внутренней сторон. Для односторонних поверхностей — лист Мебиуса, бутылка Клейна, — ' Если понятно, откуда смотреть.
144 Глава 7. Элементы векторного анализа Рис. 7.2. Бутылка Клейна подобная дихотомия невозможна, и такие си- ситуации необходимо исключить. Для гладких поверхностей 5 проблема разрешается сле- следующим образом2^. В силу гладкости в каждой точке поверх- поверхности 5 есть касательная плоскость, которая непрерывно изменяется вместе с точкой ка- касания А. Единичный перпендикуляр к каса- касательной плоскости в А называют нормалью к поверхности 5 в этой точке. При движе- движении А нормаль, как и плоскость касания, меняется непрерывно. 7.1.1. Если при обходе тонкой А любого контура на 8 нормаль возвращается в исходное положение3), поверхность 8 называют двусторонней. Процедура «отделения» внешней стороны от внутренней может быть органи- организована следующим образом. Поверхность 8 разбивается на маленькие участки — накладывающиеся друг на друга — и, начиная с некоторого исходного кусочка, на котором направление нормали назначается декларативно, внешняя сторона продолжается на соседние участки с согласованием ориентации на пересечениях. Получается нечто вроде «покусочного продолжения». 7.2. Векторное произведение Векторы" и основные операции над ними описаны в разделе 4.1. Еще одной важной операцией является векторное произведение, гДе вектор г по длине равен \Ч> х / Рис. 7.3 т. е. площади параллелограмма, постро- построенного на векторах х, у (рис. 7.3), а на- направление г определяется по «правилу буравчика». Векторное произведение не ассоци- ассоциативно, (а х 6) х с Ф а х F х с), 2' Негладкие же поверхности можно аппроксимировать гладкими. 3' На односторонних поверхностях нормаль при возврате может принять противополож- противоположное направление.
7.2. Векторное произведение 145 антикоммутативно, х х у = -у х х, но справедлив дистрибутивный закон, G.1) проверка которого требует некоторых технических усилий — зато окупается впоследствии многочисленными выгодами. Остановимся, для примера, на факте сложения вращений по правилу па- параллелограмма. Это весьма неочевидно и даже неожиданно, если учесть, что трехмерные повороты не коммутируют. Тем не менее вращение в К3 действительно имеет векторную природу. Стан- Стандартное кинематическое доказательство несколько громоздко. При использова- использовании векторного аппарата усилие мысли почти не требуется. Линейная скорость V конца радиус-вектора г при вращении вокруг оси, проходящей через начало координат О, с угловой скоростью ш равна V = ш х г, G.2) где (пока формально) вектор ш направлен по оси вращения (в сторону, опреде- определяемую по «правилу буравчика», рис. 7.4). Очень полезная формула, кстати. О Рис. 7.4. Вращение — вектор Если тело участвует в двух вращениях4* о;1 и о;2, то линейные скорости V1 =Ш1 X Г И V2 = Ш2 X Г складываются как векторы, и результирующая скорость оказывается равной работает дистрибутивный закон G.1) — V = о;1 х г + ш2 х г = (о;1 + о;2) х г, 4' Здесь и далее мы стараемся приписывать верхние индексы векторам, а нижние координатам.
146 Глава 7. Элементы векторного анализа что и дает нужный вывод. Результирующее движение происходит с векторной угловой скоростью ш = о;1 + ш2. > Замечание. Векторному произведению о х Ь, вообще говоря, можно было бы сопоставить не вектор, а параллелограмм, построенный на векторах а, 6, который имеет подходящее направление обхода. Это было бы более логично, но менее продуктивно. Наличие проблемы сразу не очевидно. Дело в том, что вектор с = ахЪ имеет принципиально другую природу, но при использовании одной и той же системы координат это никак не сказывается. Различие проявляется при переходе от левой системы к правой или наоборот. Например, при замене координат {х, у, %} на {-ж, -у> -г} обычные век- векторы (их называют еще полярными) меняются на противоположные (а на -а). Векторы типа с = а х Ъ (их называют аксиальными) — не меняются. Такого рода метаморфозы вообще характерны для векторного исчисления. Например, дифференциальные операции над обычными векторами порождают вроде бы объекты той же природы, но это поверхностное впечатление. Скорость — вектор, градиент — вектор, и разница не видна, пока исследование проводится на базе ортогональных систем координат. В неортогональных системах происходит «сбой» — формулы перехода при замене переменных оказываются различны. Выявляется так называемая контравариантная природа скорости и ковариантная природа градиента. Упражнения 1. В правой системе координат: 1Х] = к, ] X к = 1, кХ1=]. 2. Координаты вектора а х Ь равны: (а х Ь)х = ауЪ2 - агЬу, (а х Ь)у = агЬх - ахЬг, (а х Ь)г = ахЬу - ауЬх. 3. Формула двойного векторного произведения5^: ах (Ьх с) = Ь(а • с) - с(а • Ь). Примеры 1. Моментом силы Р относительно точки О называется вектор М = г х Р. Аналогично определяется момент количества движения: N = г х ть. * Мнемоническое правило: «абэцэ равно бац минус цаб».
7.3. Кинематика 147 Дифференцируя IV, получаем N = г х ту + г х ту = г х ту = г х Р = М, поскольку ту = Ригх гаи = V х ти = 0. Если система состоит из жестко скрепленных между собой материальных точек, то N = ^ г, х щу4, М = ^Г п * Р>. Для каждой точки справедливо уравнение 14,- = М8, что после суммирования по всем * дает G.3) В случае вращения системы вокруг некоторой фиксированной оси с пере- переменной угловой скоростью шA) скорость каждой частицы равна V, = г,а/, где г, расстояние до оси вращения, N = Сумма 3 = У^ тп^г] — есть момент инерции системы (тела). Таким образом, G.3) с учетом N = 1ш приводит к уравнению вращательного движения ш = М I, равносильно, 3(р = М. Кинетическая энергия с помощью момента инерции записывается так: Получается, что момент инерции для вращательного движения служит ана- аналогом массы (при использовании обобщенной координаты <р). 2. Рассмотрим движение планеты вокруг Солнца. Поскольку сила притяже- притяжения Р центральная, то ее момент действия на планету М = г х Р равен нулю, и, как следствие, N = М = О => N = соп81. С другой стороны, если за время е# радиус-вектор заметает площадь A8, то N = г х ту = тг х (ш х г) = тг2ш = = 2га—, аъ а1 что доказывает второй закон Кеплера: 8 = соп81. 7.3. Кинематика Прежде всего отметим легко доказываемые формулы дифферен- дифференцирования скалярного и векторного произведения векторов а{Ь)
148 Глава 7. Элементы векторного анализа и ЬA), зависящих от времени (или другого скалярного параметра): (а-Ь) Аа йЬ ——^——— __ ——— • 0 -+- Д • —— <и а ль й(а хЬ) Аа йЬ = — х Ь + ах —. <и А1 (>) Подчеркнем, что во втором случае порядок сомножителей прин- принципиален. Движение В неинерциальных системах. Пусть система координат Охуг движется относительно Ох'у'г'. Движение состоит в изменении расстояния ОО' = г0 и вращении Охуг с угловой скоростью ш (рис. 7.5). Я О Рис. 7.5 Дифференцируя равенство К = го + г, получаем абсолютную скорость уа = К — Го + г. Дифференцирование г = х-\ + у-} + г-к дает л" л и)' где «о = х-1-\-у -} + г -к — относительная скорость. Что касается вторых скобок, то единичные орты 1,}, к вращаются, не меняя длины, поэтому Следовательно, что в сумме с г0 называют переносной скоростью: ьс = го+ш х г.
7.4. Дивергенция 149 Таким образом, \г = уо+ш хг\ G.4) и «а = ио + ие,т.е. уа = уо + г0+ш хг. Абсолютное ускорение «/а = уа = уо 4- г0 4- ш х г 4- о; х г, где уо = (х 14- У • ] 4-* • к) 4- I х • — 4- У • ^ 4- г •— ) =шо+шхуо, а составляющая гуо = ж • IЧ- у • Л- ^ • к представляет собой относительное ускорение. Учитывая G.4), получаем ъ)Л = юо 4- Щ 4- г«к. Здесь гук = 2а; х 1;о — ускорение Кориолиса, а юе = го 4- и х (ш х г) 4- ^ х г — переносное ускорение, составляющая которого ш х (ш х г) является центростре- центростремительным ускорением. Разумеется, все это положено неторопливо изучать в рамках курса общей физики, — что вперемешку с поисками спутницы жизни и вращением го- головой по ходу буравчика — занимает семестр, а то и два. Координатный стиль мышления тормозит процесс, и сила Кориолиса в голове не укла- укладывается. Оглядываясь потом назад через призму векторного анализа, конечно, можно удивляться, на что потрачен год жизни. Но мир устроен так, что удивляться заранее — не получается. 7.4. Дивергенция Пусть в В? задана вектор-функция {векторное поле) а{г) = а{х, у, г) = {ах, ау, аг}. Можно считать, например, что речь идет о течении жидкости и а{г) — скорость течения в точке г. Далее рассматриваются поверхностные интегралы а A8, пред- ставляющие собой поток вектора а{г) (жидкости) через поверх- поверхность 5. Интеграл определяется следующим образом. Ориентированная поверхность 8 разбивается на малые участки Д5,-, причем Д5| считается вектором, длина которого численно равна площади участка, а направление совпадает с направлением нормали в произвольно выбранной точке х 6 Дф. В модели
150 Глава 7. Элементы векторного анализа с текущей жидкостью скалярное произведение а • Д5, как раз равно количеству жидкости, проходящему через площадку Д5* в единицу времени. Предел называют поверхностным интегралом ют также в форме а • Д5* при Д5, -> 0 а A5, который записыва- записыва/ а A5 = I (ах йу их + ау их их + аг их йу), 8 8 где дифференциалы Aу их = Л5Х, их их = Л5У, их йу = й5г представляют собой проекцию площадки 6,5 на соответствующие координатные плоскости. Из физических соображений ясно, чего здесь можно ожидать. Если течение жидкости не имеет ни источников, ни стоков, то ин- интеграл / а-A5 по любой замкнутой поверхности 5 будет нулевым, ибо сколько втекло внутрь 5, столько обязано вытечь6). Обыч- Обычно, чтобы подчеркнуть, что интегрирование идет по замкнутой (р а A5. поверхности, используют запись При наличии источников/стоков было бы естественно пола- полагаться на плотность их распределения, которую обозначают сЦуа, либо Уа, и называют дивергенцией, или расхождением вектора а. В этом случае в пределах объема V, ограниченного поверхностью 5, возникает или поглощается жидкость в количестве / й\\ а йУ'. При этом очевидно7) / ' Имеется в виду несжимаемая жидкость. 7' Сколько возникло в V у столько должно вытечь через 5.
7.4. Дивергенция 151 что называют теоремой (формулой) Гаусса—Остроградского, кото- которая дает возможность преобразовывать поверхностный интеграл в объемный и наоборот. Формальный путь несколько иной. Дивергенция а в точке г определяется как предел (плотность) потока вектора а через замкнутую поверхность 8, которая ограничивает бесконечно малый объем V, окружающий точку г. Необходимо, конечно, убедиться, что опреде- определение не «стреляет в никуда». Предел обязан су- Рис. 7.6 шествовать — иначе разговор пустой. Обоснование возможно посредством вычисления самого предела. Для простоты мы ограни- ограничимся случаем, когда тело объема V представляет собой кубик со сторонами Аж, Ау, Ах, параллельными координатным осям (рис. 7.6). Разность потоков вектора о через грани параллельные плоскости Оуг, очевидно, равна Аналогично по другим граням, — что после суммирования дает где Переход к пределу при АУ приводит к формуле АУ = АхАуАг. -> 0 с учетом определения дивергенции теперь дах — дх дау ду даг —. дг Замечание. Если кто-то убежден в существовании предела из физических или других соображений, то проведенные выкладки показывают, чему этот предел равен 8\ В противном случае приходится дополнительно убеждаться, что значение предела не зависит от вида АУ. Эта задача больше подходит для индивидуального размышления. ' Если предел существует, то его можно искать на любой подпоследовательности.
152 Глава 7. Элементы векторного анализа Что касается теоремы Гаусса—Остроградского, то в рамках содержательной интерпретации она очевидна и не требует доказательства. На приеме у формалиста этот номер не проходит. Обоснование может опираться на стандартную процедуру. По любому е > О объем V разбивается на столь малые элементы V*, что — Ф о • A8 - (Иу о 1 $ Суммирование Ф а - 68 дает Ф а - A8, поскольку потоки через внутренние 5,- 5 перегородки 8{ взаимно сокращаются. В итоге 5 V что с учетом произвольности е обеспечивает нужный результат. Примеры 1. Если поверхность 5 ограничивает объем V, то в случае а(г) = г: • A8 = ЗУ. Рис. 7.7 представляет несколько возможных вариантов. В ситуации (а) г2 - А82 - г, • Д5, = 37, что после суммирования и перехода к пределу дает «то, что нужно». Варианты (/>), (с) рассматриваются аналогично. Д5, О Рис. 7.7
7.5. Оператор Гамильтона 153 2. Уравнение теплопроводности. Вывод уравнения теплопроводности в данном контексте сам по себе не представляет особого интереса. Речь о другом — об адэкватности языка. На фоне координатных методов изложения урматов9* векторный стиль ассоциируется со вздохом облегчения при переходе от азбуки Морзе к обыкновенной речи. Пусть Т(г,1) обозначает температуру тела в точке г в момент времени I, с — теплоемкость, д(г) — плотность. Допустим, элемент объема 6У массой д(г) 6У за время 61 нагревается дТ на -ггсМ градусов. Для этого необходимо количество тепла д1 Интегрирование по произвольному объему V дает количество тепла идущее на нагревание|0) этого объема. Если теперь через д(г, I) обозначить удельный поток тепла в точке г в мо- момент I, тогда то же самое количество тепла ф можно посчитать другим способом: 5 V В результате V что, в силу произвольности V, приводит к При естественном предположении д = -к ёгаё Т получается стандартное уравне- уравнение теплопроводности П/Т? сд— - сИу (к ёгаё Т) = 0. 7.5. Оператор Гамильтона Оператором Гамильтона называют дифференциальный оператор «набла» |1 9* Урматами называют «уравнения математической физики». 10' Возможно, со знаком минус.
154 Глава 7. Элементы векторного анализа представляющий собой довольно удобный инструмент. При за- записи дифференциальных операций с ним можно манипулировать как с вектором. Градиент <р, например, получается «умножением» вектора V на скаляр <р: д<р д<р д<р Дивергенция оказывается равной «скалярному произведению» век- векторов V и о: дх ' ду ' дг Удобства на этом не заканчиваются. Оператор V позволяет компактно записывать и другие дифференциальные операции — например, го!а = V х а (см. след. раздел), — что наталкивает на мысль о поиске определенного единства дифференциальных операций векторного анализа. Здесь в самом деле обнаруживается некая общая идеология, но она лежит в стороне от избранной линии изложения. Отметим еще, что под скалярным произведением V • V подразумевают дифференциальный оператор Лапласа, Л Ы & Р & дх2 ду2 дг2 '• представляющий собой последовательное взятие от скалярной функции (р гради- градиента, а потом — дивергенции: д2(р д2<р д2(р ~дх~2+~ду2+^г2' 7.6. Циркуляция Криволинейный интеграл I у их вдоль кривой Ь ничем не отлича- отличать ется от обыкновенного определенного интеграла ь 1{х) ах, а где у = /(ж) описывает кривую Ь (рис. 7Я а). Некоторые отли- отличия возникают, когда Ь не описывается однозначной функцией о I
7.6. Циркуляция 155 Рис. 7.8 у = /(ж), но и тогда сохраняются обходные пути11). Кроме того, всегда можно воспользоваться стандартным методом. Кривая Ь подразделяется на малые участки длины Дж, и предел суммы при бесконечном измельчении разбиения полагается равным ин- интегралу / <р(х9у)с1х. ь Контурный интеграл ф у их равен площади 5, которую огра- с ничивает С (рис. 7.8 5). Действительно, интегрирование у по С сводится к интегрированию <р\(х) от а до Ь, что дает площадь под графиком у = <р\(х), плюс интеграл <р2(х) от Ь до а, что дает минус-площадь под графиком у = <Р2(х)- Если контур С находится не в плоскости Оху, а в пространстве Охуг, то при взятии того же самого интеграла * у их — поскольку с от г ничего не зависит — контур С надо спроектировать в плос- плоскость Оху, и далее, как в предыдущем случае, интегрировать у по проекции контура Сг. Получится 11'' Состоящие, например, в покусочном интегрировании на участках, где зависимость у от х однозначна. щ
156 Глава 7. Элементы векторного анализа где Зг — площадь, ограниченная Сг. Вместо 8г может получиться также -8%, если учитывается ориентация. Упражнение Для любой интегрируемой функции /(ж) /(ж) их = 0. Рассмотрим теперь общий случай криволинейного интеграла Ф а(г) аг=(Ь (ах их + ау<1у + аг Лг), G.5) с с значение которого называют 'циркуляцией поля а(г) по контуру С. Если а = %тй(р, то интеграл G.5) по любому замкнутому контуру равен нулю12). Действительно, A<р = 4<р-Aг, поэтому вдоль любой кривой Ь, соединяющей точки а и Ь, 1 йг = (р(Ь) - что в случае замкнутого контура (а = Ь) дает нуль. Аналогом теоремы Гаусса—Остроградского при вычислении интеграла G.5) служит теорема Стокса: Ф а(г) • йг = / го1 а • A8, G.6) где т.е. го! а = V х а, _ /да 2 дау\ (дах да2\ (дау дах\ *Ха-\ду дг)+\дг дх)+к\дх ду)' В плоском случае, когда а(г) не зависит от г, например а(г) = {Р(г),ф(г),0}, формула Стокса G.6) переходит в формулу п^ Это имеет место лишь в случае, когда потенциал <р однозначен. Для многозначного потенциала, например (р = агс*8 {ц1х)» ~~ это не так-
7.6. Циркуляция 157 Грина G.7) Ротор еще называют вихрем. Он характеризует плотность за- завихрения векторного поля. В случае потенциального поля (поля градиента) го1 §гас! <р = О, что сразу следует из символического представления13) V х (\7у?) (либо из теоремы Стокса). Несложное вычисление ротора поля скоростей G.4) вращаю- вращающегося тела, V = г;о + ш х г, приводит к показательному результату: который свидетельствует о связи ротора с вращением. М Вместо формулы Ухо для определения ротора можно использовать различные предельные переходы. Например, Ф а-йг = Ит G.8) где контур С, ограничивающий площадь 8, стягивается в точку, при этом вектор площади 5 стремится по величине к нулю, а по направлению к Л. При таком определении ротора теорема Стокса становится очевидной, а связь с предыдущим определением ротора легко устанавливается примерно так. Если для простоты предположить, что С стягивается в нуль, то, в силу ах(г) = МО) + ^х + 6-^у + ^ где производные берутся в нуле, имеем <Ь ах их = ох@) <Ь ёх+-^- <Ь хйх + -^- Ф уйх+-^ <Ь г4х+ Ф о(\\г\\) а*ж, 1 ' Векторное произведение параллельных векторов всегда равно нулю.
158 Глава 7. Элементы векторного анализа что после учета (см. начало раздела) <р их = Ф х их = О, Ф у их = -8г, Ф г Ах = 8У ее с с и 8, = 8 со5 (Л, г), 5У = 5 со5 (Л, у) приводит к - Ф ах ёх = - -у- сов (Л, г) 4- -^ сов (Л, у) 4- о(-). Аналогичные выкладки по другим координатам и предельный переход в итоге G.8). >
Глава 8 От числа к функциональному пространству 8.1. Вещественные числа Иррациональные числа иногда кажутся ненужной роскошью. Дро- Дробей, казалось бы, достаточно. Десяток-другой знаков после запя- запятой — куда больше? Но вещественные числа нужны совсем не для вы- вычислений. Плотная числовая прямая необходима как фундамент ма- математического анализа, чтобы «сходящимся последовательностям» было к чему сходиться. Чтобы имели смысл такие пределы, как про- производные, интегралы, суммы рядов, длины, площади, объемы, эле- элементарные функции. Иначе все рухнет. Определения и доказатель- доказательства каждый раз будут упираться в логическую несостоятельность. «Общественное мнение» тут, правда, особо не упорствует. Де- Дескать, вещественные — так вещественные, тем более в школе их все равно уже ввели. Однако школьного «упоминания» о бесконечных десятичных дробях недостаточно. Бесконечная дробь — это развер- развертывающийся процесс. Чем он заканчивается и заканчивается ли — в этом, собственно, и состоит вопрос. Аккуратное построение теории вещественных чисел опирается на дедекиндовы сечения. Рациональные числа с арифметическими операциями далее предполагаются известными. 8.1.1. Определение. Непустое множество А рациональных чисел назовем сечением Дедекинда и обозначим й{Л) при выполнении двух условий: 1. Если а^А,/3<аиР— рациональное число, то /3 6 А. 2. В А нет наибольшего числа. Обратим внимание на «корявость» терминологии типичную для некоторых математических ситуаций. Называть сечением множество, мягко говоря, неесте- неестественно. Однако проблема — в том, что мы хотим определить журавля в небе, имея в руках только синицу. Если бы речь шла, например, об Л, состоящем из рациональных ж < 3, то на роль сечения годилось бы число 3. Однако в случае «ж2 < 2» указать сечением л/2 пока нет возможности, поскольку игра начинается
160 Глава 8. От числа к функциональному пространству в отсутствие иррациональных чисел. Поэтому в роли сечения оказывается само множество А, что режет слух, зато напоминает о стартовых условиях. Подготавливая почву для сечений стать числами, надо опре- определить для них понятия больше, меньше, равенства, суммы и т. д. Это делается совсем легко и немного скучно. Например, неравен- неравенству й(А) < й(В) приходится сопоставить1) строгое включение: АС В, по А Ф В. Сумме й(А) + й(В) — сечение множества А + В, состоящего из рациональных чисел а + /?, где а € .А, /?€#. Что- Чтобы такие определения имели смысл, надо проверить стандартные условия, которым они обязаны удовлетворять. Скажем, отношение неравенства должно быть транзитивно: а < /?, /3 < 7 => а<7- В данном случае это обеспечивается транзитивностью строгого включения для множеств: А С В, ВСС =» А С С. Так же легко проверяются обычные свойства сложения для сечений. И так далее. Короче, все это рутинная работа, которая заканчивает- заканчивается определением на сечениях обычных числовых операций. После этого термин «сечение» приравнивается термину «вещественное чис- число». Рациональные сечения (множество элементов х < а, где а рационально) оказываются рациональными числами. Все другие сечения называются — иррациональными. Особо имеет смысл выделить понятия инфинума и супремума. Пусть дано ограниченное снизу множество М. Определим множе- множество Г нижних граней М, как множество таких рациональных 7» что *у < т для любого га Е М. Легко убедиться, что Г удовлетво- удовлетворяет условиям определения 8.1.1 и поэтому является сечением. 8.1.2. Определение. Число й(Г) называется точной нижней гранью множества М и обозначается тГ М. Если М не ограничено снизу, то полагают тГМ = — оо. Аналогично определяется точная верхняя грань2) $ирМ. '' Чтобы не нарушить уже имеющиеся неравенства для рациональных чисел. 2' В рассуждениях множество верхних граней Г надо заменить на —Г, чтобы попасть в рамки определения 8.1.1.
8.2. Проблемы бесконечности 161 Остается, может быть, самый главный вопрос «о полноте веще- вещественной прямой». Рациональные числа не исчерпывали всех точек. Хватит ли для «сплошного заполнения» дедекиндовых сечений? Рациональным последовательностям ап теперь есть «куда схо- сходиться». Но не потребуется ли новое пополнение для иррациональ- иррациональных ап? Не появятся ли «новые числа», если сечения произво- производить уже с помощью вещественных множеств А, удовлетворяющих тем же условиям 1, 2 из определения 8.1.1? 8.1.3. Основная теорема Дедекинда. Любое сечение в области вещественных чисел является вещественным числом. Другими словами, операция пополнения вещественных чисел не дает новых элементов (как в случае с рациональными числами). < Доказательство просто. Пусть сечение определяется мно- множеством А вещественных чисел. Пусть Аг — множество всех рациональных чисел из А. Вещественное число зир АТ определяет сечение А, как множество чисел х < зир Аг. > 8.2. Проблемы бесконечности Сегмент [0,1] представляет собой тот миниатюрный капкан, в который попадает- попадается бесконечность. Неограниченно развертывающийся процесс вдруг завершается, и необъятное оказывается в клетке. Именно в этом заключается 90 % парадокса. Аномалия бесконечности ведь при отсутствии границ особенно не ощущается. У машины Тьюринга, например, лента бесконечна в смысле наращиваемости — если потребуется, можно удлинить. Такая постановка вопроса вообще не вызыва- вызывает дискомфорта, равно как и противоречий. Искрить начинает, когда бесконеч- бесконечность уже состоялась, что как раз имеет место на любом кусочке вещественной прямой. Интересно, что до определенного исторического момента математики не хо- хотели замечать очевидного. Первым на непроторенную дорогу ступил Георг Кантор, и его усилия привели к перевороту математического мышления. Бесконечности, бывшие все на одно лицо, стали непохожи друг на друга. Счетность. В основу сравнения легла простая идея. Бесконечные множества X и У эквивалентны (равномощны), если между их элементами можно установить взаимнооднозначное соответствие. Множества, эквивалентные натуральному ряду, счетны. В прин- принципе удивительно, что множество дробей счетно. Устанавливается это довольно просто. Рациональные числа располагаются в виде бесконечной квадратной таблицы и нумеруются вдоль стрелочек.
162 Глава 8. От числа к функциональному пространству В результате число 1/1 получает номер 1, 1/2 — номер 2,2/1 — номер 3 и так далее. Ранее встречавшиеся числа пропускаются. При этом устанавливается взаимнооднозначное соответствие между множеством рациональных чисел и натуральным рядом. Затем Кантор показал, что множество действительных чисел отрезка [0, 1] (континуум) — несчетно. В предположении против- противного их можно пронумеровать аьа2,...,ап,..., (8.1) и тогда любое число 6 с десятичной записью отличающееся от а\ в первом десятичном знаке, от аг — во втором, и так далее, — не входит в список (8.1), что дает противоречие. Описанный способ построения числа Ь называют диагональным. До этого момента все было не слишком удивительно. Взрыв дало сопоставление квадрата и отрезка. Выяснилось, что они со- содержат одинаковое число точек. Это не лезло ни в какие ворота. В первую очередь был потрясен сам Кантор. Вот доказательство, на которое ушло три года. Каждая точка единичного квадрата задается двумя координатами х = 09а{а2..., у = 0,/?!/?2.... Ей можно сопоставить точку отрезка
8.3. Характеризация множеств 163 Элементарное уточнение деталей показывает, что получается вза- взаимнооднозначное соответствие г <Ф=> (х,у). Такой встряски мир не получал со времен Галилея, когда обнаружилось, что все тела падают с одинаковым ускорением. Гипотеза континуума. Затем Кантор стал искать промежуточное по мощно- мощности множество между натуральным рядом и континуумом [0, 1]. Одна из попыток в этом направлении навечно вошла в историю под именем канпгорова множе- множества, получаемого последовательным выбрасыванием третей из сегмента [0,1]. Сначала [0,1] делится на три равные части, и средняя часть удаляется. С каждой из оставшихся частей повторяется аналогичная операция — й так до бесконечно- бесконечности. В пределе от [0, 1] почти ничего не остается, что и называется канторовым множеством С. Легко сообразить, например, что длина выброшенных третей равна .12 4 . ' . 3 + 9 + 27+- = 1' т.е. «вся длина» [0, 1] выбрасывается. Однако оставшееся тощее множество С оказалось равномощно континууму — и это снова был шок. < Понять результат проще всего так. Элементы [0, 1] можно представлять, например, как десятичные дроби 0,а\а2..., где каждое а, принимает одно из значений 0, 1,..., 9. Континуальность [0, 1] поэтому равносильна несчетности всех бесконечных последовательностей аха2... . Десятичное основание является случайным обстоятельством. То же самое может быть сказано в рамках любой системы счисления, — например, троичной, в которой а* могут принимать лишь три значения 0,1,2. Если в троичной записи чисел запретить использование единицы, — это и будет канторово множество С. Но а< в оставшихся числах 0,с*] а2... могут принимать два значения 0, 2 — чего хватает для несчетности. > Безуспешные попытки найти промежуточное по мощности множество посте- постепенно привели Кантора к убеждению, что «промежуток» пуст — вслед за счетным множеством сразу идет континуум. Эта гипотеза подорвала здоровье многих ма- математиков, в том числе и самого Кантора. На решение проблемы ушла сотня лет. Итог оказался неожиданным. Выяснилось, что гипотезу с равным успехом можно принять или отвергнуть, как аксиому. 8.3. Характеризация множеств На узком плацдарме сегмента [0, 1] проходило очень много мате- математических исследований. В учебники, конечно, попали вершки, просчеты канули в Лету. А без них, между прочим, ничему особен- особенно не научишься. Не поварившись в том соку, не ощущаешь куда и почему математика движется. Как ни странно, вживаясь в ошибки прошлого, получаешь больше, чем от заучивания стерильных истин.
164 Глава 8. От числа к функциональному пространству Самые простые вопросы на территории [0,1] ведут в тупик. Взять хотя бы измерение длины и площади. Пример канторова мно- множества С дает повод задуматься. На каждом этапе выбрасывания третей остается 2/3 от того, что было. Поэтому мера, суммарная «длина оставшегося», стремится к нулю, - 1 -> 0 при п -^ оо. И другого, кажется, быть не может, поскольку в С нет ни одно- одного сплошного кусочка. Похоже, что меру таких множеств можно заранее полагать равной нулю. Однако... Пусть ап — последова- последовательность нечетных чисел. Разделим [0,1] на а\ частей и среднюю часть удалим. Каждую из оставшихся частей на втором шаге разде- разделим на п2 частей и средние опять удалим — и так до бесконечности. В пределе получится некий аналог канторова множества — обо- обозначим его Са — мера которого будет определяться бесконечным произведением и может быть сделана (выбором последовательности ап) любой в диапазоне [0,1). В то же время Са, как и С, не имеет ни одной внутренней точки. Под давлением этого примера уже не ясно, что отвечать на во- вопрос о мере множества дробей. Ковер СерПИНСКОГО. Ковер Серпинского — это двумерный аналог канто- канторова множества. Каждая сторона квадрата [0,1] х [0,1] делится на три части, в результате квадрат разбивается на 9 квадратов (рис. 8.1). Средний — удаляется. Потом с оставшимися квадратами повторяется то же самое — и так далее. Вообще говоря, ковер Серпинского — это линия, но не все так просто. Определение линии имеет богатую историю. На каком-то этапе Жордан предлагал удобный ва- вариант: «Линией является след от движения точки». Потом Рис 8 1 благополучие было подорвано кривыми Пеано и другими не- неприятностями. Важный шаг сделал Кантор: «Линия на плос- плоскости — это континуум, не имеющий внутренних точек». Определение всех устроило, но ненадолго. Размерность. К логическому концу ситуацию привел Урысон в своей теории размерности. Разумеется, «скоро сказка сказывается...» Дело не скоро делается потому, что в отличие от света, распространяющегося прямолинейно, мысль ходит кругами. ш
8.3. Характеризация множеств 165 Понятие линии Жордана — «непрерывный след движения точки» — ин- интуитивно очень естественно. Хорошо вжившись в него, можно ощутить драму открытия кривых Пеано, зачерчивающих целиком квадрат. Положение спас Кан- Кантор, придумавший для определения линии «континуум, не имеющий внутренних точек». Однако в пространстве его рецепт ничего не дает — обыкновенная линия перестает отличаться от поверхности. Урысон ставит вопрос на более глубоком уровне, пытаясь определить раз- размерность геометрического объекта3). В основу кладется следующая индуктивная идея. Линию, как одномерный объект, удается разбить на две части точкой (нуль-мерной). Двумерную поверхность точкой уже не разобьешь, нужна линия (одномерная) — и так далее. • Простая идея на этапе формализации упирается в мощный барьер. Опре- Определение «под ключ» — очень сложная штука. Додумывание мелочей иногда от первоначальной идеи не оставляет камня на камне. В данном случае трудности легко предвидеть. Определение должно работать на самых разнообразных объек- объектах, среди которых канторово множество — не самый худший вариант. Эпопея кончилась, правда, хорошо, но для этого нужен был Урысон. Мы не останавлива- останавливаемся на деталях, чтобы не отвлекаться. При наличии интереса можно обратиться к специальной литературе, попытавшись сначала изобрести индуктивное опреде- определение размерности самостоятельно. При этом можно ощутить разницу между «искусством и ремеслом». Попытка воспроизвести Урысона обычно не проходит. Несколько строчек определения, а не получается! Сложные задачи решаются, проблемы — не поддаются. Как заговоренные. Тут как раз и выявляется, для какой надобности человека задумал Бог. Самые большие математики создают новые понятия, обеспечивая работой тысячи коллег и последователей. Что касается определения размерности, то Урысон чуть позже определил ее иным (эквивалентным) способом: фигура 5 имеет размерность п, если ее можно разбить на сколь угодно малые замкнутые части так, что ни одна точка 5 не принадлежит п + 2 различным частям, но при достаточно мелком разбиении есть точки, принадлежащие п 4- 1 различным частям. Эта форма определения оказалась более практичной. «Ложка дегтя» в рассматриваемой области принадлежит Хаусдорфу, который определил размерность иначе. Множество А покрывается кубиками со сто- стороной е. Если NF) обозначает минимальное число кубиков, необходимых для покрытия А, и NF) при е -» О растет пропорционально е~а, то величина й назы- называется размерностью А (по Хаусдорфу). У канторова множества эта размерность равна \о%ъ 2. Мандельброт назвал множества, имеющие дробную размерность, фракталами. Контрпример Шварца. Вернемся, однако, к проблеме измерения. Изыскания в области экзотических множеств, конечно, не перечер- 3' По сравнению с теорией линейных пространств, где размерность определяется как максимальное число векторов базиса (осей координат), в данном случае речь идет о суще- существенно более общей топологической ситуации.
166 Глава 8. От числа к функциональному пространству кивают простые результаты вычисления длин, площадей и объемов. Тем не менее общая проблема остается. История с измерением площадей на искривленных поверхно- поверхностях имеет дополнительные краски. Как известно, элементарная теория площади строится с древних времен на идее равносо- равносоставленности многоугольников, а потом дополняется предельным переходом. В случае гладких плоских фигур все это хорошо рабо- работает. До определенного момента думалось, что и на искривленных поверхностях можно действовать аналогично. Но, как говорится, не тут-то было. Следующий контрпример Шварца поверг многих в глубокие раздумья. Вертикальный прямой круговой цилиндр (радиус основания г = 1, высота Н = 1) разрезается на п горизонтальных слоев толщины к = Н/п. На внешней окружности каждого горизонтального сечения отмеча- отмечаются тп равноотстоящих точек (две соседние —А,В на рис. 8.2 видны из центра под углом 2а). Во всех чет- четных сечениях выделенные точки находятся строго друг под другом. Нечетные сечения повернуты относительно четных на угол а. Две соседние точки любого сечения и третья точка, лежащая посредине — «над» либо под ними, — опре- определяют треугольник, вписанный в боковую поверхность цилиндра. Покрытие из таких треугольников при из- измельчении все точнее воспроизводит цилиндрическую поверхность, как бы ложась на нее в один слой и равномерно покрывая. Ин- Интуитивно кажется, что площадь покрытия в пределе (при п, га —> оо) должна стремиться к площади цилиндрической поверхности, равной в данном случае 2тг. На самом деле предел может быть любым ^2тг и даже никаким (т. е. не су- существовать). В конце девятнадцатого века A890 г.) этот пример в некотором роде потряс математическую общественность. Стало ясно, что интуитивно оче- очевидное понятие площади представляет собой тонкую материю и требует строгого анализа. Аномальное поведение предела устанавливается легко. Каждый треугольник покрытия имеет сторону 2 §т а = АВ и высоту л/(\ - со$аJ + к2. Его площадь, соответственно, у A - со8 аJ + к2. Теперь надо учесть, что а = тг/га, к— 1/п. Число треугольников в покрытии 2пга. Поэтому общая площадь треугольного покрытия * /77яЛ1 = 2т§т—\п2[ 1 -со§ — + 1. га у V т/
8.4. Мера Лебега 167 Если при измельчении покрытия сохраняется пропорция п = ут, то 5 -»тг\/727г2 + 4 при га -» оо. Таким образом, выбором 7 можно обеспечить любое значение предела ^ 2тг. 8.4. Мера Лебега Рассматривая задачу измерения площадей на искривленных по- поверхностях, Лебег в итоге построил общую теорию меры, решив проблему в известном смысле окончательно. Все конструктив- конструктивно задаваемые множества стали измеримыми. Для подтверждения факта существования неизмеримых множеств требуется уже новая гипотеза (аксиома выбора — см. след. раздел). Теория меры излагается во многих учебниках4), и здесь ед- едва ли целесообразно дублирование. Мы ограничимся несколькими замечаниями, которые полезно иметь в виду. В первую очередь интересно обратить внимание на историче- исторические корни. Лебег не был первым, кто занимался вопросами из- измерения площадей — и многое было наработано до него5). Более того, различные исследования довольно близко подходили к «тому, что нужно», но точного попадания в цель не было. Недоставало вроде бы мелких штрихов. Главный вопрос, естественно, упирался в само понятие меры. Вот итоговый вариант для плоского случая. За исходный пункт берется определение площади прямоугольника6) т(8) = аЬ, где а и Ъ стороны прямоугольника 5. Площадь фигуры Р, предста- вимой в виде конечной совокупности непересекающихся прямоугольников {Рп}, полагается равной т(Р) = ^2™(Рп)> (8-3) что называют аддитивностью меры т(Р). Далее для ограниченных множеств определяется внешняя мера (8.4) где инфинум берется по всевозможным покрытиям множества А конечными или счетными системами прямоугольников. "о. - ' Коротко и ясно теория меры излагается в замечательном учебнике Колмогорова и Фомина «Элементы теории функций и функционального анализа». ' Значительный вклад внесли древние греки, Жордан, Борель и др. ' Независимо от того, входит ли в прямоугольник граница, целиком или частями.
168 Глава 8. От числа к функциональному пространству Наконец, множество А называется измеримым по Лебегу, если по любо- любому е > 0 можно указать такую конечную совокупность Ае непересекающихся прямоугольников, что7* *(ААА) < е. Меру Лебега ц(А) измеримого множества А полагают равной Ц*(А). Очевидно, функция 1а(А) является продолжением меры т(Р) на более широкий класс множеств. В общем случае работает аналогичная схема, с той лишь разницей, что вме- вместо прямоугольников берется та или иная система простейших множеств, мера которых задается директивно, после чего проделываются те же манипуляции. В отличие от системы прямоугольников, где аддитивность (8.3) автоматически влечет за собой счетную аддитивность, или а-аддитивность^, требование счет- счетной аддитивности в общем случае, если необходимо, приходится оговаривать особо. Это, собственно, и есть стержень теории. Самая сложная ее часть. Хотя обычно кажется, что нет ничего проще определе- определения. Трудности, мол, состоят в доказательстве теорем. Но это — видимые трудности. При несовершенном определении исходных понятий какие-то теоремы так или иначе доказываются, а цель не достигается. И очень трудно догадаться, как надо «пошевелить» определения, чтобы теоремы стали попадать в десятку. Главное значение теории меры состоит в том, что она дает опору для рассмотрения пространств измеримых функций и для интегрирования по Лебегу. Функцию /(ж) называют измеримой, если измерим прообраз /~1(А) любого измеримого множества А. Такие функции могут очень сильно отличаться от непрерывных, будучи, например, разрывными в любой точке. С другой стороны, функция /(ж), из- измеримая на [а,Ъ], отличается от непрерывной не очень сильно в следующем смысле (теорема Лузина): для любого е можно указать непрерывную функцию (р(х) такую, что /(ж) Ф (р(х) лишь на множестве меры < е. Измеримые функции естественным образом возникают при рассмотрении . 00 функциональных рядов, поскольку сумма ^^ сп(рп(х) не обязана быть непре- непрерывной при непрерывных <рп(х). Это обстоятельство в свое время взорвало безмятежные представления об изучаемых функциях как о непрерывных или, 7' Здесь А обозначает симметрическую разность множеств, т. е. ААВ есть объединение двух разностей: А \ В и В \ А. 8' То есть справедливость (8.3) в случае бесконечного числа слагаемых.
8.4. Мера Лебега 169 в крайнем случае, имеющих не очень много разрывов. Выяснилось, что ряды Фу- Фурье (именно они исторически были в этом отношении первыми) могут сходиться к весьма экзотическим функциям. Таким образом, достаточно естественный спо- способ задания функций с помощью рядов выводил за рамки обычных представлений и привел в конце концов к построению функционального анализа — анализа в функциональных пространствах. Характерный пример дает функциональное пространство Ь2[а, Ъ], представляющее собой пространство функций /(ж), для которых существует интеграл от /2(ж), а скалярное произведение определяется по формуле F.10), т.е. A,д)= / !{х)д{х)йх. Понятно, что интегрирования по Риману в этом случае уже не до- достаточно, ибо фундаментальные по соответствующей норме по- последовательности могут сходиться к неинтегрируемым по Риману функциям. Лебег разработал общую теорию интегрирования, кото- которая обеспечила выход из положения. Интегрировать по Лебегу уметь не надо. Напомним, что уже говорилось по этому поводу в гл. 6. Интегралы Лебега и Римана совпадают, если оба существуют. Поэтому интегрирование простых функций ничем не отличается от обычного, а при интегрировании сложных — до вычислений дело не доходит. Принципиальную важ- важность имеет сама возможность интегрирования по Лебегу. Это сво- сводит концы с концами. Примерно как иррациональные числа. В при- приближенных вычислениях они не используются, но, заделывая бре- бреши, превращают вещественную прямую в нормальное игровое поле. Интеграл Лебега, в отличие от интеграла Римана, строится несколько иначе. Точки х группируются по признаку близости значений интегрируемой функции 9). Обыграть это можно различным образом. Например, так. Сначала рассматрива- рассматриваются простые функции /(ж), принимающие не более чем счетное число значений У\, Уг, • • •. Упу • • •» и Для них интеграл определяется как где Ап = {х € А, /(х) = уп}. Затем функцию /(ж) называют интегрируемой по Лебегу на множестве А, если существует равномерно сходящаяся к /(ж) по- ' А не по признаку их близости на оси х.
170 Глава 8. От числа к функциональному пространству следовательность интегрируемых на А простых функций /п(ж). Предел числовой последовательности / /п(х) &/* в этом случае называют интегралом Лебега. А Разумеется, корректность определения (существование предела и его неза- независимость от выбора последовательности /п) должна быть установлена. Этим, наряду с массой других вопросов (признаки интегрируемости, предельные пере- переходы под знаком интеграла и т.п.), занимается теория интеграла Лебега. 8.5. Аксиома выбора У абстрактного мышления не так много опорных точек. Аксиома выбора (АВ) — одна из них10). 8.5.1. Аксиома выбора. В любом семействе Ф непустых множеств в каждом множестве X Е Ф можно выбрать по одному элементу. Другими словами, существует функция выбора /, ставящая в соот- соответствие каждому X е Ф элемент /(ж) 6 X. До Цермело аксиома 8.5.1 широко использовалась в матема- математических рассуждениях как самоочевидный факт, но будучи явно сформулирована, вызвала ожесточенную критику. Принципиаль- Принципиальное отличие АВ от других аксиом заключается в разительном кон- контрасте между ее естественностью и «невероятностью» следствий. Вот, пожалуй, самый яркий пример. 8.5.2. Парадокс Банаха—Тарского. Шар В в К3 допускает разби- разбиение на конечное число множеств Вх,...,Вк, (8.5) при котором из (8.5) можно составить передвижением В], как твердых тел (перенос плюс поворот), шар вдвое большего радиуса (или вдвое меньшего, или дюжину шаров такого же радиуса). Выглядит, конечно, шокирующе, но ничего страшного в утвер- утверждении 8.5.2 нет. По крайней мере, это факт из того же разряда, что и соответствие у = 2х между [0, 1] и [0, 2]. Функция у = 2х показывает, куда передвинуть точки х 6 [0,1]» чтобы из отрезка [0, 1] получился отрезок [0,2]. У Банаха с Тарским это, разуме- 10' Нижеследующие три раздела представляют собой компиляцию фрагментов из книги: Босс В. Интуиция и математика. М.: Айрис-Пресс, 2003.
8.5. Аксиома выбора 171 ется, гениально обыграно, однако источник тот же — мощность множества не зависит от размеров. Разрывная линейная функция — еще один фокус аксиомы выбора. Линейная функция (р(х) обычно определяется характеристическим свойством <р(х + у) = <р(х) + <р(у) (8.6) при дополнительном требовании непрерывности. Решением функционального уравнения (8.6) оказывается линейная функция (р(х) = кх. Действительно, из (8.6) следует <р(рх) = р<р(х) для любого целого р. Поэтому '(й - (>•• что получается в результате замены г = рх. Это дает откуда т.е. (р(х) = кх обязано выполняться для всех рациональных ж, где к = <рA). Окончательный вывод о неизбежности <р(х) = кх делается на основе предполо- предположения о непрерывности (р. Возможность иного решения в отсутствие непрерывности кажется малове- маловероятной. Однако аксиома выбора позволяет указать бесконечное число таких решений, говорить о которых удобнее, опираясь на понятие базиса Гамеля. Напомним, что базисом называется любая совокупность линейно незави- независимых векторов {еь ..., еп,...}, через которые однозначно выражается любой вектор х рассматриваемого пространства х = ^2 Хг е,. (8.7) При этом Хг называют координатами вектора х. В конечномерном пространстве процедура построения базиса элементарна. Берется любая система В линейно независимых векторов (это может быть, в том числе, один вектор) и к ней добавляется любой вектор, который линейно не выражается через В. На каком-то шаге процесс заканчивается — иначе возникает противоречие с конечномерностью. При наличии аксиомы выбора такая процедура может быть реализована и в бесконечномерном случае. Получаемые таким образом базисы называются базисами Гамеля. Дополнительное разнообразие ситуаций определяется возможностью вво- вводить ограничения на допустимые координаты. Требовать, скажем, их рациональ- рациональности. В последнем случае действительная прямая становится бесконечномерным векторным пространством из-за рациональной несоизмеримости многих чисел. Например, Зи\/2 линейно независимы, поскольку А,3 + А2\/2 = О невозможно при рациональных А,.
172 Глава 8. От числа к функциональному пространству Возвращаясь теперь к решению функционального уравнения (8.6), возьмем любой базис Гамеля на действительной прямой, выберем некоторый базисный вектор ед, например, еА = у/5 или еА = тг, или даже еА = 1, и положим Ф) = **А, (8-8) что даст функцию, удовлетворяющую (8.6). В результате, конечно, мы имеем не синицу в руках, а журавля в небе. Функция (р(х) существует, но даже не поддается вычислению, за исключением избранных точек. Тем не менее этого оказывается иногда достаточно. Решение третьей проблемы Гильберта. Равновеликие многоугольники рав- носоставлены, т. е. один из них можно разрезать на меньшие многоугольники и сложить другой. Равносоставлены ли равновеликие многогранники? В этом вопросе заключалась третья проблема Гильберта, которую отрицательно решил М. Дэн в 1900 г. Таким образом, оказалось, что при переходе от К2 к Кг ситуация принципиально меняется. Сложное и запутанное доказательство Дэна — того, что куб и тетраэдр не равносоставлены — усилиями математиков было превращено в изящную миниатюру. Вот современный вариант. Введем понятие псевдовеса многогранника М, Р(М) = Х> *>(*). (8-9) I где суммирование идет по всем ребрам длины /,, А, — двугранный угол при 1-м ребре, а <р — функция вида (8.8). Точнее говоря, пусть в — двугранный угол при ребре правильного тетраэдра. Достроим множество {0, тг} до базиса Гамеля (легко проверяется, что тг и в несоизмеримы), и положим т. е. <р(Х) равно 0-й координате в разложении числа А по базису. Вычислять значения <р(\) мы можем лишь в двух ситуациях п^ <р(св) = с и <р(ск) = 0 для рациональных с, что как раз достаточно для наших целей. Необходимый результат вытекает из неравенства Р(куба) Ф Р(тетраэдра), поскольку ^1? = 0, (8.10) X Р(тетраэдра) = <р(в) ^ *Г = X) # * °- <8-! 0 Причина заключается в следующем. При разрезании куба или тетраэдра на меньшие многогранники и суммировании псевдовесов этих меньших много- многогранников, вычисленных по формуле (8.9), получается тот же самый псевдовес 11' Значения (р(Х) для других углов А мы не можем знать из-за произвола достройки базиса, но эти значения нам и не нужны.
8.6. Функциональные пространства 173 исходного многогранника. Это происходит потому, что суммирование по всем новым ребрам (появившимся в результате разрезания) дает нуль. Дело в том, что если некоторое / лежит внутри М и служит ребром (или частью ребра) новых многогранников, то 1{Ч>(Х\) + • • • + Р(А,)} = МА, 4-... 4- А,) = /рB*) = О, если же / лежит на грани М, то опять получается нуль Наконец, если I совпадает с ребром исходного многогранника, то Л1 4-... + А, равно тг/2 в случае куба, и в в случае тетраэдра. Таким образом, псевдовес не зависит от способа разрезания и может просто вычисляться по формулам (8.10), (8.11). Аксиома выбора, безусловно, не является инструментом, имеющим утили- утилитарное значение для инженера, но это существенный фактор общематематической культуры. 8.6. Функциональные пространства Разложение функций в бесконечные ряды естественно привело к мысли о бесконечномерной природе функций. В основу легла аналогия с конечномерным случаем х = где ж, — координаты, е, — базисные векторы. У функционального ряда /(ж) = с\(р\(х) + ... + сп(рп(х) +... величины с, были приняты за координаты, а функции <р%(х) — за базисные векторы. Наивное соображение в конечном итоге привело к созданию функционального анализа. В процессе, как водится, выяснилось, что начинать можно совсем с другого конца, задавая, например, не базис, а метрику. Но так или иначе в обиход изучения функций был введен геометрический стиль мышления. Плоскости, шары, конусы — такие понятия стали эффективно применяться при манипуляциях с множествами функций. В отличие от перехода от Е3 к Еп (п > 3), функциональный «шаг в бесконечность» был сопряжен со значительными потерями. Главная потеря была в следующем. Непрерывная функция на ограниченной замкнутой области X в Яп достигает своего максимума и минимума. Это очень важное свойство для оптимизации. Именно поэтому в Яп задача определения тах /(ж) тех
174 Глава 8. От числа к функциональному пространству никогда не упирается в проблему существования решения. В бесконечномерных задачах — это серьезная головная боль. Например, вариационная задача Ньютона минимизации функционала хйх 3 = 1 + (|0 г, »@)=0, для поиска тела вращения с наименьшим сопротивлением газовому потоку не име- имеет решения, поскольку 3 > 0, но 1П -* 0 для уп(х) = х + Вт2 шгх. Еще одно принципиальное отличие. В Яп сферу невозможно непрерывной деформацией стянуть по себе в точку, что служит основой для результатов о разрешимости уравнений. В бесконечномерном пространстве такой фокус возможен. Рассмотрим, например, сферу в С[0,1], состоящую из непрерывных функций /(ж), таких что Деформацию проведем в три шага. На первом — деформируем /(ж) в /Bж) для хе 0, - , /¦(*) = /A) для при этом функция на рис. 8.3 а переходит в функцию на рис. 8.3 б с помощью деформации Н(т,х) = /(тж) для хе /A) для хе И- [И при изменении т от 1 до 2. У а) 6) Рис. 8.3. Деформация бесконечномерной сферы
8.6. Функциональные пространства 175 На втором шаге все {\(х) деформируются в функции /2(х). График /г(ж) совпадает с графиком /](х) на [0,1/2], а правые концы плавно поднимаются до верхнего «потолка» так, чтобы /2A) = 1 (наклонный пунктир на рис. 8.3 #). Теперь (последний шаг) все функции /г(ж) стягиваются по сфере в любую точку /о(я), если /0A) = 1. Деформацией может служить Н(х, А) = А/о(*) + A - Л) /2(х), А € [0,1]. Функциональный анализ. Выдвижение на передний план понятия функционального пространства сместило акценты и дало толчок анализу в новом направлении. Такого сорта поворотные моменты в развитии научных дисциплин для поверхностного взгляда совсем незаметны, поскольку речь идет о прежних задачах, разве что под несколько иным углом зрения. Первое время кажется, что в этой метаморфозе больше минусов, чем плюсов. Но мало-помалу преимущества накапливаются, и возникает эволюционный скачок. Неожиданно выясняется, что построен дворец. Роль функциональных пространств подобна роли действительных чисел, которые сами по себе никому не нужны в таком количестве, но они преобража- преображают и оживляют математику. Не о бесконечной точности вычислений идет речь. Действительные числа необходимы вовсе не для вычислений. Их главная роль в придании законности предельным переходам, что обеспечивает дифференци- дифференцирование, интегрирование и т. п. Изучение функциональных последовательностей приводит к радикально другой ситуации. Выясняется, что расширять игро- игровое поле для функций можно в разных направлениях. Возникают сотни вариантов. У каждого свои плюсы и минусы. И хотя глаза разбегаются, широта ассортимента в данном случае играет положи- положительную роль, поскольку стандартный сценарий оказания помощи опирается именно на эту широту. В сомнительных ситуациях беда, как правило, заключается в том, что задача неправильно поставлена. Функциональный ана- анализ указывает пространство, в котором надо рассматривать задачу, и все становится на свои места. Вариационное исчисление, на- например, совсем недавно пользовалось наивными методами поис- поиска «подозрительных» функций. Проблема существования решения не поддавалась изучению — отсутствовал инструмент и координат- координатная сетка мышления. Функциональный анализ дал понимание того, как нужно правильно ставить такие задачи, в каких пространствах рассматривать... Теория целиком преобразилась.
176 Глава 8. От числа к функциональному пространству Обобщенные функции. Особого упоминания заслуживают обоб- обобщенные функции. До какого-то момента развитие понятий прохо- проходило в рамках представления о функций, как о чем-то, имеющем график. С некоторой натяжкой, конечно. Непрерывные, потом измеримые, или суммируемые с какой-то степенью... не везде од- однозначно определенные... Но так или иначе /(ж) означало, что почти везде аргументу х ставится в соответствие у = /(«)• Однако на довольно широком классе задач идеология соот- соответствия не работала. Мутила воду в основном так называемая 5-функция, которая содержательно соответствовала плотности то- точечного источника (чего-нибудь), но никак не поддавалась мате- математически разумному определению. Выход из положения был найден нестандартный, но естествен- естественный с позиций теории функциональных пространств. Обобщенные функции были определены как линейные функционалы на неко- некотором заданном пространстве V «хороших функций». В частно- частности, 6-функция при этом оказалась функционалом, действующим по правилу 6(х)<р(х) их = <р{0) -00 для любой функции (р € Х>. Кто-то может заметить, что все это отдает схоластикой и наукообразием, поскольку обычное представление о 6-функции, как о пределе колоколообразных приближений (рис. 8.4), приводит к тому же результату. Конечно, никакого разумного предела 6е(х) при е -> 0 — нет, но сам по себе он и не нужен, потому что речь, как правило, идет о решении какого-нибудь уравнения Щх) - 6(х), (8.12) где 2/ — дифференциальный оператор. Если в правой ча- части (8.12) 6(х) заменить на 6е(х) и через ие(х) обозначить соответствующее решение, то в довольно свободных пред- предположениях щ(х) -» и*(х) при е -* 0, (8.13) что, собственно, и требуется. При этом нет никакой беды, что 6е(х) не сходится. -е е Рис. 8.4 С тем, что сказано, надо согласиться. Но это та самая наивная точка зрения, связанная с поиском кривых «подозрительных на решение». Вопросы существо- существования, устойчивости и многое другое остается за кадром. Работа ведется наощупь.
8.7. Теорема Жордана и парадокс Брауэра 177 В каком смысле и* (ж) является решением (8.12) и является ли? Не упускаются ли из виду другие решения? Иными словами, решение может оказаться угаданным, но тут-то и выясняется, что необходимо гораздо больше — понимание ситуации, которого как раз не дают «доморощенные» методы. Можно добавить еще один аргумент. Зачем тратить время на обоснование предельного перехода (8.13) в каждой отдельной задаче? Почему бы не сделать это один раз для всех задач сразу? Но о такой малости на фоне сказанного выше едва ли стоит говорить всерьез. 8.7. Теорема Жордана и парадокс Брауэра Математическая формализация, как «шагреневая кожа», в боль- большинстве случаев дает не то, чего от нее ждут. Под непрерывной функцией обычно подразумевают функцию, график которой можно нарисовать, не отрывая карандаша от бума- бумаги. Поначалу кажется, что е, 6-язык переводит это представление в эквивалентную форму. Но это совсем не так. В рамки определения попадает гораздо больше функций, чем хотелось бы. Например, функция , если х рационально, , если х иррационально непрерывна в нуле, хотя график ее «бесконечно дыряв». А график везде непре- непрерывной функции у = х$т(\/х) невозможно нарисовать. Но это, как говорится, цветочки. Непрерывный образ отрезка [0, 1] может иметь бесконечную длину и покрывать весь квадрат (кривые Пеано). Становится ясно, что необходимы меры предосторожности. Одна из таких мер — сужение поля зрения до гомеоморфиз- гомеоморфизмов, каковыми называют взаимно однозначные и непрерывные в обе стороны отображения. Иногда это производит должный эффект. 8.7.1. Теорема Жордана. Гомеоморфный образ окружности делит плоскость на две части {на две связные компоненты) и является их общей границей. Это знаменитый результат из области очевидных на вид утвер- утверждений, которые очень трудно доказываются. Поначалу кажется, что теорема ломится в открытую дверь. Приведенные выше приме- примеры несколько рассеивают такое впечатление, но далеко не полно- полностью. Украшает ситуацию следующий парадокс Брауэра. Собствен- Собственно, никакого парадокса тут нет, но это по сути. Интуитивно же пример выглядит фантастично.
178 Глава 8. От числа к функциональному пространству Зададимся следующим вопросом: могут ли на плоскости сто областей иметь общую границу? Не общую точку или участок — а одну и ту же границу. Похоже на бред, но ответ — положительный. Допустим, в океане Ао есть остров, на котором имеется 99 озер А\,..., А99. На сухопутной части острова выделим множество Ме точек, расположенных в узлах квадратной е-решетки. Затем от каждого озера и от океана к каждой точке Ме пророем канал, не доводя его до этой точки на расстояние е/2. На оставшуюся часть суши поместим е/2 -решетку, и к точкам М| пророем каналы, не доходящие до соответствующих точек на е/4. Потом накроем сушу е/4-решеткой, и так далее. Понятно, что в пределе области Ло,..., А^ разрастутся до областей Ло°,..., А^ с общей границей Г. Разумеется, с тем же успехом мог быть построен пример любого числа областей с общей границей. Конечно, граница тут простым замкнутым контуром не является, но пример все же впечатляет, и на его фоне теорема Жордана уже не кажется самоочевидной. Еще более удивительно, что ситуация нескольких областей с общей границей встречается не только в фантазиях, но и на практике. Итерационная процедура ч~ 4^г (8Л4) на комплексной плоскости вычисляет корень кубический из единицы, каковых имеется три: 2 ^ (8Л5, и есть, соответственно, три области притяжения А, В, С. Процесс (8.14) сходится к одному из корней (8.15) в зависимости от того, какой области принадлежит г0. Пусть теперь Г^, Г#, Тс обозначают границы областей А, В, С. Невероятно, но факт: Га = Гв = Гс, т. е. области притяжения имеют одну и ту же границу.
Глава 9 Топология и неподвижные точки Излагаемый далее материал апеллирует к геометрической интуиции и не претен- претендует на строгость доказательств. Речь идет о далеко идущих обобщениях простого факта: если функция / в граничных точках отрезка [о, Ъ] принимает значения разных знаков, то уравне- уравнение /(ж) = 0 разрешимо на [о, Ь]. 9.1. Идеология окутывания Пусть И — некоторая область в Кп, & — ее граница, а образ границы при непрерывном отображении Р: Кп ->• Кп. В этом случае Р называют также оператором и говорят, что Р задает в Кп векторное поле Р(х). Допустим, что поле Р(х) невырождено на Г2, т. е. Р(х) Ф О при х € Г2. Предположим пока, что поверхность Р(&) связна 1\ не имеет слипшихся участков, и на одном ее кусочке определена внешняя сторона (ориентация). Разобьем Р(&) на маленькие участки — накладывающиеся друг на друга — и, начиная с исходного кусочка, продолжим определение внешней стороны на соседние участки, согласуя ориентацию на пересечениях. И так, пока не определится внешняя сторона на всей поверхности Рф), Теперь из точки 0 выпустим произвольный луч / (рис. 9.1) и посчитаем, сколько раз / протыкает Р(&) изнутри наружу — допустим, 7е Раз> и сколько — снаружи внутрь — допустим, 7е раз. Теперь величину 7СР, Й) = 7е - 7е назовем вращением векторного поля Р на Г2. '' Множество называют связным, если его невозможно представить в виде объединения двух непересекающихся открытых (непустых) множеств.
180 Глава 9. Топология и неподвижные точки Рис. 9.1 -4 Для корректности определения требуется независимость *>((Р, &) от вы- выбора Г Очевидно, в большинстве ситуаций величина у(Р,&) как функция / локально постоянна — не меняется при малых шевелениях луча. Изменений можно ожидать, если при повороте луч пересекает точку касания (точка А на рис. 9.1). Однако геометрически ясно, что при вращении / против часовой стрелки и переходе критического положения /1 появляется пара точек протыка- протыкания. Причем, если в одной из них луч будет протыкать Р(п) изнутри наружу, то в другой — наоборот. Поэтому точки протыкания могут появляться или исчезать только парами (полярными), и 7 не меняется. Если Р(п) имеет слипшиеся участки, то надо считать, что в соответствующем месте луч протыкает поверхность столько раз, сколько там слиплось слоев — и все остается по-прежнему. Это же должно быть сказано в отношении лучей, протыкающих поверхность в точках самопересечения Р(&) (луч /3 на рис. 9.1). > Для большинства приложений произвол в задании ориентации «исходного кусочка» поверхности Р(п) сам по себе не принципиален. Важно другое — пра- правильное согласование ориентации при одновременном рассмотрении нескольких областей. Формальное определение ориентации (раздел 9.5) закрывает проблему, но требует привлечения дополнительных аппаратных средств. В большинстве случаев удается обойтись кустарными методами типа следующего. Пусть п\ и п2 граничат по Г = Г2, ПГ22> внешняя сторона Г2, задана — и тем самым определена ориентация на Г, как части поверхности Г2,. Ориентация на Г, как части поверхности п2, меняется на противоположную (сохраняется), если п2 находится по другую сторону Г (по ту же сторону Г). Эта новая ориентация Г переносится на всю поверхность &2 описанным выше способом «покусочного расширения». 9.1.1. Если 0 Е О, ш вращение тождественного отображения 1(х) = х на п равно 1. -4 Это, пожалуй, единственная ситуация, где определение внешней сторо- стороны у 1(п) не вызывает вопросов, поскольку Г2 остается на месте. Луч сначала протыкает Г2 изнутри, потом — снаружи, ..., последний раз — изнутри. >
9.2. Гомотопные векторные поля 181 9.2. Гомотопные векторные поля Центральную роль в излагаемой теории играет понятие деформа- деформации, или гомотопического моста. 9.2.1. Определение. Отображения Р и С называются гомотоп- гомотопными на Г2, если существует такая непрерывная деформация {гомо- {гомотопический мост) Н(х,т), определенная2^ для х 6 & и т (Е [0, 1], что Н(х, 1) = С(х)9 причем Н(х, г) ф О при любых хит, что называют невырожденно- невырожденностью деформации. Операции гомотопического перехода от Р к О с помощью Н(х,т) визуально соответствует непрерывное деформирование поверхности Р(&) в поверхность О(п). Ограничение невырожденности, #(ж, г) Ф О, означает, что деформируемая поверхность не имеет права пересекать точку 0. Геометрически ясно, что невырожденная деформация не может поменять величину вращения 7(*)> поскольку — двигается ли луч или деформируется поверхность — точки протыкания исчезают и возникают парами (разумеется, пока деформируемая поверхность не пересекает нуля). Поэтому справедлив следующий важный результат. 9.2.2. Теорема. Гомотопные векторные поля имеют одинаковые вращения. Становится ясно, что бесконечное разнообразие практических ситуаций может быть сведено к некоторому стандарту. Деформирование Рф) на единичную сферу 5, с центром в нуле, и последующее разглаживание складок — порождает многослойную поверхность, окутывающую сферу |7(^, ^)| раз3*. Отрицательный знак 1(Р, п) связан с выворачиванием 17 наизнанку. 9.2.3. Самый распространенный на практике вид деформаций — линейная гомотопия: связывающая отображения Р и С. 2' Стенографически это записывается короче и точнее: Н: & х [0,1] -> Кп. 3' Если Р отображает 8 в 5, то ^(Р, 8) — это так называемая топологическая степень отображения Р.
182 Глава 9. Топология и неподвижные точки Линейная гомотопия может оказаться вырожденной лишь в том случае, когда найдется точка х € Г2, в которой Р(х) и О(х) имеют разные знаки, р(х) = О(х). Поэтому в случае непротивоположной направленности в лю- любой точке х € 17 отображения Р(х) и О(х) линейно гомотопны и, в соответствии с теоремой 9.2.2, имеют одинаковые вращения. 9.3. Основные теоремы 9.3.1. Теорема. Пусть векторное поле Р(х) определено и невы- невырождено на границах областей {1,{1\,..., пт, причем области П^ (] = 1,..., га) попарно не пересекаются и п = и П^-. Тогда (9.1) «4 Результат очевиден. Если Г^ и пк граничат друг с другом, то граничат и Р(^) с Р(пк) по некоторому участку Г,-*. Протыканию Г,*, например, изнутри при подсчете у(Р, Г^) будет соотвествовать протыкание Г,-* снаружи при подсчете 1(Р, &к) • Поэтому в сумме (9.1) справа — все протыкания внутренних перегородок взаимно сократятся. > Будем говорить, что невырожденное на Г2* векторное поле Р(х) имеет прокол, если Р(х) не принимает какого-то направления4), т. е. Р(х) Ф ХН цдя всех ж е Г2, А > 0 и некоторого (ненулевого) 9.3.2. Теорема. Если векторное поле Р(х) на Г2* имеет прокол, то , П) = 0. Для доказательства достаточно в качестве / взять луч, задаваемый вектором Н, — он поверхность Р(&) вообще не протыкает. 9.3.3. Лемма. Пусть векторное поле Р(х) невырождено на замы- замыкании области И, т.е. Р(х) Ф 0 при любом жбП. Тогда *у(Р9 &) = 0. << Разобьем п на непересекающиеся области 12;- настолько малых размеров, что все векторы на каждом Ц составляют друг с другом острый угол. В этом случае на любой границе 17; поле Р имеет прокол. Поэтому (теорема 9.3.2) все , Г2;-) = 0. Окончательный вывод следует из теоремы 9.3.1. > ^ То есть направления Р(х) не исчерпывают полного телесного угла.
9.4. Разрешимость уравнений 183 Из леммы 9.3.3 вытекает следующий фундаментальный резуль- результат. 9.3.4. Если "у(Р, Г2) ф О, то уравнение Р(х) = О разрешимо в т. е. существует точка х* € О, в которой Р(х*) = 0. Таким образом, любая теорема об отличии от нуля вращения векторного поля Р может трактоваться как принцип разрешимости уравнения Р(х) — 0. Отметим в заключение справедливость полезного дополнения к теореме 9.3.1, вытекающего из леммы 9.3.3. 9.3.5. Утверждение теоремы 9.3.1 справедливо без предположения п — 1I2^, но при условии невырожденности Р на п \ и Г^. 9.4. Разрешимость уравнений 9.4.1. Пусть ОЕ^м для любого х Е Г2 выполняется одно из условий: • векторы х и Р(х) не направлены противоположно; • скалярное произведение (Р(х), х) > 0. Тогда уравнение Р(х) = 0 разрешимо в п. -4 В случае непротивоположной направленности х и Р(х) теоремы 9.2.2, 9.1.1 обеспечивают равенства что по теореме 9.3.4 влечет за собой разрешимость Р(х) = 0. Два других условия влекут за собой непротивоположную направленность х иР(х). > Изучаемые уравнения часто имеют специальный вид х = Т(х). (9.2) В этом случае решение уравнения (9.2) называют неподвижной точ- точкой оператора Т. Чтобы воспользоваться здесь результатом 9.4.1, достаточно перейти к векторному полю Р(х) = х — Т(х). В итоге, например, можно гарантировать существование у Т неподвижной точки, если (Тх,х) <(х,х), хе $1
184 Глава 9. Топология и неподвижные точки Особую популярность имеет 9.4.2. Теорема Брауэра. Оператор Т, переводящий в себя замкну- замкнутый шар В, всегда имеет неподвижную точку х* 6 В. А Без ограничения общности центр шара В можно считать расположен- расположенным в нуле. Предположим противное (Г не имеет неподвижной точки в В). Тогда поле х - Т(х) невырождено на сфере Б и, в силу Т(В) С В, векторы х € В их — Т(х) непротивоположно направлены. > Легко видеть, что непротивоположная направленность х и х — Т(х) обеспе- обеспечивается в гораздо более свободных предположениях. 9.4.3. Пусть п — произвольная область, О € П и оператор Т на границе п удовлетворяет условию Т(х) Ф \х при А > 1. Тогда у Т существует неподвижная точка х* € п. > Важное замечание. Вращение векторного поля относится к разря- разряду структурно устойчивых (грубых) характеристик. Оно не меняется при малых изменениях как отображения Р, так и области О. По- Поэтому любые теоремы о разрешимости уравнений, опирающиеся на оценки 7(')> «выдерживают» малые возмущения. При вычис- вычислениях самого вращения оказывается возможным пользоваться различными аппроксимациями, не нарушая выводов, — напри- например, вместо Р(х) в окрестности Хо можно рассматривать линейное приближение Р'(хо)(х - а?о) (разумеется, если производная Р'(хо) невырождена). 9.5. Ориентация Изложенное до сих пор можно придумать, наверное, за полчаса, но уточнять потом всю последующую жизнь. Дело в том, что созидающий ракурс мышления рано или поздно сталкивается с несуразностями, которые выглядят сначала малозначительными, но в конечном итоге приводят к необходимости перестройки всего проекта. В этом отношении весьма «перспективно» выглядит понятие внешней сто- стороны поверхности. Пусть, например, п — шар в трехмерном пространстве с центром в нуле, сфера 5 — его граница. Что с этой сферой делает отображение р(х) — -ж? Вроде бы ничего. Сфера остается на месте. Поэтому, казалось бы, внешняя сторона 5 и Р(8) одна и та же. И такую ложь вполне можно допустить, если речь идет о гомотопности Р(х) и О(х) с последующим абсолютно правиль- правильным выводом о разрешимости уравнения О(х) = 0 в 12. Но ложь, безусловно, выстрелит, не в этом, так в другом месте. Если бы на 5 были нарисованы вихри, закрученные по часовой стрелке (при виде, допустим, изнутри), то на Р{8) эти вихри бы крутились уже против
9.5. Ориентация 185 часовой стрелки5*. Такой казус возникает потому, что отображение Р(х) = —х как бы выворачивает сферу наизнанку6^ — в результате внешняя сторона оказы- оказывается внутренней, а вращение отрицательным, Такое уточнение становится принципиальным, например, в следующей си- ситуации. Пусть п 1 — шар вй3с центром в нуле, п2 — шаровое кольцо (рис. 9.2), п = п\ ип2 — шар большего радиуса, чем п\. Пусть Р{х) =-х на 171, Р(х) = х на 17. По теореме 9.3.1 Поэтому, учитывая имеем что влечет за собой Р(х*) = 0 для некоторого х* € п2. Другими словами, образ шарового кольца Р(п2) обязан накрывать точку 0, что, вообще говоря, просто так не очевидно. Рис. 9.2 Пытаясь обойти стороной возможные трудности, обычно предпочитают го- говорить об ориентации поверхности, а не о внешней и внутренней сторонах. Визу- Визуально ситуацию можно представлять так. На 17 рисуются одинаково закрученные вихри. Потом наблюдатель, сидя в нуле, смотрит вдоль луча /, и протыкание поверхности Рф) засчитывает как «изнутри наружу», если в районе протыкания вихрь крутится в ту же сторону, — и наоборот. В общем случае вместо вихрей используют левые и правые базисы. Делается это следующим образом. Поскольку вращение не меняется при малых изменениях как границы, так и оператора, то 17 и Р предполагаются гладкими (в противном случае можно перейти к гладким аппроксимациям). В точке х € 17 локальный базис {еь...,е„} выбирается так, чтобы вектор в\ был направлен по внешней нормали, а век- векторы е2,... ,еп лежали в касательном пространстве к 17 в точке х. Нормаль е\ к поверхности Р(&) в точке Р(х) называют внешней, если базис одинаково ориентирован с базисом7* {еь ..., е„}. 5* Либо — по часовой, но тогда смотреть надо снаружи. ' Именно «как бы выворачивает», поскольку физическую модель сферы невозможно вывернуть наизнанку, не разрывая. 7' Напомним, что два базиса {еь ..., еп} и {е\,...,е'п} называются одинаково ориен- ориентированными, если е\ = ^2 а%)ез и ^е* [а*;1 > О-
186 Глава 9. Топология и неподвижные точки В данном контексте разговор об ориентации и строгом определении внеш- внешней стороны поверхности больше касается общей панорамы, чем конкретно излагаемых результатов. Далее будет использован единственный факт, опирающийся на «правильное» определение ориентации. 9.5.1. Пусть А — линейное невырожденное преобразование и О € п. Тогда с1е1 А. 9.6. Индексы и алгебраическое число нулей Для разрешимости уравнений важно отличие 7(-) от нуля. Установ- Установление взаимосвязи между вращением на границе и числом нулей поля внутри области дает более тонкие следствия. Нуль Жо Е О поля Р(х) называют изолированным, если в доста- достаточно малой окрестности Хо нет других нулей. Вращение поля Р на сферах достаточно малого радиуса с центром в Хо называют индексом Хо и обозначают те(Р, Хо). Корректность такого определения вытекает из одинаковости вращений Р на сферах достаточно малого радиуса. Действительно, если шары Вх и В2 не содер- содержат других нулей, кроме ж0, и Б, С В2, то из теоремы 9.3.1 и леммы 9.3.3 следует 9.6.1. Теорема об алгебраическом числе нулей. Пусть векторное поле Р(х) невырождено на VI и имеет в VI лишь изолированные нули. Тогда | | ' ' (9.3) где суммирование идет по всем нулям х^ Е VI поля Р. А Доказательство сразу вытекает из теорем 9.3.1, 9.3.5, если области 12;- определить как шары достаточно малых радиусов с центрами в точках х$. > Теорема 9.6.1 имеет разнообразные применения. Гарантирует, например, существование неизвестного нуля, если сумма индексов известных нулей отлич- отлична от у(Р, &). В различных вариантах позволяет устанавливать единственность решения. Скажем, пусть ч(Р,&) = 1 и производная (матрица Якоби) Р'(х) невырождена на п. Этого, оказывается, достаточно для существования и един- единственности решения Р(х) = 0 на п. <4 Действительно, если х0 — нуль поля Р, то Р(х) и Р'(хо)(х - ж0) непротивоположно направлены в достаточно малой окрестности ж0, поскольку
9.7. Нечетные поля 187 В силу невырожденности Р'(х) детерминант Р'(х) сохраняет знак, поэтому индексы всех нулей обязаны быть одинаковы, тй (Р, х0) = 8щп йегР'(х0) = 1. А это, благодаря условию у(Р, О) = 1, допускает не более одного нуля. > 9.7. Нечетные поля Векторное поле Р называют нечетным на центрально симметрич- симметричном множестве Г, если Р(-х) = -Р(х) при любом жбГ. Пусть нечетное поле Р задано на гра- границе шара В с центром в нуле. Представим В в виде объединения трех областей, ша- шара меньшего радиуса ^з и двух половинок П\91^2 шарового кольца (рис. 9.3). Положим Р(х) = х на Й3 и продолжим Р(х) (невырожденным образом) на всю границу й\ и Й2. Возможность такого продолжения в плоском случае очевидна. На одной радиальной перегородке поле Р задается произвольно (но с соблюдением заданных условий на концах), на другую нечетно продолжается. Далее работает индукция по размерности пространства. В К3 перегородка — это плоское круговое кольцо. Берем одну половинку, задаем на ней поле произвольно, но с соблюдением краевых условий (поскольку на ее границе нечетное поле уже задано) — на другую половинку поле Р продолжаем нечетно. И так далее. По теореме 9.3.1 Рис. 9.3 \ В) = Заметим теперь, что Й,) \ Й2) Последнее вытекает из нечетности Р. Действительно, если луч / протыкает поверхность Р(&\) в точках Х\,...,хк, то луч -/ протыкает Р(й2) в точках -жь ..., -хк, причем характер протыкания (изнутри, извне) сохраняется. Таким образом, ) = 27(^,170 + 1, т. е. вращение нечетного поля всегда нечетно, а значит, не равно нулю. Этот факт, казалось бы, относится к весьма частному слу- случаю нечетных полей, но деформации обычно дают возможность значительно «расширить» утверждение.
188 Глава 9. Топология и неподвижные точки 9.7.1. Пусть векторы невырожденного на В поля Р(х) в симмет- симметричных точках направлены неодинаково, т. е. НГР-НОН' Тогда *у(Р, В) нечетно и, следовательно, уравнение Р(х) = О разре- разрешимо в В. «4 В указанных предположениях поле Р гомотопно нечетному полю Р(х) - Р(-х). Деформацией может служить Н(х,т) = Р(х)-тР(-х). > 9.8. Собственные векторы На практике довольно часто приходится рассматривать уравнения С(х, А) = О со скалярным параметром А. 9.8.1. Пусть й Тогда при некотором А Е (Аь А2) на О, существует решение уравнения С(х, А) = 0. М В противном случае поля С(х, Х\) и С(х, А2) соединял бы невырожден- невырожденный гомотопический мост Я(ж, т) = О [ж, г А! + A - г)Л2]. > Когда уравнение с параметром имеет специальный вид Р(х) = Хх, его решения х называют собственными векторами нелинейного опе- оператора Р'. 9.8.2. В нечетномерном пространстве в случае 0 Е О невырожденный на Г2 оператор Р всегда имеет на Г2 собственный вектор, т. е. Р(х) = Хх при некотором X ф 0. < Если у(Р, п) ф 1, то поле Р не гомотопно тождественному и, следова- следовательно, при некоторых ж€17иг€@,1) т — \ тР(х) + (\ -т)ж = 0, т.е. Р(х) = х.
9.9. Обратные и неявные функции 189 Если же у(Р, п) = 1, то поле Р не гомотопно полю -/(ж), и тогда при некоторых х € & и г € @, 1) г^(ж) - A - т)х = О, т.е. Р(х) = х. > Таким образом, в нечетномерном пространстве на сфере не- невозможно задать невырожденное касательное поле (невозможно причесать сферу). Это сразу становится ясным, если центр сферы расположить в нуле и применить результат 9.8.2. Упражнения 1. Что означает результат 9.8.2 для тора в Л3, на котором задано невырож- невырожденное касательное поле? 2. Пусть 0 $ п и вращение поля х - Р(х) на 17 не равно нулю. Тогда уравнение Р(х) = Хх разрешимо на 17 при некотором А > 1. 9.9. Обратные и неявные функции В анализе хорошо известна теорема о локальной обратимости отоб- отображения Р в окрестности решения Р{х) = у на базе достаточного условия <1е1Р'(х) ф 0. Локальной обратимости Р в каждой точке, конечно, недостаточно для глобальной обратимости. Но послед- последнюю обеспечивает простое дополнительное условие Шп №)|| = оо, (9.4) ||||> что уже отмечалось в разделе 4.14. Довольно странно, что этот полезный результат остается мало- малоизвестным. 9.9.1. Теорема. Для глобальной обратимости непрерывного отобра- отображения Р, действующего в Яп, необходимо и достаточно выполнение двух условий: (9.4) и локальной обратимости Р в любой точке Кп. А Необходимость условий очевидна. Установим достаточность. 1-й шаг. В силу локальной обратимости Р функция тд [Р(х) - Р(и), и] ло- локально постоянна в достаточно малой окрестности любой точки и € Кп. Переход из и в любую другую точку V можно представить в виде последовательности сколь угодно малых шагов вдоль отрезка -А)и, Л€ [0,1].
190 Глава 9. Топология и неподвижные точки Поэтому функция те! [Р(х) - Р(и), и] постоянна8* в Кп. 2-й шаг. В силу (9.4) деформация Н(х,т) = Р(х)-тР@)-(\-т)у невырождена на сферах 5 достаточно большого радиуса. Поэтому вращения полей Р(х) - Р@) и Р(х) - у на 5 равны при любом у. А так как все индексы одинаковы, то по теореме 9.6.1 об алгебраическом числе нулей число решений уравнения Р(х) = у, как функция у, есть константа, отличная от нуля. 3-й шаг. Допустим, что Р(х) = у имеет т > 1 решений. Пусть, например, у = 0 соответствуют решения ж,,..., жто. При движении по любому лучу VI (у € Дп, I € @, оо)) из каждой точки ж, выходит непрерывная кривая ж,($) — такая что Р(х{A)) = VI. В силу локальной обратимости Р кривые ХгA) не могут пересекаться. Отнесем теперь к множеству С, все точки кривых ж,($), соответствующие всевозможным V и I. В силу той же локальной обратимости Р множества С, открыты и не пересекаются. Но ЫС, = Кп. Это противоречит связности Яп. > В более общей ситуации речь идет о существовании функции х = 6?(у), неявно задаваемой уравнением Ф(х,у) = 0. Здесь сохраняется полная аналогия с предыдущим случаем. 9.9.2. Для глобальной разрешимости Ф(ж, у) — 0 относительно х необходимо и достаточно выполнение двух условий: • Уравнение Ф(ж, у) = 0 локально разрешимо. • ||ж*||-*оо =» 1Ы-Ю0, если Ф(хк,ук) = 0. (>) 8^ В случае невырожденности производной Р'(х) постоянство индекса очевидно сразу.
Глава 10 Аналитические функции 10.1. О загадке комплексных чисел Попытки задуматься о подноготной комплексных чисел (КЧ) из- извлекают на свет мысли типа «чушь, мистика». Однако первый позыв «перечеркнуть и забыть» быстро проходит, поскольку выясняется, что вещь все-таки удобная. КЧ резко упрощают теорию колеба- колебаний, электричество... Законы волновой оптики странным образом оказываются согласованы с правилами умножения комплексных чисел. Потом вдруг обнаруживается, что изучение линейных диф- дифференциальных уравнений без КЧ вообще невозможно. Постепен- Постепенно становится ясно, что это не просто удобная вещь, а невероятно удобная. Дальше — больше. Получается, без комплексных чисел никуда нет ходу. Даже в теорию вероятностей. Даже в теорию чисел. Хотя, казалось бы... Тогда размышления устремляются в другое русло. В чем при- причина? Почему добавление к колебанию фиктивной мнимой части сразу все упрощает? Почему, чтобы найти радиус сходимости ряда ао + а\х + а2х2 + ... для вещественного ж, надо изучать поведение ряда в комплексной плоскости (причем иначе — невозможно)? Откуда у вспомога- вспомогательного инструмента такая колоссальная мощь и проникающая способность? Вот в чем источник подозрения, что какая-то косми- космическая тайна стоит за кадром. Сегодня на все эти вопросы есть простые и ясные ответы, кото- которые начали созревать и оформляться относительно недавно — в де- девятнадцатом веке. До этого в суждениях о комплексных числах да- даже таких великих математиков, как Лейбниц и Эйлер, преобладали эмоции. И очень трудно сказать, чего им не хватало, ибо сегодняш- сегодняшние ответы в общих чертах они бы могли сформулировать и тогда.
192 Глава 10. Аналитические функции Разница едва ли не идентичных формулировок была бы в наполнен- наполненности несколько иным содержанием, в других акцентах, в другом понимании тех же самых слов. Последние двести лет дали массу ин- интересных примеров, породили серию других «нереальных» инстру- инструментов. Кроме того, вымерли многие несостоятельные идеи. Все это вместе взятое наполнило старые формы новым содержанием. Тем не менее подводная часть айсберга остается невидимой. Кто скажет, в чем глубина и смысл понятия абстрактного чис- числа? Говорить вроде бы не о чем. Но рождение заняло несколько тысячелетий. Первый слой понимания сути комплексных чисел внешне до- достаточно прост. Введение операций сложения и умножения для натурального ряда инициирует цепную реакцию. Обратные опе- операции — вычитание и деление — влекут за собой необходимость появления отрицательных чисел, потом дробей. Аналогичная си- ситуация возникает в связи с извлечением корней, что приводит к появлению мнимой единицы, а потом — с учетом сложения и умножения — комплексных чисел. Иными словами, на целых положительных числах вводятся арифметические операции, после чего натуральный ряд расширяет- расширяется до максимального игрового поля. Такое поле дают комплексные числа. Процесс расширения однозначен, и дальше пути, кстати, нет ^. На следующем витке спирали возникает вопрос о широком распространении комплексных чисел. Почему они неожиданно всплывают то там, то здесь? Ответ прост. Потому что вся матема- математика стоит на арифметических операциях, для которых комплекс- комплексные числа — неизбежный финал расширения натурального ряда. Поэтому игра идет на одном поле. Конечно, это лишь плоское изображение многомерной картины. Можно изучать, например, теорию чисел, а можно отправиться в свободный полет, пыта- пытаясь понять, что же изучается в теории чисел. Числа или операции над ними? Что изучает механика? Силы и ускорения или правила их взаимодействия? Вряд ли Господь занимается измерением скоростей, а природа, скорее всего, не пользуется '' Например, кватернионы (трехмерные числа) рассматривают иногда как обобщение КЧ, но это вопрос словоупотребления. Умножение кватернионов некоммутативно (об ф 6а), и потеря тех или иных свойств «арифметических операций» неизбежна при любом расши- расширении поля комплексных чисел.
10.2. Дифференцируемое™ 193 законами Ньютона. Но уж если сами модели имеют вспомогательный характер, то почему бы им в промежуточных вычислениях не опираться на фиктивные симво- символы? Именно это и происходит, когда операции (действия) выдвигаются на первый план. Глаголы можно изучать, не обращая внимания на существительные. Вот показательный эпизод из истории теоремы Ферма 2\ Ламэ и, неза- независимо, Куммер в середине девятнадцатого века предложили «доказательства», опирающиеся на манипуляции с (п - 1)-мерными числами вида ао + а,С + ... + аПт2Сп-2, (ЮЛ) где а* — целые числа, а 2тг . 2тг С = СО8 \- % 81П . п п Беда была в том (чего поначалу не заметили авторы), что числа A0.1) не раз- разлагались единственным образом, подобно числам натурального ряда, на простые множители (неразложимые далее). Такой прокол по тем временам перечеркивал все доказательство. Куммер сделал гениальный ход, который прославил его на долгие годы. Он дополнил множество A0.1) фиктивными числами. Единственность разложения на простые множители была восстановлена, доказательство заработало! Хотя заработало и не на полную мощность — фикция привнесла свои трудности — идея эксплуатации вымысла получила еще один импульс. И теперь на такие идеи опираются многие разделы современной алгебры. По существу, Куммер предпринял очень естественный шаг. Доказательство, как правило, это серия трюков с буквенными формулами. Письменная экви- эквилибристика становится законной, если опирается на какую-то систему, пусть фиктивную — но только непротиворечивую. Еще одно требование — стыковка со входом и выходом. Фикция должна включать систему описания исходных дан- данных и систему описания ожидаемых результатов. Больше ничего не нужно. Если задача поставлена правильно, ответ будет «каким надо». Опробование таких моделей значительно обостряет понимание комплексных чисел. Понимание роли, места, корней, внутренних пружин. Конечно, это все эмоции, но от них в математике очень многое зависит. 10.2. Дифференцируемость Функцией комплексного переменного г = х + гу можно было бы считать любую функцию вида но тогда никакой интересной теории, выходящей за рамки изучения отображений на плоскости, /: К2 -> Я2, не получилось бы. 2' Речь идет о неразрешимости уравнения хп+уп = гп в целых числах при п ^> 3. В конце двадцатого века после трехсот лет безуспешных попыток теорема доказана Э. Уайлсом.
194 Глава 10. Аналитические функции Теорию аналитических функций, или ТФКП3), из обыкновен- обыкновенной рутины выделяет особое понятие дифференцируемости, которая определяется как представимость приращения функции в виде = /(* + = ААг + о(\Аг\), A0.2) где А — комплексное число, зависящее от точки г, которое называют производной $(%) в точке г, и обозначают /'(я), либо Из-за совпадения формы может показаться, что ничего осо- особенного в таком определении нет, но это только на первый взгляд. Если бы речь шла, например, просто об отображении плоскости, то определение дифференцируемости / совпадало бы по записи с A0.2), но А было бы матрицей, А = (ди дх дь (дх ди} ~ду дУ ду) A0.3) Мы же хотим, чтобы А было комплексным числом4). Это очень сильно ограничивает класс рассматриваемых функций. Таким образом, определение производной внешне выглядит обыкновенно, Г {г) = Шп Аг A0.4) но требует дополнительно независимости предела A0.4) от пути стремления Аг к нулю. Это приводит к необходимости выполнения для / = и + IV условий Коши—Римана: ди Ъ~х Ъ~х ди ду' A0.5) что устанавливается совсем просто. 3^ ТФКП — теория функций комплексной переменной. 4) Другими словами, чтобы действие матрицы А на Дг было эквивалентно умножению на комплексное число (растяжение плюс поворот).
10.3. Элементарные свойства 195 В случае Аг = Ах + гО и Ах -* 0 — вычисление предела A0.4) дает /(г + Аг) - /(г) = и(х + Дж, у) - и(х, у) | Д* Ах х, у) - у(х, у) ди ду в случае Аг = 0 + г'Ду и Ду -^ 0 тот же предел A0.4) оказывается равным /(г + Дг) - /(г) = и(х, у + Ау) - и(х, у) | Аг гАу .у(х,у + Ау) - у(х,у) ду .ди , %Ау ду ду Оба варианта обязаны совпадать, что и дает A0.5). 10.2.1. Необходимые условия Коши—Римана A0.5) в случае непре- непрерывности частных производных функций и, V в некоторой области X) достаточны для дифференцируемости $ в В. Требование непрерывности частных производных в подобного рода ситуа- ситуациях стандартно. Доказательство элементарно, см. 4.5.2. 10.2.2. Определение. Функции^ дифференцируемые в некоторой об- области Х>, называются аналитическими в Б. Тавтология терминов на данном этапе может показаться стран- странной. Зачем для дифференцируемой функции выдумывать еще одно имя? Но тут есть исключительное оправдание. Оказывается, ана- аналитические функции обладают совершенно неожиданным свойством. Дело заключается в следующем. Обыкновенный анализ при- приучает к мысли, что функция может быть дифференцируема либо один раз, либо два, либо п раз. Аналитическая функция, дифферен- дифференцируемая по определению всего один раз в области В, оказывается (что будет показано позже) бесконечно дифференцируемой5) в X). 10.3. Элементарные свойства Охи и ахи по поводу аналитических функций, конечно, должны быть подкреплены свидетельством их разнообразия. Не говоря о том, что неплохо было бы убедиться, что существует хоть одна аналитическая функция помимо константы. * То есть у нее существуют в В производные любого порядка.
196 Глава 10. Аналитические функции Примеры 1. Функция /(*) = гп при любом натуральном п дифференцируема, ее производная /'(г) = пгп'1 легко вычисляется в лоб: независимость от характера стремления Дя к нулю очевидна. 2. Сумма и произведение аналитических в Т> функций 1х{г) и /2B) — аналитичны в Т>. Функция /1B)//2B) аналитична в В всюду, где /2(г) Ф 0. Композиция аналитических функций, /(«/(я)), аналитична. (>) 3. Функция /(-г), представимая сходящимся в некотором круге (|г| < К) рядом аналитична при \х\ < К. (>) 4. Если функция /(я) аналитична в В и /'я) ^ 0, то существует об- обратная к /(я) функция д(г), аналитичная в /(/?). При этом /'(г) = 1/</(«/), где го = /(*). (>) 5. Положим На действительной оси функция совпадает с ех. Условия Коши—Римана легко проверяются. (>) Это может служить пока формальным определением комплекс- комплексной экспоненты. Более глубокие мотивы такого определения вскроются позже. 6. Функция /(г) = \г\2 = х2 + у2 не аналитична. Условия Коши—Римана выполняются только при г = 0. Из перечисленных примеров может возникнуть впечатление, что почти все функции аналитичны. В какой-то мере это так, хотя, строго говоря, правильнее обратное: «почти все — не аналитич- аналитичны». Тем не менее практика сталкивает нас в большинстве случаев с аналитическими функциями: синусы, логарифмы, дробно-раци- дробно-рациональные выражения и т. п. Разумеется, такие функции, чтобы говорить об их аналитичности, надо продолжить на комплексную плоскость, но об этом речь впереди. Для начала полезно ознакомиться с предметом, чтобы потом не удивляться по мелочам. Перечислим некоторые свойства анали- аналитических функций, где понимания можно достичь малой кровью.
10.3. Элементарные свойства 197 Свойства аналитических функций. 1. Чем меньше окрестность точки г, тем точнее выполняется соотношение А/ = /'(я)Дг, которое означает, что все Аг поворачиваются на один и тот же угол и растягиваются в одно и то же число раз. Растяжение и поворот определяются множителем /'(я). Поэтому малые фигуры переводятся функцией / в подобные (углы сохраня- сохраняются, размеры пропорционально изменяются — разумеется, с точностью до «о ма- малых»). Это служит основанием называть такие преобразования конформными. Если кривые пересекаются в плоскости г под углом а, то их образы при отображении / пересекаются в точности под углом а без всяких «о малых». 2. Задание частных производных определяет функцию с точностью до кон- константы. Поэтому задание одной из функций и(х, у), у(х,у), в силу условий Коши—Римана, с точностью до константы определяет вторую. 3. В силу условий Коши—Римана ёгас! и • ^гас! V = ихух + иууу = -ихиу + иуих = 0, т. е. градиенты функций ииу ортогональны в любой точке г, а значит, ортогональны линии постоянного уровня6* функций и и у. Это, в свою очередь, влечет за собой многочисленные следствия. Например, если аналитическая в области В функция / не константа, то ее модуль |/(я)| не может принимать максимальное значение внутри В — так называемый принцип максимума модуля. Вышесказанное позволяет указать причину. Чтобы \/(г)\2 = и2 + у2 было максимально, требуется 2и §гас1 и + 2у ^гас! V = 0, что при условии ёгаёи _1_ %гъду и и,у ф 0 возможно лишь в случае равенства нулю обоих градиентов. Равенство нулю градиента в локальном максимуме дает картинку линий уровня типа изображенной на рис. 10.1. Понятно, что наложить две такие картин- картинки центрированно друг на друга с соблюдением условия ортогональности линий уровня — невозможно. Поэтому максимум мо- модуля аналитической функции, если достигается, то только на границе области. Высказанные соображения обычно даже не упоминаются, поскольку для их превраще- превращения в строгое доказательство приходится из- Рис. 10.1 рядно повозиться с деталями. Поэтому прин- принцип максимума предпочитают доказывать на том этапе развития теории, когда это делается легко и без натяжек. Беда лишь в том, что «легко» и «прозрачно» не всегда совпадают. Легкость обоснования иногда оставляет впечатление фокуса. Поэтому наглядность даже с изъяном имеет свою цену. 4. Дифференцируя условия Коши—Римана и исключая одну из функций и или V, легко убедиться, что обе удовлетворяют уравнению Лапласа, Аи = 0, Дя = 0, где л--*. — дх2 + ду2' и являются таким образом гармоническими функциями. ' Семейства кривых и(х, у) = С, «(х, у) = С.
198 Глава 10. Аналитические функции Кто знаком с дифференциальными уравнениями в частных производных, может сразу сделать неожиданный (для аналитических функций) вывод. Задание поведения гармонической функции на границе области полностью определя- определяет ее значения внутри области. Для дифференциальных уравнений такая связь естественна и привычна, но для ТФКП — несколько шокирующа. Все, чем занимается теория аналитических функций, — как выясняется — это изучение решений одного дифференциального уравнения Аи = 0. Специалисты по дифу- рам удивляются по этому же поводу: «Неужели теория одного дифура Аи = 0 это целая ТФКП?» Упражнение При использовании полярных координат для г = те9 условия Коши— Римана для функции /(г) = и(г, <р) + гг/(г, (р) принимают вид ди _}_д^ }_ди __0г> дг ~ гд(р' гд(р~ дг' **' 10.4. Контурные интегралы Комплексный интеграл / ${%) йг вдоль кривой Ь можно рассмат- ь ривать как предел суммы к при стандартном измельчении разбиения, либо — пользуясь тем, что криволинейные интегралы действительных функций определе- определены — как / /(я) йг = ийх-уйу + г / и йу + V <1х, что получается после перемножения / = и 4- IV и йг = их + г йу. 10.4.1. Теорема Коши. Пусть функция /(г) аполитична в одно- связной области X). Тогда интеграл от /(г) по любому замкнутому контуру С, лежащему в Х>, равен нулю. Ч Доказательство моментально дает применение к Ф /(г) д,г — <р ийх -V йу + г <р ийу + с с формулы Грина G.7) с последующим учетом того, что и и V удовлетворяют условиям Коши—Римана. >
10.4. Контурные интегралы 199 В условиях теоремы 10.4.1, если кривые Ь\ Е Б и 2^2 Е В имеют одни и те же концевые точки а, Ь, то что сразу получается интегрированием по замкнутому контуру Ь\,Ь2 (рис. 10.2). Но для этого (!) внутри кон- контура, образованного кривыми Ь\ и 1,2, не должно быть особых точек (в которых /(г) не дифференцируема). Рис. 10.2 Другими словами, интеграл //(х) йг не зависит от пути инте- интегрирования, а определяется лишь начальной и конечной точками. ь Поэтому вместо \йг можно писать ?. При этом очевидно свойство аддитивности: о с о 1-И- Положим где подразумевается путь интегрирования по произвольной кривой, лежащей в И и ведущей из а в г. Легко показать, что функция Р{г) аналитична, причем Р\г) = /(г). Действительно, ¦-/' откуда
200 Глава 10. Аналитические функции Интеграл справа стремится к нулю при Дя -»> 0, что и обеспечивает Е'(г) = Множество всех первообразных, т.е. таких функций, что С (г) = /(я), называется неопределенным интегралом функции /(ж). Очевидно, первообразные отличаются друг от друга на константу. Поэтому для любой из них ь /¦ Примеры 1. Функция гп при любом п = 1,2,... аналитична везде. Поэтому интеграл от хп по любому замкнутому контуру равен нулю. 2. Пусть С — окружность радиуса Е с центром в нуле. Тогда — = 2тгг. A0.6) с Это важный факт. Интеграл легко вычисляется в полярных координатах, г = Д(со8 <р 4- г 81П <р) = Кег<р, а так как К = соп81, то их = К(- 81П <р 4- г сок (р) 4<р = гКег<р 4<р. Поэтому 2* Ф — = г / й(р = 2ттг. Интеграл оказывается не равным нулю, но противоречия с теоремой 10.4.1 нет, поскольку функция \/г не аналитична в нуле, и контур С нельзя стянуть в точку в Д2\0. Именно последнее обстоятельство является критичным для справед- справедливости теоремы Коши. Область Б на самом деле может быть какой угодно. Если контур С таков, что его можно стянуть (деформировать) в точку в области Б, то интеграл от /(я) по С будет равен нулю. 3. Если контур С не деформируется в точку, отличие контурного интеграла от нуля, разумеется, не обязательно. Например, интеграл по тому же контуру, что и в предыдущем примере, г — = 0 при целом пф\. с Для дальнейшего важно еще отметить аддитивность контурно- контурного интеграла в следующем смысле. Если контуры С\ и С^ имеют
10.5. Интеграл Коши 201 Рис. 10.3 общий участок Сп, после выбрасывания которого образуется кон- контур С, причем Сп проходится в противоположных направлениях при интегрировании по С\ и Сг, то &> /(*) <1г + &> /(*) йг = &> Это не что иное как свойство слагаемых противоположных знаков взаимно сокращаться. Ситуация на рис. 10.3 а абсолютно прозрачна. На рис. 10.35 изобра- изображен более сложный пример. Функция /(г) аналитична в кольце, ограниченном малой Сг и большой окружностью Сц. Интеграл по замкнутому контуру СгД, проходящему Сц против часовой стрелки, потом по В А, затем С я по часовой стрелке, затем возврат в исходную точку по АВ, — равен нулю. Поэтому (г) их, A0.7) что является следствием ся сг Сг 10.5. Интеграл Коши Пусть функция /(г) аналитична внутри контура С и на самом кон- контуре С. Тогда —, как функция V), аналитична на С и внутри С IV — г за исключением точки и — г. Поэтому - г IV - г A0.8) сг
202 Глава 10. Аналитические функции где Сг обозначает окружность радиуса г с центром в г. Равен- Равенство A0.8) можно получить так же, как и A0.7), поскольку в обос- обосновании A0.7) никакой роли не играло, что Сц окружность. Поскольку /(ги) = /(г) + о(ш - г), то Ф -^-^- йь) = /(г) ф + ф о(ь) - г) - г A0.9) При г -» 0 второй интеграл справа в A0.9) обнуляется, а первое слагаемое, в силу A0.6), оказывается равным $(г)-2т. В результате A0.10) что называют интегральной формулой Коши. В случае, когда С является окружностью Сг, представляет интерес перейти в A0.10) к интегрированию в полярных координатах: гп = г + ге1<р, дло = гге1<р й<р. В результате получается формула 2тг или, равносильно, Сг где из — дифференциал дуги окружности Сг. Выходит, что /(г) в точности равно среднему значению / на окружности Сг с центром в г. Бесконечная дифференцируемость. Уникальность ситуации, ко- которую улавливает интегральная формула Коши, заключается в том, что A0.10) можно продифференцировать по параметру г и получить A0.11)
10.6. Регулярность 203 потом снова продифференцировать A0.11) по 2, получить формулу для второй производной, 2тгг / (ш - и так до бесконечности, Перенос дифференцирования под знак интеграла здесь легко обосновыва- обосновывается, поскольку дифференцирование под интегралом саму функцию / вообще не затрагивает. В результате выявляется уникальная вещь. Аналитическая функция оказы- оказывается бесконечно дифференцируемой сама по себе, без каких бы то ни было дополнительных требований. Интеграл Коши дает наиболее простой ключ к пони- пониманию этого факта. Функция /(г) в силу A0.10) определяется интегрированием самое себя, а поскольку интеграл обладает улучшающими свойствами7*, то /(г) обязана быть лучше, чем того можно ожидать. Выход из положения один — быть «бесконечно хорошей». 10.6. Регулярность 10.6.1. Теорема. Если функция }{%) аполитична в некоторой ок- окрестности IV тонки а, то она представима рядом Тэйлора, /(*) = На) + П*)(г - а) + ... + !-^-{х - а)п + ..., A0.13) в любом шаре \г — а\ < г, принадлежащем этой окрестности. Ситуация кардинально отличается от той, которая имела место в случае функций действительной переменной. Там ряд Тэйлора мог сходиться вообще к другой функции (см. разд. 3.7). ^ Для доказательства возьмем максимальное г, при котором контур Сг принадлежит IV, и рассмотрим сумму бесконечно убывающей геометрической прогрессии 1 1 г -а (г - а)п IV - г XV - а (ад - аJ * * {го - а)п A0Л4) ' Из непрерывной функции делает дифференцируемую.
204 Глава 10. Аналитические функции где гп 6 Сг, а г лежит внутри Сг и потому знаменатель прогрессии (г - а)/{го - а) по модулю меньше единицы. В результате ряд A0.14) на Сг сходится равно- равномерно. Умножая A0.14) на /(ад) и интегрируя по Сг, с учетом A0.12) получа- получаем A0.13). > 10.6.2. Определение. Функция /(г), представимая рядом A0.13), сходящимся в некоторой окрестности точки 2, называется регулярной в г. Казалось бы, еще один перехлест в нагромождении терминов. Дифферен- цируемость в окрестности г, аналитичность и регулярность — просто совпадают. Но это в ТФКП. В анализе на действительной прямой это совершенно различные понятия. Кроме того, в самой ТФКП за каждым понятием стоят свои соб- собственные особые признаки, что удобно для расстановки акцентов. Упоминание регулярности функции, например, подчеркивает ее разложимость в ряд Тэйлора. 10.7. Аналитическое продолжение Благодаря теореме 10.6.1 степенные ряды в ТФКП играют роль универсального инструмента. Но при этом есть свои трудности. Например, функция 1/A - г) представляется степенным рядом 1 1 + 2 + Г + ..., A0.15) который сходится лишь при \г\ < 1 (круг А на рис. 10.4). В то же время функция 1/A - г) аналитична везде за исключением г = 1. Поэтому ее можно разложить в ряд в любой точке а Ф 1. Получится другой ряд Тэйлора, который будет сходиться в другом круге В (рис. 10.4). В каком соотношении находятся эти ряды и сама функция 1/A - г)? За кадром здесь просматривается очевидная идея. Если на области А (речь идет уже не обяза- обязательно о кругах) задана аналитическая функция /1B), на В — /2(<г) и на пересечении АПВ значения функций совпадают, то было бы хоро- хорошо /2(г) считать продолжением /|(г) на более широкую область (равно как и /\(г) — продол- продолжением /2B))- Чтобы такой трюк был законным, не хватает «малости» — гарантий единственности Рис. 10.4 продолжения. 10.7.1. Теорема единственности. Пусть функции $(%) и д(г) ана- литичны в области Ю, и их значения совпадают в различных точках ап 6 Т>, причем ап -> а € Б при п -> оо. Тогда /(г) = д(х) в Б. Доказательство. Очевидно, аналитическая в И функция К(х) = /(г) - д(г) в точках а„ обращается в нуль, а потому и Н(о) = 0, в силу ап -> а и непрерыв-
10.7. Аналитическое продолжение 205 ности Н. Поэтому в разложении Н(г) = со + с,B - а) + с2(г - аJ + ... A0.16) коэффициент Со = 0. Следовательно, Н(г) = (г — а)Н\(г). Но тогда Н(ап) = 0 =* Мап) = 0. Снова, по непрерывности, /11 (а) = 0, что означает С\ = 0. И так далее. Все коэффициенты в разложении Л оказываются нулевыми. Поэтому Н(г) = 0 в круге сходимости ряда A0.16), т.е. /(г) = д(г). Окончательный вывод о тождественности ну- нулю Н{г) в В вытекает из возможности попасть в любую точку V) 6 В по цепочке пересекаю- пересекающихся кругов (рис. 10.5), в каждом из которых Н(г) разлагается в свой ряд Тэйлора и повторяет- повторяется предыдущее рассуждение (для некоторой новой последовательности ап из предыдущего круга, где ужеН(г) = 0). > Рис. 10.5 Из доказательства легко усмотреть, что аналитичность влечет за собой изолированность нулей%\ Но главный вывод заключается, если можно так ска- сказать, в «голографическом устройстве» аналитических функций. Целое отражается в любом маленьком фрагменте. Задание функции на кусочке дуги определяет все остальное. Поэтому функции ех, $тж, \пх на действительной прямой автоматиче- автоматически порождают соответствующие функции в комплексной плоскости. Вопрос лишь в том, как их найти. Когда выдвигаются какие-нибудь дополнительные требования, проблема может оказаться сложной, но принципиально она всегда разрешима. Разложение в степенные ряды позволяет гарантированно расширить область определения аналитической функции до максимальных размеров. Иногда это реализуется совсем просто. Скажем, в ситуациях п=0 п=0 в которых ряды имеют неограниченный радиус сходимости, достаточно поменять действительное х на комплексное г — и аналитические функции ег и готовы. В случае логарифма, проблема сложнее. Конечно, х здесь можно заменить на 2, но это даст лишь ряд Тэйлора, сходящийся в круге единичного радиуса, тогда как логарифм определен в гораздо более широком диапазоне9*. Надежный выход из положения заключается в расширении области определения пошаговым переходом к другим рядам по цепочкам пересекающихся кругов, как на рис. 10.5. Это обязательно ; Имеется в виду функция, не равная тождественно нулю. 9) Логарифм определен везде за исключением действительной полуоси (-оо, 0). Говорят: на комплексной плоскости с разрезом по (-оо, 0).
206 Глава 10. Аналитические функции приведет к успеху, но только «идеологическому». Логарифм везде, где возможно, будет определен и даже вычислим, но единой формулы это не даст. Простая формула \пг Г Ом получается совсем из других соображений. Но это уже вопрос удачи, а не систе- систематического подхода. В сказанном важно обратить внимание на следующий аспект. Любая ана- аналитическая функция может быть продолжена до функции, определенной на мак- максимально возможной области. Для $т г — это вся плоскость, для г){г - 1) — плоскость с выколотой точкой г = 1. Но так или иначе появляется возможность вообще не упоминать область определения, считая /(г) определенной везде, где возможно. Это еще одна удивительная особенность ТФКП. Область определения задается самой функцией. 10.8. Многозначные функции Функции, аналитичные на всей комплексной плоскости, называются целыми, и с ними меньше всего хлопот. Любое их разложение в ряд Тэйлора сходится при любом г. Там же, где необходимо прыгать по «ступенькам разложений» (по цепочкам кругов, рис. 10.5), — при этом еще говорят о продолжении функции вдоль того или иного пути10* — может возникать проблема многозначности, связанная с тем, что продолжение по различным путям дает разные результаты п*. Такая ситуация вполне типична. Самые обыденные функции — у/г, \пг — многозначны, и это заставляет разрабатывать инструменты для борьбы с неудобствами. Один из таких инструментов — римановы поверхности. Главная идея здесь заключается в способе рассмотрения многозначной функции как однозначной на подходящей поверхности. Такая идея работоспособна не только в ТФКП. Скажем, окружность х2 4- у2 = 1 на плоскости представляет из себя вполне добропорядочный объект. Разделение переменных на аргумент и функцию по- порождает многозначность у = ±\/1 - ж2, избавиться от которой можно было бы, рассматривая у как функцию не отрезка [-1, 1], а дуги окружности. Либо окруж- окружность можно было бы сплюснуть на [-1, 1] и считать отрезок [-1, 1] состоящим из двух слоев. Значение у = л/1 - х2 тогда сопоставлялось бы верхнему слою, у = —у/1 — х2 — нижнему. Сплющенные графики аналитических функций, собственно, и являются римановыми поверхностями. Характер разрезов и склеивания листов определяется конкретными особенностями изучаемой функции. ' Например, вдоль дуги, ведущей из о в Ь на рис. 10.5. Центры кругов лежат на дуге. п) В этом случае в контуре, образуемом разными путями, обязательно имеется особая точка.
10.9. Об остальном 207 10.9. Об остальном Ряды Лорана. Использование в ТФКП рядов Тэйлора в качестве стандартного инструмента удобно, но не обязательно. Использование других рядов имеет свои плюсы и минусы. Широкое распространение при изучении аналитических функций получили, например, ряды Лорана 00 00 00 п=-оо п=0 п=1 ^ ' Первое слагаемое справа в A0.17) представляет собой обыкновенный степенной ряд, сходящийся в некото- некотором круге радиуса Я\. Второе слагаемое после замены V) = \){г — а) тоже превращается в обыкновенный сте- степенной ряд, который сходится в плоскости XV в круге радиуса Л2, а в плоскости г — вне круга радиуса 1/Кг. Поэтому областью сходимости A0.17) является кольцо (рис. 10.6), что и служит причиной популярности рядов Лорана. Чтобы накрыть изолированную особую точку требуется бесконечно много «кругов Тэйлора» либо одно Рис. 10.6 «кольцо Лорана». Несложные выкладки показывают, что коэффициенты в A0.17) могут быть определены при любом п по единой формуле с где С — произвольный замкнутый контур, лежащий в кольце \/К2 < \г-а\ < К\ и охватывающий точку а. Особые ТОЧКИ. Точку г = а называют изолированной особой точкой функ- функции /(я), если /(я) аналитична и однозначна в некотором кольце 0 < \г - а\ < К, а в самой точке а недифференцируема. Если дифференцируемость в а восстанавливается при до- либо переопреде- переопределении значения функции в этой точке, то а называют устранимой особой точкой. В том случае, когда разложение Лорана /(г) в а содержит к слагаемых с отри- отрицательными степенями {г - а), точку а называют полюсом к -го порядка. В полюсе конечного порядка модуль /(г) всегда уходит в бесконечность при г -> а. Наконец, а называют существенно особой точкой, если разложение Лора- Лорана /(г) в а содержит бесконечное число слагаемых с отрицательными степе- степенями (г - а). В существенно особой точке функция ведет себя беспорядочно, принимая в окрестности а все мыслимые значения с любой наперед заданной точностью (пример: е1^). Перечисленное не исчерпывает классификацию особых точек. Наибольшие осложнения связаны с особенностями многозначных функций. Вычеты. Коэффициент С в разложении A0.17) называется вычетом и обозначается ге$ (/, а).
208 Глава 10. Аналитические функции 10.9.1. Пусть функция /(я) однозначна и аналитична на замкнутом контуре С и внутри него, за исключением конечного числа точек п\,..., а*. Тогда I /(г) йг = 2x1 [гее (/, а,) + ... + гез (/, а*)]. A0.18) с М Аддитивность контурного интеграла сводит <р к сумме контурных С интегралов по маленьким окружностям с центрами в особых точках. Это и дает A0.18). > Естественно, возникают ассоциации с теоремой об алгебраическом числе нулей из предыдущей главы.
Обозначения Ч — обозначает начало рассуждения, темы, доказательства. > — обозначает конец рассуждения, темы, доказательства. (>) — предлагает проверить или доказать утверждение в каче- качестве упражнения, либо довести рассуждение до «логической точки». А => В — из А следует В ж Е X — ж принадлежит X ХЦУ, ХПУ, X \У — объединение, пересечение и разность множеств X и У, для разности X и У иногда употребляется эквивалентное обозначение X - У п — замыкание области п Я2 — плоскость, Л3 — трехмерное, Яп — п-мерное пространство г — мнимая единица, г2 = -1 г = х + гу — комплексное число, г = г(соз ср + г зт ф) — его тригонометрическая запись х = {х\,..., хп} — вектор, ж, — его координаты ху9 х х у — соответственно, скалярное и векторное произведение векторов х и у — для скалярного произведения используется также эквивалентное обозначение (ж, у) ЛНх) —— — производная (скорость изменения по ж) функции /(ж) ах в точке ж, эквивалентное обозначение: /'(ж) для производной по времени вместо х'A) чаще используется ж, а для второй производной ж
210 Обозначения частная производная функции и по переменной х ох ж) — градиент функции /(ж), т.е. вектор ; • . который направлен по нормали к поверхности постоянного уровня функции /(х) и численно равен скорости макси- максимального роста /(х) в точке х.
Предметный указатель Абсолютно сходящийся ряд 37 аксиома выбора 170 аналитическая функция 195 аналитическое продолжение 204 Бесконечно большая величина 22 — малая величина 22 бесконечный предел 22 бесконечный ряд 35 Бином Ньютона 11 Векторное поле 179 — произведение 144 верхний предел 29 вогнутость 57 вращение векторного поля 179 выпуклость 56, 57 Гармоническая функция 197 гармоническое колебание 139 гессиан 94 гиперплоскость 81 гомотопический мост 181 гомотопные отображения 181 градиент 78 граничные условия 60 Двойной предел 71 двусторонняя поверхность 144 детерминант 83 дивергенция 150 дифференциал 49 дифференциальное уравнение 47, 59, ПО дифференцирование 41 — оператора 88 длина дуги 102 Евклидово пространство 66 Замкнутое множество 18 Измеримая функция 168 интеграл 99 — двойной 121 — кратный 124 — Лебега 135, 169 — неопределенный 99 — несобственный 113 — определенный 101 — Римана 107 — Фурье 140 интегральная формула Коши 202 интегрирование 99 — по частям 109 интервал 18 инфинум 160 Канторово множество 163 касательная плоскость 78 квадрируемая область 121 ковер Серпинского 164 коллинеарные векторы 68 компактность 30 комплексное число 14 континуум 162 контрпример Шварца 165 контурный интеграл 155 конус 87 конформное преобразование 197
212 Предметный указатель криволинейный интеграл 154 критерий Коши 24 критическая точка 93 Лагранжиан 96 лемма Больцано—Вейерштрасса 28 — Гейне—Бореля 29 — о вложенных отрезках 25 линейно зависимые векторы 68 линейный оператор 81 логарифм 16 Мажорирующий ряд 36 матрица 82 — вырожденная 83 — единичная 82 — обратная 82 — транспонированная 82 — Якоби 88 мера Лебега 167 метрика 84 множества 17 множитель Лагранжа 97 монотонная функция 57 монотонность 56 монотонный оператор 87 Начальные условия 60 невырожденная деформация 181 неподвижная точка 86 непрерывная функция 33, 70 неравенство Иенсена 58 неявная функция 92, 190 нижний предел 29 норма вектора 66, 84 — матрицы 85 — подчиненная 85 нормаль 144 Обратимость отображения 189 обратная функция 90 однородные функции 76 односторонние производные 43 оператор Гамильтона 153 — Лапласа 154 — «набла» 153 оптимизация 92 орт 142 ортогональный базис 134 открытое множество 18 отрезок 18 Парадокс Банаха—Тарского 170 — Брауэра 177 первообразная 99 перестановки 9 — с повторениями 10 площадь кривой 121 повторный предел 71 показательная функция 16 полином Бернштейна 56 полиномы Лежандра 135 полный дифференциал 75 полуупорядоченность 87 полярные координаты 14 последовательность Коши 24 правило Лопиталя 61 предел 20 — функции 30, 69 предельная точка 18 признак Даламбера 37 — Коши 37 принцип максимума модуля 197 — сжимающих отображений 86 производная 41 — обратной функции 45 — сложной функции 45 — Фреше 88
Предметный указатель 213 производные высших порядков 44 промежуток 18 Равенство Парсеваля 134 равномерная непрерывность 35, 71 — сходимость интегралов 119 ряда 129 радиус сходимости 132 размерность 68 размещения 9 расходящаяся последовательность 22 регулярная функция 204 ротор 157 ряд функциональный 129 — Фурье 136 Сегмент 18 сечение Дедекинда 159 сжимающее отображение 86 система координат правая/левая 143 скалярное произведение функций 133 согласованная норма 86 сопряженное число 14 сочетания 9 спектр 139 спектральная норма 85 степенной ряд 131 столбцовая норма 85 строчная норма 85 сумма Дарбу 106 супремум 160 сходимость 20 Теорема Безу 12 — Больцано—Коши 34 — Брауэра 184 — Вейерштрасса 34, 56 — Виета 11, 13 — Гаусса—Остроградского 151 — Дарбу 54 — Жордана 177 — Кантора 35 — Коши 53 — Лагранжа 52, 79 — о трех собачках 22 — Римана 39 — Ролля 52 — Стокса 156 — Штольца 27 Условия Коши—Римана 194 условный экстремум 96 Формула Муавра 15 — Стирлинга 103 — Эйлера 55, 76 фрактал 165 фундаментальная последователь- последовательность 24 Циркуляция 156 Частичная сумма 129 частная производная 74 частота 139 — круговая 139 число е 26 числовая последовательность 20 Эквивалентность норм 85 экспонента 43 экстремумы 56 е -окрестность 18
^-<;<::¦;,,.-^ Издательство УРСС специализируется на выпуске учебной и научной литературы, в том числе монографий, журналов, трудов ученых Российской Академии наук, научно-исследовательских институтов и учебных заведений. Уважаемые читатели! Уважаемые авторы! Основываясь на широком и плодотворном сотрудничестве с Российским фондом фундаментальных исследований и Российским гуманитарным научным фондом, мы предлагаем авторам свои услуги на выгодных экономических условиях. При этом мы берем на себя всю работу по подготовке издания — от набора, редактирования и верстки до тиражирования и распространения. Среди вышедших и готовящихся к изданию книг мы предлагаем Вам следующие: В. Босс Лекции по математике: дифференциальные уравнения Материал в «Лекциях по математике» В. Босса дается эф- эффектно, но нетрадиционно, и отличается краткостью и про- прозрачностью изложения, вплоть до объяснений «на пальцах». Значительное внимание уделяется мотивации результатов и укрупненному видению. «Высокие материи» рассматрива- рассматриваются на доступном уровне. Книга легко читается. «Лекции» предназначены студентам, преподавателям, инже- инженерам и научным работникам. Уиттекер Э. Г., Ватсон Дж. Н. Курс современного анализа. Данфорд Н, Шварц Дж. Т. Линейные операторы. Общая теория. Князев П. Н. Функциональный анализ. Князев П. Н. Интегральные преобразования. Антоневич А. Б. и др. Задачи и упражнения по функциональному анализу. Магарил-Шьяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения. Шурыгин В. А. Основы конструктивного математического анализа. Дубровин Б. А., Новиков С. /7., Фоменко А. Т. Современная геометрия. Т. 1—3. Крыжановский Д. А. Изопериметры. Свойства геометрических фигур. БоярнукА. К. и др. Справочное пособие по высшей математике (Антидемидович). Т. 1-5. Краснов М.Л. и др. Вся высшая математика. Т. 1-6. Краснов М. Л. и др. Сборники задач с подробными решениями. Томов Г., Стерн М. Занимательные задачи. Томов Г. Мистер Томпкинс в Стране Чудес, или истории о с, С и Н. Томов Г. Мистер Томпкинс исследует атом. Фейнман Р., Лейтон Р., Сэндс М. Фейнмановские лекции по физике. В 9 томах. Задачи и упражнения с ответами и решениями к фейнмановским лекциям. В 2 томах. Вайнберг С. Мечты об окончательной теории. По всем вопросам Вы можете обратиться к нам: тел./факс @95) 135-42-16, 135-42-46 или электронной почтой 1Ж88@1Ж88.ги Полный каталог изданий представлен в Интернет-магазине: пир://Ш88.ги Издательство УРСС Научная и учебная литература
Издательство УРСС Представляет Вам свои лучшие книги: Л. С. Понтрягин: Серия «Знакомство с высшей математикой» Метод координат. Анализ бесконечно малых. Алгебра. Дифференциальные уравнения и их приложения. Дифференциальные и интегральные уравнения Филиппов А. Ф. Введение в теорию дифференциальных уравнений. Петровский И. Г. Лекции по теории обыкновенных дифференциальных уравнений. Петровский И. Г. Лекции по теории интегральных уравнений. Трикоми Ф. Дифференциальные уравнения. Эльсгольц Л. Э. Дифференциальные уравнения и вариационное исчисление. Амелькин В. В. Автономные и линейные многомерные дифференциальные уравнения. Амелькин В. В. Дифференциальные уравнения в приложениях. Кузьмина Р. П. Асимптотические методы для обыкновенных диф. уравнений. Беллман Р. Теория устойчивости решений дифференциальных уравнений. Лефшец С. Геометрическая теория дифференциальных уравнений. Теория чисел Вейль А. Основы теории чисел. Вейль Г. Алгебраическая теория чисел. Хинчин А. Я. Три жемчужины теории чисел. Хинчин А. Я. Цепные дроби. Понтрягин Л. С. Обобщения чисел. Караиуба А. А. Основы аналитической теории чисел. Виноградов И. М. Особые варианты метода тригонометрических сумм. Оре О. Приглашение в теорию чисел. Ожигова Е. П. Развитие теории чисел в России. Жуков А. В. Вездесущее число «пи». Теория вероятностей Гнеденко Б. В., Хинчин А. Я. Элементарное введение в теорию вероятностей. Гнеденко Б. В. Курс теории вероятностей. Гнеденко Б. В. Очерк по истории теории вероятностей. Хинчин А. Я. Работы по математической теории массового обслуживания. Боровков А. А. Теория вероятностей. Боровков А. А. Эргодичность и устойчивость случайных процессов. Золотаревская Д. И. Теория вероятностей. Задачи с решениями. Пытьев Ю. П. Возможность. Элементы теории и применения. Кац М. Вероятность и смежные вопросы в физике. Шикин Е. В. От игр к играм. Математическое введение.
т 2 «56 Ш Издательство УРСС Представляет Вам свои лучшие книги: Брайан Грин ЭЛЕГАНТНАЯ ВСЕЛЕННАЯ Суперструны, скрытые размерности и поиски окончательной теории Книга Брайана Грина «Элегантная Вселенная» — увлека- увлекательнейшее путешествие по современной физике, которая как никогда ранее близка к пониманию того, как устро- устроена Вселенная. Квантовый мир и теория относительности Эйнштейна, гипотеза Калуцы—Клейна и дополнительные измерения, теория суперструн и браны, Большой взрыв и мульти-вселенные — вот далеко не полный перечень обсу- обсуждаемых вопросов. Используя ясные аналогии, автор переводит сложные идеи современной физики и математики на образы, понятные всем и каждому. Брайан Грин срывает завесу таинства с теории струн, чтобы представить миру 11-мерную Вселенную, в ко- которой ткань пространства рвется и восстанавливается, а вся материя порождена вибрациями микроскопических струн. Книга вызовет несомненный интерес как у специалистов естественно-научных дисциплин, так и у широкого круга читателей. Роджер Пенроуз НОВЫЙ УМ КОРОЛЯ О компьютерах, мышлении и законах физики Монография известного физика и математика Роджера Пенроуза посвящена изучению проблемы искусственного интеллекта на основе всестороннего анализа достижений современных наук. Возможно ли моделирование разума? Чтобы найти ответ на этот вопрос, Пенроуз обсуждает ши- широчайший круг явлений: алгоритмизацию математического мышления, машины Тьюринга, теорию сложности, теорему Геделя, телепортацию материи, парадоксы квантовой физи- физики, энтропию, рождение вселенной, черные дыры, строение мозга и многое другое. Книга вызовет несомненный интерес как у специалистов, так и у широкого круга читателей. Издательство УРСС @95) 135-42-46, @95) 135-42-16, Наши книги можно приобрести в магазинах: «Библио-Глобус» (и. Лубянка, ул. Мясницкая, 6. Тел. @95) 925-2457) «Московский дом книги» (м.Арбатская, ул. Новый Арбат, 8. Тел. @95) 203-8242) «Москва» (м. Охотный ряд, ул. Тверская, 8. Тел. @95) 229-7355) «Молодая гвардия» (м. Полянка, ул. Б. Полянка, 28. Тел. @95) 238-5083, 238-1144) «Дом деловой книги» (м. Пролетарская, ул. Марксистская, 9. Тел. @95) 270-5421) «Гнозис» (м. Университет, 1 гум. корпус МГУ, комн. 141. Тел. @95) 939-4713) «У Кентавра» (РГГУ) (и. Новослободская, ул. Чаянова, 15. Тел. @95) 973-4301) «СПб. дом книги» (Невский пр., 28. Тел. (812) 311-3954)
утес «не верит глазам, своим,»: Из интервью В. Босса ¦ Ш.ельзя ли в двух словах о главной особенности «Лекций»? ¦ Диалектика обучения во взаимодействии сторон. Понимание - умение. Суть —детали. «Лекции» добиваются понимания Как? • Правдами и неправдами (улыбается). Очень важно, например, поместить проблему «целиком в кадр». Чтобы видно было «сразу все». - Объяснениями на пальцах? ¦ Когда как, только «коротко и ясно». Упрощения, недомолвки. Но главное - обнажение сути. ¦ у1 что посоветуете, если завтра экзамен, а в голове пусто? ¦ Таблетку димедрола. ИЗДАТЕЛЬСТВО НАУЧНОЙ И УЧЕБНОЙ ЛИТЕРАТУРЫ Тел./факс: 7 @95) 135-^12-16 Тел./факс: 7 @95) 135-^2-^6 2518 Ю 21377 В. Босс — автор замечательной книги «Интуиция и математика» — предложил нам издавать его «Лекции по математике». Пока выходят первые два тома — «Анализ» и «Дифференциальные уравнения». Но до этого — были раздумья. Сразу стало ясно, что «Лекции» очень эффектны, но нетрадиционны. Поэтому мы решили: соберем отклики. Разослали сто экземпляров рукописи, и теперь «не верим глазам своим». Отзывы «зашкаливают»! Это очень хорошие учебники. Из тех, что ру- ругают в стенах ВУЗов, но зачитывают до дыр. Доцент Ю. Сингин О загадке книг В. Босса. «Интуиция и ма- математика» читается как детектив. «Лек- «Лекции» на кафедре шли нарасхват. В чем дело - не понимаю. Какие-то скрытые пружины. Аспирант В. Жеглов «Лекции» В. Босса опасны. Автор просто так отдает то, чего студенты должны добиваться годами. На легких хлебах хороших специалис- специалистов не выращивают. Профессор М. Штольц Передайте В. Боссу благодарность от студен- студентов Казахстана. Ксероксы в Алма-Ате пере- перегреваются. Книги замечательные. Студенты Политеха Все как на ладони. Где Босс раньше был? Студент Д. Петров Пюбые замечания и предложения по изданию а также замеченные опечатки присылайте по адресу 1Ж55(а>иК55.ги. Полный список замеченных опечаток мо* но будет увидеть на \л/еЬ-странице этой книги и нашем интернет-магазине ННр://иК55.ш