/
Автор: Опойцев В.И.
Теги: учебные пособия и учебники по математике математика математический анализ математическая логика издательство урсс серия школа опойцева
ISBN: 978-5-9710-3295-3
Год: 2016
Текст
ШКОЛА ОПОЙЦЕВА
МАТЕМАТИЧЕСКИЙ
АНАЛИЗ
URSS
МОСКВА
ББК 22.1я73 22.161
Опойцев Валерий Иванович
Школа Опойцева: Математический анализ.
М.: ЛЕНАНД, 2016. — 272 с.
Стандартная программа математического анализа (производные, интегралы)
расширена добавлением ингредиентов из других дисциплин, чем достигается
цельность предмета. Яснее становится «что для чего нужно». При этом изложение
отличается краткостью и прозрачностью, вплоть до объяснений на пальцах.
Акцент делается на понимании существа дела, причем с заботой о новичках,
знакомящихся с предметом либо впервые, либо — по второму кругу, после не вполне
удачного первого. Охват материала достаточно широкий, но изложение построено
так, что можно ограничиться любым желаемым срезом содержания. Значительное
внимание уделяется мотивации результатов. Объяснения даются «человеческим
языком». Книга легко читается, самодостаточна и может служить основой при
изучении матанализа.
Для студентов, преподавателей, инженеров и научных работников.
Формат 60x90/16. Печ. л. 17. Зак. № АХ-710.
Отпечатано в ООО «ЛЕНАНД».
117312, Москва, пр-т Шестидесятилетия Октября, 11 А, стр. 11.
ISBN 978-5-9710-3295-3
©ЛЕНАНД, 2016
19529 ID 213615
9 "785971 0329531
НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА
URSS
E-mail: URSS@URSS.ru
Каталог изданий в Интернете:
http://URSS.ru
Тел./факс (многоканальный):
+ 7(499)724 25 45
Все права защищены. Никакая часть настоящей книги не может быть воспроизведена или
передана в какой бы то ни было форме и какими бы то ни было средствами, будь то
электронные или механические, включая фотокопирование и запись на магнитный носитель,
а также размещение в Интернете, если на то нет письменного разрешения владельца.
Оглавление
Предисловие 7
1 Стартовая площадка 8
1.1 Откуда берутся «всякие» числа 9
1.2 Всё ли так просто 10
1.3 Комплексные числа 12
1.4 Об ощущении таинственности 16
1.5 Комбинаторика 18
1.6 Бином Ньютона 20
1.7 Многочлены 21
1.8 Теоретико-множественные операции 23
2 Последовательности и пределы 26
2.1 Сходимость и пределы 26
2.2 Простейшие инструменты 28
2.3 Как работает лемма Вейерштрасса 30
2.4 Предел функции 32
2.5 Непрерывные функции 35
2.6 О теории вещественных чисел 37
2.7 Надумана ли проблема и каковы блага 40
2.8 Равномерная непрерывность 42
2.9 Фундаментальные последовательности 43
2.10 Числовые ряды 44
3 Производная и дифференциал 51
3.1 Производная . . . * 51
3.2 Правила дифференцирования 53
3.3 Дифференциалы 55
4 Оглавление
3.4 Производные элементарных функций 59
3.5 Тропа на вершину Тейлора 64
3.6 Разложение Тейлора 67
3.7 Контрпримеры и парадоксы 69
4 Интеграл 75
4.1 Первообразная 75
4.2 Определённый интеграл 77
4.3 Взаимосвязь интегралов 79
4.4 Техника интегрирования 81
4.5 Прикладные задачи 85
4.6 Несобственные интегралы 92
4.7 Дифференциальные уравнения 98
5 Функции нескольких переменных 105
5.1 В двух словах о векторах 105
5.2 Предел и сходимость 107
5.3 Непрерывность 109
5.4 Частные производные 110
5.5 Приращения и дифференциалы 110
5.6 Производные и дифференциалы
высших порядков 112
5.7 Градиент 113
5.8 О роли повторных пределов 117
5.9 Интегралы, зависящие от параметра 122
6 Отображения, или операторы 125
6.1 Аргументы и функции как векторы 125
6.2 Линейные отображения 127
6.3 Обратимые преобразования 130
6.4 Детерминанты, или определители 132
6.5 Эквивалентные нормы 133
6.6 Дифференцирование оператора 136
6.7 Принцип сжимающих отображений 137
6.8 Обратные и неявные функции 138
Оглавление 5
7 Кратные интегралы 141
7.1 Двойные интегралы 141
7.2 Замена переменных 144
7.3 Кратные интегралы 146
7.4 Объёмы n-мерных тел 146
7.5 Сюрпризы η измерений 148
8 Векторный анализ 150
8.1 Координаты и векторы 150
8.2 Скалярное произведение 155
8.3 Векторное произведение 157
8.4 Приложения к механике 160
8.5 Дивергенция 163
8.6 Оператор Гамильтона 167
8.7 Циркуляция 168
9 Гладкая оптимизация 173
9.1 Безусловный экстремум 173
9.2 Достаточные условия 175
9.3 Условный экстремум 176
9.4 Общий случай 180
9.5 Нелинейное программирование 182
9.6 Интерпретация множителей Лагранжа 184
9.7 Двойственные задачи 185
10 Аналитические функции 187
10.1 О роли комплексных чисел 187
10.2 Дифференцируемость 190
10.3 Примеры 193
10.4 Простейшие свойства 194
10.5 Контурные интегралы 196
10.6 Интеграл Коши 200
10.7 Регулярность 202
10.8 Аналитическое продолжение 205
10.9 Теорема Руше 207
6
Оглавление
11 Функциональные ряды 210
11.1 Равномерная сходимость 211
11.2 Степенные ряды 212
11.3 Ортогональные разложения 214
11.4 Механизм производящих функций 217
11.5 Ряды Фурье 218
11.6 Интеграл Фурье 221
11.7 Преобразование Лапласа 223
11.8 Дельта-функция 227
12 Неподвижные точки 231
12.1 Проблемы существования решения 231
12.2 Вращение векторного поля 234
12.3 Гомотопия векторных полей 237
12.4 Ядро теории 240
12.5 Теоремы существования 243
12.6 О теореме Брауэра 245
12.7 Р-отображения 246
12.8 Алгебраическое число нулей 247
12.9 Индексы на бесконечности 248
12.10Накрытия и гомеоморфизмы 249
12.11 Параметрические уравнения 251
13 Проблемы обучения 253
13.1 Кто мы есть и как мы учимся 254
13.2 О взаимодействии с подсознанием 257
13.3 Гипнотический вирус, будь он неладен 258
Обозначения 261
Литература 262
Предметный указатель 264
Предисловие
Нельзя по дороге в баню
отвлекаться на поездку в Сочи.
Как учат там, где система образования замешкалась в стороне?
Очень просто. Чтобы краска на сапоги не капала, кисточку держи вот
так. Потом — что-то насчёт колера. Далее разные «пустячки»
уточняются, расширяются, сливаются, — и вырастает маляр. Или, скажем,
кого-то взяли в штат. Вот тебе рабочее место, тут буфет, там туалет,
а это твои коллеги, Саша-Маша, что не ясно — спрашивай. Всё!
Нормальная стартовая площадка. Остальное приложится.
Это хороший путь, правильный. Эффективный
для освоения любой науки. Ибо всякое познание
начинается с середины, с некой данности, с кота в мешке,
а потом развивается по двум направлениям, вглубь и
вширь. Так и надо учить и учиться.
Но Высшая школа попала в западню. Группа её резидентов
двигалась «вглубь и вширь», потом где-то остановилась и решила, что с
этого места и надо обучать население. Мол, так будет лучше. В
результате никто в изучаемый предмет войти не может. Потому что
вход там, где богом задумано, а не там, куда резиденты долго шли, а
новичок не может попасть даже по щучьему велению.
Данный курс почти везде начинает с «середины».
^■^ Многое поясняя по ходу дела. Не до такой степени, ко-
■ нечно, что «вот вам буфет-туалет». Поскольку слегка
\] притормаживает, чтобы не перегнуть палку. Но сдвиг в
Д* направлении «идёшь в баню — иди» давно назрел. Чем
меньше приготовлений, тем успешнее движение.
Глава 1
Стартовая площадка
Одолевает камуфляж,
Блажь!
И страх под горлом начеку —
Страж:!
А космос в штопор и Мираж
В раж:!
Ну, вмажь разок хотя бы, а,
Вмажь!
В главе приводятся некоторые сведения из элементарной
математики. Частично как напоминание, но в большей степени для
настройки в резонанс. Особенно это касается комплексных чисел, которые на
полную мощь работают в главе 10, а по ходу дела встречаются лишь
изредка. Но они являются великолепным камертоном для ощущения
полёта орла, необходимого при изучении высшей математики. Не
говоря о том, что странствие в эмпиреях комплексных чисел неожиданным
образом открывает глаза на природу «обыкновенных» чисел.
Рисунки А. Фоменко
1.1. Откуда, берутся «всякие» числа,
9
1.1 Откуда берутся «всякие» числа
Более высокие ступени математического образования
характеризуются не столько расширением, сколько углублением обзора, —
позволяя видеть новое в давно известном. Хотя источники
появления чисел теряются в начальном образовании, там есть один
принципиальный механизм, который лучше видится на
расстоянии. Как и зачем, скажем, вводятся отрицательные числа?
Тут легко зациклиться на пустяковых причинах. Дескать, движение
вправо будем помечать знаком «+», влево — «—», и тогда «+а» шагов
вправо, «—6» влево дают результирующее местоположение a — b = (+α) + (—6),
которое при Ь > a — отрицательно. Оказывается удобно. Объяснение
возможное, но от него круги по воде не расходятся. Настоящая роль
отрицательных чисел остаётся вне поля зрения.
Главный механизм здесь в другом. После того как некоторое
время вода толчётся в ступе вокруг натурального ряда
N = {1,2,3,. ..,п,...}, (1.1)
начинают вводить арифметические операции — действия.
Изучают их свойства1, перенося внимание с существительных (1.1)
на глаголы: «+», «-», «χ», «-Ξ-». При этом игровая площадка
N раздражает своей ущербностью. Не всегда действия на ней
выполнимы. Тогда возникает идея расширить площадку (1.1), что
«под влиянием вычитания» порождает множество целых чисел
Ζ={...,-2,-1,0,1,2...},
на коем сложение и вычитание никогда не уводят результат за
пределы площадки, на которой идёт игра2.
Таким образом, если а, 6 £ Ъ, то и а ± 6 £ Z. Другими словами,
складывать и вычитать на Ζ можно без опасений, что
результат а ± Ъ уйдёт за пределы Ζ. Т. е. Ζ оказывается замкнутой
игровой площадкой, что даёт образец, стереотип мышления,
действуя по которому вводят другие числа и множества.
хОт перестановки слагаемых сумма не меняется и т. д.
2 Соответственно, решаются любые уравнения а + х = Ь.
τι
10
Глава 1. Стартовая площадка
Эта идея пронизывает всю математику. В том смысле, что
площадка, модель, на которой выполняются операции,
должна быть удобной, чтобы действовать, не заботясь о
последствиях. Поэтому модель надо расширять до тех пор, пока она не
замкнётся по выполняемым операциям,. Причём удобства
здесь — даже не самое главное, но об этом позже.
Аналогично Ζ появляется в арифметике множество рациональных
чисел (дробей), обозначаемое символом Q. Чтобы деление
выполнялось и уравнения а · χ = b решались3. Существенно, что - в итоге
оказывается определено и для дробных α и 6. Могло быть хуже.
Введение дробей - для целых α и 6, могло бы не обеспечить - £ Q для
а а
дробных α и 6. И это в некотором роде была бы катастрофа. Пришлось
бы вводить ещё дроби дробей и т. д. Слава богу — не потребовалось.
К тому же, сумма и произведение дробей — тоже дроби, т. е.
α±+βΖ \
a q уЧ*
дробь в случае дробных а и /?, в том числе отрицательных. Иначе
говоря, множество рациональных чисел Q замкнуто в арифметике,
т. е. относительно арифметических операций.
1.2 Всё ли так просто
Так ли просто расширяются игровые площадки? Когда как.
Отрицательные числа получились в результате присоединения к N
всех разностей а — Ь для всех а, Ь Ε N с последующим
отождествлением одинаковых разностей, и проверкой, что вычитание для
а, Ь G Ζ уже не приводит к дальнейшему расширению модели.
Но если бы мы захотели бесхитростно добавить к N квадратные
корни у/Ь — возникла бы проблема. Во-первых, не все корни из b Ε Ν
рациональны4. Во-вторых, добавление всех y/b к N не образует замкну-
3Запрет а ф 0 в χ = — отчасти портит вкус победы. Но не физикам.
Они, как хорошие люди, при малой выгоде большой подлости, конечно, не
сделают, но выгода от деления на ноль у них бывает слишком велика.
4 Скажем, из \/Ъ = — следует Ь2 = 5а2, откуда вытекает, что Ь2 делится
на 25, а значит а делится на 5, что противоречит несократимости -.
1.2. Всё ли так просто
11
той арифметической модели, у/2 + у/3 не является корнем из какого-
либо ρ (?), а дополнительное прибавление всевозможных сумм y/a+y/b
всё равно не даёт замкнутости, поскольку у/2 + л/3 + у/Ь, например, не
представимо в виде у/а + y/b. Поэтому с иррациональностями не всё
так просто, и вопрос имеет смысл отложить5.
Интересно, что «двумерные» числа а + Ьл/З с
рациональными а, Ь образуют замкнутую арифметическую площадку^ (?).
Такую же удобную площадку образуют и числа вида а + &л/~~3>
если договориться, что (\/--3)2 = —3 (?).
Очень важно понимать, что «числа» из всяких «расширений»
упрощают жизнь и расширяют инструментальные возможности.
Вот простенькая иллюстрация.
Рассмотрим числовой ряд
1,1,3,5,11,21,..., (1.2)
устроенный по правилу
fr
sn+2 = «Sn+i + 2sn. (1.3)
Поиск η-го члена в виде sn = хп после подстановки в (1.3) даёт
д.п+2 _ χη+ι _ 2χη — q^ чт0 после сокращения на хп приводит к
необходимости решения квадратного уравнения
х2 - χ - 2 = О,
корни которого хг = 2, х2 = — 1. Поэтому закону (1.3) удовлетворяет
как sn = ж^, так и sn = χ™, а также их линейная комбинация
Sn = OLXn + βχζ
при любых а и β. Выбирая а и β из условия 5ι = «2 = 1, получаем
Η-Ζψ£. α.4)
Обратим внимание, что ряд (1.2) содержит только натуральные
числа. Искомая же формула (1.4) использует и отрицательные числа,
и дроби, но даёт в итоге, разумеется, исключительно sn e N.
5Теория вещественных чисел рассматривается в п. 2.6.
6 Со скидкой на запрет деления на нуль.
12
Глава 1. Стартовая площадка
Далее рассмотрим числовой ряд αη,
1, 1, 0, -2, -4, -4, 0, 8, 16, 16, 0, -32, ..., (1.5)
устроенный по правилу
αη+2 = 2αη+ι - 2αη (1.6)
со стартовыми условиями ао = αϊ = 1· Подставляя αη = хп в (1.6),
приходим к квадратному уравнению
х2 - 2х + 2 = 0, (1.7)
у которого дискриминант отрицателен, и потому вещественных
корней нет. Попробуем всё же воспользоваться стандартными формулами
корней чисто формально. Корни (1.7) оказываются «странными»
χι = 1 + >/—Ϊ, Х2 = 1 - >/—Ϊ,
и формула для αη при условии αο = α ι = 1 получается такой7
Любопытно, что все «нелегальные» \/^Т в нечётных степенях здесь
взаимно уничтожаются8, и αη получаются действительными, причём
в точности реализующими последовательность (1.5). Загадочная
картина возникает. Манипуляции незаконны, а результат — правильный.
Такого рода чудеса должны мобилизовать внимание. Где-то
поблизости может таиться открытие. Здесь тот самый случай.
1.3 Комплексные числа
Попробуем расширить теперь числовую ось R в нетривиальном
направлении. Уравнение х2 = Ь при Ъ < 0 не решается. Но что
7Точнее, αη = (!+ *Г + t1-*Г, где г2 = -1, откуда an = (V2)n cos ψ
с учётом тригонометрических ухищрений, см. далее.
8 По формуле бинома Ньютона.
(1 + s/=l)n + (1 - s/=l)n
(1.8)
1.3. Комплексные числа
13
мешает нам объявить, что некое г при возведении в квадрат даёт
— 1. Тогда решением х2 = —1 будет х12 = ±г.
На этом сказка, понятное дело, не кончается. Замкнутость в
арифметике требует ещё приплюсовать к R числа вида9 χ + гу,
χ,ί/Gl, которые и называют комплексными. Их множество С
называют также комплексной плоскостью. Не факт, конечно,
что этого хватит. Но этого хватает, как потом выясняется, и для
деления10, и для извлечения корней,
и даже для извлечения корней любой степени. К тому же
решаться начинают ещё и алгебраические уравнения любой
степени, не только квадратные! Что свидетельствует о большой удаче
и точном попадании.
Комплексные числа, надо согласиться, при беглом
знакомстве уводят почву из-под ног. Однако за удивительным фасадом
здесь прячется вполне рациональная идея. Где остановиться, —
каждый решает сам. Но в любом случае начало пути пролегает
через обыкновенное знакомство с объектом.
1.3.1 Определение. Комплексными числами (КЧ)
называются числа вида
ζ = x + iy,
где χ, у — обыкновенные вещественные числа, а г — так
называемая мнимая единица, г2 = — 1. Величину χ называют
действительной частью, у — мнимой, и пишут
\х = Re(z), y = Im(z)
'Дабы всё можно было складывать и перемножать.
1 Опять-таки со скидкой на запрет деления на нуль.
14
Глава 1. Стартовая площадка
Операции сложения и вычитания определяются
покоординатным сложением и вычитанием:
\ζι±ζ2 = {х\ ± ж2) + i(yi ± у2) I
Два КЧ считаются равными, когда равны их действительные
и мнимые части. Понятия больше/меньше для КЧ не
определены. Правило умножения получается обыкновенным раскрытием
скобок. С учётом г2 = — 1, это даёт
z\z2 = {х\ + iyi)(x2 + гу2) = {х\х2 - У1У2) + г(х\у2 - у\х2).
Легко проверяется наличие стандартных свойств умножения.
Для деления используется несложный трюк избавления от
мнимой единицы в знаменателе, опирающийся на факт
вещественности произведения
zz* = (х + гу)(х - гу) = х2 + у2,
где ζ* = χ — гу называют сопряжённым числом. В результате
£1 _ ^1^2
z2 z2z2
избавляет от мнимой единицы в знаменателе и сводит деление к
умножению z\z% в числителе.
Указанные способы умножения и деления
на практике используются редко, поскольку
есть гораздо более эффективные приемы,
основанные на геометрическом представлении КЧ:
числу ζ = χ + гу сопоставляется вектор на
плоскости ζ = {х, у} (рис. справа). Вот вам и
воплощение фикции.
В полярных координатах, г = \ζ\ = ух2 + у2 — модуль ζ, φ —
аргумент ζ, в силу
:r = rcos<£, y = rsmcp,
1.3. Комплексные числа
15
КЧ ζ записывается в тригонометрической форме11
ζ = г (cos φ + i sin φ)
Неожиданно обнаруживается, что «неуклюжее» умножение
имеет прозрачный геометрический смысл. При умножении ζ\ и
Ζ2 модули перемножаются, аргументы складываются. Формула
z\Z2 = rir2[cos(<£i + φ2) + isin(^i + φ2)]
(1.9)
,12
элементарно проверяется , как и формула деления:
Ζλ Τλ
— = — [cos(^i - Ψ2) + <sin(^i - φ2)\
Ζ2 Г2
В тригонометрической форме удобно извлекать корни. При
fc = 0,1,.,.,η — 1 получаются η различных корней n-й степени
yfz= л/ricos —
+ 2for φ + 2for
h г sin
что проверяется обратным возведением в n-ю степень по
очевидной, в силу (1.9), формуле Муавра
zn = rn(cos ηφ + г sin ηψ)
и с учётом периодичности синуса и косинуса. Ко всей этой
внутренней кухне мы ещё вернёмся.
Отметим также формулу Эйлера
е ψ = cos φ + г sin φ,
τ&τ
истинная природа которой будет выявлена в дальнейшем.
11В силу периодичности тригонометрических функций аргумент φ,
вообще говоря, многозначен:
φ = Argz = {arg z + 2kn : к € Ζ}.
12 Опорой на формулы синуса и косинуса суммы двух углов.
16
Глава 1. Стартовая площадка
Удача с находкой геометрической/тригонометрической
формы комплексного числа — далеко не рядовое событие. Это
пример чуда, которое происходит вот по такой схеме.
Большие и малые разделы математики с той или иной
долей натяжки можно себе представлять как изучение
некоторого множества А объектов с определёнными в этом множестве
операциями. Какие-то операции выполняются легко, какие-то —
трудно. Естественно выглядит попытка установить
взаимнооднозначное соответствие А с каким-либо другим множеством В
и посмотреть, какие манипуляции в В соответствуют операциям
в А. Если действия в В проще операций в Л, то задачи можно
решать по схеме, изображенной на рисунке ниже.
Объекты из А трансформируются в В с помощью
преобразования G, там выполняются необходимые действия, и результат
возвращается в А. Удачный выбор В — всегда событие.
1.4 Об ощущении таинственности
Комплексные числа существуют во Вселенной сами по себе или
это мы придумали их для своего ментального удобства? Первая
точка зрения облегчает дорогу в сумасшедший дом, где
закончили жизненный путь многие творцы Теории множеств. Поэтому
вторая точка зрения предпочтительна, и мы до поры до времени
будем её придерживаться.
«Магическая природа» комплексных чисел даёт о себе знать
интуитивно неожиданным образом. Ситуация на
действительной прямой странным образом почти всегда оказывается
зависящей от того, как соответствующие задачи инсталлированы в
1.4. Об ощущении таинственности
17
комплексную плоскость. Линейные дифференциальные
уравнения при попытке ограничиться рассмотрением Rn из красивой
теории превращаются в неудобный клубок загадочных фактов.
Электротехника без КЧ блекнет и теряет логическую основу.
Трансформаторы, разумеется, продолжают работать, но
причины как-то смазываются. Если R не расширить до С, почему-
то невозможно разобраться в механизме, управляющем
сходимостью степенных рядов. Ряд
—Ц = 1-я2 + я4-...
1 + ж2
сходится только при \х\ < 1, а причина на территории R
выглядит странно. У ——π есть, видите ли, особая точка χ = г. Но с
1 + χ
какой стати точка г Ε С управляет сходимостью ряда на R?
В задаче нет даже намека на комплексные числа. Тем не
менее, именно на просторах С достигается ясность. Возникает
впечатление, что вспомогательный прием затрагивает какой-то
глубинный механизм, работающий на «другом» топливе.
Такого сорта эмоции были широко распространены в «доалгебра-
ические» времена, когда понятия групп, колец и полей только
внедрялись в сознание. Когда ещё не сформировалась привычка к
абстрактному мышлению алгебраического толка, и уже всё было, но в то лее
время, ничего не было. Когда изучение действий в отрыве от объектов
приложения казалось противоестественным.
Однако постепенно идеология модельных реализаций вошла
в плоть и кровь, и свободомыслие вторглось в мир «чисел».
Стало ясно, что обычная единица ничуть не реальнее мнимой. В
вопросе «что первично, курица или яйцо» тоже произошёл
переворот. Главенствующую роль взяли на себя операции, действия.
Числа стали вторичны. Для выполнимости действий требовалось
лишь подходящее игровое поле. Поначалу думалось — неважно
какое. Потом выяснилось — вариант один: С.
18
Глава 1. Стартовая площадка
Иначе говоря, арифметические операции порождают цепную
реакцию. Из натурального ряда возникают отрицательные
числа, потом дроби, затем мнимая единица и, наконец,
комплексные числа. На этом единственно возможное [2, т. 8]
расширение игрового поля заканчивается. Таким образом, комплексную
плоскость С, как неизбежный финал роста натурального ряда,
порождает арифметика, на которой стоит вся остальная
математика. Именно поэтому КЧ дают о себе знать практически в
любой области.
1.5 Комбинаторика
1.5.1 Размещения. Число различных вариантов выбора (с
учётом порядка) т предметов из η предметов αϊ, с&2,..., ап равно
|A™ = n(n-l)...(n-m + l)|
Действительно, есть η способов выбрать один предмет, т. е.
А\ = п. На каждый выбор первого предмета существует η — 1
способов выбора второго (из оставшихся η — 1 предметов) —
поэтому А% = η (η — 1). И так далее.
1.5.2 Перестановки. Число всевозможных перестановок η
предметов αϊ, а^..., ап равно «эн факториал»
| п! = 1 · 2 · · · η I
По соображениям удобства принимается 0! = 1.
Очевидно, перестановка получается при размещении всех
предметов, что и даёт А™ = п\
1.5.3 Сочетания. Если т предметов из αι,α2,...,αη
выбираются без учета порядка (складываются в мешок), то число
различных вариантов (число сочетаний из η по т) равно
1.5. Комбинаторика 19
Всевозможные размещения получаются перестановками
элементов в сочетаниях. Поэтому
а% = q>i,
что даёт формулу для С™, с учётом того, что А™ = п\/(п — га)!
1.5.4 Перестановки с повторениями. Пусть имеется η
предметов к типов
а\... а\ а,2 ... а>2... а^ ... α^ ,
П1 П2 Tlk
где
п\ Η \-пк=п.
Число различных перестановок этих предметов равно
Р(П1,П2,...,П*.) =
η\\η2\ . . . Tifc!
В любой перестановке рассматриваемой совокупности
предметов, ничего внешне не меняя, можно п\ элементов а\
переставить между собой п\\ способами, П2 элементов а2 — 712!
способами, ..., rik элементов α& — η&! способами. Поэтому
n\\ri2\.. .rifc! перестановок из п\ — неотличимы друг от друга,
что приводит к указанной формуле.
Рассмотрим, наконец, ещё одну типичную ситуацию. Имеется
к типов предметов, число образцов каждого типа — бесконечно.
Число различных способов выбора г предметов в данном случае
№ = кг
Стандартный пример — десять (типов) цифр, каждую из
которых при записи числа можно использовать в любом количестве
экземпляров (шестизначных чисел — миллион, 106).
Упражнения
1. Доказать:
• ^п — °п >
• сй + сй+^сйЬ
20
Глава 1. Стартовая площадка
FTT n_Gn+1'
2. Сколько различных чисел можно получить перестановкой цифр
1, 3, 7? (3!)
3. Сколько есть трехзначных чисел, в записи которых участвуют
только цифры 1, 3, 7? (З3)
4. Сколько есть различных чисел, в записи которых участвуют 1,
1, 2, — т. е. две единицы и одна двойка? (3)
1.6 Бином Ньютона
При перемножении η сомножителей
(х + у)(х + у)...(х + у)
число членов вида xn~kyk равно Ск, поскольку к штук у в η
сомножителях можно выбрать числом способов Ск. Поэтому
(х + у)п = хп + С\хп~ху + С1хп~2у2 + · · · + С^ху"-1 + уп
Это формула бинома Ньютона, которая часто используется.
Полагая χ = у = 1, получаем
В случае χ = 1, у = — 1, имеем
С*-С£ + С«-...(-1)пС£=0.
Упражнение
(x + y + z)n = Y^P{kuk2M)xklyk*zk\
где суммирование идет по &1,&2,А;з, удовлетворяющим условию
к\ + &2 + кз = п.
1.7. Много члены
21
1.7 Многочлены
Многочлены важны по двум причинам. С одной стороны, они
широко используются, с другой — служат хорошим тренажером,
вырабатывая полезные навыки «общематематического толка».
Время от времени приходится иметь дело с делением
многочленов «в столбик», например,
I Xs + 2х2 - χ + 3 \х-1
х3 -х2 ж2 + Зж + 2
Зх2 - χ
Зх2 - Зх
2ж + 3
2ж-2
5
Произведённое деление даёт тождество
х3 + 2х2 - χ + 3 = (х - 1)(х2 + Зх + 2) + 5.
Легко видеть, что в общем случае деление многочлена
Рп(х) = хп + αη-ιχη-1 + · · · + агх + а0 (1.10)
на (х — с) даст в частном некоторый многочлен Qn-\{x) и
некоторое число R в остатке, т. е.
Рп(х) \х -с
LLL Qn-l(x)
д,
что равносильно тождеству
Рп(х) = (х - c)Qn-i(x) + R,
полагая в котором χ = с, получаем простой, но важный результат:
1.7.1 Теорема Везу. ОстатокR при делении Рп(х) на (х-с)
равен Рп(с), т. е.
\R = Pn(c)\
Ά
22 Глава 1. Стартовая площадка
Таким образом, если с корень уравнения Рп(х) = 0, то R = 0.
В конечном итоге это соображение приводит к разложению
Рп(х) = (х- х\){х - ж2)... (х - хп), (1.11)
где Ж1,...,жп — корни многочлена Рп(х), которые по основной
теореме алгебры 10.9.2 всегда существуют — по крайней мере, в
комплексной плоскости.
Примеры
1. Найти остаток от деления Pn(x) nax2+px + q = (x — a)(x — b).
Очевидно, Рп(х) при делении на квадратный трехчлен даст в
остатке (в общем случае) многочлен первой степени ηχ + δ, т. е.
Pn(x) = (x- a)(x - b)Qn-2(x) +-γχ + δ. (1.12)
Подставляя в (1.12) сначала χ = α, потом χ = 6, получаем систему
уравнений
Г Рп(а) = Ία + δ
\ РП(Ь) = jb + δ
для определения η и δ.
2. Показать, что хт — 1 делится на хп — 1 лишь в том случае,
когда т делится на п.
Пусть т = nk + ρ, тогда
хт-1 = v(xn)k-l xp-l
Далее надо учесть, что ук — 1 всегда делится на у — 1,
2/-1
3. Часто встречается разложение на множители следующего
многочлена трёх переменных:
х3 + у3 + z3 - Sxyz =
= χ3 + Зху(х + y)+y3 + z3 - Sxyz - Зху(х + у) =
= (х + у)3 + г3 - Зху(х + y + z) =
= ±{x + y + z)[(x-yf + {x-z)2 + {y-z)\
1.8. Теоретико-множественные операции
23
4. Раскрытие скобок и приведение подобных в (1.11), с
последующим сопоставлением результата с (1.10), даёт теорему Виета для
многочлена n-й степени:
Х\Л
/ j X%Xj
ι,3
Xl'''Χη
Н~ Χη
= Q>n
= (-
= -
-2
-0>η-1
-1)ηαο
1.8 Теоретико-множественные операции
В пределах стандартных обозначений всегда есть люфт. Поэтому
об исходных положениях необходимо договориться.
χ £ X (х £ X) — элемент х принадлежит (не принадлежит)
множеству X. Включение «А является подмножеством
множества В» записывается как13 А С В.
A U В, А f) В, А\В — объединение, пересечение и разность
множеств. Используются также эквивалентные обозначения:
А + Б = A U Б, А· В = АП В, А-В = А\В.
Визуальные пояснения
способствуют наглядному пониманию и запоминанию
13 Включение X С У, «X подмножество У», используется далее как
эквивалент X C.Y. Иначе говоря, у нас X С У означает X СУ. При
необходимости оговорить строгое включение к X С У добавляется Χ φ У.
14 Идея Гельвеция насчёт знания общих принципов, возмещающего
незнание отдельных фактов, — в определённой степени обратима.
24
Глава 1. Стартовая площадка
III
Симметрическая разность ААВ, ilfftlf lllllll5 > состоит
из элементов, которые принадлежат либо только А, либо
только В. Операция Δ является коммутативной, ассоциативной и
удовлетворяет следующему дистрибутивному закону15:
А· (В АС) = (А-В) А(А-С).
X1 = Е\Х — дополнение множества X, определяемое как
множество элементов некоторого основного множества Е, не
принадлежащих X.
Χ χ Υ обозначает декартово произведение множеств X и У,
т. е. множество пар элементов {х, у}, χ Ε Ху у Ε Υ.
0 — пустое множество.
Ω — замыкание Ω. Но «черта над» используется и в других
целях, определяемых контекстом.
Ω = ΘΩ, — граница Ω.
2Ω = ΙΡ(Ω) — множество всех подмножеств множества Ω.
N — множество натуральных чисел {1,2,...}.
Ζ — множество целых чисел {..., —1,0,1,... }.
R = (—оо, оо) - вещественная прямая.
Множество точек жЕК, удовлетворяющих неравенству
L· — а\ < ε,
15 Любой класс множеств, замкнутый относительно симметрической
разности Δ и пересечения · = П, является коммутативным кольцом, в котором
операции Δ и Π играют роль сложения и умножения. Это замечание для
знатоков. На какой-то стадии (за пределами анализа) оно начинает играть
интригующими красками. Поначалу на него лучше не обращать внимания.
1.8. Теоретико-множественные операции
25
называется ε-окрестностью точки α и обозначается Ιε(α).
Разумеется, Ιε(α) — это обыкновенный интервал (α — ε, а 4- ε).
Множество X считается открытым, если каждая его точка
χ G X внутренняя, т. е. входит в X вместе с некоторой
своей окрестностью. Любой интервал — открыт. Множество X
замкнуто, если оно содержит все свои предельные точки,
каковыми считаются точки, в любой окрестности которых есть
элементы X. Отрезок — всегда замкнут.
Функция /(ж), преобразующая элементы множества X в
элементы множества У, обозначается как
/ : X -> У.
В случае f(x) = fo(x) на Xq С X, функцию f : X —* Υ
называют продолжением /о на X, а /о — сужением f на Хо-
Задание функции / : X —> Υ равносильно заданию ее
графика, т. е. множества пар {ж, у}, где χ G X, у = /(ж) G У.
Глава 2
Последовательности и
пределы
90% жизни уходит на приготовления.
Переход к пределу — главный инструмент математического
анализа. Все основные понятия — производные, интегралы, длины, объёмы,
ряды — получаются предельным переходом. Но зацикливаться на теме,
несмотря на её фундаментальность, сразу не стоит. Лучше
пробежаться по диагонали. Потом к недопонятому можно вернуться. Ибо
нормальный процесс обучения связан с необходимостью хождения
кругами по одному и тому же месту. Даже если бы кто-то захотел
выучить пределы окончательно, не забегая вперёд, — у него бы не
получилось. Не заглядывая в «интегралы и производные», невозможно
понять, на какие задачи пределы должны быть заточены. Однако в
любой теме есть всё же ядро, которое выглядит более-менее
одинаково с любой точки зрения. С него и надо начинать на первом этапе.
2.1 Сходимость и пределы
Числовыми последовательностями ап называют функции
целочисленного аргумента, типа ап = η или, скажем, ап = —. Дабы
2.1. Сходимость и пределы
27
подчеркнуть, что речь идёт не об n-м члене, а о всей
последовательности, иногда пишут {αη}, но чаще употребляют просто αη,
возлагая понимание на контекст.
2.1.1 Определение. Числовая последовательность ап
сходится при η —> оо к пределу а
(пишут ап —> а, либо lim an = а),
п—>оо
если по любому ε > О можно указать такое Ν, что
\ап — а\ < ε для всех п> N.
Определение 2.1.1 обычно плохо укладывается в голове, что
больше связано с психологией, чем с математикой, см. раздел 13.3.
Устранить психологический барьер помогает иногда взгляд на
ситуацию с другого ракурса. Вот эквивалентное определение.
2.1.2 Определение. Последовательность ап при η —> оо
сходится к пределу а, если неравенство \ап — а\ < ε при любом
ε > О может нарушаться только конечное число раз1.
Докажите эквивалентность, и чем чёрт не шутит,
психологические затруднения уйдут с вашего пути.
Всякая теория в начале пути проходит через какие-нибудь
тривиальности, которые всё же настраивают в резонанс, и
заслуживают хотя бы беглого взгляда.
• Если ап —> а, Ъп —> Ъ, и ап < Ъп, то а ^Ь.
Здесь и далее «для всех п» и «п —» оо» подразумеваются.
• Если ап —* а, Ъп—+ Ь, то
а»п + Ьп -> а + Ь , I jan -» ja I, \anbn -» ab
и 0"п/Ьп —> ο,/b при условии ЬШ b ^ 0.
1Другими словами, ап не разрешается выпрыгивать из любой
фиксированной ε-окрестности (а — ε, α + ε) сколько угодно раз.
28
Глава 2. Последовательности и пределы
< Пусть дано любое ε > 0 и все αη принадлежат ( | J-окрестности
точки α для η > Λ/ι, все bn — ( § 1-окрестности точки Ъ для η > Ν2. Β
этом случае все αη + 6П будут находиться в ε-окрестности точки a + Ь для
η > max(iVi,iV2). ► Остальные свойства доказываются аналогично.
Приведённое рассуждение отдаёт казуистикой, но подобному
формализму надо потихоньку учиться, чтобы уметь работать не
только топором, но и скальпелем. Однако на первом этапе
освоения новых понятий такими фокусами не стоит чересчур
увлекаться, чтобы не сбиваться с пути.
2.1.3 Числовую последовательность, имеющую нулевой
предел, ап —> 0, называют бесконечно малой величиной.
Сию неприятность надо запомнить. Это неудобный сюрприз.
Потому что последовательность — не величина, а функция.
Однако без терминологических накладок не обойдёшься. Мы же не
возражаем против «подъёмного крана» из-за того, что
«водопроводный» тоже кран. Здесь, надо полагать, ап называли поначалу
«переменной величиной», затем, для краткости, стали называть
просто «величиной».
2.1.4 Последовательность ап прип->оо расходится (ап—>оо),
если по любому Μ > 0 можно указать такое Ν, что
\ап\ > Μ для всех п> N. (2.1)
Терминология здесь плавает. В случае (2.1) говорят о
сходимости ап к бесконечному пределу. Говорят также о стремлении
к минус или плюс бесконечности (пишут ап —> =foo)5 если по
любому Μ ^ 0 можно указать такое Ν, что ап ^ Μ для всех
η > N. При этом расходящиеся последовательности называют
бесконечно большими величинами.
2.2 Простейшие инструменты
2.2.1 Теорема о трёх собачках. Если ап < Ьп < сп, и
«крайние» последовательности ап, Сп сходятся к одному и тому же
пределу, то к этому же пределу сходится и Ьп.
2.2. Простейшие инструменты
29
Μ Если αη, Сп сходятся к одному пределу ζ, то с какого-то момента они
все попадают в ε-окрестность ζ, и 6П, зажатое между ап и сп,
попадает в ту же ε-окрестность. Вот и все доказательство. «Договориться с
формалистом» предоставляется в качестве упражнения. ►
Приведённый результат чаще всего работает в сценарии
О < Ьп - Ъ < Сп, сп -» 0, тогда Ьп -> Ъ. (2.2)
Дело в том, что определение предела 2.1.1 имеет изъян,
поскольку опирается на сам предел, который бывает неизвестен.
Но часто предел угадывается, и тогда (2.2) превращает догадку
Ъп —> Ъ в установленный факт.
Вот как это работает.
• В разложении η = [1 + (у/п — 1)]п по формуле бинома Ньютона
возьмём лишь одно слагаемое С2( у/п — I)2, получится неравенство
П(п — 1) , г- _о
п> к 2 Ч^-i)2,
откуда 0 < (у/п — I)2 < —^-у, что по теореме о трёх собачках даёт
#п-»1.
• Учитывая предыдущий результат и непрерывность функции logax
при χ = 1 (см. далее), получаем
*у-*.*Н &
• В данном примере обыгрывается лишь — —* 0 и, опять-таки с
опережением событий, непрерывность функции у/1 + х в нуле:
1 1
у/п(у/п + 1 — у/п) =
1 + <'1+п
1 2
30
Глава 2. Последовательности и пределы
Доказать:
an
► оо (а > 1),
2.2.2 Лемма Вейерштрасса. Если последовательность ап
монотонно возрастает (не убывает) и ограничена сверху2, то
она сходится, ап —> а < оо.
Это уже нетривиальный результат, но он прост в
использовании и представляется интуитивно очевидным. Хотя насчёт
очевидности интуиция заблуждается.
Что касается обоснования леммы 2.2.2, то всё упирается в
теорию вещественных чисел. В зависимости от уровня
строгости построения вещественной прямой, соответствующий окрас
приобретает и лемма Вейерштрасса. Надлежащий приличным
кондициям вариант рассматривается далее. Наивный вариант,
дескать, «вещественные числа — это десятичные дроби» —
логически несостоятелен, но он приемлем на первом этапе
освоения пределов, когда не до «философских глубин». Сначала надо
освоиться на этаже пребывания. Потом можно будет вернуться
назад, спуститься в подвал, зайти к смежникам и т. п.
На территории десятичных дробей, будь они неладны, у
растущей и ограниченной последовательности с увеличением η перестаёт
меняться все большее число знаков после запятой3. Это
последовательно определяет бесконечную дробь а, которая и является пределом
αη, ибо ап может отличаться от а лишь в более и более высоких
разрядах по мере увеличения п, т. е. ап — а —* 0.
2.3 Как работает лемма Вейерштрасса
Посмотрим, каковы возможности инструмента.
2 Т. е. существуют такие Μ и Ν, что ап < Μ при п> N.
3 Стабилизация десятичных знаков имеет место в условиях монотонного
роста ап. У сходящейся последовательности ап = 1 + (—1/10)п все
десятичные знаки «прыгают» все время.
Упражнения
11 1 · 1
/ιη = 1 + - + - + h >оо, nsin ► 1.
16η η
2.3. Как работает лемма Вейерштрасса
31
2.3.1 Знаменитое число е = 2,71... определяется как предел
Jt |ИУЧ\ (23)
< Покажем, что последовательность хп = ( 1 Η— 1 монотонно
НУ
возрастает и ограничена. В разложении ( 1 + ^ ) по формуле бинома
Ньютона k-й член
«G)'-bN)-(·-^)·
очевидно, растет при увеличении η (для фиксированного к). Кроме
того, с увеличением η растет число членов разложения 11 + — ) ·
Поэтому хп монотонно возрастает. Кроме того, в силу С* I — J ^ -к,
последовательность хп ограничена, что вытекает из оценки
Χη<1 + 1 + | + ··· + ^<2 + 1 + ·.· + ^<3.
Следовательно, лемма Вейерштрасса гарантирует её сходимость к
некоторому вещественному числу (2.3), каковое «неожиданно»
оказывается одним из столпов мироздания4. ►
2.3.2 Отбрасывая часть слагаемых в разложении
при к ^ η имеем неравенство
*.*Ч4(ЧЬ-й(Ч)-('-^)·
переходя к пределу, в котором при η —> оо и фиксированном к,
получаем оценку
Причины вездесущности числа е вскрываются далее.
32
Глава 2. Последовательности и пределы
справедливую при любом к. А поскольку ещё и хп < уп, то теорема о
трёх собачках приводит к другой полезной формуле для числа е,
fr
, 1 ! 1
e = 1 + i! + 2!+- + ^ + ··
2.3.3 Следующий рядовой пример показывает, что Вейерштрасс
востребован не только в уникальных ситуациях. В последовательности
Xn = UP+ ψ
Р+'-' + у/р
η радикалов
на каждом следующем шаге последнее ρ в записи хп меняется на
ρ + >Jp, поэтому хп возрастает. Ограниченность устанавливается по
индукции. Неравенство хп < у/р + 1 верно при η = 1, а в
предположении его справедливости для η — 1, оно верно и для п:
х1=р + хп-1 <ρ + ν£+Κ(ν£ + 1)2.
Поэтому Вейерштрасс гарантирует нам хп —» а. Значение а определя-
зл>
квадратное уравнение а2 — а — ρ = 0.
ется переходом к пределу в равенстве ж2 = ρ + Χη-ι, что даёт для α
2.4 Предел функции
Далее рассматриваются функции у = /(ж), сопоставляющие
вещественным значениям аргумента χ вещественные значения у.
2АЛ Число А называют пределом функции f(x) при χ —> а
(f(x) —» А при χ —> а, пишут также lim f(x) = А), если по
X—W,
любому ε > 0 можно указать такое δ, что
\f(x) -A\<e
при условии 0 < \х — а\ < δ.
В случае χ —» оо конец определения таков: если по любому ε > 0
можно указать такое Μ > 0, что \f(x) — А\ < ε для любого х> М.
2.4. Предел функции
33
В связи с переходом от дискретного аргумента η к
непрерывному χ ситуация, конечно, меняется. Главным образом это
связано с возможностью стремления χ к конечному пределу, что
в случае дискретного аргумента — бессмысленно.
Данное определение lim f(x) = А — это та самая дефиниция на
χ—>а
(ε, 6)-языке, которая плохо укладывается в голове. Лучшее средство
для преодоления барьера — переиначьте определение сто раз,
переосмыслите, выверните наизнанку. Не бросайте крутить педали — и
второе дыхание придёт.
2.4.2 Эквивалентное определение f(x —> а) —> А. Число А
называется пределом функции f(x) при χ —* а, если
f(xn) -> A
для любой последовательности Χγΐ ► О, (хп φ а)
< Доказательство эквивалентности как будто совсем просто.
Следование второго из первого очевидно. Обратное легко устанавливается
от противного. Что означает нарушение f(x) —» А? При некотором ε
не найдется нужного δ. Другими словами, для любой
последовательности δη —* 0 существуют такие хп, что
\f(xn) - А\ > ε, 0 < \хп - а\ ^ δη, (2.4)
по это как раз противоречит второму определению. ►
Кто увидит здесь фундаментальный провал рассуждения?
Оказывается, несмотря на разрешимость системы нера-
?венств (2.4) при любом δη > 0, нельзя утверждать
существование последовательности хп. Не на что сослаться.
Нужна специальная аксиома выбора: в любом семействе
множеств в каждом множестве можно выбрать по
элементу. Идиотизм вроде бы. Кажется, что ломимся в
открытую дверь. Ясно, что можно. Ан нет. И эта аксиома
выбора запускает феноменальный детектив, см. парадокс
Банаха - Тарского.
Определение непрерывности с помощью хп полезно на
практике. Например, если существование предела установлено, то
для его нахождения достаточно определить предел f(x) для
какой-нибудь одной подпоследовательности хп.
34
Глава 2. Последовательности и пределы
Упражнение. При χ —» оо
In ж ах
► О, ► оо,
χ χ
К)'
• Если f(x) —» Л, р(ж) —» Б при χ -* а (или χ —» оо,), то
/(ж) + р(ж) _> л + Б, 7/(*) -> 7 А /(*Μ*) -> ^
u f(x)/g(x) —» Л/Б при условии д(х), В φ 0.
Справедливы и другие аналоги утверждений о пределах числовых
последовательностей. Теорема о трёх собачках, например.
Существование предела для ограниченной и монотонной f(x) тоже имеет место,
но его формулировку приходится уточнять5. Однако в целом никаких
особых трудностей здесь не возникает.
Плодящиеся определения пределов могут переполнить
голову, если не смотреть в корень. Есть лишь одно понятие предела.
Одна идея, одна схема. Остальное — вариации, каковые должны
всплывать в голове сами по себе. Если не всплывают —
тренируйтесь ещё, ходите кругами, но добейтесь результата. Что
касается вариаций, то они определяются природой переменных
(которые могут быть векторами, функциями и т. п.) и мерами
близости \х — а\, \f — А\.
2.4.3 Васнсный пример. Легко видеть, что площадь АОАС меньше (<)
площади сектора О АС, которая < площади АОВС, т. е.
-R2sinx < ]:R2x < ^R2tgx,
откуда
что по теореме 2.2.1 о трёх собачках даёт
cos ж < < 1,
X
5 Необходимо ввести понятия пределов слева/справа или снизу/сверху,
когда χ приближается к а снизу — χ Τ α, или сверху —χ | а.
2.5. Непрерывные функции
35
fr
► 1 при χ —> U
χ
(2.5)
Как говорил Плутарх, отвечать на вопрос можно тремя
способами. (1) Сказать необходимое, (2) отвечать вежливо и (3) наговорить
лишнего. В доказательствах мы стараемся, конечно, двигаться по
первому варианту. Но здесь тоже есть три способа. Сказать необходимое
можно
• промолчав,
• ограничившись сутью,
• выбрав максимально лаконичный путь.
Причём в последнем случае добиваться краткости нельзя за счёт
механического урезания умозаключений. Действовать необходимо не
только не теряя ясности, но даже приумножая её. Подобное требует
определённых усилий, и если достигается успех, заслуживает
подражания. Поэтому в литературе полезно обращать внимание на удачные
доказательства и учиться на них эффективному математическому
маневрированию. Изящное рассуждение сродни афоризму, как «хорошо
отредактированному роману».
2.4.4 Функция f(x) β случае f(x) —> 0 называется бесконечно
малой, в случае \f{x)\ —> оо — бесконечно большой.
2.4.5 Если f(x) —> 0, д(х) —> 0, и f(x)/g(x) —> 0, то говорят,
что f имеет более высокий порядок малости по сравнению с д,
и пишут f = о(д), читая «f есть о малое от д».
Например, х2 = о(х) при χ —» 0, (х — 5)4/3 = о(х — 5) при χ —» 5.
2.5 Непрерывные функции
2.5.1 Определение. Функция f(x) называется непрерывной
β точке хо, если f(x) —» f{xo) при х —» #о· Функцию,
непрерывную в любой точке [а,Ь], называют непрерывной на [а, 6].
36
Глава 2. Последовательности и пределы
Дабы «чувствовать берега», сразу полезно взглянуть на разрывные
функции. Разрывы могут выглядеть, например, так
Можно и пофантазировать в диапазоне от у = sin — до функции,
которая в рациональных точках равна нулю, в иррациональных — единице.
2.5.2 Определение. Функция f(x) непрерывна в точке xq и томм
случае, если по любому ε > О можно указать такое δ, что
\f(x) - f(xo)\ < ε, если \х - х0\ < δ.
2.5.3 Теорема. Непрерывная на [а, 6] функция ограничена снизу и
сверху6, и достигает минимального и максимального значения.
Упражнения
Плавать — только по книгам не научиться. Приходится лезть в
воду. С математикой — такая же история.
1. Сконструировать определения: непрерывности слева и справа7 \
разрывов слева и справа; бесконечного предела, f(x) —» оо.
2. Если f(x) непрерывна на отрезке [а,6], и /(а) = Л, /(6) = В,
то для любого С, лежащего между Аи В, можно указать точку
с G [а, 6], в которой f(c) = C (теорема Больцано - Kouiuf.
lim
χ—►() χ
= 1ηα (α >0).
6 Это утверждение называют теоремой Вейерштрасса.
7Функции в точке.
8Подсказка: сначала полезно убедиться (бесконечным последовательным
делением [а, 6] пополам) в существовании такого с е [а, 6], что /(с) = 0, если
А и В имеют разные знаки.
2.6. О теории вещественных чисел
37
4- limil±£)izi=A (л>0).
ζ—Ο χ ν
5. lim (l + -) =ex.
π-юо γ η J
6. limxsina; = 1.
χ—►()
IX Χ\
7. lim I cos —h λ sin — Ι =
π-+οο \ П П/
еАж.
2.6 О теории вещественных чисел
Человеку удобнее думать о целых числах как о делениях на
бесконечной прямой. Далее мысль течёт сама собой, сопоставляя точкам
между делениями дроби. А когда выясняется, что этих p/q не
хватает, возникает идея использования сходящихся последовательностей.
Препятствия на этом пути с некоторыми усилиями преодолеваются, и
вещественная прямая в самом деле может быть построена таким
способом. Есть также порочный путь: «вещественные числа — это
бесконечные десятичные дроби» — соблазняющий обманчивой простотой.
Здесь не удаётся снять логические противоречия, но мало кто
думает, что проблема так уж серьёзна. Мол, разве имеют значение мелкие
нюансы?
ill
Имеют. От мелочей зависит ВСЁ. Возьмём аксиому выбора: «в
любом семействе Φ непустых множеств в каждом множестве X Ε Φ
можно выбрать по одному элементу». Словоблудие, казалось бы.
Вещь очевидная, стоимость нулевая. Да и как оно может влиять на
«грубую реальность»?
До Цермело так и думали, вернее, даже не задумывались,
принимая «аксиому» за самоочевидный факт. Но будучи явно
сформулирована, аксиома выбора вызвала ожесточенную критику из-за ра-
38
Глава 2. Последовательности и пределы
зительного контраста между своей банальностью и «невероятностью»
следствий. Яркий пример — парадокс Банаха — Тарского:
Шар В θ R3 допускает разбиение на конечное число
непересекающихся множеств В\,..., Вк С R , из которых можно
составить передвижением Bj как твёрдых тел (перенос плюс
поворот) шар вдвое большего радиуса.
Так что очень отдалённая казуистика может революционным
образом вмешиваться в будничную жизнь. Мелкие логические нестыковки
и «пустячки» аукаются так далеко и так громко, что
предосторожности выходят в математике на передний план.
Теория Дедекинда ликвидирует такие нестыковки и строит
удобную игровую площадку (вещественную прямую) для матанализа.
Стартовой площадкой служат рациональные числа с определёнными
арифметическими операциями.
2.6.1 Непустое множество А рациональных чисел d(A) назовём
сечением, Дедекинда при выполнении двух условий:
1. В А нет наибольшего числа.
2. Если а € Α, β < а и β — рациональное число, то β Ε А.
fl* ϊ
Называть сечением множество, разумеется, противоестественно. Но дело в
том, что мы хотим поймать журавля в небе, имея в руках синицу. Если бы
речь шла о множестве А рациональных χ < 3, то на роль сечения годилось
бы число 3. Однако в случае «ж2 < 5» указать сечением у/Ъ нет возможности,
поскольку игра начинается в отсутствие иррациональных чисел. Поэтому в
роли сечения оказывается само множество А, что режет слух, но таковы
стартовые условия.
Подготавливая почву для сечений стать числами, надо определить
для них понятия больше, меньше, равенства, суммы и т. д. Это
делается совсем легко, но скучно. Например, неравенству d(A) < d(B)
приходится сопоставить9 строгое включение: А с В, но А ф В. Сумме
9 Чтобы не нарушить уже имеющиеся неравенства для рациональных
чисел.
2.6. О теории вещественных чисел
39
d(A) + d(B) — сечение множества А + В, состоящего из рациональных
чисел α + β, где a Ε Α, β Ε В. Чтобы такие определения имели смысл,
надо проверить стандартные условия, которым они обязаны
удовлетворять. Скажем, отношение неравенства должно быть транзитивно:
а< β, /?<7 =^ α<7·
В данном случае это обеспечивается транзитивностью строгого
включения для множеств: АсВ,ВсС=>АсС. Так же легко
проверяются обычные свойства сложения для сечений. И так далее. Короче,
все это рутинная работа, которая заканчивается определением на
сечениях обычных числовых операций. После этого термин «сечение»
приравнивается термину «вещественное число». Рациональные
сечения (множество элементов χ < α, где а рационально) оказываются
рациональными числами. Все другие сечения называются —
иррациональными.
Особо выделяются понятия инфимума и супремума. Пусть
множество Μ ограничено снизу. Определим множество Г нижних граней
М, как множество таких рациональных 7, что η <т для любого
рационального т Ε М. Легко убедиться, что Г является сечением.
2.6.2 Число d(T) называется точной нижней гранью множества
Μ и обозначается inf Μ. Если Μ не ограничено снизу, то полагают
inf Μ = —оо.
Аналогично определяется точная верхняя грань supM.
Остаётся главный вопрос «о полноте вещественной прямой».
Рациональные числа не исчерпывали всех точек. Хватит ли для «сплошного
заполнения» дедекиндовых сечений? Рациональным
последовательностям ап теперь есть «куда сходиться». Но не потребуется ли новое
пополнение для иррациональных ап ? Не появятся ли «новые числа»,
если сечения производить уже с помощью вещественных множеств А,
удовлетворяющих тем лее условиям 1, 2? Не появятся.
2.6.3 Основная теорема Дедекинда. Любое сечение в области
вещественных чисел является вещественным числом.
< Доказательство совсем просто. Пусть сечение определяется
множеством А вещественных чисел. Пусть Аг — множество всех рациональных
чисел из А. Вещественное число supAr определяет сечение А как
множество чисел χ < supAr. ►
40
Глава 2. Последовательности и пределы
2.7 Надумана ли проблема и каковы блага
Лемма Вейерштпрасса10 2.2.2 получает теперь вместо наводящих
соображений совершенно строгое обоснование. < У ограниченного
множества {ап} «у Дедекинда» есть супремум а = sup{an} < оо. Из
монотонного возрастания ап теперь следует ап —* а. Всё. ►
Лемма Вейерштпрасса порождает цепную реакцию
возникновения удобных инструментов в теории пределов.
2.7.1 Лемма о влоэюенных отрезках. Пересечение
бесконечного множества влоэюенных друг в друга отрезков,
[αη+ι, 6η+ι] С [αη, bn] при любом η = 1,2,...,
длина которых стремится к нулю, всегда не пусто11.
< По условию а\ ^ ... ^ ап ^ ... ^ Ьп... ^ ... ^ Ь\. Поэтому
последовательность ап монотонна и ограничена, и потому сходится,
ап —» а. А поскольку Ьп = ап + (Ьп — ап) и Ьп — ап —» 0, то и Ьп —» а.
Точка а, в силу ап ^ а ^Ьп, принадлежит всем отрезкам. ►
Рассматривая последовательности, удобно пользоваться
разными трюками перехода к подпоследовательностям.
• Пусть rik произвольная расходящаяся последовательность
целых чисел12. Последовательность аПк называют
подпоследовательностью последовательности ап.
Если подпоследовательность аПк сходится, то её предел называют
предельной точкой (или точкой сгущения) последовательности ап.
2.7.2 Лемма Больцано — Вейерштрасса13. В
ограниченной последовательности ап всегда можно выделить
сходящуюся подпоследовательность.
10 Если последовательность ап монотонно возрастает и ограничена
сверху, то она сходится, ап —> а < оо.
11 Имеется точка, принадлежащая всем отрезкам.
12nk —> оо при к —> оо
13 Широко используется в рассуждениях и доказательствах.
2.7. Надумала ли проблема и каковы блага
41
< В силу ограниченности все an принадлежат некоторому отрезку
/0 = [о>, Ь]. Разделим /о пополам и выберем ту его половину /ι, которая
содержит бесконечно много элементов αη. Затем разделим 1\ пополам
и выберем ту его половину 1^ которая опять содержит бесконечное
число элементов αη. Продолжая процесс до бесконечности, получим
бесконечную цепочку вложенных отрезков /о Э I\ D · · · D Ik D ...,
длины которых стремятся к нулю. В силу леммы Вейенштпрасса все
Ik имеют общую точку с. Тогда аПк —» с, поскольку все аПк G /*. ►
Теперь упоминавшаяся ранее теорема Вейерштрасса 2.5.3
может быть обоснована строго.
2.5.3 Теорема Вейерштрасса. Непрерывная на [а, Ь]
функция ограничена снизу и сверху.
Утверждение интуитивно естественное14. Но попробуйте его
доказать кустарными методами.
< Неограниченность /(ж), например сверху, означает, что для
любой последовательности Мп —» оо молено указать такую
последовательность Сп £ [а, Ь], что f(cn) > Мп. Лемма Больцано —
Вейерштрасса гарантирует существование у сп сходящейся
подпоследовательности. Чтобы не усложнять обозначений, можно считать
сходящейся саму последовательность сп —» с. Тогда в силу непрерывности
f(cn) —* /(с), что вступает в противоречие с f(cn) > Мп —» оо. ►
В данном контексте стоит отметить ещё один результат.
2.7.3 Лемма Гейне — Бореля. Из любого покрытия σ
отрезка [а, Ь] интервалами можно выбрать конечное
подпокрытие.
< Допустим противное. Разделим [а, Ь] пополам и выберем ту
половину, которая не покрывается конечным числом интервалов. Эту
половину снова разделим пополам — и так далее. В результате
получим цепочку вложенных отрезков [а*,6*], длины которых стремятся
к нулю, но каждый сегмент [а&, bk] не покрывается конечным
множеством интервалов из σ. Но тогда (лемма о вложенных отрезках) все
14 В значительной мере потому, что интуиция считает функцию
непрерывной, «если её график можно нарисовать, не отрывая карандаша от бумаги».
42
Глава 2. Последовательности и пределы
[ak, bk] имеют общую точку с. Точка с принадлежит некоторому
интервалу [a*, b*] Ε σ, который, начиная с какого-то номера, содержит
все последующие [α^,δ*;], что рождает противоречие. ►
Леммы Гейне — Бореля и Больцано — Вейерштпрасса глубинно
«эквивалентны», поскольку отражают одно и то лее свойство
компактности. Множество X в общем случае определяется как компактное,
если из любого его покрытия открытыми множествами можно выбрать
конечное подпокрытие. Так что лемма Гейне — Бореля
устанавливает компактность любого отрезка [а, Ь]. Вообще говоря, на прямой все
это большого смысла не имеет — компактность X означает
ограниченность и замкнутость. Но в функциональных пространствах
понятие компактности выдвигается на передний фронт и работает весьма
эффективно.
2.8 Равномерная непрерывность
2.8.1 Функция f(x), непрерывная на некотором множестве
X, называется равномерно непрерывной на X, если по любому
ε > О можно указать такое 5, что \f(x) — f(y)\ < ε, как только
\х — у\ < δ, для любых х,у Ε X.
Функции у = In ж, у = 1/х на интервале (0,1) не являются
равномерно непрерывными.
2.8.2 Теорема Кантора. Функция f(x), непрерывная на
отрезке [а, 6], автоматически равномерно непрерывна на [а, 6].
< В предположении противного для некоторого ε не найдется
нужного δ. Это означает, что для любой последовательности
положительных δп —» 0 можно указать такие хп,уп, что \хп —уп\ < δη, но
\f(xn)-f(3fn)\>e
при любом п= 1,2,...
По лемме Больцано — Вейерштпрасса из хп можно выделить
сходящуюся подпоследовательность. Для простоты, будем считать, что
сходится сама последовательность жп, т. е. хп —> с Ε [а, 6]. Но тогда и
уп -> с в силу хп - уп -> 0. В этом случае \f(xn) - f(yn)\ ^ ε
противоречит непрерывности f(x) в точке с. ►
2.9. Фундаментальные последовательности
43
2.9 Фундаментальные последовательности
Порок исходного определения предела заключается в опоре на
знание самого предела. Имея дело с an —> α, мы часто не имеем
представления о значении а, и тогда инструменты типа \αη — α\ <
ε теряют смысл. А если αη не сходится (ни к чему), как это
доказать? Перебирать всевозможные а?
Снимает напряжение и даёт в руки эффективный инструмент
понятие фундаментальной последовательности.
2.9.1 Последовательность ап называется фундаментальной,
или последовательностью Коши, если по любому ε > О
можно указать такое Ν, что
для любых п,т> N.
То есть у последовательности Коши члены с большими
номерами не могут сильно отличаться друг от друга.
2.9.2 Критерий Коши. Последовательность ап сходится в
том и только том случае, когда она фундаментальна.
< Если ап сходится, то она является последовательностью
Коши. Это устанавливается «в одно касание». Действительно, в случае
ап —* а все ап при достаточно больших η оказываются в сколь угодно
малой ε-окрестности точки а, и там уже ап от ат не могут сильно
отличаться (не более, чем на 2ε).
Обратно. Пусть ап — последовательность Коши. Покажем, что
она имеет предел. Возьмём произвольную сходящуюся к нулю
последовательность ει,..., ε к, - · ·, все ε к > 0. И пусть Νχ,..., Nk,... таковы,
что
\о>п —Qvn\ <£k при п,т^ Nk.
Тогда все ап при η ^ Nk принадлежат отрезкам
h = [aNk - ε к, a,Nk + ε*],
длины которых убывают до нуля при к —» оо. Чтобы воспользоваться
леммой о вложенных отрезках, перейдем к последовательности
вложенных отрезков Jk С Ik, которые строятся по правилу
Аг^
44
Глава 2. Последовательности и пределы
Теперь «лемма» гарантирует существование общей точки α у всех
Jfc, которая и есть предел αη, поскольку J& стягиваются к а, и все
ап Ε Jk при η > TV*.. ►
2.10 Числовые ряды
Особое внимание в анализе уделяется числовым
последовательностям вида
Αη = αϊ + · · · + αη. (2.6)
Их называют частичными суммами бесконечных рядов
№* ]Γαη = α!+ +αη + ... &Ч (2.7)
2.10.1 Конечный или бесконечный предел А частичной суммы
(2.6) определяют как сумму ряда (2.7). Ряд, имеющий конечную
(бесконечную) сумму, называют сходящимся (расходящимся).
Примеры
• Сумма бесконечной геометрической прогрессии
l + q + q2 + --- = - , Ы<1.
1-q
• Вещественное число в десятичной записи
а\ а2
а0, аха2 - - · = а0 + — + —2 + ...
• Часто встречается гармонический ряд
l + 5 + | + - + i + - = ~- (2-8)
Докажем (2.8). Установленное ранее неравенство (1 + — ) < е
после логарифмирования даёт η In ( 1 + — J < 1, откуда
- > In ( 1 + - J = ln(n + 1) - Inn.
η \ nj
2.10. Числовые ряды
45
Суммирование η первых таких неравенств приводит к
Лп = 1 + - + - + ... + -> 1п(п + 1),
Δ О П
что влечёт за собой расходимость последовательности hn.
Бесконечные ряды представляют собой эквивалентный язык
для изучения последовательностей и пределов. Действительно,
сходимость ряда означает сходимость варианты15 Ап. Обратно,
сходимость любой последовательности Ъп равносильна
сходимости ряда
4г~ h + (Ь2 - bi) + · · · + {К - Κ-ί) + · · · ·
Отметим два простых факта.
2.10.2 Сходящиеся ряды можно почленно складывать,
вычитать и умножать на константу. (*?)
2.10.3 Если ряд (2.6) сходится, то ап —> 0.
Интересно, что последнее утверждение на миг заставляет
задуматься. Когда все ап > 0, результат сразу очевиден. В общем случае
возникает заминка, которая тривиально разрешается.
Последовательности Ап и Αη-ι сходятся к одному и тому же пределу. Поэтому
ап = Ап-Ап-1 ->0. ►
w
ϊ
Многие результаты в теории числовых рядов представляют
собой несложные переформулировки известных фактов из теории
пределов. «Снять маску» обычно нетрудно.
5 Варианта — синоним числовой последовательности.
46
Глава 2. Последовательности и пределы
1. Когда все an ^ 0, ряд αχ + α2 +... сходится, если его частичные
суммы ограничены сверху, и расходится в противном случае.
2. Теорема сравнения положительных рядов
(Α): αϊ + 02 + - - -, (В): Ьг + Ь2 + ... .
2?с/ш αη ^ Ьп, начиная с некоторого п, либо η"<"1 ^ -χ^, и ряд (В)
сходится, то и ряд (А) сходится. Если (А) расходится, то и (В)
расходится. Ряд (В) называют маэюорирующим рядом для (А).
оо ..
Пример. Дт < / *■—ту при η > 2. Но ряд >^ —; — сходится,
η2 η(η-1) ν ' *""Ζ-^η(η_ι) ^
^ n(n - 1) " 1 2 + 2 3 + """ < '
п=2
оо 1
Поэтому сходится и ряд У^ —s-, причём здесь неожиданно всплывает
^—' η
ΣΙ 7Γ
^2 =Т'
число π,
п=2П
, Па 6
n=l
но это уже другая история.
3. Если т-^ имеет конечный строго положительный предел, то оба
и-п
положительных ряда (А) и (В) сходятся или расходятся одновременно.
• В общем случае ряд (2.7) называют абсолютно
сходящимся, если сходится ряд \а\\ + |аг| + · · · из абсолютных величин.
Любой абсолютно сходящийся ряд сходится ( *3г 1.
• Любой знакопеременный ряд
а0-а!-\ h (-1)ηαη + ... (все ап > 0)
при условии монотонного стремления ап к нулю — сходится. Поэтому,
например, не сходящийся абсолютно, ряд 1 — А + А — ..., сходится.
Μ Частичные суммы
А2к = (αϊ - а2) + (α3 - α4) Η h (a2k-i - a2k)
2.10. Числовые ряды
47
монотонно возрастают, поскольку все скобки положительны из-за
монотонности убывания ап и ограниченны,
Мк = ο,ι — (о>2 — аз) {а>2к-2 — a>2k-i) — 0,2k < αι·
Поэтому А2к -» А. Но тогда и А2к+1 = А2к + a>2k+i -» А ►
Приведем два признака сходимости положительных рядов,
накрывающих 90% практических ситуаций.
2.10.4 Признак Когии. Ряд (2.7) сходится, если
?/а^->а < 1,
и расходится, если а > 1.
< Для достаточно малого ε > 0, такого, что α + ε < 1, начиная с
некоторого п = Ν, будет αη ^ (α + ε)η. Поэтому ряд (2) мажорируется
сходящимся рядом
оо
Σ(α+ε)η· ►
2.10.5 Признак Даламбера. Ряд (2.7) сходится, если
► а < 1,
а если а > 1 — расходится16.
Примеры
1.Ряд
00 1 11
п=1
сходится при s > 1 и расходится при s ^ 1. Расходимость (2.9) при
5 = 1 уже была установлена. Отсюда тем более следует расходимость
(2.9) при s < 1. Установим сходимость при s > 1. Очевидно,
1,1, , 1 <2к— < *
(2* + I)8 (2fe + 2)s (2fc+1 Υ (2k+1)s 2k<-°-V'
16Доказательство аналогично предыдущему.
48
Глава 2. Последовательности и пределы
Поэтому
L·, ns<l^l 2к(з-1) '
п=1 к=0Δ
а мажорирующий ряд справа сходится, ибо представляет сумму
бесконечно убывающей геометрической прогрессии со знаменателем 1/2θ_1.
2. Ряд V^ In ( 1 Η— ) при любом χ > О расходится, поскольку
Ιη(1 + Α:1 = 1η\(1 + Ξ.γ
\ η J η \\ η J
При изучении пределов и числовых рядов довольно часто
оказывается полезным следующий результат.
2.10.6 Теорема Штольца. Если последовательность уп
монотонно возрастает и уп—> +оо, то обе последовательности
Хп Хп Хп—1
— и
Уп Уп ~ Уп-1
имеют одинаковый предел (либо обе расходятся).
Инструмент заточен на неопределённости — типа —. Тео-
Уп оо
рема Штольца особенно хорошо работает в ситуациях типа
следующей:
αϊ Η \-ап
если ап —> а, то > а.
η
Результат получается «сам собой», если положить
хп = «ι Η Ь αη, Уп = п.
Упргжнения
ι lim = 1.
2.10. Числовые ряды
49
lim —
nk+1 k+1'
3. цт(^+^У = Лб (a,b>0).
оо
4. В случае ап —» α > 0 ряд Υ^(αηχ)η сходится при |ж| < -.
00 ~™
5. Ряд \J — сходится при любом χ (воспользуйтесь признаком
η
Даламбера).
оо
6. Ряд ^^пкхп сходится при любых \х\ < 1 и к.
η
Числовые ряды служат базой для последующего изучения
функциональных рядов, которые образуют одно из
магистральных направлений в анализе. Это кое-что объясняет в расстановке
акцентов, наблюдаемой в учебниках. Например, особое внимание
оо
к бесконечным суммам Σ апЬп может показаться странным, если
не знать, что в дальнейшем подразумевается переход к изучению
оо
рядов Σαηχη.
Достаточно естественными представляются вопросы влияния
на сходимость рядов стандартных операций: перегруппировки
членов (изменения порядка суммирования), умножения рядов.
При этом выясняется, что между абсолютно сходящимися
рядами и всеми остальными проходит мощный водораздел.
Абсолютно сходящиеся ряды «беспроблемны». Они допускают любое
изменение порядка суммирования. Их можно без
предосторожностей перемножать,
оо оо оо
η η n,k
независимо от порядка суммирования членов апЬ^. В отсутствие
абсолютной сходимости возможны любые сюрпризы.
50
Глава 2. Последовательности и пределы
2.10.7 Теорема Римана. Не сходящийся абсолютно ряд
всегда допускает изменение порядка суммирования, при котором
его сумма оказывается равной любому наперёд заданному числу
(конечному или бесконечному).
Глава 3
Производная и
дифференциал
Существует достаточно света для тех,
кто хочет видеть,
и достаточно мрака для тех,
кто — не хочет.
Паскаль
3.1 Производная
Производная /'(#) — это мгновенная скорость изменения
функции f(x) в точке х. Если χ — время1, a f(x) - пройденный
путь, производная f\x) — это обычная мгновенная скорость в
момент времени х. Если «ж — время», производную принято
обозначать точкой сверху, /.
Подсознание имеет смысл приучать к интерпретации /'(ж) как
скорости изменения f(x) при изменении аргумента ж, независимо от
природы χ и f(x). Скажем, вполне естественно говорить о скорости f'(x)
изменения плотности f(x) атмосферы по мере увеличения высоты х.
Теперь о формальном определении.
*Коль скоро внутри возникает дискомфорт, когда время обозначается не
буквой ί, над этим стоит поработать. Подсознание не должно приклеивать
суть к случайным обстоятельствам.
52
Глава 3. Производная и дифференциал
3.1.1 Производной f(x) в точке χ называется предел
f-
f'(x) = lim
1 V ' Δχ-Ю
f(x+ Ax) - f(x)
Ax
(3.1)
если таковой существует. Операцию взятия производной
называют дифференцированием,. При существовании предела
(3.1) функцию f(x) называют дифференцируемой в точке2 х.
На картинке ситуация выглядит следующим образом.
fx+Ax)
fix)
\
\У
> - - -*
ι/
уГ I
' 1
1
6
X
-\~-4c
1
1
ι JC
х+Ах
га
Касательная к графику у = f(x) в точке Л тем точнее
приближает дугу AD, чем меньше Δ#. Разумеется, это само по себе
сказано не вполне точно. Во-вторых, это ниоткуда не следует.
Так будет, когда всё хорошо, т. е. существует предел (3.1). Тогда
при уменьшении Ах вертикальная прямая CD движется
влево, и BD/DC —> 0, что и является эквивалентом существования
предела (3.1), который в терминах геометрического рисунка
оказывается равным tg φ, т. е. производная численно равна тангенсу
угла наклона касательной к графику f(x) в точке х,
/'(s) = tgy>
Имеет смысл сразу осознать, что существование предела (3.1) —
штука достаточно естественная и широко распространёная. Пусть
f{x) = х2, тогда в соответствии с (3.1)
//(Ж) = Иш (χ+Αχ) ~х = Um (2ж+ Ах) = 2х.
V ' Δτ—Ο Δ Χ Δζτ-ΚΓ '
2И говорят, что f(x) дифференцируема на множестве X С Ш, если она
дифференцируема в любой точке χ € X.
3.2. Правила дифференцирования
53
Совсем просто получается х' = 1. (?) Почти так же легко
вычисляются производные других элементарных функций. Но
прежде чем этим заниматься, мы рассмотрим некоторые
вспомогательные инструменты, облегчающие взятие производных
конкретных функций.
3.2 Правила дифференцирования
1. Если известна производная /'(ж), то для у = cf(x), с
константа, можно сразу написать у' = с/7(ж), ибо
cf(x+ Α χ) - с f{x) f(x+Ax)-f(x) ,
= С ; У Cf (Χ).
Αχ
Αχ
• (πχ2Υ = 2тпг, (Зж)' = 3.
2. Производная суммы равна сумме производных
J?
(f + 9)' = f' + 9'
%
Доказательство — в качестве упражнения.
• (ж2 - 7х)' = 2х - 7.
3. Производная произведения равна
(/я)'= /'<? +/я'
(3.2)
< Пусть у = f · g, а Δ /, Ад — обозначают приращения функций,
например, Δ/ = f(x+ Ax) — f(x). Тогда
= Иш (f+Af)(g+Ag)-fg
Δχ—>0 ΑΧ
что и даёт (3.2), поскольку
δχ-0\Δ3Τ J Ах Ах yJ'
Δ/
Δ<?
Δ/
Αχ Αχ Αχ
54
Глава 3. Производная и дифференциал
(ж3)' = (х2 · х)' = 2х ■ χ + х1 ■ 1 = Зхг.
4. Правило дифференцирования сложной функции
(композиции функций):
У = f(g(x))
y' = f-9'
(3.3)
Здесь / дифференцируется «по всему своему аргументу, т. е. по
р(ж)». Допустим, у = (Зж)2. Полагаем д(х) = Зж, /(·) = (·)2.
Дифференцирование квадрата (по Зж) даёт 2 · Зж, (Зж)' = 3, поэтому у' = 18ж.
< Доказательство (3.3) занимает одну строчку3,
^=lim/(g+Ag)-/(fl) Ag =
δχ^ο Ад Αχ
Понятно, что цепное правило дифференцирования сложной
функции молено индуктивно продолжить
y = f(g(h(x)))
У' = f'g ■ 9h ■ К>
(3.4)
и так далее. Нижний индекс в (3.4) подчёркивает (напоминает), по
какому аргументу производится дифференцирование.
5. Производная частного
ff\ f'-g-f-g'
\я) " я2
легко устанавливается с помощью предыдущих правил. Частное
можно считать произведением / и 1/д, а производную (1/д)' вычислять
как производную сложной функции .
3Напоминаем, Ад = д(х+ Ах) — д(х)·
43десь мы, немного забегая вперёд, имеем в виду ( - ] =
W х2
3.3. Дифференциалы
55
6. Производная обратной функции. Если для у = f(x)
определена обратная функция χ = /_1(у), то5
у~у'х
что легко получается6 предельным переходом в очевидном
равенстве Δ χ/ Δ у = 1/(Лу/ Ах).
Человек, увы, мыслит в «обратном направлении» всегда хуже.
Трижды набивший оскомину пример тюбика, из которого выдавить
насту легче, чем загнать её обратно, образно отражает положение дел.
Именно в связи с трудностями манипулирования обратными
функциями — использование правила х'у = 1/у'х часто вызывает
затруднения. Осваивать такие вещи лучше всего на примерах. Определим
производную арксинуса, исходя из формулы для производной синуса,
(sin ж/ = cos ж. Пусть у = sin ж, χ = arcsiny. Тогда
11 1 1
ху ~ J
Ух cosx νΊ-sin2ж л/l-y2'
что даёт необходимый результат. При желании буквы ж, у теперь
можно поменять местами, (агсвтж)' = —
л/Г
ж
2
3.3 Дифференциалы
Определение производной (3.1) означает
fr
где ξ(Δ χ) —* О при Δ χ —» 0. Равенство (3.5) запишем в виде7
Af = f'(x)· Ах + о(Ах), (3.6)
5 Ещё раз обратите внимание на использование нижнего индекса,
который указывает, по какому аргументу производится дифференцирование.
Это удобный приём, широко используемый в анализе.
6Мы избегаем «разжевывания», которое иногда создаёт иллюзию
исчерпывающего объяснения, но всегда топит суть в трясине деталей.
73десь Δ/ = /(ж+ Δ χ) - f(x).
56
Глава 3. Производная и дифференциал
где о(А χ) = ξ(Α χ) Ах, и потому ο(Δ χ) не просто стремится к
нулю при Ах —> 0, а гораздо быстрее, чем Δ χ. Точнее говоря,
^^-+0 при ΔΖ-+0. (3.7)
Ах
Условие (3.7) определяет о-малое, о(), как стенографический
трюк, удобный и широко используемый. Для усвоения полезно
объяснить соседу, что такое
о(х), о(х3), о(х2 — 1), о
Два слова о понятии порядка малости, позволяющем в
одно касание уходить от неуклюжих пояснений. Пусть а(х) и
β(χ) — бесконечно малые величины, т. е. функции, убывающие
до нуля при χ —> 0, и
а(х)
-гг-г —» 0 при χ —» 0.
β(χ)
Тогда говорят, что а(х) имеет более высокий порядок малости
чем β(χ). На этом языке ο(Δ χ) — величина более высокого
порядка малости чем Δ χ.
Перейдём теперь к главной теме параграфа.
3.3.1 Линейная часть приращения А у, равная f(x)- Ax в
представлении (3.6), называется дифференциалом, функции у =
= f(x) в точке х, и обозначается dy = df.
Приращение Ажв этом контексте обозначают как dx, и
вместо (3.6) в линейном приближении имеем
df = f'(x) · dx. (3.8)
αϊ Jsur-'
е-
3.3. Дифференциалы 57
Поскольку рассмотрению дифференциалов сопутствует обычно
большая неразбериха, остановимся на некоторых реверансах, хотя это и
сопряжено с издержками типа «объяснения анекдота». Часто
определяют df как линейную функцию, что у новичков уводит почву из под
ног. Это функция в том же самом смысле, что и в случае у = 2ж,
переменная у — функция, но при данном значении аргумента у — это
уже число. Точно также dy при заданном dx — это число. И потому с
дифференциалами молено обращаться как с числами, делить одно на
другое, сокращать. В частности, деление (3.8) на dx даёт
f'(x) = £, (3.9)
что служит ещё одним общепринятым обозначением производной.
Кроме того, дифференциалы — это отнюдь не «маленькие дельта»,
как иногда думают. Они могут принимать любые значения.
Ситуацию (3.8) адекватно описывает следующее
представление. Функция у = f(x) в окрестности точки χ аппроксимируется
линейным приближением s = f{x)r, где г и s обозначают
линейные приращения вдоль осей х, у. Обозначая г через dx, s —
через dy, имеем (3.8). На рисунке
AC=dx=Ax
BC=dy
DC=Ay
линейная аппроксимация у = f(x) представляет собой прямую
KL, касающуюся графика f(x) в точке А и описываемую
линейной функцией df = f\x) - dx в координатах {dx,dy} с началом
отсчёта в точке А.
Всё это не имело бы особого смысла, если бы речь шла только
о ситуациях типа (3.6), (3.8). Выигрыш от рассмотрения диффе-
f(x+Ax)
fix)
\У
> ^
к/
уГ 1
1
1
5
X
ί 1 \ у,
/ ι }( Li
у^ ι 1
—\с
1
Ι χ
х+Ах
58
Глава 3. Производная и дифференциал
ренциалов невелик, а головной боли много8. Выгоды, конечно,
есть. Например, при работе с приращениями функций
приходится использовать приближённые равенства Δ у га /'(#) Δ χ, таская
из строчки в строчку хвосты нелинейных добавок о(). Понятие
дифференциала освобождает от этих неудобств, позволяя писать
для линейных частей приращений абсолютно строгие равенства.
Это особенно удобно в более сложных ситуациях. Например, для
у = f(x)g(x) имеем9
dy = df-g + fdg
что сразу получается умножением формулы производной
произведения двух функций на dx. Одна лишь возможность
обращаться с df /dx, как с обыкновенной дробью, порождает массу
df dx df
удобств. Например, — — = — ·
ax at at
3.3.2 Инвариантность формы дифференциала
Допустим, в у = f(x) производится замена χ = и(т), после которой
χ становится зависимой переменной. И хотя теперь уже Δ χ φ dx —
равенство dy = f'{x)dx сохраняется, в чем легко убедиться используя
формулу дифференцирования сложной функции:
dy = y'Tdr = y'xx'rdr = y'xdx.
Это свойство называют инвариантностью формы дифференциала.
Подобные «пустячки» пускают анализ в другое русло.
Дифференциалы шаг за шагом обретают другой облик. Становится
ясно, что линейные аппроксимации функций представляют
собой удобную и продуктивную категорию мышления.
Оказывается, их (аппроксимации - дифференциалы) в своей нише можно
полезным образом комбинировать, оставляя за бортом кандалы
нелинейных добавок.
8 Поначалу действительно не ясно, зачем вводятся дифференциалы. Тот
небольшой выигрыш, который они дают, на первом курсе выглядит
неубедительно, ибо пока ничего не известно о «территориях», где всё это может
хорошо «выстрелить». Но если присмотреться, то это хорошо «стреляет» и
в самых простых ситуациях.
9Не говоря уж о d(f + g) = df + dg или άζ/ = ζά/.
3.4. Производные элементарных функций
59
Формула для производной dy/dx, допускающая сокращения как в
обыкновенных дробях (но не буквы d!), часто оказывается
предпочтительнее. Например, в случае параметрического задания кривой,
х = <р(т), у = ф{т),
производную у'х с помощью дифференциалов можно вычислить, не
восстанавливая зависимости у(х):
, =ay_ _ y'Tdr _ φ'(τ)
Ух dx " x'Tdr " φ'{τ)
3.3.3 Дифференциалы высших порядков
Вторым дифференциалом d2y функции у = f(x) называется (первый)
дифференциал функции dy = f'{x)dx (как функции ж, но не dx), т. е.
d2y = d(f'(x))dx = (f"(x)dx)dx = f"{x)dx2.
Дифференциалы более высокого порядка определяются индуктивно10,
dny = f(n\x)dxn.
В отличие от дифференциалов первого порядка, для которых
всегда dy = f'(x)dx (инвариантность формы), приведённые формулы для
дифференциалов dn (η > 1) справедливы лишь в предположении
независимости аргумента х. Если χ = φ(ί), то
^y = [/M*))]&*2 = [//(V(01/*2 =
= (/" · (Ψ'Ϋ + Г · 4>")dt2 = f"dx2 + fd2x.
3.4 Производные элементарных функций
• Производная степенной функции
В случае хп при целом η > 1 из формулы бинома Ньютона,
(х+ Ах)п = хп + пх"-1· Ах + С2хп~2- Ах2 + · · · ,
10 Вторая производная /"(#) получается дифференцированием f{x).
Дифференцируя f(x) η раз, будем иметь n-ю производную /(п)(ж).
60
Глава 3. Производная и дифференциал
следует
(ж+ Ах)п - х" = пхп Ах + ο(Δχ),
откуда легко вытекает (хп)' — пхп~~1.
* ч f
* ^ у l*§ ц1 ? ^ ч> ^ :::*
-*- «■* ■■ .~.^--- !И
Рисунки А. Фоменко
В общем случае степенной функции у = хх с произвольным λ φ 0
возни чуть больше. Сначала установим вспомогательный факт
< <1 + t)A-^A при ^0.
Вводя новую переменную s = (1 + t)x — 1 (очевидно, s —» 0 при
t —* 0) и логарифмируя равенство (1 + ί)λ = 1 + s, имеем
Aln(l+i) = b(l + s),
откуда
(1 + ί)χ - 1 _ s _ s ln(l + *)
t " ί " ln(l + β) ί ""* Λ'
в силу тот, что (при t —► 0)
1
1η(1+ΐ)
1и(1 + /)/ - hie = 1.
Теперь легко получаем нужный результат
3.4. Производные элементарных функций
61
, (х+ Δχ)Λ-χΛ
Δχ->0 Δ Ж
^ Ы Xх-1 = XXх-1- ►
= lim τ—
Δχ—0 Δ#
Таким образом
(хх)' = \x(x-V
. В частности,
const' = 0, χ1 = 1, (>/#)' =
2Уж
• Производная показательной функции
^ Для у = ах имеем
у1 = lim
α*+Δτ _ αχ
α** - 1
= lim αχ— = αχ In α,
Δε—>0 Δ Χ Δε—>0 Δ Ж
поскольку
ατ-1
In α при τ —» 0,
что следует из
ατ-1 σ
τ loga(l + σ) loga(l + σ)ι'σ loga e
где ατ - 1 = σ. ►
= In a,
Таким образом {αχ)' = αχ In a
. В частности,
Θ
ж У Лж
(е*)'=*
(3.10)
Особая роль числа е при дифференцировании
показательной функции — есть πια самая причина, которая ставит е в раз-
Ряд важнейших констант. Принципиальная роль показательной
62
Глава 3. Производная и дифференциал
функции в «устройстве Вселенной» — это уже другой вопрос. Из
приведённых формул ясно, например, что дифференциальному
уравнению у' = ку удовлетворяет функция у = екх.
Аналогичным образом е появляется при решении любых линейных
дифференциальных уравнений, которыми описывается большинство
прикладных задач в физике, биологии, экономике и других
областях. Функцию ех называют также экспонентной. Вместо ех
иногда используют обозначение I
ехрж
• Производная логарифмической функции
Функции χ = ау и у = loga x взаимообратны. Поэтому
производная логарифмической функции определяется формулой
производной обратной функции.
, ι ι ι
Ху
Таким образом,
ау In a xlna
(logaxy = -±-, (1:
х In a
• Производные тригонометрических функций
В случае у = sin x имеем11.
sin(x+ Δ χ) — sin χ .. / Δχ\ sin(Ax/2)
—ν /_ _ ι— ™ο / „ λ \ _ cosx
, .. sin(x+ Δ χ) — sin χ .. / Δχ\
У = lim — = lim cos x + —г- ) ,
δ*-+ο Δ ж δ*-+ο V 2 / (Δ ^/2)
с учётом установленного ранее предела (2.5),
sin τ
► 1 при τ —» 0.
Производная косинуса вычисляется аналогично. Можно
также воспользоваться формулой производной композиции
функций либо для представления
cos χ
= л/l - sin2 ж, (3.11)
1 Пользуясь формулой разности синусов.
3.4. Производные элементарных функций
63
либо, что целесообразнее, для
= sm^--x).
COS Ж
(3-12)
Тут, как говорится, все дороги ведут в Рим. Но в случае (3.11)
необходимы предосторожности и лишние усилия из-за «плохо
выбранной дороги». Манипуляция
, ч/ 1 / Л . ч sin ж cos ж
(cosx) = —, =(—2 sin ж cos ж) = = — sinx
2%/l-sin2x
cos ж
представляет собой лишь канву. Корень — функция
неоднозначная, сокращать на cos x, который время от времени обращается
в ноль, тоже не с руки. Все эти препятствия можно обойти, но
зачем лишняя работа. При опоре на (3.12) производная косинуса
вычисляется без проблем. В итоге
(sin χ)' = cos ж, (cos χ)' = — sin x.
Производные тангенса и котангенса вычисляются по формуле
производной отношения двух функций.
(tgx)' =
1
2 '
COS Ж
(Ctgz)' = ;
sin2 ж
Наконец, производные обратных тригонометрических
функций вычисляются по формуле производной для обратной
функции, что уже было продемонстрировано ранее на примере
арксинуса.
, .._ _л, _ 1
Vi-x2
(arccos x)' =
1
Vl-x2'
(axctg x)' = ^—2, (arcctg)' = - —5.
64
Глава 3. Производная и дифференциал
3.5 Тропа на вершину Тейлора
О полезности изучения закоулков Вселенной с
дифференциальной точки зрения свидетельствуют многие факты. Один из них
3.5.1 Теорема Ферма. Пусть f(x) β точке χ = а
дифференцируема и принимает локально максимальное значение, т. е.
f(a) ^ f(x) для всех χ из достаточно малой окрестности
точки а. Тогда f'(a) = 0 .
< В предположении противного, f'(a) φ О, например f'(a) > О,
линейная (самая большая при малом Δ χ) часть приращения
f'(a)Ax>0 при Лж>0,
т. е. /(а+ Ах) > f(a) при достаточно малых Ах > О, что противоречит
наличию локального максимума в а. ►
На ситуацию полезно взглянуть и с других позиций. При
движении точки в положении максимального удаления точка
останавливается12 скорость обнуляется. Очевидно также, что
касательная к графику в точке локального максимума -
горизонтальна, т. е. tg φ = /'(α) = 0.
Обратное, разумеется, неверно. У х3 производная (Зж2) в нуле
нуль, но максимума нет. В нуле у х3 точка перегиба.
Чтобы двинуться обратно.
3.5. Тропа на вершину Тейлора
65
3.5.2 Теорема Ролля. Пусть
f(x) дифференцируема на [а, 6] и
f(a) = f(b). Тогда есть точка ξ G
[α, b], β которой /;(ξ) = 0.
Μ Из /(α) = /(6) вытекает, что f(x) на [α, b] имеет или минимум,
или максимум. Далее решает ссылка на предыдущую теорему. ►
3.5.3 Теорема Лагранэюа.
Пусть f(x) дифференцируема на *[х'
[а, 6]. Тогда существует точка
ξ G [а, 6], в которой
f(b)-f(a)
b — a
=m
Последнее равенство чаще записывают в виде
fr
/(b)-/(α) = /'(0(6-α)
подчеркивая способ выражения приращения Δ/ с помощью
умножения Ах = а — Ъ на «среднюю скорость роста» /'(£)■
< Для доказательства введем вспомогательную функцию
ω(χ) = f(x) — kx,
которая при к = [f(b)—f(a)]/(b—a) удовлетворяет условию α;(α) = ω(6).
Доказательство завершает применение к ω(χ) теоремы Ролля. Для
некоторого ξ G [α, b] будет ω'(ξ) = /'(ξ) - к = 0. ►
3.5.4 Теорема Коши. Пусть f(x) ug(x) дифференцируемы на
[α,6] и g'{x) /Об промежутке [а, Ь]. Тогда существует точка
£ € [а, 6], β которой
/(Ь)-/(а) = /'(0
5(Ь)-5(о) </(£)'
66
Глава 3. Производная и дифференциал
< Доказательство снова получается сведением к теореме Ролля с
помощью функции ω(χ) = /(ж) — kg (x), которая при
k=[f(b)-f(a)}/[g(b)-g(a)}
удовлетворяет условию ω(α)=ω(ο). Точка ξ G [α, 6], в которой ω'(ξ) =
= /'(£) _ kg'(ξ) = О, даёт «то, что нужно». ►
Теорема Коши допускает следующее усиление.
3.5.5 Теорема Коши-плюс. Пусть функции f(x) и д(х)
дифференцируемы η + 1 раз β некоторой окрестности точки а и
обращаются β этой точке β нуль вместе со своими η
производными, причём для χ φ а из этой окрестности
д(х)*0, д'(х)^0, , g(n+1\x)jiO.
Тогда существует точка ξ в окрестности а, в которой
№ = &+1)(0
д(х) 5(п+1)(0'
<4 Если f(a) = д(а) = О, то теорема 3.5.4 в применении к
промежутку [а,ж] (или [ж, а], если χ < а) гарантирует существование такого
ξ G [α,ж], что
№ = /40
9(х) <Л0'
f'(£)
Применим теперь этот факт к J t rti, и так — η раз. ►
3.5.6 Теорема Дарбу. Если f(x) дифференцируема на [а, δ], то /'(ж)
принимает все промежуточные значения между /'(а) и /'(δ). (?)
Формально к теореме Коши-плюс надо добавить замечание о про-
изводных высших порядков, поскольку до сих пор о повторном
дифференцировании речь не заходила.
• Дифференцируя /'(ж), получаем вторую производную /" (ж)
функции /(ж). Дифференцируя /(ж) η раз, будем иметь n-ю производную
/(п)(ж) функции /(ж). Для обозначения второй (n-й) производной ис-
d2f f<Ff\ v
пользуется также запись —j Ι -τα ) · Л°гда. аргумент время —
популярны точки сверху, ζ вместо ζ". Обычно /(ж) предполагается столько
раз дифференцируемой, сколько требуется по контексту.
3.6. Разложение Тейлора
67
3.6 Разложение Тейлора
Кульминационным моментом дифференциального исчисления
обычно представляется следующий факт.
3.6.1 Формула Тейлора. Пусть функция f(x)
дифференцируема η + 1 раз в некоторой окрестности точки а. Тогда для χ
достаточно близких к а справедлива формула
f(x) = /(α) + %&(х - а) + ■ ■ ■ + £&(х - а)п + о((х - а)п)
Μ Легко видеть что аппроксимирующий полином
Рп(х) = На) + 4г (* -«) + ··· + ^Г (* - «Г
1! п!
имеет в α те же производные (до n-й включительно), что и /(ж),
поэтому функции13
φ(χ) = /(χ)-Ρη(χ) и ф(х) = (х-а)п+1
удовлетворяют условиям теоремы Коши-плюс. Следовательно,
ф) = φη+1(ξ)
ψ(χ) φη+1(ξ)
зстности а.
п+1(0, Фп+1(0
/(»)-Pn(g) = /n+1(Q
(x-a)n+1 (n + 1)!'
что и требуется, поскольку
^-Ш(х-аГ»=о((х-аГ). ►
Если функция f(x) бесконечное число раз дифференцируема,
скажем, в нуле, то велик соблазн представить её в виде
бесконечного ряда Тейлора
/(*) = /(0) + ^* + ··· + ^*η + ··· · (3.13)
в некоторой точке ξ в окрестности а.
Очевидно, ψη+1(ξ) = /n+1(0, V>n+1(0 = (η + 1)! Поэтому
13 Имеющие в а нулевые производные до n-й включительно.
68
Глава 3. Производная и дифференциал
Вопрос в том, имеет ли смысл равенство (3.13). Оценки малости
«хвоста» ряда Тейлора (остаточного члена) f(x) — Рп(х)
ничего не дают. Качество приближения f(x) полиномом Рп(х)
улучшается с ростом п, но окрестность, где это происходит, может
уменьшаться до нуля. Поэтому для знака равенства в (3.13) нет
оснований. Ряд Тейлора может расходиться или сходиться к
другой функции.
Например, для функции f(x) = е-1/х , доопределённой в нуле по
непрерывности (/(0) = 0), все производные /(п)(0) = 0. Поэтому её
ряд Тейлора (3.13) сходится к (равен) тождественному нулю.
Тем не менее для многих функций представление (3.13)
справедливо, причём не в малой окрестности, а на довольно широких областях
и даже на всей числовой прямой. Например, представления14
Ύ Л х х2 хп
6 =1+1!+2!+-+Ы+···'
χ3 χ2η+ι
χ2 χ4 , ч„ χ2η
cosx=1__+__...+(_lr__+...
справедливы при любом χ Ε (—оо, +оо).
Так или иначе, но в теории функций комплексного переменного
(глава 10) устанавливается, что ряды Тейлора, с которыми приходится
иметь дело на практике, сходятся в обширных областях.
Вот ещё несколько рядов
(1 + х)°
х3 х5
arctgx = χ —— + — -
о о
х2 х3 х5 ,
—— = 1 + х + ж2 + ж3 + ...,
1-х
а , а(а - 1) 2
X7
(\х\ < 1),
(W < ι),
(1x1 < 1).
14Именно глядя на эти ряды, как гласит легенда, Эйлер открыл свою
знаменитую формулу
е** = cos φ + г sin φ
3.7. Контрпримеры и парадоксы
69
Ради справедливости надо подчеркнуть, что тейлоровская
тематика ориентирована на изучение особенностей поведения функции в
точке — а там ограничение ракурса малыми окрестностями
естественно. Если бы задача состояла в аппроксимации функций на больших
промежутках, то можно было бы вообще заходить с другого конца.
3.6.2 Теорема Вейерштрасса (аппроксимацгюнная). Для
непрерывной на [а, Ь] функции f(x) и любого ε > О всегда можно указать
такой полином Рп(х), что
\f(x) — Рп(х)\ < ε для любого χ Ε [а, 6].
Это знаменитый результат, но уже из другой области и для
других целей. Равномерную аппроксимацию f(x) на [0,1] (при η —» оо)
обеспечивают, например, полиномы Бернштейна:
Ρη(χ)=έ / (£) с№(г - x)n~k- Q (з·14)
3.7 Контрпримеры и парадоксы
Об ощущении берегов. Когда плывёшь по течению в
окружении теорем, необходимо чувствовать берега. То есть иметь
представление, что там, за пределами оговоренных условий.
Куда можно угодить, делая шаг в сторону. Поэтому примеры и
контрпримеры не менее важны чем теоремы.
Ещё важнее понимать, обеспечивают ли «оговоренные
условия» безопасность «рейса». Исключены ли аномалии. Не могут
ли хлынуть в пробоину определений какие-нибудь несуразности.
Дело в том что некоторые предположения теорем, находясь в
тени, кажутся несущественными, и выводы мерещатся
справедливыми без них. Тогда и возникает потребность в контрпримерах.
Ловушка непрерывности. Всякое определение минирует
математику. Казалось бы, что может быть проще и
естественнее понятия непрерывной функции. Но в расщелину
соответствующего определения просачиваются многочисленные уродцы.
70
Глава 3. Производная и дифференциал
Первые признаки того, что непрерывность вмещает в себя
всякую чертовщину, возникают довольно просто. График везде
непрерывной15 функции у = χ sin— невозможно нарисовать, а
график непрерывной в нуле функции
(0, если χ рационально,
ж, если χ иррационально
всюду дыряв. Ещё экзотичнее функция Римана
щ f i, если χ = —, дробь — несократима,
™ ™ (3.15)
если χ иррационально,
В подобное загодя трудно поверить. Ибо можно ли заранее
вообразить функцию непрерывную в иррациональных и разрывную
в рациональных точках .
< Известно, что иррациональное хо невозможно хорошо
приблизить рациональной дробью — с ограниченным знаменателем17.
Поэтому чем меньше окрестность xq, тем больше знаменатели
входящих туда дробей — и тем меньше значения / ( — ) = — · В итоге
f(x) -> f(x0) = 0 при χ -» х0. ►
Далее можно вспомнить кривую Пеано — непрерывный
образ отрезка (x(t),y(t)), t G [0,1], заполняющий весь квадрат
[2, т. 12]. Конечно, серьёзного удара по непрерывности
перечисленные примеры не наносят. Да, ёмкость понятия оказывается
больше, чем хотелось бы, однако неприятности терпимы. Не ка-
5 Здесь и далее подразумевается непрерывное доопределение функций с
«выколотыми точками».
16ι
Тем более что, наоборот, «функцию непрерывную β рациональных и
разрывную в иррациональных точках» построить невозможно.
17См. например, Кац М., Улам С. Математика и логика: Ретроспектива и
перспективы. «Мир».
3.7. Контрпримеры и парадоксы
71
тастрофа, в конце концов. Но лиха беда начало.
ч
44
I
• Канторова лестница бьёт по мозгам уже сильнее. Строится
она на базе канторова множества С, получаемого выбрасыванием
третей из сегмента [0,1]. Сначала [0,1] делится на три равные части,
и средняя (интервал) удаляется. С каждой из оставшихся частей
повторяется аналогичная операция — и так до бесконечности. В пределе
от [0,1] остается как раз множество С. При этом длина выброшенных
третей равна \ + ύ + ψγ~\ = 1> т· е· <<вся длина» [0,1]
выбрасывается. Но оставшееся множество С оказывается равномощно континууму,
что и производит главный сюрприз в теории множеств.
Теперь далее. Пусть функция / : [0,1] —» [0,1] на замыкании
каждого выбрасываемого (в процессе построения канторова множества)
интервала — принимает значение, равное середине этого интервала.
Вот так выглядит график f(x) после двух шагов.
Jt
3/4
1/2
1/4
/
1/3
2/3
\
Доопределение f(x) в точках второго рода но непрерывности18
даёт непрерывную монотонную функцию /(ж), производная которой
18 Концы выброшенных интервалов в канторовом множестве С
называют точками первого рода, остальные — второго рода. В точках второго рода
х полагается f(x) = lim f(xk), где Xk —> х и все Хк — точки первого рода.
72
Глава 3. Производная и дифференциал
почти всюду равна нулю, тем не менее /(0) = 0, /(1) = 1. Другими
словами, f(x) почти нигде на [0,1] не растет, успевая ощутимо вырасти
на множестве нулевой меры (несмотря на непрерывность).
• Знаменитый пример Брауэра. Этот удар уже не по мозгам,
а едва ли не по устройству Вселенной.
Зададимся дурацким на вид вопросом. Могут ли на плоскости
три области иметь общую границу? Не общий участок — а одну и
ту же границу. Похоже на бред, но ответ — положительный.
Идея конструкции довольно проста. Пусть в море С есть остров,
на острове два озера — А и В. На сухопутной части острова выделим
ε-сеть19 S£. Затем от каждого озера и от моря к каждой точке S£
пророем канал, не доводя его до этой точки на расстояние ^. В духе
рисунка (3.16) справа.
(3.16)
На оставшуюся часть суши поместим —сеть, и к точкам S£j2 пророем
каналы, не доходящие до точек сети на 4. Потом накроем сушу j-
сетью и так далее. Понятно, что в пределе области Л, В, С разрастутся
до областей А°°, В°°, С°° с общей границей Г. Граница Г — это все,
что останется от суши. А если изначально взять остров с миллионом
озер — получится пример миллиона областей с общей границей.
Такую галиматью возникает соблазн объявить фантасмагорией ума.
Дескать, чего не бывает в больном воображении. Тем более
удивительно, что картина нескольких областей с общей границей встречается не
только в фантазиях, но и на практике. Итерационная процедура
ζ3 - 1
sife+i = ** " -^т- (3.17)
19 Эпсилон-сетью множества X называют такое его подмножество 5е, что
для любого χ £ X можно указать s £ 5е, удалённое от χ не более чем на v.
3.7. Контрпримеры и парадоксы
73
на комплексной плоскости вычисляет корень кубический из единицы,
каковых имеется три,
,, zi+ivS :OzS« (3.I8)
и есть, соответственно, три области притяжения Л, В, С. Процесс
(3.17) сходится к одному из корней (3.18) в зависимости от того,
какой области принадлежит z$. Пусть Та, Г#, Тс обозначают границы
областей Л, В, С. Невероятно, но факт:
ГЛ=ГВ=ГС, (!)
т. е. области притяжения имеют одну и ту же границу20.
Дифференциальная западня. Дифференцируемая
функция обладает свойством Коши: по теореме Дарбу её
производная принимает все промежуточные значения. Это
подталкивает к выводу, что в случае дифференцируемости f(x) на [а, Ь]
производная f'(x) обязана быть непрерывной функцией, поскольку,
мол, свойство Коши представляется эквивалентом
непрерывности. Неправильно то и другое. Аргументы:
• Производная везде дифференцируемой функции
f(x) = χ2 sin-, (3.19)
χ
равная нулю при χ = О и
fix) = 2x sin cos - при χ φ О
χ χ
разрывна в точке χ = О, но обладает свойством Коши21.
См. п. 8.5 в книге Кроновер Р. М. Фракталы и хаос в динамических
системах. Основы теории. М.: Постмаркет, 2000.
Напомним, функции мы доопределяем по непрерывности. В данном
случае /(0) = 0, поскольку f(x) —> 0 при х —> 0.
74
Глава 3. Производная и дифференциал
Пример (3.19) задаёт эталон возможных неприятностей в
дифференциальном исчислении. При выборе в качестве мишени точки χ = О
ядром замысла обычно является произведение двух функций, одна из
которых подходящим образом обнуляется в нуле, а другая, типа sin —,
быстро колеблется, «ускоряясь» по мере приближения к χ = 0.
Если частоты колебаний не хватает, то вместо sin — берется что-нибудь
вроде sin(l/xfe). Возникающий ассортимент довольно широк.
• Везде дифференцируемая функция
f(x) = x2sin-^
имеет неограниченную разрывную в нуле производную, /'(О) = 0 и
12 1
f'(x) = 2х sin -я- cos —$ при х^О.
χ х χ
• Функция
f(x) = χ + х2 sin —η
χ
имеет производную /'(О) = 1, но не монотонна в окрестности нуля.
• Функция
f(x) = 2х2 + х2 sin -я-
χ
имеет в нуле строгий минимум и равную нулю производную, но её
производная в сколь угодно малой окрестности нуля принимает как
положительные, так и отрицательные значения, сколь угодно большие
по модулю.
Такие примеры способствуют поддержанию бдительности,
показывая не только чего надо опасаться, но и при каких
обстоятельствах. Эпизодически поговаривают о чрезмерной
либеральности определения производной, которое считает
дифференцируемыми в нуле функции типа χ sin(l/:r). Дескать, скверная
природа таких функций портит столбовую дорогу матанализа
компрометирующими закоулками. Однако проблема дифферен-
цируемости абсолютного ответа не имеет и иметь не может. Как
и непротиворечивость гражданского или уголовного кодекса.
Глава 4
Интеграл
A not getting what you want
is sometimes a stroke of luck.
Dalai Lamas
4.1 Первообразная
4.1.1 Операция, обратная дифференцированию, называется
интегрированием. Функцию F(x), такую что
F'(x) = f(x),
или равносильно dF(x) = f(x)dx L называют первообразной
Функции f(x), или интегралом от f(x).
Если F(x) — первообразная /(ж), то и F(x) + С — первообразная
/(ж), поскольку производная константы С равна нулю.
4.1.2 Совокупность всех первообразных f(x) называют
неопределённым интегралом, и обозначают
fr ι
f(x)dx.
(4.1)
76
Глава 4. Интеграл
Под знаком интеграла / в (4.1) стоит дифференциал
первообразной, f(x)dx = dF(x). Поскольку, например, dsinx = (smx)'dx =
= cos xdx, то
/ cosxdx = sin ж. JOll
Точнее говоря, J cosxdx = sin χ + С, но константу мы будем опускать.
Таблица производных элементарных функций легко
трансформируется в таблицу неопределённых интегралов.
/ exdx = ex, I axdx = ax/ In α, α > 0, α φ 1.
/
xxdx = - -ζλ+1, Χφ-1.
λ + 1 ^
/dx . . . f dx . f dx
— = In \x , / —. = arcsinz, / τ> = arctgx.
* J л/Г^ i 1+z2
He будем далее ломиться в открытую дверь. Некоторое
количество формул, конечно, полезно иметь в запасе, дабы не ходить
к соседу за справкой в процессе решения задач.
Что касается потенциальной полезности неопределённого
интеграла, то первое, что приходит в голову, это задачи, в которых даны
соотношения скоростей, и неизвестны — пройденные пути. Не обязательно
о километрах речь. Скажем, численность популяции x(t) растёт со
скоростью χ = кх. Конечно, интеграл сразу бы решал вопрос в ситуации
χ = (p(t) => X(t) = / (f(t)dt.
Но и в случае χ = кх интегрирование спасает1:
-5. = кх => — = kdt => I — = I kdt =>
dt x J x J
=» \nx = kt + C =» x(t) = x(0)ekt,
1 Подобные трюки работают также в более сложных ситуациях.
4.2. Определённый интеграл
77
где константа интегрирования2 С выбрана из условия ес = ж(0).
Простейшие свойства первообразной легко следуют из свойств
производных.
• f[f(x)±g{x)\dx = j f(x)dx± J g{x)dx (γ)
• af(x)dx = a I f(x)dx \jF)
jdx = x, fdf(x) = f(x) (^)
4.2 Определённый интеграл
Интегрирование возникло и какое-то время развивалось
независимо от дифференцирования. Источником послужила задача
определения площади под графиком функции у = f(x). В основу
решения была положена естественная аппроксимационная идея.
Отрезок [а, Ь] разбивается на η сегментов [ζ^,α^+ι] длины Δ Xi,
где хо = а, хп = 6, рис. (4.3). На каждом г-м отрезке выбирается
произвольная точка &, и рассматривается сумма
п-1
σ = Σί(ξί)Αχί. (4.2)
г=0
/to
(4.3)
х
α χι хм Ь
• Предел суммы (4.2), если таковой существует и не зависит
от разбиения [а, Ь] и выбора точек ξι, при стремлении к нулю
максимальной длины Δ Χι — называют определённым интегра-
ь
лом f(x) от а до Ь и обозначают I f(x)dx.
а
2 О наличии которой надо вовремя вспоминать.
^ф^
Θ
78
Глава 4. Интеграл
Конечно, в таком определении слишком много «если». Кто
будет производить разбор полётов в каждом конкретном случае?
Поэтому идут обычно по несколько иному пути. На каждом
промежутке [iCi,iCi+i] берутся точная нижняя mi и точная верхняя
Μι границы f(x), и вводятся в рассмотрение две суммы Дарбу
(нижняя и верхняя)
п—1 п—1
S = J^^lz Δ24, & = Σ^* ΔΧί.
г=0 г=0
В силу rrti ^ /(&) ^ Mi имеем s ^ σ ^ S. Поэтому для
существования предела σ достаточно, чтобы суммы Дарбу сходились
к одному пределу, т. е.
S - s -> 0.
Общий предел s и S, если таковой существует, и называют
определённым интегралом. Оба определения эквивалентны, но
второе легче проверять. При этом в случае существования инте-
ь
грала J f(x)dx в указанном смысле функция f(x) называется
α
интегрируемой по Риману, а сам интеграл — интегралом
Римана.
4.2.1 Теорема. Если функция f(x) непрерывна на [а, 6], то ин-
ь
теграл I f(x)dx существует.
а
< Доказательство обеспечивает теорема Кантора 2.8.2,
гарантирующая равномерную непрерывность f(x). Поэтому по любому ε > 0
молено указать такое δ > 0, что Δ χ ι < δ =φ· Μ» — rrii < ε для всех г,
откуда
п—1 п—1
^2(Мг - т») ΔΧΐ < ε ^2 &Xi = e(b - α),
г=0 г=0
что даёт S — s —» 0. ►
4.3. Взаимосвязь интегралов
79
В случае кусочной непрерывности f(x) (конечного числа
разрывов) результат остается в силе, поскольку
Ь с\ Ci+i Ь
О О Ci Сп
где Ci — точки разрыва.
4.3 Взаимосвязь интегралов
Если рассмотреть интеграл
χ
{х) = J f{t)dt
α
как функцию верхнего предела, то
ЛФ = Ф(ж+ Ах)-Ф(х) = / f(t)dt = /(£) ЛжН-о(Лж),
что приводит к
Ф'(х) = f(x) , т. е. Φ — первообразная.
< Вот более аккуратное рассуждение. Обозначим через £min и
ζτηαχ наименьшее и наибольшее значение функции /(ж) на отрезке
[ж, ж+ Δ ж]. Очевидно, площадь Δ Φ заключена между площадями
прямоугольников €min АХ И ξπ,αχ Δ Ж, ПОЭТОМУ
ΔΦ
ζτηϊη ^ ~~7 ^ ζτηαχ-
Ах
При Δ ж -» 0 imin -> /(ж), £тах -> /(я), в силу непрерывности /(ж).
Тогда по теореме «о трёх собачках» -^-^- —* f(x), т. е. Φ'(ж) = /(ж). ►
Аддитивность интеграла С f(x)dx = f f(x)dx + / f(x)dx вытекает из
α а, с
определения.
80
Глава 4. Интеграл
Таким образом, площадь Ф(х) под графиком у = f(x) —
это первообразная функции /(ж). Изменение точки отсчёта
а добавляет к Φ (ж) некоторую константу. От любой другой
первообразной F(x) функция Φ (χ) отличается на постоянную
величину, поэтому всегда4
о
Ф(6) - Ф(а) = F(b) - F(a) = ί f(x)dx,
что численно равно площади под графиком у = f(x) на
промежутке [а, 6]. Если f(x) на [а, 6] меняет знак, то из построения
ясно, что площади фигур между графиком и осью ж-ов засчиты-
ваются со знаком «плюс» там, где f(x) > 0, и со знаком «минус»
там, где f(x) < 0.
Дифференцируя Φ(φ(χ)) по формуле дифференцирования
сложной функции, имеем
φ{χ)
± J f(t)dt = f(<p(xW(x).
W
л ϊ
При манипулировании определёнными интегралами нередко
требуются оценки в виде неравенств. Вот два очень простых и часто
используемых факта.
• Если т ^ f(x) ^ Μ на [а, 6], то
ь
т(Ъ - а) ^ ί f(x)dx ^ М(Ъ - а). (^*)
43аметим, что разность F(b) — F(a) часто записывают в виде F(x)
4.4. Техника, интегрирования
81
• Пусть на [а, 6] функция д(х) знакопостоянна и m ^ f(x) ^ М.
Тогда ь ь
J f(x)g(x)dx = μ g(x)dx
α a
при некотором μ G [m,M]. (*# j
6 α
У /(*)<& = - J f(x)dx (γ)
α 6
6 6
• / fc/(x)dx = k ί f(x)dx (^)
α α
b b b
J[f(x) ± g(x)]dx = J f(x)dx ±fg(x)dx (^)
a a a
b с b
J f(x)dx = J f(x)dx + J f(x)dx (^)
a a c
b
• / f(x)dx ^ 0, если f(x) ^ 0 (^\
a
4.4 Техника интегрирования
Whether you think you can or
whether you think you can't, you're right!
Henry Ford
Замена переменной. Ретроспективно оглядываясь на
дифференцирование, легко выделить в ремесле взятия производных
две составляющих. Во-первых, нужно знать или иметь перед
глазами таблицу производных простейших функций. Во-вторых,
нужно уметь комбинировать элементы таблицы, опираясь на
свойства производных: производная суммы, произведения, частного,
композиции функций.
82
Глава 4. Интеграл
Со взятием неопределённых интегралов — такая же история.
«Таблица», собственно, та же самая, разве что вывернутая
наизнанку. Да и «приёмы комбинирования» те же, но «киноплёнка»
крутится в обратном направлении. Впечатления, соответственно,
другие. Пересматривать приходится заново.
• Интегрирование, как и дифференцирование, — линейная
операция, т. е. если F(x) — первообразная функции /(ж), a G(x) —
первообразная д(х), то
i[af(x) + β9(χ)]άχ = aF(x) + ββ{χ)
при любых α, β Ε Ж.
• Широко распространены переходы к интегрированию по
другой переменной, в основе которых лежит формула
Уf(9(x))g'(x)dx = F(g(x)), (4.4)
где F(g) — первообразная f(g).
Равенство (4.4) представляет собой опять-таки «вывернутое
наизнанку» правило дифференцирования сложной функции.
Дифференцируя в (4.4) F(g(x))1 получаем
Ffa(x))g'(x) = f(g(x))g'(x)>
т. е. как раз подынтегральное выражение.
Фокус практического использования формулы (4.4) для
Ιφ(χ)άχ заключается в изобретении представления
φ(χ) = f(g(x))g'(x)
с функцией /, первообразная которой известна или легко
вычисляется. Часто это получается само собой.
• Например,
/ sin3 χ cos xdx = / sin3x d sin χ = - sin4 χ
t
4.4. Техника интегрирования
83
/
ИЛИ
л/ ν f 2xdx Г dx2 ^2
φ(χ) = / Τ—— = / 77-4 = arctS* ·
J 1 + χ J 1 + χ
За кадром-то здесь фигурирует замена х2 = £, далее берётся интеграл
2> после чего исполняется возврат к переменной х. Понятно,
что сию кухню проще держать в голове, не оставляя следов.
• Замена, конечно, не всегда сама напрашивается. Иногда
приходится повозиться. Не так легко, например, додуматься, что проблему
взятия интеграла / —. решает замена t = л/1 + х2 + х. Возведе-
J_ л/l+x2
ние t — χ = л/1 + х2 в квадрат даёт
t2-l г t2 + l , t2 + l
χ = —-—, ν 1 + χ2 = —-—, dx = ο—d£,
2ί ' ν 2ί ' 2ί2
откуда
/ /Ж = /^ = 1п|*| = 1п|л/ГТ^ + *|.
J ν 1 + ж2 J t
Последний пример демонстрирует, что трюк (1) может быть лишь
элементом более сложных манипуляций.
• Если F(x) — первообразная /(ж), то
/ f(ax + b)dx = - / f(ax + b)d(ax + b) = -F(ax + b).
J a J a
Интегрирование по частям. Обращение правила
дифференцирования произведения приводит к формуле
интегрирования по частям
/ udv = uv — vdu, (4.5)
проверяемой дифференцированием с учётом
(uv)' = u'v + ш/.
Диапазон применения (4.5) весьма широк. Осваивать
инструмент надо на примерах
84
Глава 4. Интеграл
• /in xdx = ж In ж — / жа1 In ж = ж ίη ж — / dx = ж In
• / χ cos xdx = I xd sin χ = χ sin ж — /sin жйж = ж sin ж +
Возможны и более крутые виражи
• ехcosxdx = / exdsmx = e^sinx — / exsinxdx =
= eIsinx+ / exdcosx = ежвтж + ежсовж— ex cosxdx,
откуда 2 / ex cosxdx = еж(втж + cos ж).
В том же духе:
• / у/a2 — x2dx = χ χ/ α2 — χ2 — / , dx =
J J у/a2 - χ2
= xy/a2 — χ2 — / у/a2 — χ2 dx + α2 / , =,
./ У у/оР-х2
COS Ж.
откуда
/\Д*2 — ж2 а*ж = — \/а2 — ж2 + -г- arcsin —.
2 2 α
Всё это к существу интегрирования имеет весьма отдалённое
отношение. В основном, это касается жонглирования и
комбинирования простых фактов, что широко распространено во всех
сферах деятельности. Часть населения устремляется к задачам
олимпиадного уровня, но и в рядовых ситуациях необходима
определённая ловкость.
J ж2-α2 ~ J 2a\x-a x + a) X ~
= ±-(]η\χ-α\-\τι\χ + α\) = ±-\η1χ~α
2а 2а
ж + а
4.5. Прикладные задачи
85
Следующий пример несколько сложнее.
с/2)
[ dx _ Г d(x/2) /"cc
J smx J sin(x/2) cos(x/2) ~~ J si
-/
cos(a:/2) d{x/2)
cos(x/2) ~~ J sin(x/2) cos2 (ж/2)
dtg(a/2)
tg(x/2)
In
tg-
He следует забывать, что некоторые интегралы не выражаются
через элементарные функции5, например,
/sinx i dx
χ ' J 1пж"
4.5 Прикладные задачи
Длины, площади
• Площадь под синусоидой
/-
sin xdx = — cos ж
• cos π + cos 0 = 2
• Формула Стирлинга. Сумма Inn! = In 1 + · · · + Inn равна
сумме площадей заштрихованных прямоугольников,
♦j
У=\пх
Ш.
1п4-
1пЗ
1п2
1 2 3
° Тогда как дифференцирование не выводит из области элементарных
Функций.
86
Глава 4. Интеграл
и может быть приближённо заменена площадью под кривой In ж.
Поэтому
? Г (п\п
1пп!~ / \nxdx = х\пх — х\ ~ In ( — J ,
т. е. η! ~ (n/e)n. Прибавление площадей выступающих над
кривой In χ треугольников приводит к более точному результату
п\ ~ \Jn I — I .
• Длина дуги. Пусть Δ 5 обозначает длину дуги кривой
у = Д#) между точками А и В.
1
х+Ахо
Из прямоугольного треугольника ABC
As ~ у/А х2+ А у2 = \Л + (Δ у2/ Δ χ2) Αχ.
Поэтому ds = y/l + у*2 dx. Интегрирование дифференциала ds
от α до 6 даёт формулу вычисления длины дуги на любом
конечном участке.
Тестовый пример — длина cr окружности х2+у2 = R2. На верхней
полуокружности
4.5. Прикладные задачи
87
В результате
χ Γ dx χ
1 Η о о dx = R I - = R arcsin —
R2-x2 J VR2-x2 r
—R —R
4=11
= kR.
-R
Что касается площадей фигур, то они обычно строятся на
базе покрытия фигур мелкими квадратиками с последующим
предельным переходом, что приводит к двойным интегралам, см.
далее. Метод достаточно универсален, но в конкретных случаях
существуют более экономные приёмы, использующие специфику
задачи, например симметрию. Скажем, разбиение на
квадратики при вычислении площади круга на фоне известной
формулы длины окружности — выглядело бы насмешкой над здравым
смыслом. Действовать тут надо более рационально.
• Площадь круга радиуса R можно вычислять как сумму
площадей тонких колец радиуса г и толщины Лг.
П2
В свою очередь площадь кольца в первом приближении равна
2пг- Δ г. Это определяет дифференциал площади круга dS=2nrdr
Щи разбиении на кольцевые слои, что в итоге позволяет
вычислить площадь круга
R
SR= 2nrdr = nR2.
о
Пример рассматривается не в качестве изобретения
велосипеда, а как образец для подражания, демонстрирующий стереотип
использования симметрии задачи.
88 Глава 4. Интеграл
• Найдём площадь поверхности вращения6 при вращении кривой
у = Дх) вокруг оси х. Малый элемент длины дуги ds вращается
вокруг оси χ на расстоянии у = f(x)· Поэтому площадь, описываемая
элементом ds при полном обороте, равна
dS = 2nyds = 2nyy/\ + y,2dx,
что после интегрирования в тех или иных пределах даёт желаемый
«криволинейный» результат. Вращение полуокружности, например,
порождает сферу. Площадь вычисляется по найденному рецепту:
R R ι
S = 2π / ух/1 + у'2 dx = 2π ί \/R2-x2Jl + —
-R -R '
dx = 4тг#2.
χ2
Вычисление моментов инерции.
При вращении механического тела вокруг некоторой
фиксированной оси с переменной угловой скоростью ω(ϊ) = φ(ί) каждая частица
массы Δ mi, находящаяся от оси на расстоянии т^, движется со
скоростью Vi = τιω и ускорением
щ = Γ»ώ = τιφ.
Умножая закон движения каждой частицы АгПгЩ = Fi на Т{ и
суммируя по г, после перехода к пределу при Δ rrii —» 0 получим
где Μ — результирующий момент7 действующих сил, J — момент
инерции тела, представляющий собой интеграл
/■
г dm
ν
, в котором
суммирование производится по объёму тела.
Найдем моменты инерции некоторых стандартных тел.
6Мы пока делаем вид, что все просто, хотя здесь есть подводные камни,
см. «парадокс Шварца».
7Обратим внимание, что момент сил, также как угловая скорость, — это
вектор, см. «Векторный анализ».
4.5. Прикладные задачи
89
• Однородный стержень длины I. Ось вращения ОО'
проходит перпендикулярно стержню через его конец.
/
dm
*1
1
>kfЬ....^iiS, s::;|||ш^»1ш...."■ \ ■" : *' J
г ; dr \
о
Элемент длиной dr имеет массу dm = m^j-. Поэтому
ι ι 2
J = r2dm = / —r2dr = ——.
• Обруч при условии, что ось вращения проходит через центр и
лежит в плоскости обруча.
1
(4.6)
Из соображений симметрии ясно, что моменты инерции
относительно перпендикулярных осей ж, у равны, Jx = Jy, т. е.
Jx= x2dm, Jy= I y2dm,
откуда
2J = JX + Jy= l(£ + yl)dm = j R2dm = mR2,
90
Глава 4. Интеграл
что дает
mR2
• Однородный диск радиуса R. Ось проходит через центр
перпендикулярно плоскости диска.
Выделим из диска обруч радиуса г и ширины dr. Его масса равна
S = тгЛ2.
Поэтому
dS 2rdr
am = τη—τ- = m
R
,2 '
_ 2ra f
~ R2J
r6dr =
mR2
• Однородный диск радиуса R относительно диаметра
(рисунок тот лее, но теперь ось лежит в плоскости диска). Момент инерции
выделенного обруча (4.6) относительно диаметра равен dJ = dmr2/2.
Отсюда
R R
о о
• Образовавшуюся небольшую коллекцию моментов инерции
имеет смысл пополнить следующим результатом, который значительно
расширяет ассортимент.
4.5. Прикладные задачи
91
4.5.1 Теорема Штейнера. Если момент инерции Jo
относительно оси, проходящей через центр тяжести тела, известен, то
момент инерции J а относительно параллельной оси, отстоящей от
первой на расстоянии а, определяется формулой
J а = Jo + та ·
< Ситуацию иллюстрирует рисунок
fr
(4.7)
Подстановка в J = I г2 dm значения8
г = г0 + а => г2 = г2, + а2 + 2г0 · а, (4.8)
с учётом J rodm = О даёт нужный результат. ►
• С каким ускорением полый цилиндр радиуса R скатывается с
наклонной плоскости, рис. (4.9) ?
hv.C^
(4.9)
Уравнение моментов относительно мгновенной оси вращения в
данном случае имеет вид
J а -г- = mgR sin a.
at
Соотношения в (4.8) векторные, го · а — скалярное произведение.
92
Глава 4. Интеграл
В силу υ = ojR и J a = 2mR2, ускорение цилиндра получается равным
1 . ,
υ = -gsma.
2*
4.6 Несобственные интегралы
Бесконечный промежуток. Понятие определённого интегра-
ь
ла / f(x)dx естественным образом обобщается на случай
неограниченного промежутка [а, 6]. Пусть f(x) определена на [а, оо) и
интегрируема на любом отрезке [а, Л] С [а, оо), тогда:
4.6.1 Несобственный интеграл функции f(x) от а до оо
определяется как предел (конечный или бесконечный)
оо А
J f(x)dx= lim J f(x)dx (4.10)
α α
Если предел конечен, то говорят, что интеграл (1) сходится.
Если бесконечен, то — расходится.
Аналогично определяется интеграл
а а
ί f(x)dx = АКт^ [ f(x)dx. (4.11)
—оо А
Наконец, если существуют оба интеграла (4.10) и (4.11), то
оо α оо
/ f(x)dx = ί f(x)dx + f f(x)dx.
—оо —оо а
Примеры
• При ρ φ Ι
Л Л .А
' dx х1~р '
/dx _
Ϊρ " 1-р
1
1 (лх-р-1),
1-р
4.6. Несобственные интегралы
93
в случае ρ = 1
1
В результате при А —» оо имеем
оо
— = оо, если 0 < ρ ^ 1
оо
У ХР ~ Р-Г
если ρ > 1
оо
/
dx
1 + х
~2 = arctg χ
π
2'
• По закону гравитационного притяжения вес гпд тела массы га
равен9
^ = 7-^-, (4.12)
где Μ — масса Земли, Ro — радиус Земли.
Если потенциальную энергию бесконечно удалённого от Земли
тела считать нулевой, и(оо) = О, то, интегрируя работу FdR по удалению
тела в бесконечность, получаем
u(R) = J FdR=-7—
= -7-
Mm
~R~'
Вторая космическая скорость г>оо (позволяющая улететь в
бесконечность) определяется из условия
u(po) - u(Rq) = 7
Mm mv:
До
- =* v°° = \l2^·
9Хотя закон тяготения Ньютона декларирует (4.12) для точечных масс,
он справедлив и в случае притяжения однородных шаров.
94
Глава 4. Интеграл
.= ipdV.
• Работа газа при расширении от объёма Vo до V\ равна
Vo
Допустим, газ расширяется адиабатически (без теплообмена с
окружающей средой) до бесконечности. Какая работа будет произведена?
При адиабатическом расширении взаимосвязь давления с объёмом
определяется законом Пуассона
pVk = const, к = Cp/cv т. е. pVk = p0Vq
Следовательно,
/* „.I/* I» poVo
Vo
_ fPoVp*
'J Vk
vo *-l
• При вращении графика кривой у = — в диапазоне (1, оо) вокруг
оси ж образуется тело вращения (4.13), объём которого равен
оо
/πάχ
V
ι
что получается как результат предельного суммирования объёмов
колец радиуса у = — и толщины Δ χ (Δ\^ = тгу2 Δ ж).
ft-
(4.13)
Αχ
Интересно, что объём тела ограничен, но вертикальное плоское
сечение, проходящее через ось ж, имеет бесконечную площадь (!)
оо
f dx
оо.
4.6. Несобственные интегралы
95
факт лежит в основе парадокса маляра.
оо
• Часто думают, что для сходимости интеграла / f(x)dx от
положительной функции /(ж) требуется f(x) —» 0 при χ —> оо. Это, правда,
больше психологический вопрос, чем математический.
ί У
• · · α (4·14)
η
На самом деле, если f(x) равна нулю вне треугольных пиков (высотой
f(n) = 2 и шириной основания 1/п2), рис. (4.14), то10
с»
/ОО -
/(x)dx = ^— <oo. (4.15)
Понятно, что, не нарушая сходимости, высота пиков может расти до
бесконечности при подходящем убывании ширины.
Многие результаты о сходимости несобственных интегралов
перекликаются с признаками сходимости числовых рядов. Осо-
оо
6УЮ роль играна а6соЛЮтпо снящиеся иптеерали J /(*)<**,
ОО
сходящиеся вместе с / \f(x)\dx. Понятна в этом контексте роль
интегралов положительных функций.
• Если 0 ^ f(x) ^ g(x) при достаточно больших х, то сходимость
оо оо
G = I g(x)dx влечёт за собой сходимость F = I f(x)dx,
а расходимость F — расходимость G.
Юг
Запись (4.15) интегралов и сумм без указания нижних пределов
интегрирования/суммирования используется обычно для обозначения факта
сходимости или расходимости.
96
Глава 4. Интеграл
• Если существует конечный предел
lim Щ = Μ > О,
я—оо д(х)
то оба интеграла F и G сходятся или расходятся одновременно. (?)
Интегралы от неограниченных функций.
4.6.2 Пусть теперь функция f(x) определена на [а, 6),
интегрируема на любом отрезке [а, с] С [а, 6) и уходит в
бесконечность при χ —> Ь — О, т. е. при χ стремящемся к Ь слева. Тогда
ь
несобственный интеграл / f(x)dx определяется как предел
а
(конечный или бесконечный)
о с
/f(x)dx = lim / f(x)da
c^b-0 J
(4.16)
Как и прежде, если предел конечен, то говорят, что интеграл
(4.16) сходится. Если бесконечен, то — расходится.
В указанных условиях точку Ъ называют особой. Из
контекста ясно, что представляет собой несобственный интеграл, если
особой является точка а, обе точки а и 6, либо некоторая точка
внутри отрезка [a,ft].
Примеры.
• При ρ φ Ι
J x" l-p\c 1-/ h
в случае р = 1
||=ь^=
= — In с.
4.6. Несобственные интегралы
97
В результате при с —» 0 + О имеем
[dx _ 1
У xp ~ P-V
если О < ρ < 1
/dx
если ρ ^ 1
1
/lux
dx = χ In ж — ж
= -1.
У л/г
ах . π
= = arcsin 1 — arcsinO = —.
тг/2 тг/2
/" / dcosx
/ tg ж αχ = — / = — In cos x
J J cos χ
тг/2
Глубоко ли надо копать, изучая интегралы? Копать надо,
сколько положено — скажут в деканате. Там учебная программа.
Возникшая, разумеется, вследствие заботы о нуждах Галактики.
Но многое в той программе включено/выключено по причине
неуправляемого хаоса. Один промахнулся, другой поддержал, у
третьего не было времени отфильтровать и причесать.
Но где провести черту в идеальной ситуации? В
обстановке без нависающей дамокловым мечом системы образования,
решившей всё за нас. Где остановиться, например, в изучении
несобственных интегралов? Ограничиться сказанным выше или
обратиться к Фихтетолъцу? Понятно, универсального ответа быть
не может. Кому-то и сказанного многовато, а другой
чувствует «это моё!» — и отдаётся хронической тяге, забывая даже о
продолжении рода. Тем не менее в ситуации «общего
положения» есть всё-таки разумный ориентир. При изучении
предмета планку имеет смысл поднимать на такую высоту, начиная с
которой можно легко двигаться дальше. Или лучше сказать по-
другому. Необходимо осваивать критическую массу фактов,
способную далее расти самостоятельно в благоприятных условиях.
98
Глава 4. Интеграл
4.7 Дифференциальные уравнения
Дифференциальные описания. По мере изучения анализа и
физики человек начинает понимать, что дифференциальное
исчисление — это ДНК Вселенной. Возникает даже недоумение.
Откуда у дифференциальных описаний всепроникающая сила?
А секрет-то весьма прост. Процессы, разворачивающиеся во
времени, не укладываются в голове одномоментно,
фотографически. О движении кометы или остывании утюга человеку, как и
Создателю, легче судить «здесь и сейчас», а не как о траектории
x(t) целиком, на всей оси времени. Поэтому закон Ньютона11,
тх = F, равносильно πιύ = F, (4.17)
описывает динамический процесс x(t), или v(t), в каждый
данный момент, в каждой данной точке, озадачивая нас по поводу
траекторий в целом.
Φ
(4.18)
Разумеется, в (4.17) необходимо указать, как сила F зависит
от текущего положения точки x(t) и/или скорости x(t) = v(t). В
частности, «маятник на пружине» (4.18) движется в
соответствии с уравнением тх+кх = 0, где к — коэффициент упругости
пружины, т — масса грузика. Крутильные колебания
описывает такое же уравнение
Ιφ + 3φ = О,
/ - момент инерции диска, J φ крутящий момент стержня.
Равно как и другие физические законы.
4.7. Дифференциальные уравнения
99
В компанию (4.18) попадает и колебательный контур,
представляющий собой электрический маятник. Уравнение
колебаний снова имеет тот лее вид,
названия коэффициентов другие: q — электрический заряд, L —
индуктивность, С — емкость. Место «возвращающей силы»
занимает электрическое напряжение q/C.
При наличии вязкого трения уравнение тх + кх = О
усложняется, приобретая вид
тх + Рх + кх = 0. (4.19)
Далее обстоятельства и факторы растут как снежный ком.
Появляются задачи с несколькими взаимодействующими телами,
и там возникают уже системы дифференциальных уравнений.
Прикиньте хотя бы описание системы из двух грузиков:
Так что спрос на решение дифференциальных уравнений
широк и многообразен12, а соответствующая математическая
дисциплина изящна и глубока. Но первые шаги (самые первые)
имеет смысл сделать в рамках матанализа.
Простейшие уравнения. Решение дифференциального уравнения
х = № (4.20)
сводится к обыкновенному интегрированию,
*(*)= [ f(t)dt + c,
Уравнения электродинамики, диффузии, распространения волн и
эпидемий, гидро- и аэродинамики — дифференциальные.
100
Глава 4. Интеграл
где с — произвольная константа, которая выбирается обычно из
начального условия типа ж(0) = жо, в связи с чем часто сразу пишут
t
x(t)=x(0) + ί f(s)ds. (4.21)
Вообще говоря, называть (4.20) дифференциальным уравнением
даже язык не поворачивается. Дана производная, надо найти
первообразную. Что тут нового? Но глубокие воды начинаются с маленьких
ручейков. Так что лицезрея только (4.20), выводы делать рано.
Несколько сложнее уравнение, ж = /(ж), т. е. ^ = /(ж), которое
переписывают в виде
dx
fix)
и после интегрирования получают
= db,
lwi=ldt=t+c' (4·22)
что неявно определяет функцию ж(£). Всё благополучно разрешается,
если интеграл в (4.22) берётся, что случается, когда задача «хорошо
поставлена». Высшими силами, например.
В частности, для χ = Хх легко получаем:
/ — = / Xdt, откуда In ж = At + const, окончательно x(t) = cext.
Заметим, что уравнение
x = f(x,t) (4.23)
в общем случае уже не решается ни в элементарных функциях, ни в
квадратурах. То есть решение не удаётся записать даже с участием
интегралов. При этом «нерешаемыми»13 оказываются самые простые
с виду уравнения. Например, χ = χ +t2.
Но в этой «нерешаемости» нет ничего страшного, о чём будем говорить
уже в курсе дифференциальные уравнений.
4.7. Дифференциальные уравнения
101
Рассмотрим для иллюстрации несколько примеров.
• В момент t = 0 двигатель лодки выключается. Какое
расстояние лодка пройдет по инерции, если скорость в момент
выключения — vo, а сила сопротивления воды пропорциональна
скорости, F = -βν ?
Интегрирование уравнения движения,
dv
m-= -/*,,
даёт
Гάν_ = _β_ Гdt ^ hlv + c = _P_t
J ν m J m
Константа определяется из условия υ(0) = νο. В итоге
v(t) =v0e m .
Окончательно,
oo
с _ f й+- v°m
&max — / Vat — -r—
e m
vom
• Реактивное деиэюение. В неподвижной системе координат в
некоторый момент масса ракеты равна М, скорость — v. Через малый
промежуток времени Δ t скорость ракеты увеличится на Δ г>, масса
Уменьшится на Δ Μ, причём Δ Μ будет иметь некоторую скорость V.
< Закон сохранения количества движения
Μυ = (Μ- ΑΜ)(υ+ Δ υ)+ AM · V
после деления на Δ Μ и перехода к пределу при Δ Μ —» 0 приводит к
dv ЛГ dM
MdM + V9 = 0> или dv = ~V9~M>
гДе Vg = у — ν — скорость истечения газов.
102
Глава 4. Интеграл
Интегрирование последнего уравнения даёт
v= f dv = -Vg [ ^ ^ -Vg\nM + C
Константа С определяется, например, из условия Μ = Mo при ν = 0,
что даёт ν = Vg In ^^, откуда следует формула Циолковского
Μ
Mo
Μ
- Pv/Vg
• Веревка длины I перекинута через блок. В начале
один из свисающих концов длиннее другого на h.
Найти χ в момент t. Трение отсутствует.
< При плотности веревки (на единицу длины)
равной ρ вес длины χ будет рдх, а масса всей веревки
pi. Закон движения (Ньютона) принимает вид
Д.. .. 2<?
pl-x = рдх, т.е. χ = — χ.
Подстановка χ = ext приводит, с учётом начальных
условий ж(0) = /ι, χ(0) = 0, к результату
1(()=*рч.-^').
• Точильное колесо радиуса R, погруженное нижней половиной в воду,
вращается с угловой скоростью ω. На какую максимальную высоту
забрасываются брызги?
< Фиксируем на ободе колеса
некоторую точку А. Её координата у
меняется по закону
у = ΙΙήτιωί, откуда у = Βωcosωί.
Брызги, срывающиеся с колеса в
точке А, взлетают на высоту
h = y + - = Rsm<p+__
cos φ,
где φ = ωί.
4.7. Дифференциальные уравнения
103
В точке максимума производная h по ^ДЦОлжна быть равна нулю,
dh Д2о;20 .. п
— = R cos φ 2 cosfflsm φ = 0,
άφ 2g
откуда либо cos φ = 0, либо sin</? = g/Bw2. > -
Уравнения второго порядка. Какууже отмечалось, малые
колебания маятников единообразно опжьываются уравнением
х + ω2χ = 0. (4.24)
Общим решением (4.24) служит14
x(t) = ^sin(o;t+#.,
где А - амплитуда, δ - сдвиг по фазе, ω -фруговая частота. Задание
начальных условий ж(0), ж(0) определяет вйббор констант Л, δ.
При наличии вязкого трения уравненние (4.19), т. е.
χ + Ί± + ω2χ=% (4.25)
сопряжено с некоторыми проблемами. Оббойтись
тригонометрическими функциями при решении (4.25) ууже не удаётся. Трение
влечёт за собой энергетические потери, ι jj колебания должны
затухать. В качестве решения напрашиваемся eXt. Поскольку ди4>-
ференцирование экспоненты даёт подстановка е™
в (4.25) приводит к (λ2 + 7λ + ω2)βχί == 0. Поэтому, если λ —
корень уравнения
λ2 + 7λ + α;2^ (4.26)
то eXt удовлетворяет (4.25). Поэтому общее решение имеет вид
x(t) = aeXlt + с%№\
где Αι, А2 - корни (10).
В случае комплексных корней Αι, \ ввозникает впечатление,
что нашла коса на камень. Но тревога- оказывается ложной. Бо-
Jiec того, все разрешается наилучшим оббразом — эффективно
Легко проверяется дифференцирование**·
104
Глава 4. Интеграл
и просто. Если βλί у/довлетворяет уравнению (4.25) при \\^ = <х±
±г/3, — то уравненшю (4.25) удовлетворяет как действительная
часть функции
eai(cos/?i±zsin/?i),
так и мнимая. Поэттому все действительные решения уравнения
(4.25) исчерпываютгся семейством
x((t) = eat(ci cos/ft + с2 sin/ft).
Глава 5
Функции нескольких
переменных
Инстинкт не даёт ходу скороспелым умозаключениям.
Иначе голова окажется полна идеями,
которые цитрамоном не лечатся.
5.1 В двух словах о векторах
Если х, у — длина, ширина прямоугольника, то площадь ζ = ху
представляет собой функцию двух переменных. В общем не очень сложном
случае графиком ζ = /(ж, у) будет некая поверхность.
Изначально имеет смысл ориентироваться всё же на
произвольное число переменных. В случае функциональной зависимости
106
Глава 5. Функции нескольких переменных
2/ = /(#ι,..., Хп) комплект
X = {#1, · · · ч хп)
удобно считать вектором, мысленно откладывая х\,...,хп по
координатным осям, и коротко записывая f(x).
Поначалу думается, что векторные понятия используются для
краткости. Это лишь часть правды. Геометрия пространства
имеет «некоординатный» характер, и координатное насилие над ней
мешает видеть такие простые понятия, как расстояние,
направление, ортогональность, без которых «за деревьями леса не
видно». В полной мере эти факторы выявляются в «Линейной
алгебре», но и в данном контексте без них не обойтись.
Поэтому очень коротко напомним некоторые существенные для
дальнейшего пункты. Аналогия с обычным представлением о
векторах становится осмысленной при подходящем определении операций:
• умножение на скаляр1, Хх = {Хх\,..., Ажп},
• сложение, χ + у = {χλ + уь ..., хп + уп},
X -y = Xiyi + \-ХпУп
• скалярное произведение,
эквивалентные обозначения: χ · у = (ж, у) = ху = (ху).
С помощью скалярного произведения вводится евклидова норма
(длина вектора),
\\Х\\ = у/^Г^ = ^х2 + ...+Ж2? (5Л)·
а с помощью нормы расстояние \\х — у\\ между векторами ж, у.
Множество векторов, на которых введены перечисленные операции,
называют п-мерным евклидовым пространством и обозначают Rn.
1 Обратите внимание, что изложение ведётся с расчётом на некоторую
догадливость читателя. Разумеется, здесь λ — скаляр, и не составило бы
труда написать λ € R, что принято в математических текстах. Но учебник
со справочником «в одном флаконе» имеет свои минусы. Плюсы тоже есть,
однако, хотя «кашу маслом не испортишь», с некоторого момента каша с
маслом превращается в масло с кашей.
5.2. Предел и сходимость
107
Скалярное произведение в R3 обычно определяется как
произведение длин векторов на косинус угла между ними. Потом выясняется,
что (ж, у) = х\у\ Л l· жзуз даёт то же самое. В общем случае такое
соответствие имеет место благодаря неравенству Коши-Буняковского,
Θ
ху< \\х\\
(5.2)
которое даёт возможность ввести понятие косинуса
cos<p = aj.y/||aj|| - ||у||,
угла между векторами при любом п.
Неравенство (5.2) доказывается совсем просто. Раскрывая скобки
в очевидном неравенстве (х — Ау)2 ^ 0, имеем А2||у||2—2Ажу+||ж||2 ^ 0
для любого А, — что возможно лишь при неположительности
дискриминанта квадратного многочлена — а это и есть (5.2).
Существенную конструктивную роль в многомерном анализе
играет понятие ортогональности. Векторы ж, у определяют как
ортогональные, если их скалярное произведение равно нулю, χ · у = 0.
Ортогональность в свою очередь позволяет ввести в Шп понятие плоскости,
как множества элементов ж, ортогональных вектору о,
о · χ = 0, т. е. а\Х\ Η Ь апхп = 0.
5.2 Предел и сходимость
Векторный язык при изучении функций у = f(x\,... ,хп)
оказывается удобен и даже необходим с первых шагов.
5.2.1 Определение. Число А называется пределом функции
У = f(x) при χ стремящемся к а,
f(x) —» А при χ —» а, (5.3)
если по любому ε > 0 можно указать такое δ, что2
\f(x) - А\ < ε, как только 0 < ||ж — а\\ < δ. (5.4)
Обратите внимание в (5.4) на существенность условия 0 < \\х — а\\.
108
Глава 5. Функции нескольких переменных
Вся разница с определением предела функции одной переменной
заключается в замене меры близости \х — а| на ||ж — о||.В результате η
условий \xi — (ц\ —» 0 заменяются одним ||ж — а\\ —» 0. Но вода камень
точит. Капля за каплей и пределы выруливают на новую платформу,
где мозаика подробностей перестаёт ретушировать суть.
• Определение. Число А называется пределом функции у =
= f(x) при χ —> оо, если по любому ε > О можно указать
такое Μ > О, что \f(x) — A\ < ε, как только \\х\\ > М. Вместо
А = lim f(x) используют также запись
Л = „ 1Jm f№'
||aj||-K»
Заметим, что (ε, 5)-определение предела (5.3), как и в
одномерном случае, эквивалентно следующей дефиниции.
• Число А есть предел функции f(x) при χ —> а, если
f(xn) -► А
на любой последовательности хп —> а (хп φ α)3.
Здесь, кстати, можно многое повторить в новой обстановке,
воспроизводя многоголосие учения о пределах функции одной
переменной4. Некоторые учебники так и делают, решая
заодно государственные задачи типа «чем-то занять население» или
«отвлечь от психологически опасных попыток поиска смысла
жизни». На самом деле важно понять, что в основе
всевозможных определений пределов в разных дисциплинах лежит одна
и та же схема. И когда она усваивается, человеку легче
самому сконструировать нужное определение, чем выискивать его в
тексте. Поэтому здесь можно рекомендовать вернуться к
пределам функции одной переменной и посмотреть, как там
трансформировались бы понятия при смене формата у = f(x) на
3Опять-таки обратите внимание на принципиальное условие хп φ а.
4Начиная приблизительно из того же положения: векторные
последовательности вместо числовых, последовательности Коши, бесконечно малые
величины.
5.3. Непрерывность 109
у = /(si,...,an).
t л, I
5.3 Непрерывность
При переходе к функциям многих переменных не меняется
также и определение непрерывности. Не меняется по сути.
Изменяется лишь мера близости. Поэтому звучит та же мелодия немного
в другой аранжировке.
5.3.1 Функция f(x) непрерывна в точке5 χ = а, если
f(x) —> f(a) при χ —► α,
т. е. если по любому ε > 0 можно указать такое δ, что
\f(x) — f(o>)\ < ε, как только \\х — а\\ < δ.
Аналогия с одномерным случаем сохраняется тотально. Ту
же роль играют последовательности Коти. Если установлено
существование предела f(x) —> А при χ —► α, то f(xk) —> Л на
любой последовательности хк —► а, и обратно. Далее:
• Из любой ограниченной последовательности хк можно извлечь
сходящуюся подпоследовательность (лемма Больцано - Вейерштрасса).
• Непрерывная на ограниченном замкнутом множестве функция у = f(x)
ограничена снизу и сверху, и достигает своих минимального и
максимального значений (теорема Вейерштрасса).
• Функция /(ж), непрерывная на ограниченном замкнутом множестве X,
автоматически равномерно непрерывна6 на X (теорема Кантора).
5 И непрерывна на X С Мп, если непрерывна в любой точке X.
6Функция f(x) равномерно непрерывна на X, если по любому ε > 0
можно указать такое δ, что
\f(x)-f(y)\<e, если \\χ-ν\\<δ
Для любых ж, у G X.
110
Глава 5. Функции нескольких переменных
5.4 Частные производные
Если у /(#1,..., хп) зафиксировать все переменные кроме Xi,
получится функция одной переменной х^ её обыкновенную
производную называют частной производной f(x) по х^ и обозначают
-β-, или f'Xi. Избежать недопонимания проще всего, рассмотрев
несколько примеров.
о dz о dz
z = xy => ai = ?/' э^ = 2ху;
RT f R f RT
Р=^Г =» Рт=у> Pv= v
2 '
x = sin(o;t + φ) => x't = ω cos(u;£ + φ), χφ = cos(u;£ + φ).
• Пусть ζ = f(u,v). Тогда производная функции одной переменной
z(t) = f(u(t),v(t)) равна
ch _ dl , df ,
dt~ дчщ+ лЛ'
что устанавливается переходом к пределу в равенстве
Δζ_ f(u+ A u,v+ Αν) — f(u,v+ Α υ) Δ u f(u,v+ Αν) — f(u,v) Α υ
At Au At Αν At'
В общем случае ζ = /(жь ..., жп), χ» = x»(yi,..., ym),
dz γ^ dz dxi
ду0 ~ ^ dxi dy0 '
Конечно, определить частную производную — дело нехитрое.
Вопрос в другом. Какова роль частных производных в анализе
функций многих переменных?
5.5 Приращения и дифференциалы
Приращение функции. Роль частных производных
выявляется, когда речь заходит о приращении функции
А.
Δ / = f{x+ Δ Χ) - /(χ),
5.5. Приращения и дифференциалы
111
что, с точки зрения наглядности, удобнее рассмотреть на
примере двух переменных, ζ = f(x,y). Перепишем для этого случая
приращение
Δ ζ = /(ж+ Δ ж, у+ Δ у) - /(ж, у).
в виде
f(x+ Δ ж,у+ Δ у) - f(x,y+ Δ у) , f(x,y+Ay)-f(x,y)
Az = Δ ж Η Δ у,
Αχ Ay
откуда следует
Az = f'x(x,y+ Ay) A x + o(A χ) + f'y(x,y) Ay + o(Ay),
и в итоге
Аг = ?1Ш Δ х + УШ Δ у + 0(|,(я>у)||)
дж
#2/
но только в предположении fx(x, у+ Δ у) —» /-£(#, у) при Δ у —> О,
что обеспечивается, например, непрерывностью производной -J-
в окрестности (х,у). Проделанное указывает на справедливость
следующего результата.
5.5.1 Теорема. Если функция и = f(x) имеет непрерывные в
окрестности точки χ = {х\,... ,хп} частные производные, то
справедлива формула приращения
^z = ^2fXi(x)AXi + o(\\Ax\\). (5.5)
<=1
Непрерывность частных производных здесь не обязательна7.
Однако просто наличия производных, которой хватает8 в одномерном
случае, тут недостаточно.
Но вполне приемлема, ибо на практике чаще всего имеет место.
Для справедливости формулы приращения.
112
Глава 5. Функции нескольких переменных
Как и в скалярном случае, линейную часть (5.5) записывают
в форме
dz = Y^fXl{x)dXi ^|§g (5.6)
г=1
и называют полным, дифференциалом, функции f(x). При
этом f'x.(x)dxi называют частными дифференциалами.
5.6 Производные и дифференциалы
высших порядков
Снова дифференцируя частные производные, имеем частные
производные более высокого порядка. Например, в случае ζ = ху2
: 2х.
d2z
дх2
югично
- д dz - о
дхдх '
d2z _
дхду
d2z
ду2
a dz _
дхду
[ём в данном случае оказывается
а2^
_ d2z
_ д dz
дуду
2у,
дхду дудх
(5.7)
Совпадение смешанных производных (5.7) — явление характерное,
хотя и необязательное. Равенство (5.7) по своей природе является
равенством повторных пределов. Справедлив следующий общий
результат.
• Если функция ζ = /(ж ι,... ,жп) имеет непрерывные производные до
т-го порядка включительно, то любая смешанная производная
dmz
дх^ ...дх™~'
не зависит от порядка дифференцирования.
Формальное обоснование этого результата может оказаться
громоздким и неуклюжим. Здесь проще всего ограничиться
доказательством (5.7) в качестве упражнения, из чего обычно становится ясна
справедливость общего утверждения.
5.7. Градиент
113
Время от времени полезно задумываться о сути используемых и
наблюдаемых доказательств. Строго говоря, они являются лишь
эмоциональной аргументацией. Степень подробности и траектория
рассуждения всегда зависит от того, с чем «противная сторона»
готова согласиться. Доказывая, мы оперируем смысловыми категориями.
При этом логические прорехи очень трудно контролировать. «Имея
семейство множеств, в каждом множестве можно выбрать по
элементу» — не самоочевидный ли тезис? Вышло — нет9. Так что до
синтаксического уровня аргументации человеку никогда не добраться. Хотя
некоторые авторы пытаются увлечь население в эту «чёрную дыру».
Дифференциалы высших порядков идут «по тому лее следу».
Дифференциал от дифференциала даёт второй дифференциал:
т. е.
г г гфз J
Продолжая процесс, получаем
d™f = у^ u J dx?1 ... dx™n, (5.8)
где суммирование ведется по всем m\-\ h mn = га.
Что касается разложения Тейлора
* 1 ят f
^/=Е^?ЕЭа;Г,..аСпАхГ-А^+о(||ЛхГ),
тп=1 σ L n
то оно естественным образом перекликается с (5.8), и может быть
получено 'разложением Тейлора в нуле функции одной переменной
φ(τ) = f(x + т Δ ν), где Δχ= г Αν.
5.7 Градиент
В многомерном анализе важную роль играют понятия градиента
и производной по направлению.
9См. аксиому выбора.
114
Глава 5. Функции нескольких переменных
Производная функции ζ = f(x, у) по направлению
единичного вектора s = {sx,sy} определяется как обычная производная
по Θ:
J Г\ £ Г\ £
4 = 4 = ^0/О* + θ*χ, У + esy) = fasx + -Q-Sy (5·9)
Правую часть (5.9) естественно интерпретировать как скалярное
произведение вектора s = {sx,sy} на вектор
->·{№}·
который называют градиентом функции /. Для градиента
используют также обозначение V/ (читается «набла эф»). Таким
образом
4 = 8- V/. (5.10)
В силу
s · grad/ = ||grad/||||e|| · cosy?
максимум в (5.10) достигается при φ = 0, т. е. когда вектор
s совпадает по направлению с градиентом. При этом значение
максимума равно модулю градиента ||V/||, поскольку ||s|| = 1.
Следовательно, градиент V/ — это вектор скорости
максимального роста функции /.
Производная (5.10) обращается в нуль, когда s и ||V/||
ортогональны друг другу, что имеет место, если s направлен вдоль
касательной к линии постоянного уровня10 /(ж, у). Стало быть,
в каждой точке поверхности f(x,y) = const градиент V/ перпен-
10 Или лежит в касательной плоскости к поверхности постоянного уровня
/(ж), если размерность аргумента ^ 3.
5.7. Градиент 115
дикулярен этой поверхности, направлен по нормали.
У
ч
(5.11)
\
graaf(x)
Таким образом, касательная плоскость в точке {xq, j/o} к линии
постоянного уровня функции ζ = f(x,y) описывается
уравнением11
^(х-хо) + ^(у-уо) = 0, (5.12)
а касательная плоскость к поверхности ζ = f(x,y) в точке
{^(b#(h2/o} определяется уравнением
ζ ~ ζο = ^(х - хо) + ^(у - г/о). (5.13)
Уравнение (5.13) является непосредственным аналогом (5.12),
поскольку касательная плоскость к графику (5.13) — это
касательная плоскость к поверхности постоянного уровня функции
трёх переменных и = ζ — f(x,y), градиент которой
/ι _£У _Ё1\
I ' dx' dyj
Двумерный случай (аргумент лежит в плоскости), конечно, в силу
своей наглядности должен служить первоисточником при изучении
Многомерного случая. Визуальное представление линий постоянного
Уровня и перпендикулярных им линий, вдоль которых направлены
гРадиенты, помогает лучше усвоить геометрию внутреннего устрой-
На рис. (5.11) это пунктирная прямая.
116 Глава 5. Функции нескольких переменных
ства функций ζ = f(x, у), а там и до ζ = /(ж ι,..., χη) недалеко.
При этом благотворно для воображения поразмышлять над
траекториями движения по градиенту
х = V/(«), (5.14)
где
V/(*)=gra./(*) = {|£,..,g-}.
Один из источников интереса к системам типа (5.14) — численные
процедуры поиска локальных максимумов функции /(ж).
Отталкиваясь от двумерного случая, легко записать
касательные плоскости в общем случае ζ = f(x), х Ε W1. Уравнение
касательной плоскости в Rn к поверхности постоянного уровня
в точке Xq\
Vf{x) · (χ - хо) = 0.
Уравнение касательной плоскости в Rn+1 к поверхности
графика ζ = f(x) в точке {ζο,χο}, ζ0 = f(xo)'·
ζ - ζο = V/(cc) · (χ - χ0).
Формула конечного приращения в векторных обозначениях
приобретает вид
Δζ = ν/(α)· Δχ + ο(\\ Ах\\).
Применение теоремы Лагранэюа к функции скалярного
аргумента
<р(т) = /(х + т(у-х))
5.8. О роли повторных пределов
117
даёт
φ(1) - φ(0) = φ'(θ) = £ ^(Уг ~ Xi) = V/(w) · (у - х),
где w = х + 9(у — х) при некотором θ € (0,1). Поэтому
/(у) - /(*) = V/(w) (у-х)
что называют теоремой о среднем.
5.8 О роли повторных пределов
Равенство повторных пределов. Повышенное внимание к
повторным пределам типа
lim lim/(ж, у)
χ—>α у—>Ь
и сосредоточенность на изучении равенств
lim lim f(x, у) = lim lim f(x, у) лМ\Г (5·15)
x—*ay—>b у—>Ьх—*сь j^aL
выглядят весьма странно, ибо думается, что главным
действующим лицом в подобном контексте должен быть предел
Ϊ1
lim f(x,y), (5.16)
(z>2/)-4<W
не зависящий от пути стремления (х, у) —> (а, 6). Но
существование (5.16) из (5.15) даже не следует, да и обратная импликация
не работает, см. далее примеры.
Поэтому (5.15) и (5.16) — явления независимые, хотя и
соприкасающиеся. При этом (5.15) имеет важное самостоятельное
значение, едва ли не большее чем (5.16). Дело в том, что в
подноготной основных операций матанализа (дифференцирования,
интегрирования, суммирования рядов) лежат предельные
переходы. И вопросы изменения порядка этих операций упираются,
118
Глава 5. Функции нескольких переменных
по существу, в равенство повторных пределов. Можно ли менять
ювания12,
d2f d2f
12
порядок дифференцирования
(?)
дхду дудх'
вносить дифференцирование под интеграл,
ί//(Ι,,„./^, (?)
Ω Ω
менять местами интегрирование с переходом к пределу,
lim / f(x,y)dx = / lim f(x,y)dx, (^J
Ω Ω
— это всё разные лица равенства (5.15).
Поэтому на первом этапе изучения проблематики разумно
сконцентрироваться на ситуациях, где всё на виду. И там
особое внимание уделить осмотру «берегов», тех территорий, где
желанные и ожидаемые свойства нарушаются.
Примеры
• Вот простейшая ситуация
ax + cy a .. ах + су с
lim lim — = -, lim lim — = -,
ж_о у->о bx + dy о y->o z->o bx + dy d
в которой повторные пределы могут не совпадать.
Функция
х2-у2
2 2ху, если х,у 7^0;
Н*,У)=\ Х +2/
0, если χ = у = 0,
имеет в нуле частные производные /^(0,0) = 1, /ух(0,0) = —1, что
противоречит расхожему представлению о равенстве смешанных производных
независимо от порядка дифференцирования. Но в данном случае «не
хватает» непрерывности fxy и }ух в окрестности нуля.
5.8. О роли повторных пределов
119
У функции
f(x, у) =xsin -, *ЩМ (5-17)
Φ
доопределённой в нуле по непрерывности, /(0,0; = и, существует
двойной предел при (х,у) —* (0,0), но только один из повторных.
• А у функции
г _ ху
f(x,y) = {
2 2, если ж,у^0;
Х +У (5.18)
0, если χ = у = 0
в нуле существуют и равны оба повторных предела, но двойного —
вообще нет13.
Теоремное обеспечение
Повторные пределы ускользают из-под контроля при
наличии у функции тех или иных особенностей. В благоприятных
ситуациях предосторожности чаще всего излишни.
5.8.1 Теорема. Если функция /(ж, у) при χ —> α, у —> Ъ имеет
двойной предел А (конечный или бесконечный), и при любом у из
некоторой окрестности точки Ь существует предел lim /(ж, у),
то существует и
lim lim /(ж, у) = А.
у—>Ьж—>а
3Обратим внимание, функция (5.18) имеет разрыв в нуле, причём
довольно экзотический:
• Предела у f(x) при (х,у) —> 0 нет, но при стремлении к нулю вдоль
к
любой прямой χ = ку значение / имеет предел -j.
• Несмотря на разрыв, при любом фиксированном у функция
φ{χ) = f(x, const) — непрерывна, и имеет частные производные всюду,
в том числе в нуле, т. е. в точке разрыва!
120
Глава 5. Функции нескольких переменных
Другой повторный предел, как следует из примера (5.17),
может не существовать. Если однако, в дополнение к условиям
теоремы, при любом χ из некоторой окрестности точки α существует
предел lim /(ж, у), то оба повторных предела существуют и рав-
у—>Ъ
ны двойному.
< Доказательство теоремы несложно. По любому ε > 0 можно
указать такое δ > 0, что
\x-a\<6,\y-b\<6 =» \f(x,y)-A\<e =» \д(у) - А\ < ε,
где д(у) = lim /(ж, у). Поэтому \\тд(у) = А. ►
χ—>а у—>Ь
Вот ещё один удобный на практике результат.
5.8.2 Лемма. Пусть при любом χ из некоторой окрестности
точки а существует предел lim f(x,y) = φ(χ), а при каждом у из неко-
торой окрестности Ь существует предел lim /(ж, у) = ф(у). Если при
χ—>а
этом /(ж, у) стремится к φ(χ) равномерно по ху то оба повторных
предела существуют и равны друг другу. ( ^# J
^ IW II
О равномерной сходимости
На практике часто рассматривается последовательность
функций /п(ж), поточечно сходящаяся к «некой» функции /(ж), т. е.
/п(#) —* /(#) при каждом фиксированном х. В качестве fn(x)
оо
обычно фигурируют частичные суммы какого-либо ряда Σ Ψη(χ)·
При этом возникают стандартные вопросы наследования
функцией f(x) тех или иных свойств функций fn(x). Например,
непрерывна ли f(x) в точке хо, если все fn(x) непрерывны вжо? Легко
видеть, что положительный ответ эквивалентен равенству
к
lim lim fn(x) = lim lim fn(x).
x—>xq n—>oo n—xx) аз—юзо
5.8. О роли повторных пределов
121
Проблема существования двойного предела даже не возникает.
Ключом к решению в такого рода задачах служит часто та
или иная разновидность равномерной сходимости.
Последовательность функций /п(ж), поточечно сходящихся к f(x) для
любого х Ε X, называют равномерно сходящейся, если по
любому ε > О можно указать такое Ν, что14
\fn(x) ~ f(x)\ <ε, при η> Ν, хе X.
5.8.3 Теорема. Если последовательность непрерывных
функций fn(x) сходится к f(x) равномерно на замкнутом
ограниченном множестве X, то f(x) непрерывна на X.
Μ Равномерная сходимость fn(x) к f(x) означает
/(«) =fn(x) + <Pn(x),
где φη(χ) равномерно сходится к нулю. Поэтому
1/(«) - f(v)\ < !/»(*) - /»(ν)Ι + \ψη(χ)\ + \φη(ν)\.
Далее по заданному ε > О выберем такое п, что (в силу равномерного
стремления φη(χ) к нулю)
\φη{ζ)\<εβ
для любого ζ Ε X. Затем для выбранного η укажем такое δ (в силу
непрерывности функций /п(ж)), что из \х — у\ < δ будет следовать
\fn(x) - fn(y)\ < ε/З, и в итоге \f(x) - f(y)\ < ε. ►
С феноменом равномерной сходимости целесообразно
освоиться на примерах и контрпримерах, дабы «чувствовать берега»
и придерживаться магистральных путей.
• Стандартной иллюстрацией на тему «как плоха поточечная
сходимость в отсутствие равномерной» обычно служит
последовательность fn(x) = хп, которая при любом фиксированном χ Ε (0,1)
сходится к нулю, при χ = 1 — к единице. Иными словами, хп на [0,1]
поточечно сходится к разрывной функции.
14 Идея равномерной сходимости может принимать разные облики.
Поэтому валено ошущать саму идею, чтобы не запоминать слишком много
определений. Вместо дискретного параметра п, например, может фигурировать —
непрерывный.
122
Глава 5. Функции нескольких переменных
• Функция
/(
{ (\ х\
2 о , если 0 ^ χ ^ у;
О, если у ^ ж ^ 1
при у —» О сходится к нулю не равномерно, поэтому следствия типа
1 1
lim / f(x,y)dx = 1, / lim f(x,y)dx = О
y^OJ J y^O
о о
не вызывают удивления.
• Но равномерная сходимость сама по себе не гарантирует
благополучия, особенно если находится в глубине многослойной задачи.
Пусть, например, fn(x) = — при χ G [0,η], и fn(x) = 0 при χ > п.
Очевидно, последовательность функций {fn(x)} равномерно сходится
к нулю на [0,оо), но
lim / fn(x)dx = 1.
5.9 Интегралы, зависящие от параметра
В прикладных задачах приходится рассматривать функции,
возникающие в результате интегрирования. Например,
Ь
Ф(у) = J f(x,y)dx. (5.19)
α
Поскольку интегрирование обладает улучшающими
свойствами (из интегрируемой функции делает непрерывную, из
непрерывной — дифференцируемую), то многие манипуляции с Φ (у)
можно менять местами с интегрированием при довольно
свободных предположениях относительно функции f(x,y).
Вот простые и легко доказываемые факты.
5.9.1 Если
f(x,y)-*v(x) при у-*уо
5.9. Интегралы, зависящие от параметра
123
равномерно15 по х, то
о ь
lim / f(x,y)dx= / lim f(x,y)dx. (gp)
2/->2/o J J 2/->2/o \ * /
5.9.2 Пусть функция f(x,y) и частная производная df(x,y)/dy
непрерывны в прямоугольнике [а, 6] х [с, d]. Тогда
ь
-jf(x,y)dx = j—^-dx
при любом у G [с, d], что в случае зависимости верхнего предела
интегрирования от у дополняется равенством
<р(у) <р(у)
^ J f(x,y)dx= J Щ^ах + ^р'Ш&^у),
а а
где имеется в виду φ($) Ε [α, 6]. (?)
5.9.3 Если функция /(ж, у) непрерывна в прямоугольнике [а, Ь] χ
[c,d], то
d Ь Ь d
dy f{x, y)dx = J dx J /(ж, y)dy. \^fj
Выдвигаемые требования к /'(ж, у) не выглядят слишком
жёсткими, но и они могут быть ослаблены. Выходит, что
интегрирование для стандартных операций анализа не воздвигает
больших преград. Предельные переходы могут свободно проникать
«сквозь интеграл» снаружи внутрь, и наоборот. Проблема
усложняется при переходе к несобственным интегралам, где
приходится опираться на дополнительное условие равномерной сходимо-
сти интегралов.
15 Равномерная сходимость по ж в данном случае означает: по любому ε > О
^ожно указать такое £, что |/(ж,у) — <р(х)\ < ε ПРИ любом ж, как только
\v-yo\<S.
124
Глава 5. Функции нескольких переменных
В случае
ОО А
J f(x, y)dx = jim^ J f(x, y)dx (5.20)
это означает равномерную сходимость (5.20) по у, т. е. по
любому ε > 0 можно указать такое В, что при А > В выполняется
неравенство
/ f(x,y)dx- / f(x,y)da
< ε
для любого у из рассматриваемой области У.
Для несобственных интегралов на конечном промежутке
ключевым также оказывается условие равномерной сходимости
интегралов, определяемое по аналогии с предыдущим. Выполнение
соответствующих условий приходится проверять отдельно либо
«в лоб», либо опираясь на различные достаточные признаки. В
более сложных случаях используется так называемая теорема
Арцела, но это уже инструмент из «другой оперы».
Глава 6
Отображения, или
операторы
Сложное — и дурак придумает.
Михаил Кошкин1
6.1 Аргументы и функции как векторы
Чаще всего на практике приходится иметь дело с моделями, в
которых и «аргументом», и «функцией» служат наборы числовых
переменных. β ^ ^
Линейная модель производства. Пусть Xj обозначает
интенсивность j-ro технологического процесса, а^ — количество г-го
продукта, производимого (aij > 0) или потребляемого (а^ < 0) при
единичной интенсивности j-ro технологического процесса. Тогда суммарное
производство (потребление) г-го продукта определяется суммой
η
νΐ = Σανχΐ> г = 1,...,га. (6.1)
i=i
Меэюотраслевой баланс. Имеется η отраслей, г-я отрасль
выпускает г-й продукт в количестве Х{. На выпуск единицы г-ro продукта
β системе затрачивается а^ ^ 0 единиц j-ro продукта. Понятно, что
при выпуске набора
X = {Ж1,...,ХП}
Главный конструктор легендарного танка Т-34.
126
Глава 6. Отображения, или операторы
чистый выпуск г-го продукта равен у ι = χι — £). aijXj. Вопрос о
продуктивности модели, таким образом, сводится к положительной
разрешимости системы уравнений
к
^ - 22 ai3x3 =Уг> г = 1,..., п. (6.2)
В подобного рода ситуациях совокупности функций
У\ = /i(si,...,an)>
(6-3)
Уп = /nV^l? · · · > %n)
вектору χ = {х\,..., χη} сопоставляют вектор у = {у ι,..., yn}.
Стенографический трюк, состоящий в замене (6.3) записью
У = /(*), (6.4)
переводит мысль на следующий этаж виртуальных
манипуляций. Поначалу думается: ну, не может такого быть. Какой толк
от перехода (6.3) —> (6.4) кроме экономии чернил? Тем не менее
(6.4) рождает новую категорию мышления. «Бухгалтерская
ведомость» (6.3) превращается в компактный атом /, и появляется
возможность говорить, что / отображает элемент χ в у, в связи с
чем / называют отображением, или оператором2. Элементы χ
и у считают при этом векторами, или точками3 из Rn. Таким
образом, / переводит точки в точки. Пустячок, казалось бы, но он
ведёт к революционным метаморфозам в головах пользователей.
Шапки вверх бросать торопиться, конечно, не надо. Процесс
медленный, постепенный. Ассортимент выгод пополняется шаг за шагом.
В какой-то момент, скажем, обращает на себя внимание композиция
fg, т. е. f(g(x))9
χ -> у -» ζ,
2Или преобразованием. Не возбраняется и прежнее название «функция».
3Несмотря на то, что переменные ж, у могут иметь разный физический
смысл, их можно считать векторами одного пространства в рамках
фиксированной системы измерений.
g.2. Линейные отображения 127
по попробуйте расписать ζ = f(g(x)) в духе (6.3). И беда тут не в том,
что писанины много, а в том, что мысли расползаются.
Что касается пределов и непрерывности таких вектпорнознач-
ных функций /, то в определениях модули меняются на нормы —
вот и вся разница. Два примера:
6.1.1 Определение. Вектор b называется пределом отображения
f : Ш.п —» Мп при χ стремящемся к а (т. е. f(x) —» А при χ —» а),
если по любому ε > 0 можно указать такое δ, что
||/(ж) — 6|| < ε, если \\х — а\\ < δ.
6.1.2 Определение. Оператор f : Rn —» Rn называют непрерывным
в точке а, если по любому ε > 0 можно указать такое δ, что
\\f(x) - f(a)\\ <ε, если \\х - а\\ < δ,
и непрерывным на X С Мп, если он непрерывен в любой точке X.
6.2 Линейные отображения
Простейшим примером векторнозначной функции (6.4) является
линейный оператор. Его покоординатная запись выглядит так:
ί У\ = diixi + αΐ2#2 Η Ь а\пхп,
I 2/2 = ^21^1 + α22#2 Η 1" α2ηΧη,
[ Уп = dnixi + αη2Χ2 Η Ь аппжп
Каждая строчка в (6.5) — это скалярная линейная функция
ζ = а · χ = а\Х\ + · · · + ο>ηχη,
которая принимает постоянные значения а · χ = β на
гиперплоскостях4 параллельных плоскости а · χ = 0. Действительно, из
α и = /3, а · ν = β следует α · (ге — ν) = 0, т. е. вектор и — ν
параллелен (лежит в) плоскости а · χ = 0.
4Множества а · χ = β называют гиперплоскостями, чтобы подчеркнуть,
что они не являются линейными пространствами, которым положено вместе
с векторами содержать их сумму. Другими словами, гиперплоскость — это
плоскость, не проходящая через начало координат.
(6.5)
128
Глава 6. Отображения, или операторы
Таблицу коэффициентов А = [а^] в (6.5),
ЧЯг
ап
^21
Q>nl
0>12 ··
^22 ··
«п2 ·
• 0>1п
• a>2n
0"ПП
называют матрицей и коротко пишут у = Ах, определяя тем
самым умножение матрицы на вектор. При этом в у = Ах под ж, у
подразумеваются вектор-столбцы. Первый индекс у а^
обозначает номер строки, второй — столбца. Совокупность элементов
Лц> · · · > ann называют главной диагональю матрицы.
Теория операторов (6.5), или матриц, изучается в «Линейной
алгебре», каковая является выдающейся математической
дисциплиной, сочетающей в себе глубину с изяществом и лёгкостью.
Но об этом речь в отдельном курсе. В данном контексте
остановимся лишь на некоторых понятиях, необходимых по ходу дела.
Умножение матрицы на скаляр и сложение матриц:
j A = [jaij], А + В = [a,ij + bij].
При этом, очевидно,
Α(λχ + μy) = ХАх + μAy, (6.6)
и это показывает, что на матрицу молено смотреть как на
линейный оператор5. Подобный взгляд автоматически порождает правило
умножения матриц. Допустим, вектор χ под действием оператора В
переходит в ζ = Вх, а вектор ζ под действием оператора А
переходит в у = Α ζ. Результирующее преобразование χ в у определяется
матрицей С = АВ с элементами с^, формула вычисления которых
определяется обыкновенным приведением подобных,
у*= Σaik Σ Ьк*х*= Σ Σ aikbkjXj = Σ ci3xo·
к j jк J
Следовательно, С = АВ есть матрица с элементами
Cij
= £aikbkj. ^
(6.7)
5 (6.6) — как раз характеристическое свойство линейного оператора.
6.2. Линейные отображения
129
Произведение матриц в общем случае не коммутативно6, АВ φ ΒΑ, но
ассоциативно, А(ВС) = (АВ)С, и дистрибутивно, А(В + С) = АВ + АС, что
легко проверяется.
@
А@
Ах
На векторы и фигуры линейное преобразование Ах действует как
поворот плюс растяжение. В случае Ах + b добавляется ещё перенос
is
Матрица Ат с элементами ajj = α,β называется
транспонированной к А. Матрицу называют симметрической, если А = АТ, и косо-
симметрической, если А = —АТ. Для транспонированной матрицы
широко используется также обозначение А!.
При транспонировании произведения:
(АВ)Т = ВТАТ,
что элементарно устанавливается:
■4 (АВ)Т =
(6.8)
ι- η
L *
τ
=
г η
/] cijkbki
. k
=
r -ι
l^bTkOkjl
- к J
= BTAT. ►
В данном контексте имеет смысл кое-что уточнить насчёт
устройства Шп, в котором действуют линейные преобразования. Говорят, что
множество векторов {ж1,..., хк} линейно зависимо, если существуют
такие коэффициенты λι,..., λ*, не все равные нулю, что
Хгх1 + · · · + ХкХк = 0.
В случае | АВ = В А | говорят, что матрицы А та. В коммутируют.
130
Глава 6. Отображения, или операторы
В противном случае говорят о линейной независимости {х ,..., χ }.
Коллинеарные векторы (лежащие на одной прямой), а также
компланарные векторы (лежащие в одной плоскости) — линейно зависимы.
Линейно независимое множество {е1,..., еп} называют базисом,
если любой вектор χ можно представить в виде линейной комбинации
х = Х1е1 +···+ληβη.
Стандартный базис Шп:
Γι"
0
[о
, е2 =
"0"
1
0_
Число η векторов, составляющих базис (и не зависящее от выбора
последнего), определяет размерность пространства.
6.3 Обратимые преобразования
Изучению отображений способствуют некоторые удобные
понятия. А также неудобные, но общепринятые.
• В ситуации у = f(x) элемент у считается образом х, а
совокупность элементов х, образом которых служит у, — прообразом7 у.
• О функции f : X —* Y, отображающей элементы χ Ε X в
элементы у Ε Υ, в случае f(X) = Υ говорят как о сюръективном
отображении, или отображении «на»8.
• Если образы различных элементов χ χ φ χ2 не совпадают, /
называют инъективным отображением, или инъекцией. В этом
случае уравнение у = f(x) имеет (если имеет) единственное решение
χ = f~l(y), где /-1 называют обратным отображением, которое
может быть определено не на всем Y. Но если / ещё и сюръекция, то
f-i-.Y-tX.
7Либо полным прообразом, оставляя за термином «прообраз» любой
элемент х, переходящий в у.
8В общем случае / : X —> Υ говорят, что / отображает X «в» Υ.
β.3. Обратимые преобразования
131
Особого внимания заслуживает понятие гомеоморфизма, каковым
называют взаимно однозначное (инъектиеное плюс сюръективное) и
взаимно непрерывное (непрерывны как /, так и /-1)9 отображение
/ : X -> Υ (6.9)
Пространства, между которыми молено установить гомеоморфизм,
считаются гомеоморфиыми.
Отображение называют локальным гомеоморфизмом, если у любой
пары точек ж, у такой, что /(ж) = у, найдутся окрестности, гомео-
морфно отображаемые (с помощью /) друг на друга.
Перечисленное имеет прямое отношение к распространённой задаче
исследования систем уравнений вида (6.3), (6.4), т. е.
f(x) = у. (6.10)
Повторим ещё раз. Если / сюръективно, система (6.10) имеет решение χ € X
при любом убУ. Если — инъективно, то решение (6.10) всегда единственно
(разумеется, при условии существования). А когда — инъективно и
сюръективно, то решение (6.10) при любом у £ Υ существует и единственно.
Наконец, в случае гомеоморфизма f — добавляется ещё непрерывная
зависимость решения χ £ X от у £ У.
Интересно посмотреть, как сказанное преломляется в
частном случае линейного отображения
f(x) = Ах. (6.11)
Здесь инъективностъ обеспечивает «всё остальное». Если
Αχ1 φ Ах2 при χ1 φ ж2, (6.12)
возможность взаимно однозначного соответствия, непрерывного только
в одну сторону — кажется сомнительной, но в этом мире случается все, что
не запрещено, см. [3].
132
Глава 6. Отображения, или операторы
то (6.11) сюръективно10 и гомеоморфно отображает 1
что означает существование обратного оператора А .
на
Но это пока в «божественных понятиях». Так сказать, с
точки зрения Всевидящего Ока. Ибо не ясно, как проверять (6.12).
Ответ даёт «Линейная алгебра». Оператор Ах обратим, когда
детерминант {определитель) матрицы А не равен нулю,
det A ^0.
(6.13)
В случае (6.13) матрицу А называют невырооюденной.
Равносильный признак невырожденности А — линейная
независимость вектор-строк матрицы11. За информацией о
детерминантах и линейной независимости лучше обратиться к «Линейной
алгебре», но краткую справку мы всё же дадим.
6.4 Детерминанты, или определители
Единичный куб, построенный на векторах (ребрах)
ei =
ΓΙ]
0
k
, e2 =
ГО]
1
_oJ
(6.14)
под действием матрицы (оператора) А = [aij] переходит в параллелепипед,
построенный на вектор-столбцах матрицы А,
ац
βηΐ}
din
Объём этого параллелепипеда и есть det А с точностью до знака, т. е.
детерминант — это коэффициент искажения объёма при линейном
преобразовании А с учётом сохранения или перемены ориентации. Дело в том, что
любое тело Ω С Rn можно разбить на N кубиков со стороной ε и объёмом εη,
и тем самым сколь угодно точно приблизить объём Ω величиной Ν·εη.
Каждый кубик под действием А перейдет в параллелепипед объёма | det А\ · εη.
10Равно как и сюръективностъ, т. е. разрешимость Ах = у при любом t/,
влечёт за собой (6.12).
11 Из линейной независимости вектор-строк вытекает линейная
независимость вектор-столбцов, и наоборот.
0.5. Эквивалентные нормы 133
Поэтому А искажает объём любого тела β |det A\ раз12.
Другие пути определения и вычисления детерминанта см. всё-таки в
«Линейной алгебре». Не так трудно было бы дать подробные пояснения и здесь,
но это нарушило бы ритм изложения. Да и знакомиться с некоторыми
экспонатами надо в подходящей обстановке, при адекватных декорациях. Там
возникает резонанс с духом n-мерного коловращения, синхронизация с
внутренней логикой дисциплины. А здесь всё это будет потеряно. Не говоря о
том, что «посторонние разговоры» уводят мысль с магистрального пути.
6.5 Эквивалентные нормы
Евклидова норма (5.1), ||ж|| = у/{х~х), служит базой для
введения в W1 расстояния \\х — у\\ между векторами ж, у. Но
популярны и другие нормы. Например, кубическая норма,
||я?||т = тах|ж<|, (6.15)
г
и октаэдрическая норма,
ινιι = Σν· (6·16)
г=1
2 Из определения детерминанта как коэффициента искажения объёма
сРазу следует |detAB| = |det A||det£|, хотя, как известно, модули мож-
но опустить: det АВ = det A det В.
134 Глава 6. Отображения, или операторы
Вот примеры единичных шаров в R2:
ν ■*.·<*■%,
ιωι,<ι iixiim<i
Возникает, конечно, естественный вопрос: зачем столько норм?
Нельзя ли обойтись одной? В принципе можно, но
многообразие норм обеспечивает удобства. Выбор нормы «под задачу»,
как правило, существенно облегчает решение. Скажем, требуется
установить сходимость хп —> 0, для чего необходимо доказать,
что при любом ε > О для достаточно больших η выполняется
неравенство
\\χη\\ < ε. (6.17)
Какую норму в (6.17) выбрать? Может оказаться, что по
одной норме (6.17) легко доказывается, по другой — нет. Поэтому
выбор нормы — это рычаг, распоряжаясь которым, можно
облегчать решение задач. Но есть ещё один принципиальный вопрос,
может быть, самый принципиальный. Если последовательность
хп сходится но одной норме, будет ли она сходиться — по другой.
В Rn ответ — «да»13.
6.5.1 С точки зрения сходимости в Rn все нормы жеиеог
лентны, т. е. для любых двух норм || · ||ь || · Ц2 можно указать
такие константы а и β, что
||«||ι^α|Μ|2, \\χ\\2^β\\χ\\ι
при любом χ G М71.
13 В функциональных пространствах — «не обязательно».
^
lUrll <1
6.5. Эквивалентные нормы
135
< Легко видеть, что любая норма однозначно определяется
заданием единичного шара14. Функция φ(χ) = \\x\\i на множестве ЦхЦг = 1
достигает своих минимального (7 > 0) и максимального (δ > 0)
значений. Поэтому
7|М1з ^ Μι ^ δ\\χ\\2
при любом χ G Шп. ►
Нормой матрицы А называют положительное число ||Л||,
удовлетворяющее тем же самым условиям 1-3 (см. сноску), если в них
векторы заменить на матрицы. Поскольку матрицы — это по
существу линейные операторы в Rn, дополнительно необходимо
согласование норм векторов и матриц, чтобы была возможность оценки образов
Ах. Норма матрицы ||Л|| называется согласованной с нормой вектора
||ж||, если для любых А и χ
\\Ах\\ < \\А\\\\х\\,
и для любых матриц А и В выполняется неравенство \\АВ\\ < ||Л||||£||.
Чтобы неравенство \\Ах\\ ^ ||Л||||ж|| давало хорошую оценку, оно
должно быть неулучшаемо. Это мотивирует выделение в
самостоятельное понятие подчинённой нормы матрицы:
И| = max ||Ar||.
ΙΙ*ΙΙ=ι
Нормам || · \\т и || · ||/ подчинены, соответственно,
η
||Л||т = max V^ |a»j|, (строчная норма),
г ' ^
3=1
И
η
11А11 / = max V^ \ aij |, (столбцовая норма).
г=1
В качестве которого может быть «назначено» любое выпуклое
Центрально-симметричное тело. Для такого вывода надо обратиться к
определению нормы. Нормой вектора χ € Кп называют положительное число
||ж||, удовлетворяющее следующим требованиям:
1. ||ж|| =0 в томм случае, когда χ = 0;
2. \\χ + 2/|| < ||ж|| + ||у|| (неравенство треугольника);
3. ||аж|| = |а| · \\х\\ для любого а € (—со, со).
136
Глава 6. Отображения, или операторы
6.6 Дифференцирование оператора
Вернёмся к нелинейным операторам. Оглядываясь назад, можно
заметить, что дифференцируемость до сих пор сводилась к
возможности линейной аппроксимации приращения функции /(ж),
Α/ = ζ·Δχ + ο(\\Αχ\\), (6.18)
в окрестности рассматриваемой точки. В одномерном случае ζ
было численным коэффициентом, равным f\x). Для
скалярной функции η переменных внешне все осталось тем же самым.
Вплоть до ζ = f'(x), но f'(x) — стало вектором (градиентом),
а произведение в (6.18) — скалярным.
В нашем случае, / : Rn —► Rn, тоже ничего не меняется,
внешне. По-прежнему ζ = f(x), но теперь f'(x) это матрица
размера η χ η,
/'(*)
[dxjj '
которую называют производной Фреше, или матрицей Якоби15.
И теперь /'(ж)· Δ ж — это умножение матрицы на вектор.
Короче говоря, снова имеем16
А/ = //(ж)-Лж + о(|| Ая? ||), (6.19)
причём ничего нового — по сравнению со случаем скалярной
функции η переменных — здесь нет. Потому что у = f(x) в
данном случае представляет собой набор η скалярных функций
У г = fi(x), Для каждой из которых по теореме 5.5.1
АУг = УЛ(ж)-ЛЖ + 0(|| ах\\).
Объединение η таких неравенств в одну формулу (6.19) никакого
нового содержания не привносит, за исключением
стенографического. Просто для краткости используется матричный язык.
Другое дело, что язык — вещь продуктивная.
15 Вообще говоря, могут рассматриваться отображения / из W1 в Rm при
η / га. В этом случае матрица Якоби будет прямоугольной, размера га х п.
16Для справедливости (6.19) необходимо выполнение дополнительных
условий типа непрерывности частных производных, см. теорему 5.5.1.
6.7. Принцип сжимающих отображений
137
Выгоды использования матричного языка выявляются буквально на
каждом шагу. Скажем, умножение матриц Якоби сводит громоздкое
дифференцирование сложной функции у = f(g(x)) в одну строчку17
/ г/ /
Ух = fg 9x-
6.6.1 Теорема о среднем. Пусть оператор f непрерывно
дифференцируем, и в некоторой норме \\f'(z)\\ ^ λ на отрезке, соединяющем точки χ
и у- Тогда
Н/(«) - /ЫН < λ||* - vll· (6-20)
< Доказательство. Разобьем отрезок ζ = τχ 4- (1 — т)у, соединяющий
χ и у, точками ζ% на малые участки (полагая zq = ж, ζ ν = у). В силу (6.19)
||Δ/4||<λ||Δ*4||+ο(||Δ*4||),
где Δ fi = f(zi+i) — f(zi). Отсюда ясно, что для любого ε > 0 можно выбрать
настолько мелкое разбиение, что
||Δ/,||<(λ + ε)||Δ*«||.
Но тогда
И/(*)-/Ы11 =
ΣΔ*
< ΣII δ/ίι < (λ+ε)Σιι ΔΖίΐι = (λ+ε)Σιι*-ίΊΐ
Окончательный вывод даёт предельный переход ε —> 0. ►
6.7 Принцип сжимающих отображений
Многие уравнения естественно или принудительно сводятся к
разрешимости уравнения
χ = f(x), (χ е X). (6.21)
Решение х* = f(x*) называют неподвижной точкой оператора /.
6.7.1 Определение. Отображение f : Rn —> W1 называется
сжимающим , если существует такое λ < 1, что
11/0*0 - /(У)II ^ 4х ~ УII для любых х, у е Мп. (6.22)
17Т}»««-.г™^ *12
Вместо η равенств
^t/i _ у^ dfj dgk
dxj ~ Zf dgk dxj '
138
Глава 6. Отображения, или операторы
6.7.2 Теорема. Всякое сжимающее отображение f : Ш71 —> Rn
имеет неподвижную точку х*, которая единственна.
Последовательные приближения xk+l = f(xk) сходятся к х*
независимо от начального положения χ .
< Покажем, что любая последовательность χ , определяемая
механизмом xk+1 = f(xk), является последовательностью Коши. Очевидно,
II*- - хт\\ < Их" - /0*П)Н + 11/(х") - /ООН + II/0O - «ΊΙ,
т. е.
||х" - хт|| < φ{χη) + λ||χ" - хт|| + <р(хт),
где φ{χ) = \\х — f(x)\\. Следовательно,
||«- —"Ц < У(»") + У(«") ^ ρ („, „_>«,).
Здесь мы воспользовались тем, что φ(χ) на любой последовательности
xk+1 = f(xk) убывает до нуля, поскольку ip(xk+1) ^ \(p(xk), что вытекает
из (6.22). Поэтому Хк —> х*. В силу (6.22) оператор / непрерывен.
Следовательно, х* = f(x*). Двух неподвижных точек быть не может, благодаря
тому же неравенству (6.22). ►
6.8 Обратные и неявные функции
При решении системы уравнений (6.10), т. е. у = f(x),
существенную роль играет зависимость решения χ от у, остаётся ли χ
единственным решением при изменении у, непрерывно ли
зависит от у. В отсутствие непрерывности, например, получалась бы
глупость. Параметры у меняются чуть-чуть, а решение χ улетает
в тартарары. Короче говоря, проблема упирается в обратимость
преобразования / в окрестности рассматриваемой точки.
6.8.1 Теорема. Пусть оператор f, действующий в W1,
непрерывно дифференцируем в окрестности нуля18, /(0) = 0 и
матрица Якоби /'(0) невырождена. Тогда в некоторой окрестности
нуля оператор f обратим.
< Исходному у = }{х) эквивалентно уравнение χ = Ф(ж, у) с
оператором
ф(х,у) = х + [1'(о)Г1[у-/{х)\,
18 От о = /(b) к О = /(О) всегда ведёт замена координат.
β. 8. Обратные и неявные функции
139
имеющим в нуле нулевую производную Фреше,
*i (0, y) = I-[f (О)]"1/' (0) = [0].
Поскольку матрица Φ'χ (О, у) нулевая (при любом t/), а сама производная
ф'х(х,у) непрерывна и не зависит от t/, то при некотором ε > 0 в шаре
||ж|| < ε можно обеспечить такую малость элементов Ф'(х,у), что
||Ф'(ам/)|| < λ < 1.
Поэтому (теорема 6.6.1) в шарю ||ж|| < ε оператор Ф(х,у) сжимает с
коэффициентом λ при любом у, причём, в силу Φ(0, 0) = 0 и той же теоремы
6.6.1, Ф(ж,0) переводит шар ||ж|| < ε в шар меньшего радиуса λε. Это, в
совокупности с непрерывностью по t/, гарантирует, что при малых у (из
некоторого шара ||у|| < δ) оператор Ф(х,у) переводит шар ||ж|| < ε в себя.
Далее остается применить теорему 6.7.2, которая обеспечивает однозначную
разрешимость уравнения у = f(x) в окрестности {||ж|| < ε, \\у\\ < δ}. ►
Результат 6.8.1 интуитивно понятен. В окрестности нуля
уравнение у = f(x) в силу (6.19) равносильно
У =
dfi(0)
дх
з J
•х + о(\\х\\),
откуда
X =
Шоу
Ί -1
L dxj
{v-o(IN)},
dfi(0)
дх*
интуитивно просмат-
и роль невырожденности матрицы
ривается. Однако «дух приблизительности» всё же остаётся, а
дожимая задачу, приходим в конце концов к необходимости
доказательства типа данного выше.
Локальная обратимость отображения представляет собой частный
случай следующей более общей задачи. Если в некоторой окрестности точки
(жо,2/0), для которой Ф(жо,2/0) = °> векторное уравнение19
Ф(ж,у) = 0
(6.23)
°Днозначно разрешимо относительно ж, то говорят, что (6.23) определяет в
окрестности (хо,у0) неявную функцию х(у)·
9Имеется в виду Φ : Rn x W
>Rn
140
Глава 6. Отображения7 или операторы
6.8.2 Теорема о неявной функции. Пусть Ф(ж0,2/0) = 0;
отображение Φ (ж, у) непрерывно по совокупности переменных и непрерывно
дифференцируемо по χ в некоторой окрестности (хо,у0)} а матрица Яко-
би Фх(жо,2/0) певырооюдена. Тогда уравнение (6.23) задаёт в некоторой
окрестности точки (жсъ2/о) меленую функцию х(у), которая непрерывна.
Доказательство почти не отличается от доказательства предыдущей
теоремы. Надо лишь в качестве Φ (ж, у) взять
Ф(х,у) = х- [К^УоТ'Ъ&У)· (*£)
Локальной обратимости / в каждой точке Rn, конечно, не
хватает для глобальной обратимости. Последнюю
обеспечивает простое дополнительное условие
Urn ||/(*)||=oo,
(6.24)
см. теорему 12.10.1.
Пример. У функции у = /(ж) с компонентами
2/1 = Χΐ +<£ΐ(#2,···,#π),
2/2 =Х2 +<Р2(яЗ>--->Яп),
2/π-Ι = Хп-1 + ψη-ΐ(Χη),
Уп=Хп + COnst
(6.25)
матрица Якоби
/'(*) =
/ι §^
0X2
\0
дхп
дц>2
дхп
ϊ /
имеет детерминант
det/'(x) = l #0).
Поэтому матрица f'(x) везде невырождена, и f(x) локально обратима
при любом χ и любых ψχ. Плюс к тому, в ситуации (6.25)
автоматически выполняется условие (6.24), независимо от того, каковы ψ{.
Поэтому уравнение у = /(ж) однозначно разрешимо при любом у Ε Мп.
Глава 7
Кратные интегралы
Спасибо тебе, Господи,
что ты создал всё нужное нетрудным,
а всё трудное — ненужным.
Георгий Сковорода
7.1 Двойные интегралы
Интегрировать можно (и бывает нужно) не только вдоль прямой,
но и по площадям, объёмам и вообще по любым множествам, на
Объём V цилиндрического тела,
стоящего на основании D в
плоскости ху и ограниченного в
направлении ζ поверхностью
2 = /(Я, У),
можно приблизить суммой
VA =^2/(Хг,Уг)АХгАуг,
г
Равной сумме объёмов вертикальных столбиков высотой /(ж^ Уг),
стоящих на малых квадратиках с площадью Δ^Δ^.
Предел VA при измельчении разбиения фигуры D называется
которых задана мера.
142
Глава 7. Кратные интегралы
двойным интегралом функции f no области D и обозначается
(7.1)
//
f(x,y)dxdy=KmVA
Заодно возникает интерпретация двойного интеграла как
объёма, заключенного под графиком ζ = /(ж, у). Объёмы, где
/(ж, у) > Оили < 0, засчитываются со знаком плюс/минус.
Короче говоря, все развивается по образцу определённого интеграла
от функции одного переменного, только промежутки заменяются
плоскими фигурами. Аналогично вводятся суммы Дарбу и т. п1.
В случае ζ = f(x, у) = 1
dxdy = Sd,
Ι!·
D
где Sd — площадь фигуры D. Таким образом, двойной интеграл
может использоваться для вычисления площадей.
Что касается возможного диапазона обозначений, то вместо
произведения дифференциалов dxdy иногда пишут
дифференциал площади dS, вместо J J — просто /, если из контекста ясно, о
чём идет речь. Наконец область D может заменяться её
описанием типа х2 + у2 ^ 1.
Сведение двойного интеграла к повторному.
Практически — это единственный метод вычисления двойного
интеграла, заслуживающий внимания. Снова всплывает теория
повторных пределов. Другое дело, что в случае непрерывных функций
f(x, у) и простых ограниченных областей D никаких проблем не
1 Принципиальная тонкость здесь заключается в допуске к рассмотрению
только квадрируемых областей D, которые характеризуются тем, что
ограничены контуром, имеющим нулевую площадь. Площадь кривой, в свою
очередь, определяется (упрощённо говоря) как предел суммы покрывающих
кривую квадратиков при бесконечном их измельчении. Для простых
областей D никаких проблем не возникает. Более того, придумать «проблемную»
область D — не так легко.
γ.1. Двойные интегралы
143
возникает. Например, в условиях прямоугольной области
повторные интегралы из утверждения 5.9.3 оказываются равны как раз
двойному интегралу
α ь о a
\\ f(x,y)dxdy = dy f(x,y)dx = dx f(x,y)dy,
[a,b] x [c,d]
что представляет собой не что иное, как равенство повторных
пределов двойному2 для аппроксимирующей суммы VA.
Рассмотрим теперь область D,
ограниченную кривыми у = а(х) и
у = β(χ), переменная χ
меняется от а до Ъ. Опять-таки, если
все фигурирующие функции
непрерывны, то, очевидно,
4J=Pfc>
Ь β(χ)
f(x,y)dxdy= dx f(x,y)dy
D a a(x)
%
Здесь возможны некоторые
трудности в связи с неоднозначностью
функций типа а(х) и /?(#), см.
выше. Выход из положения
подсказывает рис. слева. Отрезок [а, Ь]
подразделяется на промежутки, в пределах
JT* которых область D молено покусочно
описывать прежним образом.
Двойные интегралы могут рассматриваться и на бесконечных областях.
144
Глава 7. Кратные интегралы
Пример. Проверим рецепт на вычислении площади круга, х2 + у2 ^ г2,
У
yr2-i2
' = I dx I dy = 2 / у/г2 — x2dx = πτ2. &
7.2 Замена переменных
При вычислении двойных интегралов довольно часто
эффективным инструментом является замена переменных
{Χ,υ} = θ(ξ,η) = {χ(ξ,η),ν(ξ,η)},
упрощающая или область D, или функцию f(x,y)-
Например, в полярных координатах {г, φ},
l 2/ =
χ — τ cos у?,
у = r sin φ,
круг χ + у2 < R оказывается прямоугольником
(7.2)
[О, R] χ [0,2тг).
φ
х x=rcos φ
y=r sin φ
Функция f(x,y) меняется при этом на /(г cos φ, г sin φ). Остается
вопрос о соотношении дифференциалов площади dxdy и drdtp.
Коэффициент искажения объёма — в данном случае площади — в малой
окрестности точки {г, φ} определяется величиной | det0'(r,<£)| = г,
гдх
дг
ду
Vdr
dxi
Θφ
ду
Θφ]
α»< \ \дг 8ψ\ _ [cosv?
θ(τ,φ)= \эу ду \-[ήηφ
—г sin φ
г cos φ
7.2. Замена, переменных
145
Следовательно,
2π R
/ / dxdy = / άφ ι rdr = 7i\R2,
x2+y2^R2 0 О
что с вычислительной точки зрения проще прямолинейного взятия
интеграла, использованного выше.
В общем случае замены (7.2) формула перехода к новым
переменным такова
jjf(x,y)dxdy = ΙΙί(χ(ξ,η)Μξ,ν))\^θ'(ξ,η)\άξάη. (7.3)
Dxy Όζη
Наличие модуля под интегралом (7.3) контрастирует с правилом
замены переменной в определённом интеграле3
о ρ
J f(x)dx = J f[x®]At№, (7-4)
где α = ж(а), b = χ(β). Очевидно, |ж'(01 в (7-4) является
коэффициентом искажения длины, но знак модуля отсутствует. Причина
заключается в том, что промежуток интегрирования в (7.4) ориентирован
(а < Ь либо а > 6), и от этого зависит знак интеграла. Двойной же
интеграл определялся пока на неориентированных областях.
Однако возможен другой подход. Области придаётся ориентация
заданием направления обхода ограничивающего контура — положительного
или отрицательного. Соответственно, площади ориентированной
области приписывается знак плюс или минус. И тогда в формуле замены
неременных модуль с детерминанта снимается.
3Вытекающим из формулы (4.4) для неопределённого интеграла.
146
Глава 7. Кратные интегралы
7.3 Кратные интегралы
Тройной интеграл по области D от функции u = f(x,y,z)
определяется как предел
III f(x,y,z)dxdydz = KmQVA
D
где
УА =^2f(xuyuZi)AxiAyiAzi.
(7.5)
Аналогия с двойным интегралом полная. Область D режется на
малые кубики (со сторонами |Дж*|, |Δ^|, |А^г|), и в качестве
отправной точки рассматриваются суммы (7.5). Дальнейшее
развитие теории (в том числе интегралов большей кратности) идет
по тому же пути, что и двойных интегралов. Суммы Дарбу,
повторное интегрирование, несобственные интегралы и т. п4.
7.4 Объёмы n-мерных тел
В описании стандартных n-мерных тел обычно фигурирует некий
характерный размер а, входящий в неравенства вида φ(χ,α) ^ 0.
Скажем, n-мерный шар описывается неравенством х\ + К in ^ о,2.
Функции φ, как правило, однородны, т. е.
φ{τχ,τα) = τηφ(χ,α),
что позволяет с помощью замены Xj = a£j перейти к
рассмотрению «единичных» тел (а = 1).
При вычислении объёма это приводит к формуле
V(a) = anV(l)
(7.6)
поскольку det xi = оп и
V(o) = I dVx = J |det a^dVfc.
43амена переменных происходит по формуле аналогичной (7.3), где у
Θ' — другое количество переменных.
γ.4. Объёмы n-мерных тел
147
Таким образом, объём n-мерного куба со стороной а равен
V (а) = ап.
При вычислении n-мерных интегралов широко применяется индукция
по размерности пространства, обыгрывающая симметрию задачи.
Например, для вычисления объёма Tn(h) n-мерного симплекса:
х\ ^ 0,..., хп ^ 0; χι Η Ь Хп < К
к цели быстро ведет преобразование
п-1
τη(ΐ)=ίάξη [...[ dei...den-i =
о £ι+···+ξη-ι^ι-ξ«
1
= Γη-ι(ΐ)^ι -€»)-4» = ^Д
О
где все & ^ 0 и
Γ„-ι(1 - {») = (1 - ξη)η_1Τη_ι(1)
в силу (7.6). Учитывая Τι(1) = 1, последовательно приходим к Гп(1) = -^у.
Окончательно
Г„(Л) = ^-.
П!
При вычислении объёма Бп(г") n-мерного шара:
х\ + · · · + 4 ^ г2
работает аналогичный трюк,
п-1
Βη(1)=ίάξη [.·[ #ι...#»-ι =
-1 «+-+^-ι^ι-^
2L
ι η — 1 ^
= B»-i(l) f(l-U) 2 <%n=2Bn-1(l)fsmnu<L·.
-1 0
В итоге преодоления рутины для чётной и нечётной размерности
пространства получается:
<#чХ к 0к+1 к
ВМг) = ^г™, вЛ+1(т) = фг^Л+К (7.7)
148
Глава 7. Кратные интегралы
7.5 Сюрпризы η измерений
• Из (7.7) следует, что объём n-мерного шара Вп(г)
любого фиксированного радиуса (скажем, г = 1000км) при η —> оо
стремится к нулю!
• Пусть квадрат с ребром 2 разбит на 4 единичных
квадрата, в каждый из которых вписан круг диаметра D = 1. В
центральную область вписан круг диаметра d, касающийся
остальных кругов. Очевидно, d = л/2 — 1.
Аналогичным образом в R3 куб с ребром 2 можно разбить на 8
одинаковых кубов, в каждый из которых вписать шар диаметра
D = 1. Диаметр центрального вписанного шарика будет равен
d = \/3 — 1. Продолжая в том же духе, в Ш.п будем иметь диаметр
вписанного шарика
d = у/п — 1.
Таким образом, вписанный шарик, начиная с η = 10, вылезает
за пределы ограничивающего куба, не говоря о том, что,
начиная с η = 5, радиус «маленького» шарика превосходит радиус
«большого».
• Какое максимальное число вершин может иметь
многогранник, у которого каждые две вершины соединены ребром*?
На плоскости R2 указанным свойством обладает лишь
треугольник — максимальное число вершин т = 3. В R3 — тетраэдр
(га = 4). В пространстве четырёх измерений и выше такой
многогранник может иметь вершин сколько угодно\
7.5. Сюрпризы п измерений
149
Ч Доказательство. Рассмотрим так называемый циклический
многогранник в R4 с любым числом вершин, лежащих на кривой
*М = {г, г\ т3, г4}, г > 0.
Кривая х(т) обладает поразительным свойством. Через любые её две
точки x(t), x(s) можно так провести плоскость Η (в данном случае
трёхмерную, коль речь идет об R4), что все её точки х(т) будут находиться по
одну сторону Н. Покажем это. Рассмотрим функцию
φ(τ) = (т — t)2{r — s)2 = αο + air + ol-it1 + азт3 + α4Τ4,
и в качестве плоскости Η возьмём множество точек ж, для которых
h · χ + αο = 0, h = {αϊ,0:2,0:3,0:4}.
Очевидно, h · х(т) + αο = φ(τ) ^ 0, значит, вся кривая х(т) лежит по
одну сторону Н. Кроме того ясно, что лишь две точки x(t), x(s) попадают
на саму плоскость if,
φ{1) = φ{8) = 0.
Теперь остается вспомнить, что многогранник является выпуклой
оболочкой своих вершин, в данном случае точек
ж(п),...,ж(гт). (7.8)
Все плоскости типа Н, как говорят, опорные. Отрезок, соединяющий х{тг)
и x(tj), весь лежит в Η, и ни одна его точка не может быть получена как
выпуклая комбинация остальных вершин (7.8), поскольку те лежат строго
по одну сторону Н. Поэтому отрезки, соединяющие любые две точки из
(7.8), будут ребрами искомого многогранника. ►
Глава 8
Векторный анализ
Ability may get you to the top,
but it takes character to keep you there.
John Wooden
8.1 Координаты и векторы
Вернёмся к тому, что вкратце рассматривалось в разделе 5.1.
Векторные представления возникают естественно и вроде бы
бесхитростно. По крайней мере изначально многообещающими не
выглядят. Но шаг за шагом постепенно выводят на новые
этажи виденья, с которых в «покоординатной писанине» начинают
просматриваться совершенно новые понятия, которые «за
деревьями» детальных описаний были не видны.
При изучении функций и = f(x,y,z) никакого визуального
пространства изначально нет. Есть функция и аргументы.
Переменные, параметры что угодно, но никакой геометрии.
Пространство возникает как виртуальный инструмент, когда
значения x,y,z мысленно откладываются по осям выдуманного
пространства. Разумеется, затея с геометрией имеет смысл лишь в
том случае, если она хоть что-то даёт. Виденье, понимание или
хотя бы вдохновение. Как ни странно, даёт всё. Аморфные
алгебраические факты приобретают наглядную интерпретацию,
настроение поднимается, задачи начинают решаться.
8.1. Координаты и векторы
151
Поскольку геометризация анализа идёт «координатно»,
возникает вопрос о целесообразном выборе системы координат. В
большинстве ситуаций наиболее удобны ортогональные
системы координат со взаимно перпендикулярными осями (х, у, ζ),
но которым направлены единичные орты {i,j, k}.
Координатами при этом называют числа, определяющие положение точки
г = {#, у, ζ} в пространстве R3 и представляющие собой
ортогональные проекции г на оси (х, у, ζ).
'ш А±^
Ио_л
(правая)
(левая)
(8.1)
Подготавливая почву для обобщений, естественно нумеровать
оси координат и орты как (х\,Х2^з) и {е1,в2,ез}, что потом
облегчает следующий шаг — тройка увеличивается до п, и
обобщение R3 на Rn готово. Но в R3 привычнее и в некоторых
отношениях удобнее система Oxyz, в которой а = {ax,ay,az}. Поэтому
ей тоже будем пользоваться наравне с Ох\Х2Хъ·
Однако вернёмся к нашим баранам. Геометрически вектор
определяют как направленный отрезок1. При этом все
векторы, которые одинаково направлены и равны по длине,
считаются равными, что позволяет ограничиться
рассмотрением векторов, исходящих из начала координат2.
Сумма χ = {ж1,Ж2,#з} и У = {УьУ2,2/з} определяется как
ж + у = {х\ + ί/ι, Х2 + 2/2, #з + Уз},
Но этого мало, см. далее.
Такова точка зрения в идеологии свободных векторов.
152
Глава 8. Векторный анализ
что равносильно сложению векторов по правилу
параллелограмма, эквивалентом которого является правило треугольника.
Преимущества последнего выявляются при сложении
нескольких векторов, рис. (8.2). Каждый следующий слагаемый вектор
приставляется началом к концу предыдущего — замыкающий
вектор даёт сумму. Вычитание выводится из сложения: Ь — а
определяется как вектор, который в сумме с а даёт Ь. Этому
соответствует простой геометрический трюк: начала а и Ь
совмещаются, а концы соединяются отрезком, направленным к Ь,
что и даёт разность Ь — а, рис. (8.2).
Умножение на скаляр \x={\xi,\x2,\xs} растягивает (|λ| > 1)
или сжимает (|λ| < 1) вектор ж, не меняя направления при λ > О,
и меняет его на противоположное при λ < 0.
Определение вектора просто как направленного отрезка ведёт к
проблемам, мешая алмазы с пустой породой. Скажем, трёхмерное
вращение на угол φ — вектор или не вектор? С одной стороны, ему можно
сопоставить направленный по оси отрезок прямой длины φ. Но что
толку? Неприятность заключается в том, что вращения около разных
осей не складываются по правилу параллелограмма3, — и это даёт
отрицательный ответ на исходный вопрос. Поэтому в подобное
определение вектора необходимо добавить требование, чтобы векторы
складывались по правилу параллелограмма. В данном контексте речь идёт
об элементах вида χ = {ж1,Ж2,#з}> которые складываются «как
надо», по определению. Что касается правил сложения сил, моментов,
потоков и других физических величин — это задача из другой оперы.
Конечно, геометрия имеет изначально «некоординатный»
характер, и её координатное описание часто уводит мысль, вообще
3Складываются по правилу параллелограмма бесконечно малые
вращения, что влечёт за собой векторную природу угловой скорости, см. далее.
g,l. Координаты и векторы
153
говоря, в противоестественном направлении. Чисто векторный
язык геометрически точнее. Но полезны оба языка, и
максимальный эффект даёт их параллельное использование.
Векторы, лежащие на одной прямой (одинаково или
противоположно направленные), называют коллинеарнымщ лежащие
в одной плоскости, — компланарными.
Говорят, что множество векторов4 {ж1,...,ж*5} линейно
зависимо, если существуют такие коэффициенты λι,..., λ&, не все
равные нулю, что
Χχχ1 + · + Xkxk = 0.
В противном случае говорят о линейной независимости
векторов {ж1,... ,хк}.
Коллинеарные векторы всегда линейно зависимы. Компланарные —
линейно зависимы, если их больше двух. (?) Максимальное число линейно
независимых векторов определяет размерность пространства.
Линейно независимое множество {е1,в2,ез} в пространстве
считается базисом, если любой вектор χ можно представить в
виде линейной комбинации
X = Х\е\ + Ж2в2 + #зез-
Величины Xi называют координатами точки χ Ε Μ3.
Стандартный базис R3 (единичные векторы, орты, {ei, ег, ез}
направлены по осям декартовых координат):
ei =
1"
0
0
, е2 =
0
1
0
, е3 =
0
0
1
(8.3)
Упражнения
1. Из векторов а, 6, с можно сложить треугольник, если а + Ь + с = О.
2. Любые три вектора на плоскости либо четыре — в пространстве —
линейно зависимы.
Векторы с индексом мы выделяем жирным шрифтом, чтобы отличить
Их от координат.
154
Глава 8. Векторный анализ
3. Любые два неколлинеарных вектора а, Ь определяют плоскость5, все
точки которой могут быть записаны в виде
г = λα + μb.
4. В случае λ + μ = 1 точка г = \α + μb лежит на прямой, проходящей
через концы векторов α и 6. При дополнительном условии λ, μ ^ 0
точка г = \а + μb лежит на отрезке, соединяющем α и 6.
5. Если а, Ь, с — радиус-векторы вершин треугольника ABC, то
г = -(а + Ь + с)
является радиус-вектором точки пересечения медиан.
Проекция аь вектора а на вектор Ь, направ- а
ление Ь, определяется формулой /\
аь = \а\ cos φ, /Λ ΐ Ь
ab
где φ — угол между α и Ь, неважно по малой или большой дуге
измеренный — в силу cosy? = ΰοβ(2π — φ).
Проекции ах, ау, αζ на декартовы оси х, у, ζ представляют
собой как раз координаты вектора а в системе Oxyz.
В некоторых ракурсах теории важным оказывается деление
систем координат на две категории. Прямоугольную систему Oxyz
называют правой, если буравчик при вращении от ж к у движется
вдоль ζ - рис. (8.1), и левой, если ось ζ направлена
противоположно — рис. (8.1).
Косоугольные координаты. Иногда декартовой называют
косоугольную систему координат общего вида, в которой координаты определяются
разложением вектора по двум (на плоскости) или по трем (в пространстве)
направлениям, которые не обязательно взаимно перпендикулярны.
Атрибутом «декартовости» при этом является наличие базиса. Примером недекар-
5Проходящую через три точки: нуль, α и 6.
gt2. Скалярное произведение
155
товых координат могут служить (нелинейные) полярные координаты
(вектор характеризуется длиной г и углом φ с выделенным направлением).
В общем случае непрямоугольных координат понятие ориентации
опирается на следующее определение. Упорядоченная тройка некомпланарных
векторов а, Ь, с, исходящих из точки О, называется правой, если для
наблюдателя, расположенного β нуле, обход концов а, Ь, с в указанном
порядке происходит по часовой стрелке. В противном случае тройка а, Ь,
с — левая. Соответственно классифицируются базисы.
Если не оговорено противное, под декартовыми — подразумеваются
далее прямоугольные координаты.
8.2 Скалярное произведение
Скалярное произведение определяется как произведение длин
векторов на косинус угла между ними6,
х - у = \х\ · |y|cos<£
(8.4)
Другими словами, χ · у есть произведение длины χ = \х\ на
проекцию вектора у на вектор ж, т. е7.
ху = χ · ух.
Из-за четности и периодичности косинуса, cos(2n — φ) = cosy?, — не
в&Жно, как измеряется угол.
Точка в обозначении скалярного произведения часто опускается. Для
°бозначения ху используется также запись (ж, у) или (х,у).
156
Глава 8. Векторный анализ
Скалярное произведение удовлетворяет обычным свойствам умножения:
ху = ух, (коммутативность)
х(у + ζ) = ху + χ ζ. (дистрибутивный закон)
Второе вытекает из равенства проекции суммы векторов — сумме проекций.
Отметим попутно, что длина \а\ (ещё говорят — норма, и пишут ||а||)
вектора а = {ах,ау} по теореме Пифагора равна
\\а\\ = yjal + al,
т. е. α = а · а = ах + а2. В пространстве, соответственно,
||а||2 = о2 = а2 + а\+а\,
откуда
(а ± б)2 = (о, ± Ьх)2 + (ау ± 6У)2 + (а, ± 62)2,
что приводит к
. (а + б)2 - (а - б)2
а · о = ——^ — = ахох + ауЬу + а2о2.
Последнюю формулу
а · Ь = ахЬх + а^бу + а^ (8.5)
иногда принимают за исходное определение скалярного
произведения, выводя (8.4) в качестве следствия (8.5).
Произведение а · Ь = \а\ · |6|cos<£ отражает широко распространённый
в природе способ взаимодействия векторов, характеризуемый умножением
длины одного вектора на проекцию другого: |α|6α· Работа, например силы
F на перемещении 8, равна
F - s = \F\ -\β\οοβφ9
поскольку «работает» только составляющая F, направленная вдоль з.
Поток жидкости через площадку площади AS равен скалярному
произведению ν AS, где ν — скорость течения (в районе AS), а вектор AS
считается направленным по нормали к площадке. Физически опять-таки понятная
ситуация: количество жидкости, протекающей через AS, определяется
нормальной составляющей потока и не зависит от касательной составляющей.
gS. Векторное произведение
157
Произведение единичных векторов
α = {cos α, sin α}, b = {cos/?, sin/?}
сразу даёт формулу «косинуса разности»,
ab = cos(a — β) = cosacos/? + sinasin/?,
поскольку \а\ = \b\ = 1.
Равенство нулю скалярного произведения ab означает — в
силу cos(a, 6) = 0 — ортогональность ненулевых векторов а и Ь.
Поэтому аг = 0 (при фиксированном α и текущем г = {ж, у, ζ})
представляет собой уравнение плоскости, ортогональной
вектору а и проходящей через начало координат.
Уравнение
аг = 5 (8.6)
задаёт гиперплоскость**, не проходящую через начало
координат при δ φ 0, и означает, что проекция радиус-вектора г =
{х, у, ζ} любой точки (8.6) на направление α одна и та же. Если
дополнительно,\а\ — 1, то эта проекция численно равна δ.
8.3 Векторное произведение
Ещё одной важной операцией является векторное произведение,
с= а х Ь,
где вектор с по длине равен
\с\ = \а\ |b|sin<p
8 Гиперплоскость отличается от плоскости тем, что не проходит через
начало координат.
158
Глава 8. Векторный анализ
т. е. площади параллелограмма, построенного на векторах а, 6,
а направление с определяется по «правилу буравчика».
Векторное произведение не ассоциативно,
(а X 6) X с φ α Χ (6 χ с),
антикоммутативно,
х χ у = —у χ ж,
но справедлив дистрибутивный закон,
(x + y)xu = xxu + yxu, (8.7)
проверка которого требует некоторых технических усилий — зато окупается
впоследствии многочисленными выгодами.
С помощью (8.7) в одно касание доказывается, что угловая
скорость — вектор! Факт еаоюный и крайне неожиданный,
если учесть, что трёхмерные повороты не коммутируют.
ωι
<ж
О
При использовании (8.7) усилие мысли почти не требуется
Линейная скорость ν конца радиус-вектора г при вращении вокруг
оси, проходящей через начало координат 0, с угловой скоростью
ω равна
ν = ω χ г, (8.8)
где (пока авансом) вектор ω направлен по оси вращения в
сторону, определяемую по «правилу буравчика».
g,3. Векторное произведение
159
Если тело участвует в двух вращениях с*> и ω , то линейные
скорости
υ1 = ω1 χ г и ν2 = ω2 Χ г
складываются как векторы, и результирующая скорость
оказывается равной, в силу (8.7),
υ=ω1χν + ω2χν = (ω1 + ω2) X г,
что и даёт нужный вывод. Результирующее движение
происходит с векторной угловой скоростью ω = ω1 + ω2.
• При замене координат {ж, у, ζ} на {—ж, —у, —ζ} обычные векторы (их
называют ещё полярными) меняются на противоположные (а на —а).
Векторы типа с = а X Ь (их называют аксиальными) — не меняются. Такого
рода метаморфозы вообще характерны для векторного исчисления. Например,
дифференциальные операции над обычными векторами порождают вроде
бы объекты той же природы, но это поверхностное впечатление. Скорость —
вектор, градиент — вектор, и разница не видна, пока исследование
проводится на базе ортогональных систем координат. В неортогональных системах
происходит «сбой» — формулы перехода при замене переменных
оказываются различны. Выявляется так называемая контправариантная природа
скорости и ковариантная природа градиента. Но это уже епархия
тензорного исчисления, где изучается кое-что незаметное в рамках анализа.
• В правой системе координат:
ixj=k, j x fc = г, kxi=j. (^#)
• Координаты вектора а X Ь равны:
(а X Ь)х = ауЬг
(а X Ь)у = агЪх
(а X b)z = axby
(?)
— azby,
— axbzi
— aybx.
Здесь и далее мы стараемся приписывать верхние индексы векторам,
а нижние — координатам.
160
Глава 8. Векторный анализ
8.4 Приложения к механике
Моменты. Моментом силы F, приложенной в точке г
относительно точки О, называется вектор
Μ = г χ F.
Аналогично определяется момент количества движения:
N = г χ την.
Дифференцируя iV, получаем10
N = fxmv + rxmv = г χ mv = г χ F = Μ,
поскольку mv = F и fxmv = ν χ την = 0.
Если система состоит из жёстко скрепленных между собой
материальных точек, то
N = Σ ri х mivi> Μ = y^rjX Fj.
Для каждой точки справедливо уравнение Ni = Mi, что после
суммирования по всем г даёт
dN
= М
(8.9)
В случае вращения системы вокруг некоторой
фиксированной оси с переменной угловой скоростью ω(ί) скорость каждой
частицы равна ν ι = τ^ω, где r^ расстояние до оси вращения,
N = (У2miri) ω = ]ω·
10 Обоснование правил дифференцирования скалярного и векторного
произведения векторов a(t) и 6(ί), зависящих от времени,
d(a -b) _ da , db
dt ~ ~dt' dt
d(a xb) da db
dt dt dt
предоставляется в качестве упражнения. Напоминаем, что в случае
векторного произведения порядок сомножителей принципиален.
8.4. Приложения к механике
161
Сумма J = J2miri ~~ есть момент инерции системы (тела).
Таким образом, (8.9) с учётом N = Jc*> приводит к уравнению
вращательного движения
11
3ώ = Μ
равносильно,
J(f = M
Кинетическая энергия с помощью момента инерции
записывается как
2 2
• Рассмотрим движение планеты вокруг Солнца. Поскольку
сила притяжения F центральная, то её момент действия на планету
Μ = г X F равен нулю, и, как следствие,
ЛГ = М = 0
N = const.
С другой стороны, если за время dt радиус-вектор заметает площадь
dS, то
ч 9 mr2d(p Л dS
N = rxmv = тг χ (ω χ r) = mr ω = —-— = 2m—,
at at
что доказывает второй закон Кеплера: S = const.
Движение в неинерциальных системах. Пусть система
координат Oxyz движется относительно Ох'у'ζ'. Движение состоит в
изменении расстояния 00' = т*о и вращении Oxyz с угловой скоростью ω
Получается, что момент инерции для вращательного движения служит
аналогом массы (при использовании обобщённой координаты φ).
162
Глава 8. Векторный анализ
Дифференцируя R = г о + г, получаем абсолютную скорость
Va = R = Го + Г.
Дифференцирование г = χ · г + у · j + ζ · к даёт
. / di dj dk\
f = (x.i + y-j + z.k)+[x-- + y-+z--j,
где v0 =X'i + y'j + Z'k — относительная скорость. Что
касается вторых скобок, то единичные орты г, j, к вращаются, не меняя
длины, поэтому
di dj dk
— =wxt, — = ω X j, — = ω χ к.
dt dt dt
Следовательно,
di dj dk
что в сумме с г0 называют переносной скоростью: ve = г о + ω Χ г.
Таким образом,
г = ν0 + ω X r\ (8.10)
и va = vo + ve, т. e.
Va = Vo + r0 + ω Χ Τ\
Абсолютное ускорение
Wa = Va = Vo + П) + ώ X Г + U> X Г,
где
v0 = (a5-i + 2/-j + £-fc)+ia· — + ^· — +i· — J=iuo + wXvo,
а составляющая гио = X9i + ymj + zmk представляет собой
относительное ускорение.
Учитывая (8.10), получаем
Wa = Ч*>0 + ™е + Wfe.
Здесь
lufe = 2α; χ ν0
gm5. Дивергенция
163
ускорение Кориолиса, а
We = г0 + ω χ (ω X г) + ώ Χ г
переносное ускорение, составляющая которого ω Χ (ω Χ г) является
центростремительным ускорением12.
Разумеется, все это с налёту не освоить. А неторопливо,
вперемешку с поисками невесты и вращением головой по ходу буравчика —
занимает семестр, а то и два. Не говоря о том, что сила Кориолиса
пускает жизнь в другую колею.
8.5 Дивергенция
Пусть в R3 задана вектор-функция (векторное поле)
а(г) = a(x,y,z) = {ах, ау, az}.
Можно считать, например, что речь идет о течении жидкости, и
а(г) скорость течения в точке г.
Далее рассматриваются поверхностные интегралы I adS,
S
представляющие собой поток вектора а(г) (жидкости) через
поверхность S. Интеграл определяется следующим образом.
Ориентированная поверхность S разбивается на малые
участки A S^ причём Δ Si считается вектором, длина которого
численно равна площади участка, а направление совпадает с
направлением нормали в произвольно выбранной точке χ Ε. A Si.
В модели с текущей жидкостью скалярное произведение a- A Si
Равно как раз количеству жидкости, проходящему через
площадку A Si в единицу времени. Предел Σ а' Δ Si при Δ Si—> 0
Двойное векторное произведение α χ (6 X с) в общем случае
вычислялся по правилу «абэцэ равно бац минус цаб»:
а X (Ь X с) = Ь(а · с) — с(а · 6).
164
Глава 8. Векторный анализ
называют поверхностным интегралом
вают также в форме
/ adS,
который записы-
/ a dS = / (axdydz + aydxdz + azdxdy)
где дифференциалы
dydz = dSx, dxdz = dSy, dxdy = dSz
представляют собой проекцию площадки (вектора) dS на
соответствующие координатные плоскости.
Из физических соображений ясно, чего здесь можно
ожидать. Если течение жидкости не имеет ни источников, ни
стоков, то интеграл / α · dS по любой замкнутой поверхности S
S
будет нулевым, ибо сколько втекло внутрь S, столько обязано
вытечь13. Обычно, чтобы подчеркнуть, что интегрирование идет
fa,
по замкнутой поверхности, используют запись
,dS.
При наличии источников/стоков было бы естественно
полагаться на плотность их распределения, которую обозначают
diva, либо Va, и называют дивергенцией, или расхождением
вектора а. В этом случае в пределах объёма V, ограниченного
поверхностью S, возникает или поглощается жидкость в
количестве f divadV. При этом очевидно14
JadS = /div adV
что называют теоремой (формулой) Гаусса — Остроградского,
которая даёт возможность преобразовывать поверхностный
интеграл в объемный, и наоборот.
13Имеется в виду несжимаемая жидкость.
14Сколько возникло в У, столько должно вытечь через S.
8.5. Дивергенция
165
Из сказанного ясно, что дивергенция а в точке г есть предел
ψ а · dS
div a = lim -——
ν—о
плотность потока вектора а через замкнутую поверхность S, которая
ограничивает бесконечно малый объём V, окружающий точку г.
Необходимо, конечно, убедиться, что определение не «стреляет в
молоко». Предел обязан существовать — иначе разговор пустой. Обоснование
возможно посредством вычисления самого предела. Для простоты, мы
ограничимся случаем, когда тело объёма V представляет собой кубик со
сторонами Δ ж, Δ у, Δ ζ, параллельными координатным осям.
Разность потоков вектора а через грани параллельные плоскости Oyz,
очевидно, равна
\дах
-χ— Δχ + ο(Δχ)
οχ
Ay Δζ.
Аналогично по другим граням, — что после суммирования даёт
дах дау
дх ду
daz
~dz~
AV + o(AV),
гДе Δ V =Δ χ·Α у-Α ζ. Переход к пределу при Δ V —> 0 с учётом определения
Дивергенции теперь приводит к формуле15
diva =
дах да-
дх
+
■ + ■
daz
ду dz
Что касается теоремы Гаусса — Остроградского, то в рамках
содержательной интерпретации она очевидна и не требует доказательства На
Если кто-то убеждён в существовании предела, то проведённые выклад-
ки показывают, чему этот предел равен. Ибо, если предел существует, то его
м°Жно искать на любой подпоследовательности. В противном случае
приходится убеждаться, что значение предела не зависит от вида Δ V, что больше
°Дходит для индивидуального размышления.
166
Глава 8. Векторный анализ
приеме у формалиста, правда, этот номер не проходит. Обоснование может
опираться на стандартную процедуру. По любому ε > 0 объём V разбивается
на столь малые элементы Vi, что
Si
a · dS — div α
<ε.
Суммирование φ a · dS даёт φ α · dS, поскольку потоки через внутренние
Si S
перегородки Si взаимно сокращаются. В итоге
φ α · dS — I divadV\
<e^2Vi = eV,
\s ν
что с учётом произвольности ε обеспечивает нужный результат.
• Если поверхность S ограничивает объём V, то в случае a(r) = г:
f
r-dS = 3V.
О
(8.11)
О
Рис. (8.11) представляет несколько возможных вариантов. В ситуации слева
г2- Δ S2 - Γι- Δ Si + ο(...) = ЗУ,
что после суммирования и перехода к пределу даёт «то, что нужно».
Остальные варианты рассматриваются аналогично.
• Уравнение теплопроводности. Вывод уравнения в данном
контексте сам по себе не представляет особого интереса. Речь о другом —
об адекватности и предпочтительности векторного языка.
Пусть T(r, t) обозначает температуру тела в точке г в момент времени *,
с — теплоемкость, р(г) — плотность.
g.6. Оператор Гамильтона
167
Допустим, элемент объёма dV массой p(r)dV за время dt нагревается
на 7E"dt градусов. Для этого необходимо количество тепла
дТ
dQ = cpdV^-dt.
στ
Интегрирование по произвольному объёму V даёт количество тепла
/дТ
cpdV—dt,
ν
идущее на нагревание (или охлаждения — тогда знак минус) этого объёма.
Если теперь через q(r,t) обозначить удельный поток тепла в точке г в
момент ί, тогда то же самое количество тепла Q можно посчитать другим
способом:
Q = - j>q- dSdt = - ί divq dVdt.
s ν
В результате бухгалтерия даёт
J(cp^+divq\ dV = 0,
что, в силу произвольности V, приводит к
ср-т- +divg = 0.
При естественном предположении q = —kgradT получается стандартное
уравнение теплопроводности
fyji
ср— - div (fcgradT) = 0
8.6 Оператор Гамильтона
Оператором Гамильтона называют дифференциальный
оператор «набла»
^ .д .д , д
V = i— +j— + fc—,
дх ду dz
представляющий собой довольно удобный инструмент. При
записи дифференциальных операций с ним можно манипулировать
168
Глава 8. Векторный анализ
как с вектором. Градиент φ, например, получается
«умножением» вектора V на скаляр φ:
.Θφ .θφ , θφ
αχ oy oz
Дивергенция оказывается равной «скалярному произведению»
векторов V и а:
_ дах дау θαζ
Эх ду dz
Удобства на этом не заканчиваются. Оператор V позволяет
компактно записывать и другие дифференциальные операции —
например, rota = V χ α (см. след. раздел), что наталкивает
на мысль о поиске определённого единства дифференциальных
операций векторного анализа, см. [5].
Отметим ещё, что под скалярным произведением V · V подразумевают
дифференциальный оператор Лапласа,
Л „2 д2 д2 с?
Δ = ν = д? + ду* + д?'
представляющий собой последовательное взятие от скалярной функции φ
градиента, а потом — дивергенции:
д2(р д2(р 32φ
divgrad^ = ^ + —\ + —£.
8.7 Циркуляция
/ P(x,y)da
Криволинейный интеграл I P(x,y)dx вдоль кривой L на плос-
L
кости Оху, где Р(х,у) — скалярная функция, заданная на. L,
определяется следующим образом. Кривая L, ведущая из
точки А = {х0,у0} в точку В = {xN,yN}, подразделяется точками
П = {хг,Уг} на малые участки, и предел суммы
У^2/Р{хиуг) Ах» где \Axj = Si-Sj-i| (8.12)
gj. Циркуляция
169
при бесконечном измельчении разбиения полагается равным
интегралу / P(x,y)dx.
Замечание. В (8.12) вместо Р(хг, у г) логичнее было бы написать Ρ(ζί, Ήί),
где {CiiVi} — произвольная точка на г-м участке кривой. Но в естественных
предположениях на результирующий предел это не влияет.
Важно обратить внимание на другое. Вместо (8.12) более ожидаемо, что
ли, было бы рассматривать суммы
^P(xi,t/i)| An I, где
ΑΠ = Гг — П-1
(8.13)
с последующим переходом к пределу. Такие криволинейные интегралы тоже
имеют юридический статус (их называют интегралами первого рода, тогда
как определённые выше — второго). Но интегралы на базе (8.12) нужнее.
Интегралы на базе (8.12) возникают в более общей задаче,
когда задано векторное поле a(r) = {P(r),Q(r)} и надо
интегрировать скалярное произведение а(г) · dr, т. е.
/ a(r) -dr= Pdx +
Qdy.
(8.14)
Если a(r) — сила, зависящая от г Ε L, то интеграл (8.14) — это
работа, совершаемая силой а(г) по перемещению точки вдоль
кривой L. И эта физическая интерпретация — один из главных
источников интереса к интегралам вида (8.14).
• Если у = f(x) описывает кривую L, рис. (8.15)-(а), то
криволинейный интеграл / ydx ничем не отличается от обыкновенного
\У
Г* Ρ
Ж i
Г*Р
(8.15)
(Ь)
170
Глава 8. Векторный анализ
ъ
определённого интеграла / f(x)dx. Отличия возникают, когда L не
α
описывается однозначной функцией у = /(ж), но и тогда сохраняются
обходные пути, состоящие в поэтапном интегрировании на участках,
где зависимость у от χ однозначна.
При этом, если L представляет собой замкнутый контур С,
соответствующий интеграл по С называют контурным и обозначают как
Φ ydx. Интересно, что (f> ydx равен площади 5, которую ограничивает
с с
контур С, рис. (8.15)-(6). Действительно, интегрирование у по С
сводится к интегрированию φι (χ) от α до 6, что даёт площадь под
графиком у = ψι(χ), плюс интеграл ψ2(χ) от Ь до а, что даёт минус-площадь
под графиком у = ψ2{χ)>
Если контур С находится не в плоскости Оху, а в пространстве
Oxyz, то при взятии того лее самого интеграла ф ydx — поскольку
с
от ζ ничего не зависит — контур С надо спроектировать в плоскость
Оху, и далее, как в предыдущем случае, интегрировать у по проекции
контура Cz. Получится
/3
» ydx = SZ,
с
где Sz — площадь, ограниченная Cz. Вместо Sz может получиться
также — 52, если учитывается ориентация.
Для любой интегрируемой функции f(x) : Φ f(x)dx = 0. ί jF 1
с
Рассмотрим теперь общий случай криволинейного интеграла
<р а(г) · dr = Φ (axdx + aydy + azdz), (8.16)
с с
называемого циркуляцией поля а(г) по контуру С.
Если а = graoV, то интеграл (8.16) по любому
замкнутому контуру равен нулю. Действительно,
άφ = V<p · dr,
8.7. Циркуляция
171
поэтому вдоль любой кривой L, соединяющей точки а и Ь,
/ V<p · dr = ip(b) - φ(ά),
L
что в случае замкнутого контура (а = Ь) даёт нуль.
Аналогом теоремы Гаусса - Остроградского при вычислении
интеграла (8.16) служит теорема Стокса:
<р а{г) · dr = rota- dS
(8.17)
где
rot о = V Χ ο
т. е.
Vx
\ ду dz J \ dz dx J \ dx dy J '
В плоском случае, когда а(г) не зависит от z, a(r) = {Р(г),<2(г*),0},
формула Стокса (8.17) переходит в формулу Грина
fpd* + Qdy = f {£-%}***
(8.18)
Ротор называют также вихрем. Он характеризует плотность
завихрения векторного поля. В случае потенциального поля (поля
градиента)
rot grad φ = 0,
что следует из представления V X V</? (либо из теоремы Стокса).
Вычисление ротора поля скоростей (8.10) вращающегося тела,
ν = ν0 + ω Χ г,
приводит к показательному результату:
rot ν = 2ω\,
который свидетельствует о связи ротора с вращением.
172
Глава 8. Векторный анализ
Вместо формулы V Χ α для определения ротора можно использовать
различные предельные переходы. Например, проекция ротора на
направление h:
ι α · dr
с
f.
roth α = lim -— , (8.19)
где контур С, ограничивающий площадь 5, стягивается в точку, при этом
вектор площади S стремится по величине к нулю, а по направлению к h.
При таком определении ротора теорема Стокса становится очевидной,
а связь с предыдущим определением ротора легко устанавливается
примерно так.
Если С стягивается в нуль, то, в силу
(\ /Л\ О0>х О0>х О0>х /и и ч
г) = МО) + -^х + -Qjj-y + -τ^ζ + o(||r||),
где производные берутся в нуле, имеем
<р α,χάχ = ах(0) ψ dx + -^- ψ xdx + -^- ψ ydx + -^- ψ zdx + ψ o(||r||)ckr,
с ее с ее
что после учёта
<р dx = <р xdx = О, <р ydx = —SZ1 ψ zdx = Sy
с с с с
и
Sz = 5cos(/i, ζ), Sy = 5cos(/i,y),
приводит к
1 / . дах /. х дах ,. х , ч
- <Ь axdx = —— cos(/i, ζ) + — cos(/i, у) + ο(·).
с
Аналогичные выкладки по другим координатам дают в итоге (8.19).
Глава 9
Гладкая оптимизация
Жизнь под предлогом оптимизации
маскирует непонимание сути.
9.1 Безусловный экстремум
Тяга к оптимизации спрятана глубоко в природе человека.
Может быть потому, что придаёт многому осмысленный вид. «Угол
падения равен углу отражения» — навевает скуку, а «свет
распространяется по наикратчайшему пути» — вдохновляет. Но
позыв больше идеологический. Укрепляет дух и направляет мысль.
Конкретные задачи не любит. Рассказывать тем не менее
приходится как будто всё наоборот. Иногда и жить так приходится.
Протуберанцы раскопок экстремальных задач уходят за
горизонт, однако начинать естественно с привычного и простого.
С теоремы Ферма 3.5.1 в первую очередь. У функции у = f(x)
к локальном максимуме в точке χ = а производная /'(а) = 0.
L/
,* ^-Т%>, Ϊ
174
Глава 9. Гладкая оптимизация
Следовательно в случае векторного аргумента, если f(x) имеет
локальный максимум в нуле, то функция одной переменной
/(0,...,0,^,0,...,0)
тоже имеет локальный максимум в нуле. Поэтому все частные
производные df(0)/dxi обязаны быть нулевыми, что означает
обращение в нуль градиента.
9.1.1 Теорема.1 Если f(x) β точке χ = χ* дифференцируема
и принимает локально экстремальное (максимальное или
минимальное) значение, то градиент У/(ж*) = О.
У функции у = /(ж 1,^2) линии постоянного уровня в районе
локального минимума χ = 0 выглядят примерно так
graoffx)
Замкнутые контуры стягиваются к центру, в котором градиент
«вынужден» быть направлен сразу во все стороны, что возможно
лишь при его обнулении.
Заметим, функции f(x) предполагаются далее гладкими. Здесь под
гладкостью подразумевается непрерывная дифференцируемость, каковая
существенна в данном контексте. Функция f(x) = 2х2 + x2sin(l/x2), например,
имеет в нуле строгий минимум и равную нулю производную, но (!) β сколь
угодно малой окрестности нуля эта производная принимает как полооюи-
тельные, так и отрицательные сколь угодно большие значения.
1 Теорема даёт лишь необходимое условие оптимума, но его чаще всего
достаточно для решения задачи, ибо условие V/(a;*)*= 0 для экстремальной
точки — обязательно. Поэтому искомое критическое значение х* попадает
в число решений системы уравнений V/(a;) = 0. Последняя обычно имеет
либо одно, либо несколько решений, среди которых уже трудно заблудиться.
g 2. Достаточные условия
175
Точки, в которых градиент обращается в нуль, называют
критическими. Их многообразие, разумеется, не исчерпывается экстремумами.
9.2 Достаточные условия
В одномерном случае разложение Тейлора
/(ζ) = /(α) + ^(ζ-α) + ^(ζ-α)2 + ...
показывает, что в критической точке а, /'(а) = 0, достигается
минимум, если /"(а) > 0, и — максимум, если /"(а) < 0. В общей
ситуации тоже можно судить о характере критической точки по
квадратичной части разложения Тейлора,
о2 г
/(ж*+ дж) = /(ж*) + v/(a;*)· дж +Σ^: AXi Лж* + °(Н Ах II2)·
Если второй дифференциал, называемый гессианом,
положительно определен, т. е.
У^ ——т:— AXi AXj > 0 при Аж^ 0,
то в критической точке ж* — минимум , ибо в малой окрестности
ж* будет /(ж*+ Δ ж) > /(ж*), потому что V/(cc*) = 0.
Если матрица Гессе3
а2/
вырождена, ситуация прин-
I dxidxj J
Дипиально усложняется. В скалярном случае о характере
критической точки можно судить по первому ненулевому члену ряда
Тейлора. Для функций η переменных дело обстоит совершенно
иным образом, и там сам чёрт ногу сломит .
2г>
о случае отрицательной определенности — максимум.
Матрица Гессе — это матрица Якоби отображения V/(x).
Предвидеть трудности, но не их масштаб, довольно легко. Вопрос
решайся в теории катастроф [6].
176
Глава 9. Гладкая оптимизация
Островок порядка характеризуется невырожденными
критическими точками, в которых невырожденны матрицы Гессе.
Классическая лемма Морса гарантирует существование в
некоторой окрестности V невырожденной критической точки, т. е.
локальной системы координат ж ι,..., χη такой, что
/ = х\ + ■ · · + х\ - х21+1 а£, χ е V. (9.1)
Функция вида (9.1) называется морсовским I-седлом. В
случае 1 = 0 имеем максимум, при I = η — минимум.
Лемма Морса даёт полную классификацию невырожденных
критических точек. Для вырожденных критических точек такой
классификации нет. Простой пример вырожденной критической
точки — обезьянье седло, которое описывается функцией
f(x,y) = x3-3xy2
9.3 Условный экстремум
Оптимизация обычно сталкивается с необходимостью соблюдения
некоторых условий. Скажем, так разделить ресурс R на части {жι,..., жп}>
чтобы добиться максимального эффекта Σφΐ(χί) —> max, но при со-
г
блюдении, разумеется, ограничения ]П χ{ ^ R.
г
Ограничений (условий оптимизации) в задаче может быть
много, но идеологически важно разобраться с простейшей
ситуацией одного ограничения. Допустим, максимизация5
f(x) —> max
сдерживается одним ограничением, которое задаётся уравнением
д(х)=0, * = {*!,..., яп}. (9.2)
5Гладкость рассматриваемых функций везде подразумевается.
g 3. Условный экстремум
177
Бели точка χ находится на поверхности д(х) = О, то в
направлении плюс-минус градиента Vg(x) двигаться нельзя — иначе
точка х сразу сойдет с поверхности д(х) = 0, и условие
нарушится, рис. (9.3)-(а). Можно смещаться в касательной
плоскости (на бесконечно малую Δ ж), т. е. перпендикулярно Vg{x).
Если градиент Vf(x) не коллинеарен Vg(x), т. е. не совпадает
но направлению с ±Vg(cc), то у V f(x) есть составляющая в
касательной плоскости к д(х) = 0, вдоль которой можно сдвинуться
и увеличить тем самым значение f(x)·
Этой последней возможности «сдвинуться и увеличить значение
/(ж)» нет: либо в вырожденном случае6, либо когда градиенты
коллинеарны,
V/(cc) = XVg(x) при некотором λ φ 0. (9.4)
Тогда в точке χ происходит касание поверхностей g(χ) = 0 и
/(ж) = /?, рис. (9.3)-(6). При этом достигается (возможно)
условный минимум. Условие (9.4), таким образом, является
необходимым, — но только в невырожденной ситуации.
Особые случаи — стандартная головная боль. Соломинка
обходится дороже стога сена, и средств на другие надобности
перестает хватать. Поэтому обычно не жалеют сил на достижение
единообразия, позволяющего обходиться без «реверансов»
6Вырожденный случай охватывает «малоинтересные» ситуации: либо
Vp(ic) = о, либо в точке χ на поверхности д(х) = 0 достигается безусловный
Минимум /(ж), и направление градиента Vg(x) не играет роли.
178
Глава 9. Гладкая оптимизация
В данном случае, например, избежать упоминания
вырожденной ситуации можно так. Если ж* — точка условного
максимума, то найдутся такие числа λο,λι, не равные нулю
одновременно, что
А0/(ж*) + \ig(x*) = 0.
Но это имеет свои минусы. Во-первых, смешивая воедино
разнородные явления, формулировка теряет лицо. Во-вторых,
рассуждения всё равно требуют разграничения возможностей.
Задачи, в которых можно положить λο = 1, характеризуют
как регулярные. Регулярными называют и соответствующие
точки минимума.
Итак, правило поиска условного минимума заключается в
решении системы (9.4)7 совместно с уравнением (9.2). На практике
это оформляется немного иначе. Задача
f(x) —» max, g(x) = 0, (9.5)
заменяется поиском экстремальной точки χ лагранжиана
L{x,X) = f(x)-\g{x) (9.6)
при надлежащем выборе λ. Знак перед λ принципиального
значения не имеет (пока).
В итоге все сводится к решению системы η + 1 уравнений:
«м- » w-^°· '-1 -
относительно η + 1 неизвестных Ж1,...,жп, λ. Коэффициент А
называют множителем Лагранжа.
Пример. Забегая несколько вперед8, решим задачу
η η
У^Пу/χϊ —> max, ^2,Xi=X, (9.7)
г=1 г=1
7Это η скалярных уравнений, поскольку градиент — вектор.
8 «Забегание выперед» связано с присутствием ограничений х% ^ 0.
д.З. Условный экстремум
179
которую можно интерпретировать как оптимальное распределение
ресурса X по п ячейкам с эффективностью Ггу/χϊ от использования ресурса в
количестве χι.
Действуя по регламенту, получаем:
η / η \
L(x,X) = Ύ^η,/χΙ-\ I Y^Xi -χ\ »
i=l \i=l /
£ = ^-λ=0' Σ*<=*> < = ι,...,η.
r г=1
Решение последней системы уравнений даёт оптимальное распределение:
*Г = Х^Н> (»-8)
Σ^
а также значение множителя Лагранжа λ* = ττλ/Σ·/ r]/X' c которым пока
не ясно, что делать (см. раздел 9.6).
Итоговая формула (9.8) получается в результате бесхитростного
решения вышестоящей системы уравнений — и нуждается по этой причине в
обосновании того, что найден действительно максимум. В первую очередь
требует проверки возможность более эффективного решения на границе
неотрицательного ортанта. Такая возможность исключена, так как производная
в нуле любой функции Ггу/χΐ бесконечна и, следовательно, у каждой ячейки
в нуле бесконечна скорость роста эффективности. Поэтому какое-то
количество ресурса всем надо давать — иначе заведомо можно получить выигрыш,
передав малую часть ресурса той ячейке, которая ничего не получила.
Таким образом, решение должно лежать внутри рассматриваемой
области и обязано улавливаться методом множителей Лагранжа. Поскольку
«метод» других стационарных решений не обнаружил — на этом можно
ставить точку.
Рассмотрим теперь ситуацию двух ограничений
gi(x) = 0 и д2(х) = 0.
Как уже отмечалось в начале раздела, чтобы оставаться на
поверхности д(х) = О, можно двигаться только перпендикулярно
гРадиенту Vg(x). В данном случае надо оставаться на обеих
поверхностях одновременно, чего можно достичь, смещаясь
перпендикулярно как V#i(cc), так и Vg2(x)· Другими словами, дви-
гаться можно лишь перпендикулярно плоскости, проходящей
через оба градиента. Если градиент целевой функции V f(x) лежит
вне этой плоскости, то у него есть составляющая в разрешенном
180
Глава 9. Гладкая оптимизация
направлении, и значение f(x) можно улучшать. В противном
случае,
\7/(ж) = XiVgi(x) + \2^92{х) при некоторых λι,\2 φ 0,
разрешённых направлений нет, и соответствующая точка χ —
кандидат на решение. В итоге вместо (9.6) лагранжианом будет
L(x,\) = f(x) - \igi(x) - \292(х)·
Разумеется, как и выше, нужны оговорки насчёт
вырожденных случаев, к каковым теперь добавляется возможность
касания в точке χ поверхностей д\{х) = 0 и д2(х) = 0, при которой
градиенты Vg\(x) и Vg2(x) оказываются линейно зависимы.
9.4 Общий случай
Решая обпгую задачу
/(ж)-»пип, д1(х)=0, ..., 0т(ж) = О, (9.9)
оптимизируют лагранжиан
т
L(x, λ) = f(x) - Σ xj9j(x)
по х при надлежащем выборе λι,..., \т.
В результате поиск условного экстремума (9.9) сводится к
решению системы уравнений
9^ = Έλ^ 9i(x) = 0, ... ,дт(х) = 0,
k = 1,... , га.
Картину портят вырожденные случаи, на рассмотрение
которых уходит много энергии с очень низким КПД. Малая
эффективность такой работы определяется двумя
обстоятельствами. Во-первых, многие исключения тривиальны и скучны. Во-
вторых, вырожденные случаи на фоне типичных ситуаций —
всего лишь «точка в континууме».
(9.10)
a 4. Общий случай
181
Последнее обстоятельство создаёт впечатление, что уйти от
рассмотрения исключительных вариантов совсем просто.
Достаточно «слегка пошевелить» условия. Подобный трюк изредка
экономит усилия, но иногда анализ вырожденных случаев
неизбежен. Например, при изучении зависимости поведения системы
от параметра. Меняющийся параметр натыкается на аномалию,
которую «не обойдешь», и это заставляет бросить всё и заняться
патологией.
9.4.1 Теорема. Если точка х* есть решение задачи (9.9), то
найдутся такие числа AjJ, λ\,..., А^, не все равные нулю, что
т
AoV/(**) = £\*Vft(**). (9.11)
г=1
Условие (9.11) вместе с gi(x*) = О, ..., gm(x*) = 0 образуют
систему η + т уравнений относительно η + т + 1 неизвестных
#ι,..., хп\ Aq, Aj, ..., Am.
Однородность по А (произвольное ненулевое λ& можно положить
равным единице) позволяет систему считать замкнутой (число
неизвестных и уравнений совпадает).
Таким образом, замена лагранжиана (9.10) функцией
т
Lq(x, А) = АоДж) - Σ Xj9j(x)
i=i
позволяет в формулировке теоремы 9.4.1 обойтись без оговорок.
На практике обычно полагают Ао = 1, и если в процессе решения
что-то настораживает, начинают разбираться в чем дело.
Любые предположения, позволяющие исключить в (9.11)
случай Ао = 0 — например линейная независимость градиентов
^9i(x*), · · ·, V#m(cc*) — называют условиями регулярности.
182
Глава 9. Гладкая оптимизация
9.5 Нелинейное программирование
Задача нелинейного программирования,
f(x) -> min,
&(χ)=0, г = 1,...,т, (9.12)
hj(x) ζΟ, j = l,...,r,
отличается от (9.9) наличием дополнительных ограничений в
виде неравенств. Ограничения в (9.12) удобно записывать в
векторном виде: д(х) = О, h(x) ^ 0. Элементы ж, удовлетворяющие
ограничениям задачи, называются допустимыми решениями.
Присутствие в ограничениях неравенств типа χ ^ 0, — вещь
характерная. Более того, с помощью дополнительных
переменных задача (9.12) приводится к виду
f(x) -> min, g(x) = 0, h(x) + ζ = 0, ζ ^ 0, (9.13)
где из неравенств фигурирует только неотрицательность
координат.
Если решение х* задачи (9.12) равносильно (9.13),
удовлетворяет неравенству hj(x*) < 0, то ограничение hj(x*) ^ 0 роли не
играет, и его можно не принимать в расчёт. Такого сорта
ограничения называют пассивными, в отличие от активных,
характеризуемых выходом решения на границу: hj(x*) = 0.
9.5.1 Теорема Каруша - Дэюона. Если точка х* есть
решение задачи (9.12), то найдутся такие числа AJjj, λ*,..., λ^ и
μ*,..., μ*, не все равные нулю, что9
т г
ASV/(**) + Σ λ?Vft(**) + Σ Whjix*) = 0, (9.14)
9 За кадром имеется в виду лагранжиан
Σο(χ,Χ,μ) = А0/(ж) + $^А^(ав) + 5^μ*Μ«)·
3=1 j=l
Обратите внимание на знаки.
g 5. Нелинейное программирование
183
причем Aq ^ 0, все дрОи
μ^(χ·)=0, j = l,...,r. (9.15)
Равенства (9.15) называются условиями дополняющей не-
эюёстпкости, и проистекают из отмеченного выше соображения
о несущественности пассивных ограничений. Если hj(x*) φ О, то
соответствующий множитель Лагранжа μ^ = О, в силу (9.15), —
что равносильно исключению неравенства hj(x) ^ 0 из списка
ограничений. Гарантия положительности коэффициентов μ*- у
активных ограничений очевидна в связи со знаком неравенств
hj(x) < 0.
Уравнения (9.14), (9.15) вместе с т ограничениями д%{х) = 0
и учётом однородности по множителям Лагранжа - приводят в
соответствие число уравнений и неизвестных. Поскольку
теорема 9.5.1 даёт лишь необходимые условия, которым обязано
удовлетворять решение задачи (9.12), ни о чем больше можно не
упоминать. Как правило, эти условия позволяют получить
желаемое. Но возможны также осложнения, связанные с
обстоятельствами, которые принято характеризовать как вырожденные.
Например, · функция /(ж) имеет безусловный минимум на границе;
• градиенты функций, определяющих ограничения, оказываются линейно
зависимы; · нет допустимых решений, т. е. отсутствуют точки ж,
удовлетворяющие ограничениям. В последнем случае система уравнений (9.14), (9.15)
плюс д(х) = 0 может иметь решение, но оно не удовлетворяет
ограничениям, и задача (9.12) оказывается неразрешимой. Теорема 9.5.1 формально
справедлива, поскольку исходное предположение просто не выполняется.
В первых двух случаях теорема также остается справедливой, но
эффективность её падает, потому что соответствующая система уравнений несет на
себе следы не вполне нормальной ситуации. Решений оказывается слишком
много, и без понимания того, что происходит за кадром, выбрать нужное —
не так просто, особенно, если речь идет о «слепом» машинном поиске.
Многие руководства, пытаясь помочь неопытным пользователям,
раскладывают возникающие варианты по полочкам в форме многочисленных
Утверждений. Эффект получается отрицательный. Ибо возникает иллюзия
наличия рецептов на все случаи жизни, но этими рецептами при
недопонимании предмета обязательно пользуются невпопад. Сказывается «слепое
чтение» теорем, при котором из поля зрения ускользают многие
предположения из-за непонимания их роли, не говоря об общей потере ориентации,
к°гда все мешается воедино. Поэтому при столкновении с нетипичными
ситуациями требуется понимание «подводных течений».
184
Глава 9. Гладкая оптимизация
9.6 Интерпретация множителей Лагранжа
Изучая множители Лагранжа, важно не упустить главное. В
результате решения экстремальных задач определяются
«ненужные» коэффициенты Aq, А|,..., А^ и μ|,..., μ*. Но они, понятно,
говорят о чем-то, что может представлять дополнительный
интерес, а то и первоочередной.
Секрет частично раскрыт условиями дополняющей
нежёсткости: если μ*: = О, то соответствующее ограничение hj(x) ^ О
пассивно. С целью дальнейшего «расследования» возьмём
задачу с одним ограничением
f(x) -> min, g(x) = 6, (9.16)
отличающуюся от (9.5) наличием числового параметра Ь.
Пусть {ж* (6), А* (6)} обозначает экстремальную точку соответствующего
(9.16) лагранжиана L(x,X) = f(x) — X[g(x) — b]. Дифференцируя
L(b) = L[a;*(6),A*(6)], получаем
S = E£§-£w»-w>-4-A-(b)
Eog dxi
7hu~db
(9.17)
dxi db db
г
В (9.17) оба выражения в квадратных скобках равны нулю по причине
df ^—ч df dx*
g(x*(b)) = b. Поэтому
dL
db
db
, где
db
С другой стороны, группируя в (9.17) слагаемые иначе:
dL ^-^ч
~db=^
dXi dXi
d4+x'^
получаем —- = А* (6). В итоге:
db
ι-*·»
(9.18)
Таким образом, А* (6) показывает скорость роста
оптимального значения целевой функции / по параметру Ь. Иными словами,
представляет собой цену ограничения. Ещё говорят о
чувствительности оптимума по отношению к ограничению.
gj. Двойственные задачи
185
В задаче распределения ресурса (9.7), например, λ* = ^ JΣ^ т]Iх Д3^1
зависимость суммарного эффекта от использования ресурса10 X системой
в целом. Это значение λ* при использовании в качестве реальной цены на
ресурс имеет то преимущество, что индивидуальная прибыль
Tiy/Χχ — A Xi
каждого элемента достигает максимума при тех значениях ресурса ж*,
которые оптимальны по суммарному критерию, т. е. для всего «коллектива».
В случае m ограничений gj(x) — bj = О чуть более громоздкие
выкладки приводят к обобщению (9.18):
Ё1
(9.19)
9.7 Двойственные задачи
Вернёмся к задаче (9.16) с одним ограничением. На рисунке
\g(x)
изображены линии постоянного уровня функций f(x) и д(х).
Поскольку, как уже отмечалось, градиенты в экстремальной точке
должны быть коллинеарны, решение задачи х* будет точкой
касания линий постоянного уровня
f(x) = с и д(х) = Ь.
При таком угле зрения понятно, что нет разницы, идет ли речь
0 задаче «/(ж) —* min, д(х) = Ь» или о двойственной задаче
«д(х) —» max, f(x) = с».
При условии его оптимального распределения внутри системы.
186
Глава 9. Гладкая оптимизация
Смена минимума на максимум при переходе к двойственной
задаче на данном этапе рассмотрения проблемы в определённой
степени условна. Проще говорить об экстремуме в той и другой
задаче. Есть две функции, / и д, и получается, что нет разницы,
какую из них оптимизировать при поддержании значения
второй — на заданном уровне. Уточнение сорта оптимизации
(минимум или максимум) возникает при некотором углублении в
задачу, когда в поле зрения попадает «правильное» построение
лагранжиана (за счет «правильного» выбора знака, см.
замечание к теореме 9.5.1).
В случае более общей задачи
/(ж)-»пип, 9i(x)=0, ..., gm(x)=0
возникает аналогичная ситуация. С точки зрения поиска
стационарных точек нет особой разницы, какая функция в наборе
{/И, gi(x), ..., gm(x)}
оптимизируется, а какие —- описывают ограничения.
Глава 10
Аналитические функции
В Поднебесной нет задач,
есть только паруса фантазий.
10.1 О роли комплексных чисел
Выход в комплексную плоскость вскрывает внутренние механизмы
многих теорий. Скажем, теория матриц без комплексных чисел (КЧ) —
вообще не теория. Начинается-то все с естественных вопросов1. Как
найти систему координат, в которой матрица А как линейный
оператор стала бы диагональной, т. е. как найти преобразование Т,
обеспечивающее трансформацию А в наиболее простую форму:
(10.1)
^ В случае (10.1) А' на векторы нового базиса {fi,... ,fn} действует
предельно просто: A'fj = Xjf'j, что после умножения слева на Т, справа на Т-1,
Даёт ТА'Т~1 ■ TfjT"1 = AjTfjT"1, т. е. AS, = Xjfj, где ϊά = TfjT"1. ►
Таким образом, для определения чисел λ^ и векторов fj надо
решить уравнение (А — Х1)х = 0, каковое может иметь непулевые ре-
Разговор пока для создания подходящего настроения. Поэтому
технические детали играют роль декораций, на которые не надо обращать
причального внимания.
Ω7
А' = Т-гАТ =
λ!
ληη
188
Глава 10. Аналитические функции
шения χ = fj лишь в случае, когда матрица А — XI вырождена, т. е.
det(^ — XI) = 0, что называют характеристическим уравнением
матрицы Л, его решения λ^ — собственными значениями, а
соответствующие ненулевые решения fj — собственными векторами матрицы А.
Далее линейный анализ подходит к фундаментальному
поворотному моменту. Если уравнение det(A — XI) = О имеет
η различных действительных корней λ^, то все слишком
хорошо. Каждому λ^ соответствует свой собственный вектор (j. Эти
векторы составляют базис новой системы, в которой матрица
Т~1АТ принимает диагональный вид, а матрица перехода Τ
образуется столбцами fj.
Угроза потери этих благ из-за того, что полином n-й
степени редко имеет η действительных корней, подталкивает к
выходу в комплексную плоскость С. Там характеристическое
уравнение всегда имеет η корней. Но если параметр λ
комплексный, то к рассмотрению надо допускать комплексные векторы,
иначе нет смысла говорить о ненулевых решениях χ уравнения
(А - Х1)х = 0.
Затем возникает необходимость в сдаче следующей позиции.
Столбцы (j (теперь комплексные) образуют в совокупности
матрицу перехода Т, которая приводит А к диагональной форме
Т_1АТ, причём у Т~1АТ на диагонали могут стоять в том числе
комплексные λ^. Получается, что надо допускать к
рассмотрению комплексные матрицы. Поэтому проще всего — и
целесообразнее с самого начала все считать комплексным. Конечно,
не все так просто, как поначалу кажется, — подробности в [2,
т. 3] но комплексный вариант не только спасает теорию
матриц от блуждания впотьмах, но и открывает многие ракурсы,
которые иначе остались бы незамеченными. Спектр матрицы в
С, например, гарантирует в Rn асимптотическую устойчивость
системы χ = Ах+Ъ, если Re Xj < 0 для всех j. Система χ = Ах+Ъ
изначально «действительна», но её поведение оказывается
следствием «комплексных пружин». И такое положение вещей
характерно для действительного анализа вообще.
10.L О роли комплексных чисел
189
Вычисление k-й производной функции у = —^— весьма обременитель-
х + 1
но. В то же время, представление функции в виде
= г_ /__1 1_
2 \х + г χ — г
легко даёт
У(к) = J(-Dfcfc!
что легко переводится в действительную форму.
КЧ резко упрощают теорию колебаний, электричество.
Законы волновой оптики странным образом оказываются
согласованы с правилами умножения комплексных чисел. Потом вдруг
обнаруживается, что изучение линейных дифференциальных
уравнений без КЧ вообще невозможно. Постепенно становится ясно,
что это не просто удобная вещь, а фантастически удобная.
Дальше — больше. Получается, без комплексных чисел никуда нет
ходу. Даже в теорию вероятностей. Даже в теорию чисел.
Тогда размышления устремляются в другое русло. В чем
причина? Почему добавление к колебанию фиктивной мнимой части
всё упрощает? Почему, чтобы найти радиус сходимости ряда
ао + а\х + а2Х2 + ...
для вещественного χ надо изучать поведение ряда в комплексной
плоскости (причём иначе — невозможно)? Откуда у
вспомогательного инструмента такая колоссальная мощь и проникающая
способность? Вот в чем источник подозрения, что какая-то
космическая тайна стоит за кадром.
Сегодня на все эти вопросы есть простые и ясные ответы,
которые начали созревать и оформляться относительно
недавно — в девятнадцатом веке. До этого в суждениях о
комплексных числах даже таких великих математиков, как Лейбниц и
Эйлер, преобладали эмоции. И очень трудно сказать, чего им не
Хватало, ибо сегодняшние ответы в общих чертах они бы могли
сформулировать и тогда. Разница едва ли не идентичных
формулировок была бы в наполненности несколько иным содержанием,
в Других акцентах, в другом понимании тех же самых слов.
Последние двести лет дали массу интересных примеров, породили
I (ж + г)
•\fc+l
(х-г)
fc + l
190
Глава 10. Аналитические функции
серию других «нереальных» инструментов. Кроме того, вымерли
многие несостоятельные идеи. Все это вместе взятое наполнило
старые формы новым содержанием.
Первый слой понимания сути комплексных чисел внешне
достаточно прост. Введение операций сложения и умножения для
натурального ряда инициирует цепную реакцию. Обратные
операции — вычитание и деление — влекут за собой необходимость
появления отрицательных чисел, потом дробей. Аналогичная
ситуация возникает в связи с извлечением корней, что приводит к
появлению мнимой единицы, а потом — с учётом сложения и
умножения — комплексных чисел.
Иными словами, на целых положительных числах вводятся
арифметические операции, после чего натуральный ряд
расширяется до максимального игрового поля. Такое поле дают
комплексные числа. Процесс расширения однозначен, и дальше
пути, кстати, нет2.
На следующем витке спирали возникает вопрос о широком
распространении комплексных чисел. Почему они неожиданно
всплывают то там, то здесь? Ответ прост. Потому, что вся
математика стоит на арифметических операциях, для которых
комплексные числа - неизбежный финал расширения натурального
ряда. Поэтому игра идет на едином общем поле.
10.2 Д ифференцируемость
Функцией комплексного переменного ζ = χ + гу можно было бы
считать любую функцию вида
f(z) =u(x,y)+iv(x,y),
но тогда, с точностью до декораций, все свелось бы к изучению
отображений на плоскости, / : R2 —> R2,
[у.
2Например, кватернионы (трехмерные числа) рассматривают иногда как
обобщение КЧ, но это вопрос словоупотребления. Умножение кватернионов
некоммутативно (ab фЪа),п потеря тех или иных свойств «арифметических
операций» неизбежна при любом расширении поля комплексных чисел.
u(x,y)
[v(x,y)
1
j0.2. Дифференцируемость
191
Аналитические функции, изучаемые в ТФКП, выделяет
особое понятие дифференцируемости, каковая определяется как
представимость приращения функции в виде
Δ f(z) = f(z+ Α ζ)- f(z) = Α Δ ζ + o(| Δ ζ\),
(10.2)
где А — комплексное число, зависящее от точки ζ, которое
называют производной f(z) в точке ζ, и обозначают f'(z), либо -*-.
Может показаться, что ничего особенного в таком
определении нет, но это только на первый взгляд. Если бы речь шла,
например, просто об отображении плоскости, то определение диф-
ферснцируемости / совпадало бы по записи с (10.2), но А было
бы матрицей,
А =
гди
дх
dv
idx
dui
ду
dv
ду]
(10.3)
Мы же хотим, чтобы А было комплексным числом3. Это очень
сильно ограничивает класс рассматриваемых функций.
Определение производной записывают также в виде
f'(z) = lim
Δζ—>0
f(z+ Δ ζ) - f(z)
Δ ζ
(10.4)
но в (10.4) требуется дополнительно независимость предела от
пути стремления Δ ζ к нулю, что приводит к необходимости
выполнения для f = u + iv условий Коши — Римана:
ди _ dv dv ди
дх ду' дх ду
(10.5)
Необходимость (10.5) устанавливается совсем просто.
Другими словами, чтобы действие матрицы А на Δ ζ было эквивалентно
Умножению на комплексное число (растяжение плюс поворот). Такие
матрицы, как известно, имеют вид к · . h откуда следует необхо-
[smcp cosy? J
Димость условия (10.5).
192
Глава 10. Аналитические функции
< В случае Δ ζ =Δ ж -МО и Δι->0 вычисление предела (10.4) даёт
u(x+ Ах,у) -u(x,y) .v(x+ А х,у) -у(х,у) _^ ди .ду _ ,
Ах Ах дх дх
в случае Az = 0-t-iAyuAy—>0 тот же предел (10.4) оказывается равным
и(х, у+ А у) - и(х, у) .v(x,y+ Ay) -v(x,y) dv .ди ,
г- h г — ► д г— = f {z),
г Ay г Ay ay ay
Оба варианта обязаны совпадать, что и приводит к (10.5). ►
(!) Независимость предела (10.4) от характера стремления Δ ζ к нулю —
позволяет вычислять производную f{z) любым удобным способом:
,( df ди .dv ,. .df dv .du
ηζ) = 8ϊ = 8ϊ+ιτϊ либ° /{ζ) = -% = ^-%-
С учётом (10.5) это даёт дополнительно:
„,, х ди .ди „,, х dv .dv ,ЛГ^^
f{z) = ^-%' fiz) = ^+^· (ια6)
10.2.1 Необходимые условия Коши — Римана (10.5) в случае
непрерывности частных производных функций и, ν в некоторой
области D достаточны для дифференцируемости f в D, т. е.
в каждой точке ζ G D.
< В силу непрерывности частных производных4:
Δ и = и{х+ Δ ж,у+ Δ у) - и(х,у) = —Δχ+—Δί/ + ο(|Δ ζ\).
ox oy
Аналогично для Δ ν. С учётом условий Коши — Римана это приводит к
Δ f(z) =Au + i Av= (-Γ^+ i-τ- ) (Δ χ + г Δ у) + ο(\ Δ ζ\),
что совпадает с определением (10.2). ►
(!) Требование непрерывности частных производных в п. 10.2.1 —
необязательно. Достаточно дифференцируемости и и ν как функций
действительных переменных в каждой точке (ж, у) £ D, для чего одного лишь
существования частных производных не хватает [2, т. 1].
4Ниже Δ обозначает (пока) приращение, а не оператор Лапласа.
10.3. Примеры
193
10.2.2 Функции, дифференцируемые в некоторой области D,
называются аналитическими в D.
Тавтология терминов может показаться странной. Зачем для
дифференцируемой функции выдумывать ещё одно имя? Но тут
есть исключительное оправдание. Оказывается, аналитические
функции обладают совершенно неожиданным свойством. Дело
заключается в следующем. Обыкновенный анализ приучает к
мысли, что функция может быть дифференцируема либо один
раз, либо два, либо η раз. Как будет показано далее, имеет место
удивительный факт:
Аналитическая функция, дифференцируемая по
определению всего один раз, оказывается бесконечно
дифференцируемой.
10.3 Примеры
Несмотря на довольно жёсткие рамки дифференцируемости,
аналитические функции весьма многочисленны и разнообразны.
1. Функция f(z) = zn при любом натуральном η дифференцируема, её
производная f{z) = ηζη~λ легко вычисляется:
{Ζ+ Δ г)П ~ *" = пг-1 + (...)· Δ z-tnz-1
Α ζ
при Δ ζ —> 0. Независимость от характера стремления Δ ζ к нулю очевидна.
2. Сумма и произведение аналитических в D функций fi(z) и /2(2) —
аналитичны в D. Функция fi(z)/f2(z) аналитична в D всюду, где /2(2) φ 0.
Композиция аналитических функций, f(g(z)), аналитична.
< Обоснование слово в слово повторяет обычные доказательства
аналогичных утверждений (по поводу дифференцируемости) в случае
действительного аргумента. ►
3. Функция f(z), представимая сходящимся в некотором круге (\z\ < R)
Рядом
оо
f(z) = ^2anzn,
аналитична при \z\ < R. Пример дается пока авансом .
До рассмотрения вопросов сходимости комплексных рядов.
194
Глава 10. Аналитические функции
4. Положим
е2 = ех (cos у + г sin у) = ex+iy.
На действительной оси функция совпадает с ех. Условия Коши — Римана
легко проверяются. (?) Это может служить пока формальным
определением комплексной экспоненты. Более глубокие мотивы такого определения
вскроются позже.
5. Функция f(z) = \z\2 = х2+у2 не аналитична. Условия Коши — Римана
выполняются только при ζ = 0.
Из перечисленных примеров может возникнуть впечатление,
что почти все функции аналитичны. На самом деле, конечно,
«почти все — не аналитичны». Но практика сталкивает нас в
большинстве случаев с аналитическими функциями: синусы,
логарифмы, дробно-рациональные выражения и т. п.
С оазисом аналитических функций соседствуют и обескураживающие
примеры. Не аналитична функция ~ζ = х — гу. Сопряжение нарушает
аналитичность и в общем случае. «Зеркальный образ»
f(z) = u(x,y)-iv(x,y)
и сама функция f(z) = u(x, y)+iv(x, у) не могут обе удовлетворять условиям
Коши — Римана, если не говорить о тривиальном исключении f(z) = const.
Нигде не дифференцируема, скажем, функция f(z) = 2х + гу, что
указывает на широкое поле контрпримеров, если в таковых есть потребность.
Однако теория, как и Вселенная, растёт в благоприятных направлениях.
10.4 Простейшие свойства
Остановимся на некоторых свойствах аналитических функций,
где понимание достигается малой кровью.
1. Чем меньше окрестность точки ζ, тем точнее
выполняется соотношение Δ / = f(z) Δ ζ, которое означает, что все Δ я
поворачиваются на один и тот же угол и растягиваются в одно
и то же число раз. Растяжение и поворот определяются
множителем ff(z). Поэтому малые фигуры переводятся функцией f θ
подобные (углы сохраняются, размеры пропорционально
изменяются — разумеется, с точностью до «о малых»). Это служит
основанием называть такие преобразования конформными.
iQ.4- Простейшие свойства
195
Разумеется, если кривые пересекаются в плоскости ζ под
углом ol, то их образы при отображении / пересекаются в точности
под углом ol без всяких «о малых».
2. Тот факт, что аналитическое преобразование w = f(z)
локально представляет собой растяжения и повороты, влечет за
собой обязательное сохранение ориентации. Иначе говоря, образы
всех маленьких вихрей оказываются закручены в ту же сторону,
в силу чего невозможны отражения. Именно поэтому диффе-
ренцируемость f(z) исключает дифференцируемость f(z). При
этом двукратное сопряжение f(~z) сохраняет аналитичность.
3. Задание частных производных определяет функцию с
точностью до константы. Поэтому задание одной из функций и(х,у),
v(x, у), в силу условий Коши — Римана, с точностью до
константы определяет вторую.
4. В силу условий Коши — Римана
Vu · Vt> = uxvx + UyVy = —uxuy + uyux = О, (Ю.7)
т. е. градиенты функций u(x,y) и v{x,y) ортогональны β
любой точке ζ, а значит, ортогональны линии постоянного уровня6
функций ии v.
5. Дифференцируя условия Коши — Римана и исключая одну
из функций и или ν, легко убедиться, что обе удовлетворяют
Уравнению Лапласа:
и являются таким образом гармоническими функциями, хорошо
известными благодаря другим источникам происхождения.
Кто знаком с дифференциальными уравнениями в частных
производных, может сразу сделать неожиданный (для
аналитических функций) вывод. Задание поведения гармонической
функции на границе области полностью определяет её значения
внутри области. Для дифференциальных уравнений такая связь
естественна и привычна, но для ТФКП - несколько шокирующа.
Семейства кривых и(х,у) = С, v(x,у) = С.
196
Глава 10. Аналитические функции
Все, чем занимается теория аналитических функций, — как
выясняется — это изучение решений одного дифференциального
дх2 + ду2
противоположным образом: «Неужели теория одного дифура —
это целая ТФКП?»7
уравнения —^ Η ^ = 0. Специалисты по дифурам удивляются
Гидродинамическая модель. Вектор скорости
и(х, у)
?{х,у)\
1
двумерного безвихревого потока — без источников и стоков — обязан
удовлетворять двум уравнениям
ди dv dv ди .
divv= —+ —=0, rotv = - -s-=0· (10·8)
ox oy ox ду
Чтобы (10.8) совпадало с условиями Коти — Римана, достаточно взять
за исходную функцию
f(z) =u(x,y)-iv(x,y),
каковая «видится в зеркале» при наблюдении за f(z). В данном случае
аналитической должна быть f(z), но не f(z), — если желательно говорить об
условиях Коти — Римана.
Линии тока в модели совпадают с траекториями дифференциального
уравнения ^ = f(z). Взаимосвязь моделей (ТФКП и гидродинамики)
двусторонняя. Интуитивные представления о ламинарных течениях позволяют
кое-что заключать об аналитических функциях, и «наоборот».
10.5 Контурные интегралы
Комплексный интеграл / f(z)dz вдоль кривой L можно рас-
г
гммы
Y^f(zk) Azk
L
сматривать как предел суммы
7 Здесь есть некоторая натяжка в ту и другую сторону.
j0.5. Контурные интегралы
197
при стандартном измельчении разбиения либо, пользуясь тем,
что криволинейные интегралы действительных функций
определены как
/ f(z)dz = / udx - vdy + i / udy + vdx,
L L l
что получается после перемножения / = u + iv и dz = dx + idy.
10.5.1 Теорема Коши. Пусть функция f(z) аналитична в
односвязной области D. Тогда интеграл от f(z) no любому
замкнутому контуру С, лежащему в D, равен нулю8.
Ч Доказательство моментально даёт применение к
<р f(z)dz = <р udx — vdy + г <р udy + vdx,
ее с
формулы Грина (8.18) с последующим учётом того, что и и υ удовлетворяют
условиям Коши — Римана. ►
В условиях теоремы 10.5.1, если кривые L\ G D и L<2 € D
имеют одни и те же концевые точки а, 6, то
J f(z)dz = J f(z)dz, ^^β (10-9)
что сразу получается интегрированием по замкнутому контуру
(10.9). Но для этого (!) внутри контура, образованного
кривыми L\ и L2, не должно быть особых точек, в которых f(z)
недифференцируема9. Другими словами, интеграл / f(z)dz
L
lz не
8 Теорема Коти остаётся справедливой и в более общем случае. Область
£* может быть неодносвязной, но тогда контур С должен быть таков, чтобы
его можно было стянуть в точку по области D. Либо интегрировать надо по
совокупности контуров, ограничивающих D, см. [2, т. 9].
Иначе нарушается предположение теоремы 10.5.1 об аналитичности
Функции f(z) в области D.
198
Глава 10. Аналитические функции
зависит от пути интегрирования, а определяется лишь
начальной и конечной точками. Поэтому вместо / f(z)dz можно писать
L
£ ь с ь
I f(z)dz. При этом очевидно свойство аддитивности: /=/+/.
О α α с
Положим
ζ
F(z) = J f(w)dw,
a
где подразумевается путь интегрирования по произвольной
кривой, лежащей в D и ведущей из α в ζ.
Легко показать, что функция F(z) аналитична, причём
F'(z) = f(z)
Действительно,
z-\-bz
F(z+ A z)- F{z) = I f(w)dw,
откуда
F(z+ Az)-F(z)
Az
Z-\-bZ
z-\-e&
Интеграл / f(w)dw стремится к нулю при Δ ζ —> 0, что и обеспечиваг
ζ
ет F'{z) = f(z). Множество первообразных Φ(ζ), Φ'(ζ) = f(z), называют
неопределённым интегралом функции f(z). Очевидно, первообразные
отличаются друг от друга на константу. Поэтому для любой из них
ъ
J ί{ζ)άζ = Φ{ο)-Φ{α).
Примеры.
• Функция ζη при любом η = 1,2,... аналитична везде. Поэтому
интеграл от ζη по любому замкнутому контуру равен нулю.
10.5. Контурные интегралы
199
• Пусть С — окружность радиуса R с центром в нуле. Тогда
/
dz
— =2πι
ζ
(10.10)
Это важный факт. Интеграл легко вычисляется в полярных координатах,
ζ = R(cos φ — i sin φ) = Re~1(p,
а так как R = const, то
dz = R(— sin φ — i cos φ)άφ = iRe~t(pd(f.
Поэтому
27Г
φ — = i I d(p = 2m.
с о
Интеграл оказывается не равным нулю, но противоречия с теоремой
10.5.1 нет, поскольку функция \/z не аналитична в нуле, и контур С
нельзя стянуть в точку в R2\0. Именно последнее обстоятельство является
критичным для справедливости теоремы Коти. Область D на самом
деле может быть какой угодно. Если контур С можно стянуть в точку в
области D, то интеграл от f(z) no С будет равен нулю
Для дальнейшего важно ещё отметить аддитивность
контурного интеграла в следующем смысле. Если контуры С\ и С2
имеют общий участок Ci2, после выбрасывания которого
образуется контур С, причём Си проходится в противоположных
направлениях при интегрировании по С\ и С2, то
Φ f(z)dz + Φ f(z)dz = Φ f(z)dz
C\ C2 С
Это не что иное как свойство слагаемых противоположных знаков
взаимно сокращаться. Ситуация на рис. (10.11)-(а) абсолютно прозрачна.
lBj*~.
\ (10.11)
200
Глава 10. Аналитические функции
На рис. (Ю.П)-(Ь) изображен более сложный пример. Функция f(z) аналв-
тична в кольце, ограниченном малой Сг и большой окружностью Cr.
Интеграл по замкнутому контуру Сгд, проходящему Cr против часовой стрелки,
потом по В А, затем Ст по часовой стрелке, затем возврат в исходную точку
по АВ, — равен нулю. Поэтому
что является следствием
Φ f(z)dz = Φ f(z)dz,
Φ f(z)dz + Φ f(z)dz = Φ f(z)dz.
(10.12)
CrR
10.6 Интеграл Коши
Пусть функция f(z) аналитична внутри контура С и на самом
контуре С. Тогда -"—'- как функция w аналитична на С и
внутри С за исключением точки w = ζ. Поэтому
<f^dW=i^dw, (Ю.13)
J W — Ζ J W — Ζ
где Сr обозначает окружность радиуса г с центром в ζ.
Равенство (10.13) можно получить так же, как и (10.12), поскольку в
обосновании (10.12) никакой роли не играло, что Cr окружность.
Поскольку f(w) = f(z) + o(w — z), то
J w- ζ J w - ζ J
O7· O7· O7·
dw f o(w — ζ) ,
+ φ — Ldw.
w — ζ J w — ζ
(10.14)
При г —> 0 второй интеграл справа в (10.14) обнуляется, а
первое слагаемое, в силу (10.10), оказывается равным f(z) · 27ri
В результате
(10.15)
что называют интегральной формулой Коши.
j0.6. Интеграл Коши
201
В случае, когда С является окружностью CV, представляет интерес
перейти в (10.15) к интегрированию в полярных координатах:
w = ζ + rei(p, dw = ιτβφάφ.
В результате получается формула
2тг
или, равносильно,
О
(10.16)
где ds — дифференциал дуги окружности Сг.
Выходит, что }{z) в точности равно среднему значению f на
окружности Сг с центром в ζ.
10.6.1 Принцип максимума модуля10. Функция f(z), не равная
константе , и аналитическая на замыкании области Ω, — может достигать
максимума своего модуля \f{z)\ только на границе области Ω.
< Доказательство легко вытекает из факта (10.16), ибо при равенстве
среднего значения / на окружности СГ значению / в центре СТ — максимум
модуля |/| в центре — невозможен. Поэтому во внутренней точке области
невозможен локальный максимум модуля, тем более — глобальный. ►
Бесконечная дифференцируемость. Уникальность
ситуации, которую улавливает интегральная формула Коши,
заключается в том, что (10.15) можно продифференцировать по
параметру ζ и получить
/& \т=Ц^-
(10.17)
потом снова продифференцировать (10.17) по ζ, получить
формулу для второй производной,
™-hiA»·
Принцип максимума имеет многочисленные следствия, широко
применяемые в качестве подручных инструментов.
202 Глава 10. Аналитические функции
и так до бесконечности,
Перенос дифференцирования под знак интеграла здесь легко
обосновывается, поскольку дифференцирование под интегралом саму функцию /
вообще не затрагивает.
В результате выявляется уникальная вещь. Аналитическая
функция оказывается бесконечно дифференцируемой сама по себе, без
каких бы то ни было дополнительных требований. Интеграл Копш
даёт наиболее простой ключ к пониманию этого факта. Функция f(z) в силу
(10.15) определяется интегрированием самоё себя, а поскольку интеграл
обладает улучшающими свойствами11, то f(z) обязана быть лучше, чем того
можно ожидать. Выход из положения один — быть «бесконечно хорошей».
10.7 Регулярность
10.7.1 Теорема. Если функция f(z) аполитична в некоторой
окрестности W точки а, то она представима рядом Тейлора,
f(z) = Да) + f'(z)(z - а) + · · · + ^P-(z -< + ..., (10.19)
в любом шаре \ζ — α\ < г, принадлежащем этой окрестности .
< Для доказательства возьмём максимальное г, при котором контур С г
принадлежит W, и рассмотрим сумму бесконечно убывающей
геометрической прогрессии
— = —+ 7^ + ... + J!z-£L_ + ..., (10·20>
w — z w -a (w - a) (w - a) +
где w € Cr, ά ζ лежит внутри Сг, и потому знаменатель прогрессии (ζ —
a)/(w — а) по модулю меньше единицы. В результате ряд (10.20) на СТ
сходится равномерно. Умножая (10.20) на f(w) и интегрируя по Сг, с учётом
(10.18) получаем (10.19). ►
11 Из непрерывной функции делает дифференцируемую.
12 Ситуация кардинально отличается от той, которая имела место в
случае функций действительной переменной. Там ряд Тейлора мог сходиться
вообще к другой функции (см. раздел 3.7).
IQ. 7. Регулярность
203
Ю.7.2 Определение. Функция, предстпавимая рядом (10.19),
сходящимся в некоторой окрестности точки а, называется
регулярной, или голоморфной в точке а.
Казалось бы, ещё один перехлёст в нагромождении терминов. Диф-
ференцируемость в окрестности ζ, аналитичность и регулярность —
просто совпадают. Но это в ТФКП. В анализе на действительной
прямой это совершенно различные понятия. Кроме того, в самой ТФКП
за каждым понятием стоят свои собственные особые признаки, что
удобно для расстановки акцентов. Упоминание регулярности
функции, например, подчеркивает её разложимость в ряд Тейлора1^.
10.7.3 Теорема. Любой степенной ряд с ненулевым радиусом
сходимости является рядом Тейлора своей суммы.
Разумеется, это переформулировка теоремы 10.7.1. Однако новая
форма часто привносит дополнительные краски, и «процесс» начинает
развиваться другим путём. Благодаря теореме 10.7.3 на степенные
ряды можно смотреть как на ряды Тейлора. При этом фундаментальную
роль играет следующий простой результат.
10.7.4 Теорема Абеля. Если ряд 2_\°ηζΎΙ сходится при каком-то
п=0
ζ, равным по модулю г, то при условии \ζ\ < г он сходится
абсолютно, а при \ζ\ ^ г — ε (ε > 0) — ещё и равномерно.
< Из сходимости со 4- C\z + ciz7, + · · · вытекает CnZn —> 0, а значит и
ограниченность: |cnr-n| < М. Поэтому для \z\ < г будет
Σι*.*Ί = Σι*·'·ηι· ί <ΜΣ
< со,
что обеспечивает абсолютную сходимость в круге \ζ\ < г. Аналогичная
выкладка даёт требуемую равномерную сходимость. ►
Использование в ТФКП рядов Тейлора в качестве стандартного
инструмента удобно, но не обязательно. Использование других рядов
Тем не менее, на прилагательные аналитическая, регулярная и
голоморфная (функция) надо смотреть как на синонимы. Это главное. Что-
6bI фразы типа «аналитическая функция голоморфная в такой-то
области» — не ставили в тупик. Особенно поначалу. Потом уже синонимам мож-
Но придавать оттенки.
204
Глава 10. Аналитические функции
имеет свои плюсы и минусы. Широкое распространение при изучении
аналитических функций получили, например, ряды Лорана
оо оо оо
/(*)= Σ <=η(ζ-α)η = Σοη(ζ-αΤ + Στ^-. (10.21)
п=—оо π=0 π=1 ^ '
Первое слагаемое справа в (10.21) представляет собой обыкновенный
степенной ряд, сходящийся в некотором круге радиуса R\. Второе
слагаемое после замены w = -=-^— тоже превращается в обыкновенный
степенной ряд, который сходится в плоскости w в круге радиуса i?2, a
в плоскости ζ — вне круга радиуса 1/В,2-
Поэтому областью сходимости (10.21)
является кольцо, рис. справа, что и служит
причиной популярности рядов Лорана.
Чтобы накрыть изолированную особую точку
требуется бесконечно много «кругов Тэйло-
ра» либо одно «кольцо Лорана».
Несложные выкладки показывают, что коэффициенты в ^10.21)
могут быть определены при любом η по единой формуле
27гг J (z —a
/w-*.
с {ζ~α)η+1
С — произвольный замкнутый контур, лежащий в кольце
1
_ <\z-a\<Rx
и охватывающий точку а.
Коэффициент
= hjf{z)dz (10·22)
С
в разложении (10.21) называется вычетом и обозначается res(/, a).
10.7.5 Теорема. Пусть функция f(z) однозначна и аполитична на
замкнутом контуре С и внутри него за исключением конечного числа
точек αϊ,..., α*. Тогда
I f(z)dz = 2ттг[ге8(/, аг) + ·. · + res(/, о*)]. (10.23)
с
φβ. Аналитическое продолжение
205
4 Аддитивность контурного интеграла сводит Φ к сумме контур-
с
пых интегралов по маленьким окружностям с центрами в особых
точках. Это и даёт (10.23). ► Инструмент (10.23) широко применяется
ддя решения многочисленных задач.
10.8 Аналитическое продолжение
Благодаря теореме 10.7.1 степенные ряды в ТФКП играют роль
универсального инструмента. Но при этом есть свои трудности. Например,
функция у-^— представляется степенным рядом
который сходится при \ζ\ < 1 (крут А). В то же время функция
аналитична везде за исключением ζ = 1. Поэтому её можно
разложить в ряд в любой точке α φ 1. Получится другой ряд Тейлора,
который будет сходиться в другом круге В (10.24). В каком
соотношении находятся эти ряды и сама функция .. _ ? За кадром здесь
просматривается очевидная идея.
Если на области А (речь идет уже не обязательно о кругах)
задана аналитическая функция fi(z), на В — /г(^), и на пересечении
А Р| В значения функций совпадают, то было бы хорошо /2(2) считать
продолжением fi(z) на более широкую область (равно как и fi(z) —
продолжением /г(^))· Чтобы такой трюк был законным, не хватает
«малости» — гарантий единственности продолжения.
10.8.1 Теорема единственности. Пусть функции f (z) ug(z) ана-
литичны в области D, и их значения совпадают в различных точках
ап g D, причём ап —> a G D при η —» оо. Тогда f(z) = g(z) в D.
< Доказательство. Очевидно, аналитическая в D функция h(z) = f(z)—
9(ζ) в точках ап обращается в нуль, а потому и h(a) = 0, в силу ап —> а и
непрерывности h. Поэтому в разложении
206
Глава 10. Аналитические функции
h(z) = со + ci(z - α) + c2(z - α)2 + ... (10.25)
коэффициент со = 0. Следовательно, h(z) = (ζ — a)hi(z). Но тогда
h(an) = 0 -* /ΐι(αη)=0.
Снова, по непрерывности, hi (α) = 0, что означает с\ = 0. И так далее. Все
коэффициенты в разложении h оказываются нулевыми. Поэтому h(z) = 0 в
круге сходимости ряда (10.25), т. е. f(z) = g(z).
Окончательный вывод о тождественности
нулю h(z) в D вытекает из возможности
попасть в любую точку w £ D по цепочке
пересекающихся кругов, рис. слева, в
каждом из которых h(z) разлагается в свой
ряд Тейлора, и повторяется предыдущее
рассуждение (для некоторой новой
последовательности α,η из предыдущего круга,
где уже h(z) = 0). ►
Из доказательства легко усмотреть, что аналитичность14 влечет
за собой изолированность нулей. Но главный вывод заключается,
если можно так сказать, в «голографическом устройстве»
аналитических функций. Целое отражается в любом маленьком фрагменте.
Задание функции на кусочке дуги определяет все остальное.
Поэтому функции ех, sin ж, In ж на действительной прямой
автоматически порождают соответствующие функции в комплексной
плоскости. Вопрос лишь в том, как их найти. Когда выдвигаются какие-
нибудь дополнительные требования, проблема может оказаться
сложной, но принципиально она всегда разрешима. Разложение в
степенные ряды позволяет гарантированно расширить область определения
аналитической функции до максимальных размеров. Иногда это
реализуется совсем просто. Скажем, в ситуациях
оо п оо 2п+1
η=0 η=0 ν '
в которых ряды имеют неограниченный радиус сходимости,
достаточно поменять действительное χ на комплексное ζ — и аналитические
функции ez и sin ζ готовы. В случае логарифма,
ΐηχ = Ε(-ΐΓ-1^ΣΐΓ
^—' Г)
14Имеется в виду функция, не равная тождественно нулю.
10.9. Теорема, Руше
207
проблема сложнее. Конечно, χ здесь можно заменить на ζ, но это даст
лишь ряд Тейлора, сходящийся в круге единичного радиуса, тогда как
логарифм определен в гораздо более широком диапазоне15. Надежный
выход из положения заключается в расширении области определения
пошаговым переходом к другим рядам по цепочкам пересекающихся
кругов. Это обязательно приведет к успеху, но только
«идеологическому». Логарифм везде, где возможно, будет определен и даже
вычислим, но единой формулы это не даст. Простая формула,
J W
1
получается совсем из других соображений. Но это уже вопрос удачи,
а не систематического подхода.
В сказанном важно обратить внимание на следующий аспект.
Любая аналитическая функция может быть продолжена до функции,
определённой на максимально возможной области. Для sin ζ — это
вся плоскость, для γ-^ плоскость с выколотой точкой ζ = 1. Но
так или иначе появляется возможность вообще не упоминать область
определения, считая f(z) определённой везде, где возможно. Это ещё
одна удивительная особенность ТФКП. Область определения
задаётся самой функцией.
Функции, аналитичные на всей комплексной плоскости,
называются целыми, и с ними меньше всего хлопот. Любое их разложение в
ряд Тейлора сходится при любом ζ. Там же, где необходимо прыгать
по цепочкам кругов, — может возникать проблема многозначности,
связанная с тем, что продолжение по различным путям даёт разные
результаты16. Такая ситуация вполне типична. Самые обыкновенные
функции yfz, In z — многозначны, и это заставляет разрабатывать
инструменты для борьбы с неудобствами, см. [2, т. 9].
10.9 Теорема Руше
Сначала несколько слов об особых точках, как о засасывающих воронках.
Их никто, как правило, не хочет изучать, поскольку — «не до аномалий». Но
они иногда требуются не сами по себе, а как инструмент решения проблем,
15 Логарифм определен везде за исключением действительной полуоси
(—оо,0). Говорят: на комплексной плоскости с разрезом по (—оо,0).
16В этом случае внутри контура, образуемого разными путями,
обязательно имеется особая точка.
208
Глава 10. Аналитические функции
где патология нависает виртуально, как «угроза». Кроме того, аномалия —
обычно наиболее информативная часть явления в целом.
Точку ζ = α называют изолированной особой точкой функции /(г), если
f(z) аналитична и однозначна в некотором кольце
0 < \z - а\ < г,
а в самой точке а — не дифференцируема. Если дифференцируемость в а
восстанавливается при доопределении значения функции в этой точке, то а
называют устранимой особой точкой17.
Если все коэффициенты с_п разложения Лорана f{z) в а равны нулю
при η > /с, но с_к φ 0, точку а называют полюсом к-го порядка.
О нулях и полюсах аналитической функции }{ζ) удобно судить по
логарифмическим вычетам, каковыми называют обычные вычеты (10.22)
производной логарифма
[ln/(*)]' = 5g·
При этом оказывается:
hfjudz=N-p> (10·26)
с
где N и Ρ соответственно — полное число нулей и полюсов f{z) внутри
контура С. Каждый нуль и полюс считается столько раз, каков его порядок.
Интеграл (10.26) имеет также другую естественную интерпретацию18:
ά/?$Λ=έΔ «"»'<*>· (10-27)
С
где Δ с argf(z) — изменение аргумента f(z) при обходе контура С точкой ζ.
Таким образом,
ι
N-P= -L Δcargf(z),
17Особая точка а функции f(z) устранима в томм случае, когда лоранов-
ское разложение f(z) в окрестности а не содержит отрицательных степеней.
18Вывод формул (10.26), (10.27) можно использовать в качестве
упражнения, либо см. [2, т. 9, гл. 6].
10.9. Теорема Руше
209
что называют принципом аргумента. В частности, если f(z)
аналитична внутри контура С, то в области, ограниченной
контуром С, функция f(z) имеет
N = — Δ с arg f(z) нулей.
I
(10.28)
10.9.1 Теорема Руше. Если функции f(z), g(z) аналитичны
в области D и непрерывны па замыкании D, причём \f(z)\ > \g(z)\
па контуре С, ограничивающем D, то f(z) и f{z)+g{z) имеют
в D одинаковое число нулей.
< На С, в силу |/(2)| > \g(z)\ > 0,
\f(z)+g(z)\Z\f(z)\-\g(z)\>0,
функции / и / + g нулей не имеют. Далее,
£ АС axgt/W +,(,)] = JL ДС arg{/(2) [l + fg] } =
причем arg
■♦$
-SAc»g/W + 5;A<,«rg|l + /w
= 0, потому что вектор 1 + К\ I не может сделать
J\z)
оборота вокруг нуля, оставаясь в правой полуплоскости в силу
Поэтому
Nf+g = — А с arg[/(z) + g(z)] = — Δ с arg/(z) = Nf.
м
< 1.
10.9.2 Основная теорема алгебры. Любой многочлен Ρη(ζ)
п-й степени имеет на комплексной плоскости С ровно η корней.
< В применении к ситуации
f(z) = ζ", 9{ζ) = αη-iz""1 ■
■ + α\ζ + αο,
теорема Руше сразу даёт необходимое заключение, потому что все
требования выполняются на кругах достаточно большого радиуса. ►
Глава 11
Функциональные ряды
Многие неприятности
в гильбертовы пространства
не помещаются.
Представление функций / : R —> R в виде бесконечных сумм,
f(x) = ο0φο(χ) + сцр\{х) Η + οηφη(χ) + ..., (11.1)
играет в анализе существенную роль. Функциональные ряды (11.1)
интерпретируются обычно как запись f(x) в координатной
форме, сп — n-я координата, φη(χ) — направляющий вектор n-й оси.
Постепенно выясняется, что за этим стоит гораздо больше, чем
просто внешнее сходство.
Принципиальной особенностью разложений (11.1) является
возможность приближения функций f(x) частичными суммами
fn(x) = со<А)(я) Η + СпЧ>п{х). 3^
Вопрос сходимости fn(x) —» f(x) обычно подменяют вопросом
стремления к нулю хвоста ряда
оо
У^ Ck(Pk(x) -* 0 при η -» оо, (11.2)
к=п+1
t
11.1. Равномерная сходимость
211
что влечёт за собой сходимость /η(#) κ некоторой функции, но
к «эф ли от икс?» — это другая задача. Дело в том, что
проблемы нет, когда само разложение (11.1) служит определением
f(x). Если же f(x) определяется как-то иначе, то необходимо
ещё обосновать, что правая часть (11.1) сходится именно к f(x).
11.1 Равномерная сходимость
Под равномерной сходимостью ряда
ft
^2,0ηψη{χ)
(11.3)
π=0
подразумевается равномерная сходимость к нулю его хвоста
(11.2) на рассматриваемом отрезке [а, Ь]. Равномерной
сходимостью ряда на бесконечной (либо незамкнутой) области X будем
называть его равномерную сходимость на любом ограниченном
замкнутом подмножестве X.
11.1.1 Теорема. Пусть все функции φη(χ) непрерывны на
отрезке [а, Ь], и ряд (11.3) сходится равномерно. Тогда его сумма
f(x) — непрерывная функция.
< Результат сразу следует из теоремы 5.8.3. ►
11.1.2 Теорема. Пусть функции φη(χ) непрерывны на [а, Ь], и
ряд (11.3) сходится равномерно. Тогда ряд (11.3) можно
почленно интегрировать, т. е. интеграл от суммы ряда f(x) равен
оо
/ f(x)dx = Σ€η 4>n(x)dz
Ι η=ο {
< Доказательство элементарно. Из равномерной сходимости к нулю
хвоста ряда следует стремление к нулю интеграла хвоста
ь ь
/ f(x)dx - 5^cfc / (pk{x)dx
J и—η J
о
при η
•оо. ►
212
Глава 11. Функциональные ряды
11.1.3 Теорема. Пусть функции φη{χ) непрерывно
дифференцируемы на [а, 6] и равномерно сходится как ряд (11.3), так и
ряд, составленный из производных:
π=0
Тогда почленно продифференцированный ряд (11.4) сходится к
производной f'(x), т. е.
/'(») = £ °»^(*)
π=0
Если сюжет (11.3) разворачивается на комплексной плоскости С,
тогда равномерно сходящийся ряд аналитических функций можно почленно
интегрировать и дифференцировать без всяких дополнительных условий.
Доказательство имеет технический характер. Некоторое удивление может
вызывать отсутствие требования равномерной сходимости ряда (11.4),
которое в данном случае выполняется автоматически благодаря аналитичности.
Причина заключается в следующем. Если остаток ряда rn(z) на контуре С
/ / \ ! / rn(w) .
меньше ε по модулю, то в силу rn(z) = -—: <р ^dw справедлива рав-
27гг J (w- z)
2
номерная на С оценка |гЦги)| < —γ£·> ГДе L ~ длина контура С, a, p —
максимальное расстояние от ζ до контура С, см. главу 10.
Коль равномерная сходимость рядов выходит в данном
контексте на авансцену, естественно, повышается роль
соответствующих критериев. Вот очень простой признак равномерной
сходимости, который зачастую выручает.
11.1.4 Если \θηψη{χ)\ ^ 7п пРи любом χ G X и числовой ряд
оо
Σ,Ίη сходится, то ряд (И Л) на X сходится равномерно.
11.2 Степенные ряды
В анализе широко используются степенные ряды
71=0 Α 1ώ
(11.5)
11.2. Степенные ряды
213
как в ситуации zGR, так и в случае ζ G С. Ключом к сходимости
(11.5) является теорема Абеля 10.7.4, каковая в проекции на
действительную ось звучит так.
11.2.1 Если ряд (11.5) сходится при каком-то χ = г, то при условии
\х\ < \г\ он сходится абсолютно, а при \х\ < |г* — е| ещё и равномерно
(при любом ε > 0).
Из 11.2.1 сразу следует, что область сходимости степенного
ряда — это всегда промежуток (—Д, Д), в котором ряд сходится,
причём всегда абсолютно, а на любом сегменте
[—г, г] С (—Д, Д) — равномерно. В результате можно
гарантировать, что на (—Д, Д) ряд сходится к непрерывной функции и
его можно почленно интегрировать и дифференцировать1.
Радиус сходимости R может быть конечным или бесконечным.
Что касается сходимости ряда на концах промежутка (—Д, Д), то
ситуации могут быть разные (встречаются все мыслимые).
Примеры
1. Ряды
3 χ2η+1
sinx = x__ + ... + (_ir__ + ..., (1L7)
сходятся при любом х, что моментально выводится как из признака Коти
2.10.4, так и из признака Даламбера 2.10.5.
2. Те же признаки Коти и Даламбера легко позволяют установить
сходимость степенных рядов
1 -, . .2,3
1-х
= 1 + ж + ж+аГ + ..., (11.8)
1п(1+х) = х-у + |--|- + ..., (11.9)
но уже при \х\ < 1.
Во всех перечисленных случаях признаки Коти и Даламбера
позволяют точно уловить границы сходимости, т. е. заодно определяют радиусы
сходимости рядов, что в каком-то смысле закономерно. В общем случае
радиус сходимости ряда (11.5) вычисляется с помощью верхнего предела
по формуле
r-1 =ΊϊπΓ£/Μ·
1 Из-за того что степенные ряды на действительной прямой попадают в
юрисдикцию ТФКП и пользуются «аналитическими благами».
214
Глава 11. Функциональные ряды
11.3 Ортогональные разложения
Степенные ряды (11.5) представляют собой один из самых
бесхитростных способов разложения функций по осям
По конечномерным пространствам ясно, что систему координат
надо выбирать с умом, чтобы потом не кусать локти. Во многих
отношениях выгодны, например, ортогональные оси. Но что
такое ортогональность в бесконечномерных пространствах? Чтобы
ввести соответствующее понятие, начинать надо со скалярного
произведения. Будем считать величину
Θ
о
(f,g) = J f(x)g(x)da
(11.10)
скалярным произведением функций f и д. Легко проверить, что
(11.10) действительно определяет операцию, которая
удовлетворяет обычным свойствам скалярного произведения.
Аналогия с конечномерным случаем на этом не
заканчивается. Функции считаются векторами, а равенство (11.1) их
координатным представлением. Конечно, здесь не всё так просто,
как выглядит, но будем пока придерживаться оптимистической
ноты. Систему векторов (базис)
W^wWr··)^),···}
(11.11)
назовем ортогональной, если
ь
[ψη, Ψπι) = / φη{χ)ψπι{χ)άχ = 0 при тфп, (11-12)
и ортонормальной, если дополнительно
\\ψΛ = {ψη,φη)ϊ = ί J <pl(x)(x)d*
= 1.
(11.13)
11.3. Ортогональные разложения
215
В случае ортонормалъной системы (11.11) после умножения
(11.1) на φη(χ) и интегрирования от а до Ъ, получается2
Г °° )
J f(x)(pn(x)dx = Σ°* <Pk(x)<Pn(x)dx = ch, (11-14)
к=0 a
что даёт формулу для определения коэффициентов сп
(координат /(#)).
Теорема Пифагора в рассматриваемой ситуации
\\ff= f2(x)dx = ^cl (П.15)
β η=0
называется равенством Парсеваля3.
Нш ЩШР ЩШР
В приложениях широко используются различные ортогональные
системы. Например, известная тригонометрическая система
1, cosx, sin ж, ..., cos пж, sinnx, ..., (11.16)
ортогональная на4 [—π,π], служит основанием для знаменитых рядов
Фурье. Ортогональность (11.16) легко проверяется, например,
1 , , 1 1 ( п + к n-к \ ,
/ cos nx cos кхах = - / I cos —-—χ + cos —-—χ 1 αχ = 0, η ψ к.
—π
Нормирование5 (11.16) даёт ортонормальную систему:
1 cos ж sin ж cosnx sinnx
2С учётом (11.12) и (11.13).
3Из (11.15) следует, что разложение (11.1) любой интегрируемой с
квадратом функции имеет коэффициенты Сп —> 0.
4Либо на любом другом промежутке длины 2π.
5Умножение φη на подходящие множители для обеспечения (11.13).
216
Глава 11. Функциональные ряды
Достаточно широко используются ортогональные на [—1,1]
полиномы Лежандра6
tf^
2пп\ dxn
Щ
Щ
Δ
Погоня за выгодами, разумеется, имеет свои
издержка. Во-первых, из-за новой меры близости (11.15) —
предельные переходы выводят за пределы пространства
непрерывных функций. В результате приходится
допускать к рассмотрению совершенно новые объекты — так
называемые функции из Lq. — которые требуют
привлечения интегрирования по Лебегу. Во-вторых, используемые
ортогональные системы должны быть полны — в том
смысле, что любую функцию можно представить в виде
(11.1) — для проверки чего нужен инструмент.
К
Эти проблемы удовлетворительно решаются, но в рамках
другой дисциплины — функционального анализа. В то же время
ортогональные ряды существенны для классического анализа.
Поэтому затронутая тематика исторически застряла на полпути. В
своей основе она излагается в рамках обычного анализа, но при
этом обходятся стороной острые углы.
Пространство L2[a, b] — это пространство функций /(ж), для которых
существует интеграл от квадрата /2(ж), и скалярное произведение
определяется по формуле (11.10). К необходимости такого определения однозначно
подталкивает всё, что сказано по поводу ортогональных разложений. В то
же время, если подразумевается обыкновенное интегрирование, то данное
определение L2 внутренне противоречиво, поскольку фундаментальные по
норме (11.13) последовательности могут сходиться к неинтегрируемым по
Риману функциям. То есть — к функциям, норма которых не определена
из-за невозможности интегрирования. Ситуация в свое время была не из
лёгких. Выход из положения нашёл Лебег, разработавший более обитую
теорию интегрирования, см. [2, т. 5].
Интегралы Лебега и Римана совпадают, если оба существуют. Причём
интеграл Лебега — кроме «спокойствия души» — ничего не даёт, и в части
6 Популярны также ортогональные на [—1,1] полиномы Чебышева
Тп(х) = cosnarccosx, но там в основе лежит иначе определяемое
скалярное произведение.
Ц.4. Механизм производящих функций
217
вычислений о нём можно даже не упоминать. Принципиальную важность
имеет сама возможность интегрирования по Лебегу. Это сводит концы с
концами. Примерно как иррациональные числа. В приближённых
вычислениях они не используются, но, заделывая бреши, превращают вещественную
прямую в нормальное игровое поле. Аналогичную «философскую» роль в
функциональных пространствах играет теория Лебега.
Полнота ортогональных систем — это тоже проблема функционального
анализа — и пытаясь расставить все точки над i, можно увязнуть на
другой территории. Но в общих чертах здесь многое понятно. Решающую роль
играют аппроксимационные теоремы Вейерштрасса типа 3.6.2.
Аналогичное утверждение имеет место для функций из Lq. с заменой
неравенства \f(x) — Рп(х)\ < ε на \\f(x) — Рп(х)\\ < ε·> гДе норма
определяется равенством (11.13). Поэтому система {1,ж,ж2,... } — полна в Ζ/2, равно
как и любая её ортогонализация, сохраняющая возможность разложения
(11.1) с любыми коэффициентами. Остаётся заметить, что «история» почти
дословно повторяется для тригонометрических полиномов, что гарантирует
полноту систем, лежащих в основе рядов Фурье.
• Коэффициенты Сп, обеспечивающие минимум
к=0
определяются формулой (11.14). (?)
Оптимальность коэффициентов сп с точки зрения (11.17) плюс
полнота системы {φη(χ)} — это как раз та комбинация, которая позволяет
гарантировать, что разложение (11.1) сходится именно к }{х), если Сп
считаются по формулам (11. Ц). Подразумевается, конечно, сходимость
β среднем, т. е. по норме Li.
11.4 Механизм производящих функций
Чтобы люди не перепутались, им дают имена. Бесконечную
последовательность чисел αο, αϊ,..., αη,... тоже можно поместить
иод одну крышу, заранее индивидуально пометив все ап. Один
из вариантов «кошелька» для {ап} — ряд
оо
/(«) = Σ<»η«η. (Ц-18)
π=0
dx -> min, j^ (11-17)
Jf-
218
Глава 11. Функциональные ряды
Если в (11.18) f(s) — не просто обозначение ряда, а его
компактная сумма типа
1 s2 ss
= 1 + s + s2 Η либо ln(l + s) = s- — + — -...,
1 — 5 λ Ο
манипуляция оказывается эффективной для работы с {αη}.
Достаточно вспомнить соотношение
из которого извлекается масса тождеств для биномиальных
коэффициентов. Аналогичная техника работоспособна в очень
широком диапазоне.
Степенной характер производящего ряда необязателен. Воз-
оо
можно использование рядов Фурье 53 °ηψη{^) с ортогональной
п=0
оо
системой функций {φη{^)}. Например, 53 Cn^ms. Конечно, в тео-
п=0
рии рядов Фурье мысль направляется от функции к ряду, но
движение навстречу возникает само собой.
Многие комбинаторные задачи ведут к производящим функциям,
хорошо известным по другим сюжетам. И наоборот, разложение
элементарных функций в ряд Тэйлора даёт последовательности
коэффициентов, имеющие естественную комбинаторную интерпретацию.
Взаимосвязь местами прозрачна, кое-где — загадочна.
11.5 Ряды Фурье
Рядами Фурье называют различные вариации разложения
функций по ортогональным тригонометрическим системам, например
по (11.16). Нормализация и подсчёт коэффициентов разложения
по формуле (11.14) в этом случае приводят к представлению
оо
f(x) = ί^+^(αη cosnx + bn sinnx), (-π < χ < π), (11.19)
2 η=ι
11.5. Ряды Фурье 219
где
π π
ап = - / /(ж)cosпжсгж, Ьп = - f(x)sinnxdx.
—π —π
Разложение (11.19) можно представить в эквивалентной форме
jf
/(ж) = ^ An sin(nrr + £n)
при очевидном пересчёте коэффициентов.
о Проверить справедливость разложений:
оо
Л \~~v нчп-nSinnrr , х
• ж = 2> (-l)n+1 (-π < а: < π).
η=1
2
з~
• ,2 = ^+4Х:(-1Г^^ <-π<*<π).
η=1
о Представление (11.19) легко переносится (заменой переменных) на
функции, заданные на произвольном отрезке. Например, в случае [—1,1]
}{χ) = у + 2^ ( <*η cos -ρ + 6η sin -ρ J , (11.20)
где
ι ι
an = j /"/(*)сое ^ρ Λ, 6η = у ί f(t)sm^dt. (11.21)
-ί -г
Частичная сумма
η
£η0*0 = "^ + Σ(α*:cos ^χ + &* sin ^χ)
fc = l
сходится к /(ж) — но только в среднем, т. е. по норме L?..
Другие вопросы тоже легко решаются в Li. Причина понятна.
Идеология, формулы подсчёта коэффициентов — все проистекает из L^.
Никто, правда, не запрещает интересоваться, как обстоят
дела в случае непрерывных либо кусочно-непрерывных функций.
Тут, конечно, приходится городить новый огород, потому что
хозяйство прибыло из L2, а его насильно акклиматизируют в
других условиях. Все меняется с первой строчки. Равенство в (11.19)
220
Глава 11. Функциональные ряды
становится проблематично, потому что теперь не ясно, куда ряд
сходится. Потом, конечно, выясняется, что — «более-менее, куда
надо», но с оговорками. Чтобы в точке χ ряд сходился к f(x) ~
накладывается, например, условие Дини: сходимость интеграла
Ι|/(,+.)-/(*)μ fe
при некотором ε > 0.
В местах разрывов ряд сходится к полусумме значений функции слева
и справа. А разрывов не удаётся избежать даже в «непрерывном случае» по
той причине, что ряд, если уж сходится на [—/, /], то в силу собственной
периодичности он сходится на всей оси — к функции, периодически
продолженной с [—/,/] на (—оо, оо). Периодическое же продолжение f(x) обязательно
порождает разрывы, если /(—/) φ /(/). Поэтому на краях промежутка [—/, /]
сходимость «специфическая». Зато, если /(— /) = /(/), то среднее
арифметическое частичных сумм
Sp(x) + Si (а;) + · · · + Sn(x)
n + 1
сходится равномерно к f(x) на всей оси (теорема Фейера). Затем
возникает проблема равномерной сходимости в обычном смысле. Затем — изучается
характер убывания коэффициентов. Потом — особенности. Далее —
почленное интегрирование и дифференцирование. Теория начинает занимать тома,
но это имеет свои плюсы.
Здесь стоит приоткрыть завесу над внутренней кухней
математики. Там слишком много говорят о важности нужных
и особенно ненужных теорем. Для открытия финансирования
это действительно ценно — но в том нет никакой беды, ибо
так устроен мир. Более того, в том заключена мудрость,
поскольку от науки требуется не столько эффективность,
которая возникает сама собой, сколько незатухающее тление.
Главная проблема — чем-то занять учёных. Не так важно чем,
но — по специальности. Пусть доказывают ерунду,
публикуются и спорят. Это поддерживает квалификацию и не даёт
увлечься коммерцией. В противном случае учёные выведутся,
и станет ясно, что «были нужны», а новых негде более взять.
Поскольку мир устроен мудро, математики постоянно
заняты. В результате каждая дисциплина содержит кое-что
11.6. Интеграл Фурье
221
«лишнее». С другой стороны, присмотришься к человеку —
масса необязательных деталей. Но убери их — и человека нет.
Что касается рядов Фурье, то они, конечно, очень сильно
разрослись. Тому, однако, есть серьезная причина — особая роль
гармонических колебаний, каковыми называют
обыкновенные синусоиды
x(t) = A sm(2nut + δ), (11.22)
где А — амплитуда, ν — частота , 2πν = ω — круговая частота,
δ сдвиг по фазе. Но о гармониках (11.22) лучше говорить в
другом контексте.
11.6 Интеграл Фурье
Где-то, может быть, некоторые детали «гуляют сами по себе».
Но в нашей Вселенной всякая частность цепляется за другую,
и цепочки уходят в бесконечность. Потому «однажды начавши,
трудно кончить» не только «вкушать хорошую пишу и чесать,
где чешется», но и многое другое. Затеяв разговор о рядах,
невозможно умолчать об интегралах Фурье, которые являются
логическим продолжением темы и дают представление о берегах. При
этом, разумеется, не стоит лезть на берег и углубляться в дебри.
Итак. Ряд Фурье — это обязательно периодическая функция.
При увеличении периода 21 в (11.20) спектр f(t) все плотнее
заполняется гармониками с круговыми частотами:
π 2π ηπ
Ul = у, 072 = —Г , · · · , Un = — , . . . ,
отстоящими друг от друга на Δα; = у.
В предположении абсолютной интегрируемости /(£),
оо
ί \f(t)\dt < оо, (11.23)
— оо
предельный переход в (11.20) при / —> оо заменяет суммирование
интегрированием:
л·
I оо
/(*) = /('
αω cos ωχ + Ьш sin ωχ)άω
(11.24)
222
Глава 11. Функциональные ряды
где αω, Ьш получаются предельным переходом
CLn Ъп
αω. — ► Ьш при Αω —> 0 (т. е. при / —> оо),
Αω Αω
что дает
оо оо
αω = - J f(t)cosujtdt, Ьш = - ί f(t)amu>tdb. (11.25)
— оо —оо
Коэффициент ао при / —> оо пропадает в силу (11.23).
Подстановка (11.25) в (11.24) после использования формулы косинуса
разности двух углов приводит к
f(x) = - ί ί f(t) cos\(t - x)dtd\
\
(11.26)
что, собственно, и называют интегралом Фурье7.
Предыдущая пара формул (11.24)—(11.25) — прозрачнее понятийно.
Свёрнутая в клубок формула (11.26) — маскирует содержание, но компактна.
Манипуляции типа (11.24)—(11.26) чаще используются на
территории С, порождая популярное преобразование Фурье9,
оо
/И = ± J f(t)e-^dt. (11.27)
Тут, правда, возникает впечатление, что шило меняется на
мыло, поскольку одна функция / замещается другой, /. Однако /
7Для справедливости (11.26) необходимы дополнительные требоваг
ния типа условия Дини. Если в (11.26) f(x) слева заменяется на
" 9 ·> то формула становится верной в довольно свободных
предположениях.
оо
8Обратное преобразование: f(t) = I f(u))ewtdiu. Замкнутый круг делит-
— оо
ся иногда в другом месте, и тогда прямое и обратное преобразования Фурье
выглядят несколько по-другому,
оо оо
/(«) = ^== f me^dt, f(t) = -^J /(ω)β-^άω.
Ц.7. Преобразование Лапласа
223
в некоторых отношениях, особенно с точки зрения
дифференцирования, получается скомпонованной рациональнее. В итоге
достигается выигрыш при решении линейных
дифференциальных уравнений, и, что более важно, возникают новые категории
мышления [2, т. 2, гл. 8].
11.7 Преобразование Лапласа
Затронув преобразование Фурье, т. е. сказав «а», приходится
говорить «бэ». Преобразование Лапласа
(11.28)
где ρ = σ + ζω, — усовершенствует методику, основанную на
преобразовании (11.27). Функцию f(t) при этом называют
оригиналом, a f(p) — изображением, что записывают обычно как
либо
/(*).= /(?)
M = sr {f(t)y
Традиционно предполагается кусочная непрерывность /(£). Точнее, на
любом ограниченном участке допускается не более чем конечное число
разрывов первого рода9. Разумеется также, /(£) = 0 при t < О, и показатель
роста ограничен (|/(i)| < Keat) для некоторых а, К > 0 и всех t ^ 0.
Выгоды преобразования Лапласа по сравнению со
стандартным преобразованием Фурье заключаются в том, что при
больших Кер = σ метод (11.28) справляется с быстрорастущими
функциями, тогда как (11.27) упирается в расходящиеся
интегралы. В этом, собственно, и заключается роль действительной
части σ, которую можно выбирать по своему усмотрению,
исходя из потребностей задачи10. В частности, при σ = 0 получается
преобразование Фурье функции /(£), если f(t) = 0 при t < 0.
9 Разрыв первого рода характеризуется существованием конечных
пределов слева и справа.
10 Правильнее даже сказать, что σ вообще заботы не требует. Выбирать и
фиксировать значения σ не надо. Важно лишь понимать, что при достаточно
больших σ интеграл (11.28) сходится.
224
Глава 11. Функциональные ряды
Успех преобразования Лапласа при изучении линейных
систем определяется двумя обстоятельствами. Во-первых,
линейностью:
λ/(0+μ^).= λ/(ρ)+μ§(ρ).
Во-вторых, заменой дифференцирования умножением. Точнее
говоря,
/(*)
оо оо
= Ζ" e-^f(t)dt = J e-^dfit) =
ОО
IOO о
= e-ptf(t)\ - / pe-ptf{t)dt = pf(p) - /(0), (11.29)
Ιο J
где при взятии интеграла по частям действительная часть ρ
выбирается настолько большой, чтобы модуль e~ptf(t) при t = оо
обращался в ноль.
Естественно, предпочтение отдается задачам, в которых /(0) =
. Есть и другие удобные свойства.
= 0, и тогда
/(*).= р/(р)
• Изображение интеграла:
t
ff(r)dr = -f(p). (11.30)
J Ρ
о
t
< В силу (11.29) для g(t) = I f{r)dr, g(0) = 0, имеем
о
№=g'(t)=pg(p),
T.e.f(p)=pg(p) =» (11.30). ►
• Дифференцирование изображения: j(p) = —tf(t).
оо
fit) f Л
• Интегрирование изображения: ^-^- = / f(p)dp, где путь
ρ
интегрирования целиком лежит в области существования
изображения f{p).
ц.7. Преобразование Лапласа
225
• Запаздывание:
f(t-a) = e-^f(p) (α>0).
Μ Поскольку f(t — а) = 0 при t < α, то
оо оо
f(t - а) = f f(t - a)e-ptdt = J /(r)e-p(T+<,)dr = e~paf(p). ►
α Ο
• Свертка:
t
J f(r)g(t - r)dr = f(p)g(p). (11.31)
о
< Здесь и выше обходятся стороной вопросы ограниченности
скорости роста оригиналов на бесконечности. В (11.31) подразумевается, что при
условии существования изображений /(р) и д(р) преобразование (11.28)
свертки
о
/ f(r)9(t—r)dr существует и равно правой части (11.31)11. Если без этих
о
хлопот, то обоснование сводится к выкладке
t оо оо
j f(r)9(t - r)dr = J f(r)dr J e-ptg(t - r)dt =
0 Or
oo oo
= J f(r)e-prdT J 9(ξ)ε-ρ(άζ = f(p)g(p). ►
0 0
Примеры и упражнения
/(At) = |/(f), A>0.
η!
• τ* _.
■-ρη+1·
sin ωτ = — .= — I : — ] = —z
2г 2ι \ρ — ιω ρ + τω J p +l
11 Иначе говоря, если значения действительной части в ρ = σ + ιω можно
взять такими, что преобразование (11.28) существует как для /(£), так и для
g(t), — то подходящее σ существует и для свертки (11.31).
226
Глава 11.
sin t .
—— .= arctgp.
F" ο ι τί /. ι Τ" —■ t
(ρ2+ω2)2
At .η _. n!
•"(р-аГ'
где 0(ί) = J J
Функциональные ряд^
t<0
• Изображение /(р) функции /(ί) является аналитической функцией в
области Rep > α, где α — оценка степени роста /(£), т. е. такая постоянная,
что |/(i)| < Keat для некоторого К > 0 и всех t ^ 0.
• Если ρ —> оо в секторе | argp| < ^ — е (е > 0), то
lim pf(p) = /(0).
ρ—юо
А если существует предел /(оо) = lim /(£), то
t—юо
lim p/(p) = /(оо),
р—►()
где ρ —> 0 внутри того же сектора | argp| < Ц — е.
Обращение преобразования Лапласа. Оригинал по
изображению (11.28) вычисляется по формуле Меллина
σ+ζοο
/(*)=2^ / <?*fWP, (11-32)
σ—ioo
где интегрирование идет вдоль вертикальной прямой Re ρ = σ,
причём значение σ в (11.32) — не менее показателя степени роста
функции f(t).
< Рецепт (11.32) сводится к обращению преобразования Фурье.
Применяя к экспоненциально убывающей функции e~atf(t) сначала
преобразование (11.27), а потом его обращение, имеем с учётом }{ω) = 0 при ω < 0
оо оо
e-atf(t) =JL ί άτ ί β-σω/(ω)β-ίτ<ί-"»<ίω =
— оо —оо
оо оо сю
=L· I eiTt*/e_<a+iT,"/(w)^ = έ / eiTtf(p)dr,
11.8. Дельта-функция
227
где р = σ + ir- Деление на е at приводит к
оо <т+гоо
— oo <t —гоо
Ц.8 Дельта-функция
О дельта-функции необходимо сказать главное на первых
ступенях высшей школы, потому что она, δ(ί), то и дело появляется
там и сям в сопровождении абсурдных комментариев. Феномен
принадлежит теории обобщённых функций [2, τ 5], и за
пределами этой территории S(t) производит иногда странное
впечатление. Дабы «по дороге в баню» не отсылать читателя «в Сочи»
по адресу [2, т. 5, глава 8], напомним основные моменты здесь,
чуть-чуть замахиваясь на все обобщённые функции.
Изначально δ(ί) определялась как предел единичных импульсов12
δε (£) 5 например прямоугольной формы, при стремлении к нулю
ширины импульса, ε —» 0. Трудность заключалась в противоестественности
обстоятельств. В пределе получалась функция, равная бесконечности
в нуле и нулю — в остальных точках. Однако ситуации, в которых
возникала потребность в чем-то подобном, всегда сводились к
вариантам, когда δ(ί) стояла под интегралом. То есть δ(ί) нужна была не
как функция, а как нечто, обеспечивающее при интегрировании
определенный эффект. Но тогда и обыкновенный предел не нужен был.
оо
12Характеризуемых условием J" S£(t)dt = 1.
—оо
228
Глава 11. Функциональные ряды
оо
/
Хватало сходимости интеграла
S£(t)(p(t)dt -» φ(0) при ε -> 0,
что позволяло определить δ(ί) как особый предел S£(t) —* δ(ί) в смысле
оо оо
J S£(t)(p(t)dt -» A 6(t)(f(t)dt.
—оо —оо
Иначе говоря, под £(£) достаточно было понимать «нечто»,
действующее на функции φ по правилу:
оо
(δ,φ) = [ S(t)(p(t)dt = φ(0). (11.33)
—оо
Но (11.33) — это функционал. Надо лишь подходящим образом
подобрать пространство вспомогательных функций φ.
Соотношение (11.33) служит прообразом общего определения.
Обобщённые функции / описываются как функционалы
оо
(/,φ) = J f(tMt)dt, <реш, (n.34)
—оо
на множестве В финитных функций13, непрерывно
дифференцируемых любое число раз. Последовательность {/п} полагается сходящейся
к обобщённой функции /, если
для любой функции φ Ε В.
11.8.1 Всякий линейный непрерывный функционал (/, φ) на В
называется обобщённой функцией14.
13 Непрерывная функция <p(t) называется дтнитной, если область, в
которой φ(ί) ф 0, — ограничена. Замыкание области, где φ{ί) ф 0,
именуется носителем φ(ϊ) и обозначается как supp φ. Разные функции из D могут
быть отличны от нуля на разных областях (у каоюдой свой носитель).
14 Не каждый функционал на D может быть представлен в виде (11.34).
Если это возможно, обобщенную функцию f(t) называют регулярной.
Ц.8. Дельта-функция
229
Дифференцирование определяется правилом переброски
производной, {f,ψ) = -</,¥>'),
оо
(/» = J f'(t)<p(t)dt =
— оо
оо оо
= f <p(t)df(t) = <p(t)f(t)\°° - ( /(%'(t)dt = -</,/>,
«^ I —oo «*
—oo —oo
каковое в ситуации (11.34) возникает само по себе в результате
интегрирования по частям с учётом финитности функций φ.
На δ(ί) общая часть теории проецируется следующим образом.
Дельта-функция декларируется как функционал, действующий в В
по правилу (δ, φ) = φ(0). Производная δ'(ί) действует в результате как
(δ',φ) = -{δ,φ') = -φ'(0). -^
Следствием правила переброски производной является соотношение
где 0(£) — функция Хэвисайда15.
Замена переменной при интегрировании указывает на
справедливость соотношений
оо оо
ί δ(ί - a)<p(t)dt = φ(α), ί δ(αί)φ(ί)άί = -φ(0),
а также
δ(ί - tk)
sm]=,L·^
В частности,
о Δ Δ
единичный скачок: 6(t ^ 0) = 1 и θ(ί < 0) = 0.
230
Глава 11. Функциональные ряды
Преобразование Лапласа f(p) = / e~ptf(t)dt обобщённых
о
функций было бы естественно рассматривать как значение
функционала / на функциях e~pt. Но e~pt φ. О, однако D можно
безболезненно переопределить, например, как совокупность
бесконечно дифференцируемых функций, для которых tk<p"\t) —> 0 при
t —► оо и любых целых fc, I ^ 0. В этом случае обычные свойства
преобразования Лапласа (раздел 11.7) остаются без изменения.
В частности,
{6,е-*) = е-%=0 = \, т.е. \δ(ρ) = 1.
Обычным образом определяются изображения производных <rn) (t),
SM{p) = (S(n\e-pt)=pn,
запаздывания, δ(ί — τ) = е_рг, и т. п.
Глава 12
Неподвижные точки
Подход «на пальцах»
раскрепощает и вдохновляет.
12.1 Проблемы существования решения
Исследование любой модели начинается, как правило, с
выяснения существования решения у той или иной системы уравнений
f(x) = 0, которую всегда можно привести к виду1
χ = Т(х). (12.1)
Решение (12.1) называют неподвижной точкой оператора Т.
Существование решения уравнения (12.1) обеспечивается, к
примеру, принципом сжимающих отображений {теорема 6.7.2).
За пределами этого результата мало что известно в рамках
традиционного математического образования. Топологические
методы исследования неподвижных точек считаются излишне
сложными. До некоторой степени на слуху следующая теорема2.
12.1.1 Теорема Брауэра. Любое непрерывное отображение
Т{х) шара В в себя имеет неподвижную точку χ е В.
1 Форма (12.1) иногда возникает сама собой, иногда — искусственно, с
прицелом, например, вычислительного характера.
2 Как правило, без доказательства.
232
Глава 12. Неподвижные точки
Далее будет изложена общая идеология, в рамках которой
результаты типа 12.1.1 тривиальны. Но на теорему Брауэра
интересно взглянуть и с другой точки" зрения.
Пластичный шар В, ограниченный сферой 5, можно сплющить и
распластать по S. Это означает существование непрерывного отображения F(x)
шара на сферу. Факт, конечно, банальный. Потребуем, однако, чтобы при
такой деформации точки S оставались на месте. Другими словами,
фиксируем границу S и, деформируя внутренность В, пробуем распластать шар
по граничной сфере. Интуитивно ясно, что, не разрывая шар, сделать это
невозможно. Так что «не существует непрерывного отображения шара В
в граничную сферу S, которое все точки S оставляет на месте»3.
Негативный характер утверждения не умаляет его ценности, ибо
надлежащая переформулировка приводит к позитивному результату 12.1.1.
< Действительно, в предположении противного, χ φ Τ (χ) для любого
χ & В. Соединим χ и Т(х) отрезком прямой и продолжим его за точку χ до
пересечения со сферой S в точке F(x). Понятно, что F(x) — непрерывное
отображение В в 5, оставляющее сферу S на месте. Противоречие. ►
'$> ^
Л. Э. Я. Брауэр, 1881-1966
Несмотря на интуитивно прозрачное доказательство,
попытки строго расставить точки над i уводят здесь весьма далеко. В
связи с этим теорему Брауэра расценивают обычно как
гроссмейстерский трюк. Кое-что по части разрешимости f(x) = О
устанавливается легко. Начиная с теоремы Больцано — Коши4.
В той же нише есть чуть более сложные результаты. Скажем,
факт пересечения нелинейных диагоналей, непрерывных кри-
3Тем не мене строгое обоснование этого факта нетривиально.
4 Если значения непрерывной функции f(x) на концах отрезка [а, Ь]
имеют разные знаки, то f(c) = 0 в некоторой точке с € [а, 6].
12.1. Проблемы существования решения
233
вых, соединяющих противоположные вершины прямоугольника,
- 4к (12·2)
Имеет смысл доказать (12.2) в качестве упражнения. Феномен,
правда, выглядит сбоку бантиком. Но к нему сводится красивая
фольклорная задача5, вроде бы совсем из другой оперы.
Из пункта Α β пункт В ведут две дороги L\ и L2, по
которым две точки из А в В могут двигаться, оставаясь все время
в поле зрения друг друга
Вопрос в том, могут ли точки двигаться, — одна из А в В,
другая из В в А, — оставаясь все время невидимы друг другу?
< Пусть χ обозначает расстояние от А до точки на Li вдоль L\.
Соответственно, у — расстояние от А до точки на Li вдоль Li. Одна кривая на
рисунке (12.2) описывает движение точек из А в В, когда они остаются все
время в поле зрения друг друга. Движению точек, одной из А в В, другой
из В в А, — отвечает некоторая траектория, изображенная другой кривой
на (12.2). В силу непрерывности кривые пересекаются. В пересечении точки
видны друг другу. Решение задачи — отрицательно. ► Банальность (12.2)
превращается таким образом в изюминку.
5Поскольку «ничто не было названо именем первооткрывателя» — об
авторстве задач и теорем чаще всего трудно говорить. Достаточно сказать,
что формула Эйнштейна Ε = тс? открыта Хэвисайдом, закон Бойля —
Мариотта — Гуком, преобразования Лоренца — Фогтом.
234
Глава 12. Неподвижные точки
12.2 Вращение векторного поля
Далее мы обрисуем не вполне строгую, зато геометрически
наглядную картину теории вращения векторных полей.
Итак, пусть Ω — некоторая область в Rn, Ω = Г — её граница,
а /(Г) — образ границы при непрерывном отображении /. В
этом случае / называют также оператором6 и говорят, что /
задаёт в Ш.п векторное поле f(x).
Допустим, речь идет о существовании решения уравнения
/(ж) = 0 (12.3)
в области Ω, т. е. о принадлежности нуля образу /(Ω).
Другими словами, накрывает образ /(Ω) точку 0 или нет? Если да,
то элемент ж* Ε Ω, переходящий в нуль, /(ж*) = 0, называют
нулём векторного поля f(x).
В случае, когда некая «благообразная» область
слегка деформируется преобразованием / во что-нибудь типа
или даже , вопрос о включении О Ε /(Ω)
сводится к выяснению расположения нуля внутри образа
границы /(Г) или — снаружи. В общем случае Г может переходить
в довольно хитроумные поверхности /(Г). В частности,
окружность может перейти во что-нибудь типа
• о
и тут уже не ясно, где внутренность /(Г). Но как бы там ни
было, разрешимость (12.3) в Ω по значениям f(x) на границе Ω
6 Отображение, оператор, функция — используются как синонимы.
12.2. Вращение векторного поля
235
поддаётся выяснению. Путь к этому не очень длинный, если не
злоупотреблять деталями.
Итак. Будем считать Г и / гладкими (в противном случае
можно перейти к гладким аппроксимациям), и у поверхности
/(Г) определим внешнюю и внутреннюю стороны. Для этого
возьмём маленький кусочек Δ поверхности Г — у него
внутренняя сторона та, которая соприкасается с Ω, — и на фрагменте
/(Δ) С /(Г) стороны определим стандартным образом:
В регулярной точке χ £ Δ локальный базис {ei,— 9en}
выбирается так, чтобы вектор е± был направлен по внешней нормали, а векторы
ег9 · · · 5 еп лежали в касательном пространстве Тх к Δ в точке х. Нормаль
е\ к поверхности /(Δ) в точке f(x) называют внешней, если базис
{ei,..., en} = {ei, f'(x)e2,..., f'(x)en}
одинаково ориентирован с базисом7 {ei,..., еп}.
Далее разобьем /(Ω) на маленькие участки —
накладывающиеся друг на друга — и, начиная с исходного Δ, продолжим
определение внешней стороны на соседние участки, согласуя
ориентацию на пересечениях, пока не определится внешняя сторона
на всей поверхности /(Ω). В плоском случае этому сопоставить
можно прокатывание шарика по одной из сторон, как на
нижеследующем рисунке.
Считая поле f(x) невырожденным на Ω, т. е. f(x) φ 0 при
7Два базиса {ei,..., еп} и {ei,..., е^} называются одинаково
ориентированными, если e'i = Σα4€ό и det[aij] > 0.
236
Глава 12. Неподвижные точки
χ Ε Ω, предположим также (для удобства рассуждений), что
поверхность /(Ω) связна и не имеет слипшихся участков8.
Выпустим из нуля произвольный луч I и посчитаем, сколько
раз I протыкает /(Ω) изнутри наружу — допустим, 7е Р33, и
сколько — снаружи внутрь — пусть 7е раз9· Величину
7(/,Ω)=7θ-7θ (12.5)
назовем вращением, векторного поля f на ft.
Для корректности определения требуется независимость
7(/, Ω) от выбора I. Очевидно, величина 7(/, Ω), как функция Z,
локально постоянна — не меняется при малых шевелениях луча.
Изменений можно ожидать, если при повороте луч пересекает
точку самопересечения С или касания А. Геометрически ясно,
что при вращении I против часовой стрелки и переходе, скажем,
критического положения /χ, появляется пара точек протыкания.
Причём, если в одной из них луч протыкает /(Ω) изнутри
наружу, то в другой — наоборот. Поэтому точки протыкания
появляются или исчезают полярными парами, и 7 (12.5) не меняется.
Если /(Ω) имеет слипшиеся участки, то надо считать, что в
соответствующем месте луч протыкает поверхность столько раз, сколько там слиплось
слоев — и все остается по-прежнему. Это же должно быть сказано в
отношении лучей, протыкающих поверхность в точках самопересечения /(Ω) —
луч /з на рис. (12.4). В рассматриваемом случае получается 7(/> Ω) = 2.
В ситуации, когда окружность преобразуется в «восьмёрку»,
Все эти требования снимаются рутинными приемами.
9 Если у Ω несколько компонент связности , манипуляции проде-
лываются с каждой компонентой, и засчитываются в общую копилку.
12.3. Гомотопия векторных полей
237
7(/> Φ = ~~ *» ес ΊΗ ^ лежит в области L.
В случае отображения Ω в более замысловатую к ?уЮ
^
Л
возникают следующие варианты: 7(/, Ω) = 1, если О лежит в с»ро; области;
7(/, Ω) = 2, если О — в области 2?; наконец, 7(/>Ω) = 0, если0 eD.
12.2.1 Теорема. Если О G Ω, то вращение тождественного
отображения 1(х) = х на Ω равно 1.
Это, пожалуй, единственная ситуация, где определение
внешней стороны у /(Ω) не вызывает вопросов, поскольку Ω остается
на месте. Луч сначала протыкает Ω изнутри, потом — снаруж.*,
наконец последний раз — изнутри.
Все вышесказанное подразумевает пространства Rn
размерности η ^ 2. Для определенной «свободы передвижения»
полезно доопределить вращение в одномерном случае.
Любая ограниченная область Ω € К1 представляет собой интервал (а,/?).
Если /(а) < 0, /(/?) > 0, то 7(/, Ω) = 1. В случае
/(а)>0, /09) < 0 =► 7(/.ή) = -1.
Если же /(а) и /(/5) одного знака, то 7(/> ή) = 0.
12.3 Гомотопия векторных полей
Определили вращение мы визуально, но вычислять-то *y(f,U)
потребуется инструментально. Соответствующим инструментом
Для этого служат деформации, или гомотопические переходы.
238
Глава 12. Неподвижные точки
12.3.1 Определение. Невырожденные10 на Ω отображения /0
и /ι называются гомотопными на Ω, если существует такая
нееыроэюденная непрерывная деформация (гомотопия) H(x,t)7
Них [О,1] -> Rn \ {О},
что11
Н(*,0) = /о(*), Η(χ,1) = /ι(«).
Операции гомотопического перехода соответствует
непрерывное деформирование поверхности /ο(Ω) в поверхность /ι(Ω).
Невырожденность гомотопии, H(x,t) φ О, означает, что
деформируемая поверхность не пересекает точку 0.
Геометрически ясно, что невырожденная деформация не
может поменять величину вращения 7(")> поскольку — двигается
ли луч, деформируется ли поверхность — точки протыкания
исчезают и возникают парами. Разумеется, пока деформируемая
поверхность не пересекает нуля, т. е. H(x,t) φ 0. Поэтому
справедлив следующий важный результат.
12.3.2 Теорема. Гомотопные векторные
поля имеют одинаковые вращения.
Становится ясно, что бесконечное разнообразие практических
ситуаций может быть разбито на классы. Представителями
классов могут служить, например, /(ж), отображающие Ω на
единичную сферу S с центром в нуле. Деформация /(Ω) на 5 с
последующим разглаживанием складок — порождает
многослойную поверхность, окутывающую сферу |7(/,Ω)| раз12.
Отрицательный знак 7(/» Ω) связан с выворачиванием Ω наизнанку.
«Число окутываний» — и есть вращение j(f,U) с точностью до знака.
Если на плоскости в нуль вбить гвоздь, то число окутываний нуля
деформацией контура H(U,t) поменять невозможно, не нарушая условия Я (ж, t) φ 0.
10 Не обращающиеся в нуль.
11 Построение гомотопии от /о к /ι равносильно продолжению
отображения if : Χ χ {0} χ {1} -> Κη \ {0} на пространство X х [0,1].
12Если / отображает 5 в 5, то *y(f, S) — это так называемая
топологическая степень отображения /.
12.3. Гомотопия векторных полей
239
Несмотря на элементарный характер утверждения 12.3.2, оно
играет принципиальную роль, поскольку служит основным
инструментом для вычисления вращений векторных полей,
позволяя переходить с помощью гомотопии от изучаемых полей к
более простым, часто стандартным, вращение которых известно.
12.3.3 Самый распространенный на практике вид деформаций -
линейная гомотопия:
H(x,t) = (l-t)f(x)+tg(x),
связывающая отображения fug.
Линейная гомотопия может оказаться вырожденной лишь в том случае,
когда найдется точка χ £ Ω, в которой векторы f(x) и д(х) противоположно
направлены, f(x) = \д{х), λ < О,
Поэтому в случае непротивоположной направленности в любой точке
х € Ω отображения f(x) и д(х) линейно гомотопны и, в соответствии с
теоремой 12.3.2, имеют одинаковые вращения.
В связи с теоремой 12.3.2 закономерно возникает вопрос о
справедливости обратного утверждения. Обязательно ли
гомотопны поля с одинаковым вращением? В общем случае это не
так. Если же Ω - шар, положительный ответ на поставленный
вопрос даёт знаменитая теорема Хопфа.
12.3.4 Теорема. Невырожденные на сфере S с Μη; η > 2,
векторные поля с одинаковым вращением гомотопны. >
240
Глава 12. Неподвижные точки
Теорема 12.3.4 не участвует в формировании излагаемого
далее аппарата, но показывает, что «аппарат» достигает
максимума возможного. В том смысле что за рамками соответствующей
«деформационной идеологии» не остается каких-либо других
топологических инвариантов (помимо вращения), из которых
можно было бы вытащить дополнительную информацию.
Выше подразумевался гомотопический переход от /о к
векторному полю /ι, деформирующий поверхность /ο(Ω) в /ι(Ω),
с помощью гомотопии
ft(x) = H(x,t).
Однако деформация может осуществляться не только за счёт
изменения оператора, но и за счёт изменения области. Как бы
деформация ни происходила, для сохранения величины вращения
существенно лишь, чтобы деформируемая поверхность не
пересекала точку 0. Вот точная формулировка результата. Пусть Ω^
(t G [0,1]) описывает непрерывный переход от области Ωο κ Ωι.
Результирующую деформацию ft(&t) назовем невырожденной,
если ft(x) т^ 0 при любых t G [0,1], χ G ttt.
12.3.5 Теорема. Если деформация /$(Й*) невырожденна, mo
7(/ο,ή0) = 7(/ι,ήι).
Это простое обобщение теоремы 12.3.2 иногда оказывается
полезным, позволяя при вычислении вращения переходить не
только к более простому полю, но и к более простой области.
12.4 Ядро теории
12.4.1 Теорема. Пусть векторное поле f(x) определено и
невырождено на границах областей Ω, Ωι, ..., Qmp причём Qj
попарно не пересекаются и Ω = (J Ω^;. Тогда
оо
7(/,Ω) = $>(/Λ)· (12-6)
12.4. Ядро теории
241
< Результат очевиден в контексте определения 7(0 методом
«протыкающего луча». Если Ωί и Qk граничат друг с другом, то граничат и /(Ω*)
с /(Ω/^) по некоторому участку rifc. Протыканию лучом Г^, например,
изнутри при подсчёте 7(/»^i) будет соответствовать протыкание Ггк снаружи
при подсчёте 7(/? &к)·
Поэтому в сумме (12.6) справа все протыкания внутренних перегородок
взаимно сократятся. ►
Будем говорить, что невырожденное на Ω векторное поле
f(x) имеет ахиллесово направление, если f(x) не принимает
значений какого-то направления, как на рис. (а).
(а) (Ь) (с)
Иначе говоря, f(x) φ Xh для всех χ Ε Ω, λ > 0 и некоторого
ненулевого h Ε Шп. На рисунках (b) и (с) направления f(x)
исчерпывают полный «телесный» угол.
12.4.2 Теорема. Если векторное поле f(x) на Ω имеет
ахиллесово направление, то j(f, Ω) = 0.
< Для доказательства достаточно в качестве / взять луч, задаваемый
вектором /ι,
/ = {χ : χ = λ/ι, λ € [0, οο)},
он поверхность /(Ω) вообще не протыкает. ►
Если поле f(x) на Ω принимает все направления, т. е.
параметрическое уравнение f(x) = Xh имеет решение ж Ε Ω при
любом векторе h φ О и некотором λ > 0, то для 7(/, Ω) φ О
этого, конечно, недостаточно. Однако:
242
Глава 12. Неподвижные точкц
12.4.3 Если поле f(x) ua Ω принимает все направления
только по одному разу13, то 7(/,Ω) φ О, точнее: |7(/,Й)| = 1.
12.4.4 Лемма. Пусть поле f(x) невырождено на замыкании
области Ω, т. е. f(x) φ О при любом χ Ε Ω. Тогда 7(/, Ω) = 0.
< Разобьем Ω на непересекающиеся области Qj настолько малых
размеров, что все векторы на каждом замыкании Ω^ составляют друг с другом
острый угол. В этом случае на любой границе flj поле / имеет
ахиллесово направление. Поэтому (теорема 12.4.2) все j(f,flj) = 0. Окончательный
вывод следует из теоремы 12.4.1. ►
Из леммы 12.4.4 вытекает фундаментальный результат:
12.4.5 Теорема. Если 7(/,Ω) φ 0, то уравнение f(x) = 0
разрешимо в Ω, т. е. в Ω существует нуль векторного поля
х* G Ω, /(ж*) = 0.
Таким образом, любая теорема об отличии от нуля вращения
векторного поля / может трактоваться как принцип
разрешимости уравнения f(x) = 0.
Отметим в заключение справедливость полезного
дополнения к теореме 12.4.1, вытекающего из объединения теоремы 12.4.1
с леммой 12.4.4.
12.4.6 Утверждение теоремы 12.4-1 справедливо без
предположения Ω = \jCij, но при условии невырожденности f на
Ω\υ*ν
Что касается практического вычисления 7(/,Ω), то главный
акцент приходится обычно на поиск гомотопии изучаемого поля
к какому-либо довольно простому типа f{x). В крайнем случае
«станцией назначения» служит линейное поле.
13Т. е. f(x) = Xh при любом h φ 0 имеет единственное решение χ £ Ω.
12.5. Теоремы существования
243
12.4.7 Вращение линейного поля. Пусть О е Ω и А —
лилейное невырожденное преобразование. Тогда
7(j4,n) = signdetA, (12.7)
причём 7(-4, Ω) = ind (А, О).
< Если В шар с центром в нуле настолько малого радиуса, что В С Ω,
то с учётом п. 12.4.6 имеем
7(Α,ή)=7(Α,Β),
поскольку Аж невырождено на Ω \ В. Образ АВ сферы В также является
сферой, вообще говоря, в другой норме. Следовательно, любой луч
протыкает поверхность АВ ровно один раз, откуда \^(А, Ω)| = 1. Знак вращения
определяется ориентацией, что и даёт 12.7. ►
12.5 Теоремы существования
12.5.1 Теорема. Пусть О G Ω и на границе, т. е. для любого
χ G Ω выполняется одно из условий:
• векторы χ и f(x) не направлены противоположно;
. ||/(*)-*||<||/(*)|| + |М|;
• скалярное произведение (/(ж), х) > 0.
Тогда уравнение f(x) — 0 разрешимо в Ω.
< Из непротивоположной направленности χ и f(x) следует14
7(/,ή) = 7(/(*),ή) = ι,
но тогда главный принцип существования нуля векторного поля {теорема
12.4.5) гарантирует разрешимость f(x) = 0. Два других условия влекут за
собой непротивоположную направленность χ и f(x). ►
Изучаемые уравнения часто имеют специальный вид
х = Т(х). (12.8)
14См. теоремы 12.2.1, 12.3.2.
244
Глава 12. Неподвижные точки
В этом случае решение (12.8) называют неподвижной точкой
оператора Т. Чтобы воспользоваться здесь результатом 12.5.1,
достаточно перейти к векторному полю f(x) = х—Т(х). В итоге,
например, можно гарантировать существование у Τ
неподвижной точки,если
(Τχ,χ) < (ж, ж), хей.
В юрисдикцию п. 12.5.1 попадает и теорема Брауэра (12.1.1).
Её имеет смысл переформулировать с некоторым уточнением.
12.5.2 Теорема. Оператор Т, переводящий в себя замкнутый
шар В, всегда имеет неподвижную точку χ* Ε В При этом
Ί(Ι-Τ,Β) = 1.
< Без ограничения общности центр шара В можно считать расположенным
в нуле. Допустим противное: Τ не имеет неподвижной точки в В. Тогда поле
χ — Т(х) невырождено на сфере 0 и, в силу Т(В) С В, векторы ж£Йи
χ — Т{х) — непротивоположно направлены, иначе точка Т(х) лежала бы на
продолжении радиус-вектора χ G В, что противоречит Т(В) С В. ►
Из доказательства видно, что непротивоположная
направленность χ и χ — Т(х) обеспечивается и в более свободных
предположениях. Поэтому справедлив следующий результат
12.5.3 Пусть Ω - произвольная область, О G Ω, и оператор
Τ на границе Ω удовлетворяет условию Т(х) ^ Хх при λ > 1.
Тогда у Τ существует неподвижная точка χ* Ε Ω.
12.6. О теореме Брауэра
245
12.6 О теореме Брауэра
Хотя j(f,ft) может принимать любые целые значения, в
практических задачах преобладает ситуация15
7(/,Й) = 1 (12-9)
на областях Ω типа шара. Сюда попадает и теорема Брауэра
12.5.2. Обратим внимание на лёгкое, но существенное обобщение.
12.6.1 Шар В в теореме 12.5.2 можно заменить любым мно-
ofcecmeoM А, гомеоморфным замкнутому шару.
< Действительно, пусть оператор / переводит в себя множество А, го-
меоморфное замкнутому шару В, и G — соответствующий гомеоморфизм.
В этом случае оператор G~XTG отображает в себя β и по теореме 12.5.2
имеет неподвижную точку х* € В, т. е.
G"xTG(xm) = хт =* TG(x*) = G(x*).
Следовательно, у* = G{x*) € А — неподвижная точка оператора Т. ►
Ключом к решению практических задач чаще всего
оказывается либо сама теорема 12.5.2, либо утверждения, в которых
теорема Брауэра выступает в роли скрытого механизма. Вот
показательный пример.
12.6.2 Лемма Кнастера — Куратовского — Мазуркевича.
Пусть X произвольное множество в Rn; А(х) —
точечно-множественное отображение (из X в Шп) с компактными образами. Пусть
для всякого конечного подмножества {а?1,..., ж*.} С X выпуклая обо-
k
лочка точек {a?i,... ,х&} содержится в объединении (J Α(χι). Тогда
г=1
пересечение всех множеств А(х) не пусто,
< В силу компактности образов достаточно показать, что не пусто
пересечение любого конечного множества образов. Предположим противное,
к
т. е. П A{xi) = 0 для некоторого множества точек {хг,...,Хк}. Тогда
г=1
к
(J Yi = Мп, где Yi обозначает дополнение к А(хг).
г = 1
15Видимо потому, что «Бог изощрен, но не злонамерен».
246
Глава 12. Неподвижные точки
Пусть теперь рг{х) — разбиение единицы в Rn, согласованное с
покрытием {Yi}, т. е. такой набор функций, что16
к
^2,рг{х) = 1, SUpppi С Yi-
г=1
к
Отображение φ(χ) = Σ Рг(х)хг, очевидно, преобразует в себя выпук-
г=1
лую оболочку с {ж ι,..., Xk } и, по теореме Брауэра, имеет неподвижную
точку х*. При этом рг{х*) > 0 для г из некоторого подмножества индексов
Μ С {1,. · ·, к}, и рг{х*) = 0 для г £ М. Но тогда
X* = Σ Рг(х*)Хг € С0{Ж» : I € М} С (J A(Xi).
Следовательно, х* £ А{хг) для некоторого г £ М, т. е. ж* ^ Υί, а значит,
Pi (ж*) = 0, что приводит к противоречию. ►
12.7 Р-отображения
Круги по воде от теоремы Брауэра расходятся весьма далеко, и,
так или иначе, многие результаты являются её следствиями. Вот
своеобразная изюминка.
12.7.1 Теорема Карамардиана. Пусть непрерывный
оператор f(x) = {/ι(ж),... ,/п(ж)} определен при всех χ ^ О и
является Р-отобраэюением, т. е. для любого ненулевого вектора
χ ^ 0 можно указать такой индекс j, что
Xj'fj(x)>0·
Тогда неравенство f(x) > О положительно разрешимо11.
Иными словами, уравнение у = f(x) при некотором у > О
имеет решение χ ^ 0. Вкус и аромат скучному на вид
утверждению придаёт следующая содержательная интерпретация.
Назовем переменные х% действиями, yi — результатами.
Например, Xi количество г-го лекарства, у ι г-й показатель
16Здесь suppp обозначает носитель функции р(х), т. е. множество тех х,
для которых р(х) > 0.
17Под f(x) > 0 подразумевается fi(x) > 0 для всех г = 1,..., п.
12.8. Алгебраическое число нулей
247
здоровья (температура, давление). Одинаковые номера за
действиями закрепляют «свои» результаты. Понятно, что при
наличии побочных влияний совместные стереотипные действия могут
приводить к отрицательным последствиям, в результате чего
излечение больного может оказаться невозможным.
Однако пусть связи гц = /»(ж) определяются Ρ-отображением,
т. е. любая совокупность положительных действий не может дать
отрицательные результаты по всем номерам, для которых Xi > 0.
Хотя бы один результат будет ожидаемым. Тогда теорема 12.7.1
гарантирует возможность так подобрать действия (лекарства) Xi >
0, что все результаты будут строго положительными (все
показатели улучшатся, несмотря на побочные влияния)18.
Ч Доказательство теоремы 12.7.1. Применим лемму 12.6.2, которая,
заметим, остается справедливой при замене предположения о компактности
образов А(х) требованием их открытости и ограниченности. В качестве X
возьмём η вершин симплекса Δ = {χ : \\х\\ = 1, χ ^ 0}:
Ж;={0,...,0,1,0,...,0},
и положим
А(хг) = {х : fi(x) > 0, ж € Δ}.
Из определения Р-отображения следует, что выпуклая оболочка
любого подмножества вершин симплекса Δ покрывается соответствующим
объединением \JA(xi), что позволяет (лемма 12.6.2) гарантировать непустоту
пересечения всех A(xi). ►
12.8 Алгебраическое число нулей
Нуль xq Ε Ω векторного поля f(x) называют изолированным,
если в достаточно малой окрестности xq нет других нулей.
Вращение поля / на сферах достаточно малого радиуса с центром
в xq называют индексом xq и обозначают ind(/,a?o)·
Корректность такого определения вытекает из одинаковости
вращений / на сферах достаточно малого радиуса.
Действительно, если шары В\ и #2 не содержат других нулей, кроме xq,
и В\ с #2, то из теоремы 12.4.6 следует
7(/,Bl) = 7(/,В2).
18 Об универсальных Ρ-отображениях см. Опойцев В. И. Нелинейная си-
стемостатика. М.: Наука, 1986.
248
Глава 12. Неподвижные точки
12.8.1 Теорема об алгебраическом числе нулей. Пусть
векторное поле f(x) невырождено наС1 и имеет в Ω лишь
изолированные нули Xj. Тогда
7(/,Л) = ^5ш1(/,^), (12-Ю)
з
где суммирование идет по всем нулям xj Ε Ω поля f.
< Доказательство сразу вытекает из п. 12.4.6, если области Qj
определить как шары достаточно малых радиусов с центрами в точках Xj. ►
Теорема 12.8.1 имеет разнообразные применения.
Гарантирует, например, существование неизвестного нуля, если сумма
индексов известных нулей отлична от 7(/,Ω). В различных
вариантах позволяет также устанавливать единственность
решения. Скажем, пусть ry(f,U) = l,n производная (матрица Якоби)
/'(ж) невырождена на Ω. Этого, оказывается, достаточно для
существования и единственности решения у f(x) = 0 на Ω.
< Действительно, если Хо — нуль поля /, то f(x) и /'(жо)(ж — хо)
непротивоположно направлены в достаточно малой окрестности Хо, ибо
f(x) = f'(x0)(x - хо) + о(\\х - х0\\).
В силу невырожденности f'(x) детерминант det/7(ic) сохраняет знак,
поэтому индексы всех нулей обязаны быть одинаковы,
ind(/,2C0) = signdet/7(iCo) = 1.
А это, благодаря условию j(f, Ω) = 1, допускает не более одного нуля. ►
12.9 Индексы на бесконечности
Если поле / невырождено при больших по норме ж G Rn, то
говорят, что особая точка оо поля / изолирована. При этом
теорема 12.4.1 и лемма 12.4.4 гарантируют, что вращение f(x) на
сферах достаточно большого радиуса одно и то же. Это общее
вращение называют индексом на бесконечности и обозначают
ind(/,oo).
12.10. Накрытия и гомеоморфизмы
249
Если поле /(ж) имеет лишь изолированные нули Xj и определен индекс
f на бесконечности (т. е. /(ж) невырождено при достаточно больших по
норме χ € Кп), то число нулей Xj конечно, и в силу п. 12.4.6 имеет место
равенство
Σ ind (/, Xj) = ind (/, oo).
3
Допустим, для некоторой матрицы /'(oo)
iim ΙΙ/(*)-/'(°°ΗΙ=0. (12Л1)
Н*11-оо \\х\\
В этом случае поле / называют асимптотически линейным, а матрицу
/'(оо) — производной на бесконечности оператора /.
12.9.1 Пусть поле f асимптотически линейно и det/'(oo) φ 0. Тогда
особая точка оо поля f изолирована и
ind(/, oo) = signdet/'(oo).
< Доказательство совсем просто. По условию ||/(ж) —/7(оо)ж|| = о(||ж||).
Но так как матрица /'(оо) невырожденна, это влечёт за собой
справедливость неравенств
||/(χ)-/'(οο)χ|Κ||/'Μ*||
на сферах достаточно больших радиусов, что гарантирует
непротивоположную направленность полей f(x) и f'{oo)x. ►
12.10 Накрытия и гомеоморфизмы
Как уже отмечалось в разделе 6.8, для глобальной обратимости
отображения F к его локальной обратимости достаточно добавить условие
lim |№)||=oo. (12.12)
Nl—oo
Странно, что этот результат остаётся за пределами общего
математического образования. Странно по нескольким причинам. С одной
стороны, сей факт важен и полезен, ибо освещает немало прикладных
задач. При этом достаточно прост, существенное обобщение
достигается малой кровью. Наконец, результат несёт на себе немалый
педагогический потенциал, закладывая ценные стереотипы мышления.
12.10.1 Теорема. Для глобальной обратимости непрерывного
отображения F, действующего в Rn, необходимо и достаточно
выполнение двух условий: (12.12) и локальной обратимости F
в любой точке W1.
250
Глава 12. Неподвижные точки
< Необходимость очевидна. Достаточность:
Во-первых, в силу локальной обратимости F функция
ind[F(x) - F(u), u]
локально постоянна в достаточно малой окрестности любой точки и £ Rn.
Переход из и в любую другую точку ν можно представить в виде
последовательности сколь угодно малых шагов вдоль отрезка
Ам+(1-А)«, λ€ [0,1].
Поэтому функция ind[F(ic) — F(u), и] постоянна в Rn.
Далее. В силу (12.12) деформация
if (ж, г) = F(x) - rF(0) - (1 - т)у
невырождена на сферах S достаточно большого радиуса, при любом у 6 S.
Поэтому вращения полей F(x) — F(0) и F(x) — у на. S равны при любом
у £ S. А так как все индексы одинаковы, то по теореме 12.8.1 об
алгебраическом числе нулей число решений уравнения F{x) = у как функция у
есть константа, отличная от нуля.
Допустим, что F(x) = у имеет т > 1 решений. Пусть, например, у = О
соответствует решению Χι, — , хт · При движении по любому лучу vt (v 6
Mn, t G (0, oo)) из каждой точки Χι выходит непрерывная кривая Xi(t) —
такая, что F(xi(t)) = vt. В силу локальной обратимости F кривые Xi(t) не
могут пересекаться.
Отнесем теперь к множеству d все точки кривых x%(t),
соответствующие всевозможным ν и t. В силу той же локальной обратимости F
множества d открыты и не пересекаются. Но (JCi = Шп. Это противоречит
связности Rn. ►
В более общей ситуации речь идет о существовании функции χ = G(y),
неявно задаваемой уравнением
Ф(ж,2/) =0.
Здесь сохраняется полная аналогия с предыдущим случаем.
12.10.2 Теорема19. Для глобальной разрешимости Ф(х,у) = О
относительно χ необходимо и достаточно выполнение двух условий:
• Уравнение Φ (ж, у) =0 локально разрешимо.
• ||ав*||->оо => ||2/fc||->oo, если Ф(хк,Ук)=0.>
Поскольку никогда не знаешь, что где и когда выстрелит, вот несколько
опорных вех. Для тех, кто изволит добровольно бросить взгляд.
О Пусть f : X —> Υ, где Χ, Υ линейно связны, причём любая
замкнутая кривая в Υ моснсет быть стянута в точку. Тогда чтобы f было
гомеоморфизмом X на Υ необходимо и достаточно выполнение двух
условий:
^Доказательство более общего утверждения есть в [2, т. 13].
12.11. Параметрические уравнения
251
(a) / является локальным гомеоморфизмом;
(b) прообраз любого компакта из Υ компактен в X. >
О Пусть ind (/, оо) φ 0, и выполняется (12.12). Тогда уравнение f(x) =
= у разрешимо при любом у £ Rn. <4 В силу (12.12) на сферах достаточно
большого радиуса поля f(x) и f(x) — у непротивоположно направлены. ►
О Пусть f(x) — локальный гомеоморфизм и образ f(Rn) замкнут в
Еп. Тогда f накрывает Rn. >
О Пусть локальный гомеоморфизм G : intR+ —> intR+ удовлетворяет
20
условию
\\LG(х)\\-> оо при \\L(x)\\ ->oo.
Тогда G — гомеоморфизм intRJ на intR+. >
12.11 Параметрические уравнения
На практике нередко встречаются уравнения
С(ж,А) = 0 (12.13)
со скалярным параметром λ. Здесь теория вращения работает в
сочетании с дополнительными ухищрениями.
12.11.1 Пусть
7[G(«,Ai),n]^7[G(ai,A2),n].
Тогда при некотором λ Ε (λι,λ2) на ft существует решение
уравнения (12.13).
< В противном случае поля G(a;,Ai) и С(ж,А2) соединял бы
невырожденный гомотопический мост
if (ж, t) = G[x, t\i + (1 - ί)λ2]. ►
Ещё одна популярная идея — функционализация параметра.
В (12.13) вместо λ подставляют некоторый функционал А(ж), в
результате чего G(x, λ) = 0 переходит в
G(x,X(x)) = F(x)=0,
20Где L(x) = {1ηχι,...,1ηχη}.
252
Глава 12. Неподвижные точки
и если вращение j(F, Ω) оказывается ненулевым, то (12.13)
имеет решение ж* е Ω при λ* = А(ж*).
От идеи до исполнения путь, конечно, неблизок. По щучьему веленью не
получается, потому что выбор функционала А (ж) — самостоятельная
проблема. Но она все же менее сложна и более конкретна чем расплывчатая
задача (12.13), не привязанная ни к какому конструктивному замыслу.
Когда уравнение с параметром имеет специальный вид
/(ж) = Аж,
его решения, по аналогии с линейным случаем, называют
собственными векторами оператора /.
12.11.2 Лемма. В нечётномерном пространстве в случае 0 £ Ω
невырожденный на Ω оператор f всегда имеет на Ω собственный
вектор, т. е. f(x) = Хх при некоторых А φ О и χ £ Ω.
< Если 7(/>Ω) φ 1, то поле / не гомотопно тождественному и,
следовательно, при некоторых ж £ Ω и t £ (0,1)
tf(x) + (1 - t)x = 0, т. е. /(ж) = —~— χ.
Если же 7(/, Ω) = 1, то поле / не гомотопно полю —/(ж), и тогда при
некоторых ж £ Ω и t £ (0,1)
tf(x) - (1 - t)x = 0, т. е. /(ж) = ^у^ж. ►
12.11.3 В нечётномерном пространстве
сферу невозможно причесать (без макушки),
т. е. задать на сфере невырожденное
касательное поле.
< Это сразу становится ясным, если центр сферы расположить в нуле
и применить результат 12.11.2 к касательному полю /(ж). ►
Глава 13
Проблемы обучения1
Час, затраченный на понимание,
экономит год жизни.
Учить математику на 90% надо так же, как
остальное. Ибо успех обеспечивают общие
принципы, а 10% приходится на математическую
специфику. Но «принципы» системой образования
игнорируются. Школа учит английскому 10-15
лет — результаты катастрофические. Тогда как
Миша Цацкин женился на китаянке, прожил год
в большой китайской семье, и теперь болтает на
китайском как на родном.
С математикой — такая же история. Основная
беда в том, что знание в препарированном виде
пытаются протолкнуть через бутылочное горлышко
подсознания. Не пролезает. Нутро человека
заточено под естественные способы обучения. А система
придерживается искусственного оплодотворения.
О проблемах обучения см. oschool.ru
ifi
254
Глава 13. Проблемы обучения
13.1 Кто мы есть и как мы учимся
Любая аудитория делится на три категории: А, В и С. Первые
схватывают на лету, вторые переосмысливают2, третьи ничего
не понимают, как ни объясняй.
Сразу важно оговориться, все группы одинаково ценны
для мировой цивилизации. Не по причине лицемерной пози- ^J
ции, а по сути. Потому что в условиях, скажем, землетрясе- I
ния или рисования — они проявляются иначе. Не говоря о К
том, что гениальные решения чаще рождаются в недрах С.
Конечно, мы баланс немного нарушаем в пользу С, но это
для компенсации их невыгодной роли в школьные годы. Плюс к
тому, выразив восхищение, спокойно можно писать, что они —
не понимают. Теперь в этом нет ничего обидного. Из них потом
такие Менделеевы получаются, что группе А остается сожалеть,
что схватывала на лету.
Однако разговор сейчас о другом. Группа С ничего не
понимает, и не поймет — но Система смириться с этим не хочет.
В результате процесс затягивается до тошноты. Остановиться
нельзя, ибо С ещё не поняли, а В и А перестали понимать — ибо
когда скобки в (х — у) (х + у) раскрываются полгода, ум начинает
заходить за разум.
^^ Выход из положения кажется тривиальным. Надо объяс-
\ί пять коротко и просто. Ориентируясь на А и В. Группе С
I хуже не будет. Да и перед А-\- В не надо слишком расшарки-
)| ваться. Тогда процесс вернётся в естественное русло. Норма-
^ лизуются акценты, пропорции, интонация.
Конечно, вроде бы возникает противоречие. Если «коротко
и просто», то чем наполнять занятия? Понятно же, что общее
время обучения сокращать нельзя. Инкубационный процесс, так
сказать. Набивший оскомину пример девятимесячного
вынашивания плода здесь как раз к месту.
2 То есть сначала понимают частично или неправильно. Потом
возвращаются назад и переосмысливают. И далее по кругу.
13.1. Кто мы есть и как мы учимся
255
Но «коротко и просто» легко вписывается в инкубационное
ожидание. Масса времени уходит на переучивание. Быстрое
схватывание на деле не так замечательно, как выглядит. Выясняется,
что быстро — не обязательно правильно. Да ещё выветривается.
Поэтому схватывание на лету не означает завершения процесса.
В группе В положение ещё хуже. Переосмысливание не
обходится без ошибок и цементирует заблуждения. Поэтому объяснять
приходится снова и снова.
Получается в итоге сказка про белого бычка. Группу С
перестали принимать в расчёт, но потребность в объяснениях едва ли
не увеличилась. Однако объяснения теперь нужны совсем
другие. Не для заполнения отведённого времени, а для получения
результата. Внешне всё по-прежнему переливается из пустого в
порожнее, но знание растёт и крепнет иод мягким
корректирующим воздействием.
Если кому-то кажется, что в Школе/ Университете так и есть —
думайте дальше. На словах похоже, но о наличии пропасти легко
судить по результатам «на стороне», которые имеют очень простое
объяснение. Процесс вне Школы вытаскивается из ловушки «одни
делают вид, что учат, другие — что учатся» и ставится на нормальные
рельсы. Объяснения, решение задач, комментарии — все делается с
единственной целью достижения результата. Поэтому объяснения, не
меняя своего имени, меняют суть. Исчезает направленность «в
никуда». Без натуги, вскользь, не преследуя цель сразу достичь
максимального эффекта, не выходя за пределы 5-10 минут, выделяя главное и
оставляя возможность неправильно понять детали, возвращаясь раз
за разом назад, но в другой аранжировке, в лёгкой и даже в
легковесной форме — такие объяснения несколько отличаются от того, что
могло бы одобрить министерство образования. Но они дают результат!
И было бы неплохо поставить на те же рельсы образование целиком.
Теперь посмотрим на А, В, С изнутри, дабы понять,
кто мы есть, или кого мы учим. Представители А, В, С
разбросаны в диапазоне, о широте которого можно судить
по крайним точкам.
• Слева пребывает тот, кого стандартными методами учить
невозможно. В чистом виде — это уникум, гений. Ни одну строчку
Ά
t
256
Глава 13. Проблемы обучения
он не может дочитать до конца, потому что спотыкается на
каждом слове. Слова завораживают и уносят в другой мир. Верблюдов до
сих пор не видел, хотя пять раз бывал' в зоопарке. Но так выходило,
что всё внимание поглощали воробьи на входе. Фокус его интереса
цепляется за любую деталь, и воображение уносит неведомо куда, с
любой стартовой площадки.
• На правом краю устроился совсем другой индивид. Ему не до
подробностей. Взор устремлён за горизонт. Мелкие «почему» его не
интересуют, детали не отвлекают. Тратить энергию и время готов
только по большому счёту.
Второго учить традиционными методами очень легко. Вы
ещё не успели объяснить, как он призывает двигаться дальше.
Вот уравнение, вот решение. Что ещё объяснять?
А как первого из группы С можно учить? Никак3.
Вдумайтесь. Что посоветовать можно? — Тому, кто учит, — смиритесь
и будьте деликатны. — Тому, кто учится, — не расстраивайтесь,
такова жизнь. Живите, как получается.
А ля гер ком алягер, что поделаешь. Проблему усугубляет
русский менталитет. Запад стремится понять КАК, мы всегда
хотим докопаться ПОЧЕМУ. Как бы там ни было, но и системы
образования наши так ориентированы. А учить умению КАК,
между прочим, гораздо проще, чем разумению ПОЧЕМУ.
Бесконечно проще. Потому что у КАК всегда есть исчерпывающий
ответ4, а ПОЧЕМУ уводит в бездонную пропасть. Одно
цепляется за другое, и нет этому конца. Отсюда и томление русской
души, и необыкновенные взлёты на фоне мучительных провалов
русского образования. Тактически иногда целесообразнее
начинать с вопроса КАК. Запад предпочитает этим и заканчивать,
тщательно заделывая брешь в пространство ПОЧЕМУ5. Мы же
расширяем эту брешь и культивируем стремление туда. В
результате часть населения не удаётся вернуть обратно. Зато другая —
вдохновлена и не может успокоиться.
3Разве что индивидуально, подыгрывая и аккомпанируя. Утопия.
4В одном из вариантов: НИКАК, — т. е. нет способа.
5 Известно: кто знает КАК — исполняет, кто знает ПОЧЕМУ —
руководит. Но пусть, думает Запад, «почему-калки» пробивают себе дорогу сами.
Иначе с остальными — такая морока. Как у нас.
13.2. О взаимодействии с подсознанием
257
13.2 О взаимодействии с подсознанием
Проблема взаимодействия сознания с подсознанием в обучении
краеугольная (см. oschool.ru). Слабое звено здесь в том, что осознав что-
либо «математическое» умом, человек останавливает процесс. И Беге-
мотик6, который учится медленнее, остаётся необученным. В других
областях источником у него служат чувства. А тут формулы — без
сопровождения разумом теряют смысл, превращаются в
информационный мусор. Поэтому выход из положения остаётся один: продолжать
процесс обдумывания, воображения, проигрывания в голове.
Затея, конечно, выглядит по-дурацки. Вы уже всё поняли, но
продолжаете переливать из пустого в порожнее. Однако процедуру можно
организовать иначе. Персонифицируйте подсознание и начинайте
обучать его, разыгрывая из себя учителя. Процесс невероятно полезный.
Если бы Бегемотик не существовал, его бы стоило выдумать. Ибо
лучший способ изучить предмет — научить другого. И подсознание —
идеальный слушатель, который всегда под рукой. Разумеется,
исполнять сие желательно с лёгкой иронией, дабы компенсировать иногда
возникающее ощущение идиотизма. Но будьте уверены, что освоив
такой внутренний диалог, вы добьетесь больших успехов не только в
математике, но и в других сферах бытия.
Обучая подсознание, необходимо стремиться к простоте, в
поисках которой приходится сталкиваться с определёнными сложностями.
Потому что сообщества профессионалов образуют анклавы, куда не
хотят пускать посторонних. Недаром Бернард Шоу писал, что всякая
профессия — это заговор против непосвящённых.
Экономисты отгораживаются от толпы заумными теориями. А
хирурги в не столь давние времена принимали в штыки обезболивающие
препараты, считая, что при обезболивании любой дурак сможет делать
операции. Математики тоже не лыком шиты. Ставя барьеры строгости
обоснования результатов, они не только решают благородную задачу
очищения теории от разной шелухи и создания надёжного
фундамента, но и ставят палки в колеса новичкам, которым бы хотелось понять
6Или Крокодильчик, или Змей Горыныч, или Маша/Саша. Подсознание
мы называем Бегемотиком в качестве общего знаменателя.
258
Глава 13. Проблемы обучения
сначала кое-что «на пальцах». Но не тут-то было. Вспоминается
жена,, которая спрашивала мужа, накрыть стол для гостей так, чтобы
ещё пришли, или чтобы больше не приходили? Как математики «стол
накрывают» сами знаете.
О других особенностях воспитания Бегемотика см. oschool.ru.
13.3 Гипнотический вирус, будь он неладен
Анатомия непонимания не так проста. Конечно, если историю России
можно изучать, не зная, что натворили греки до нашей эры, то даже
за арифметику, не владея ремеслом раскрытия скобок, нечего браться.
В математике всё жутко переплетено. И если что упущено — так оно
потом аукается, не переставая.
Ещё хуже другое. Ничего не упущено — а непонимание как та
ложка дёгтя. Всё выучено, усвоено до автоматизма. Но какая-то' заноза
остаётся. И ноет, и болит, и какая-то пелена застилает мозги.
Жизнь превращается в каторгу и сводится к написанию
шпаргалок, которые — очень ненадёжная вещь. «Шаг вправо, шаг влево» —
и вы в ступоре, и вас экзаменатор берёт за фук. Не говоря о том, что
любую новую тему вы всё равно не понимаете, ибо для понимания
нужны инструменты в голове, а не писульки в рукаве. Вызубренное
не лучше шпаргалки. Ибо «шаг вправо, шаг влево» — и вы опять в
ступоре. Потому что знаете КАК, но не знаете ПОЧЕМУ.
А % *£
Разумеется, изучая предмет, надо ходить кругами. Много раз по
одному и тому же месту. Вы представьте, что переехали жить в новый
город, и хотите узнать его. Вам достаточно будет проехаться по
территории? Конечно, нет. Город надо исходить вдоль и поперёк. Пешком
и на трамвае, и днём и ночью, и в дождь и в снег, и в праздник и в
будни. Поговорить с людьми. И порыскать «в поисках», и проклясть
его лабиринты и тупики. Чтобы, как говорится, полюбить на целый
век. И тогда лишь, однажды выходя из дома, вы увидите вдруг
Знакомый город. С математикой такая же песня — и хождение кругами
необходимо. Но без понимания диагноза «лечение» идёт всё-таки не
13.3. Гипнотический вирус, будь он неладен 259
так успешно, как хотелось бы. А одна из главных причин заключена
в действии «гипнотического вируса».
/& 4 tl
Гипноз, как принято считать, основан на проходе в глубины
подсознания обманным или силовым путём7. И чем легче человек поддаётся
гипнозу, тем труднее ему даётся математика, в которой слишком много
механизмов, заклинивающих сознание и действующих по типу
тройной спирали Эриксона8. Спираль Эриксона — это хитрый и вместе с
тем очень простой трюк.
Рассказывается некая история, которая в середине обрывается, и
начинает рассказываться вторая история, которая снова не доводится
до конца, и повествование переключается на третью историю.
Сознание вынуждено держать в памяти все эти половинчатые истории — и у
него оказываются «заняты руки». Охрана снята, дорога к подсознанию
свободна, слушатель в трансе9. В математике нечто подобное
происходит постоянно. В результате многие попадают в состояние транса
задолго до того, как то или иное рассуждение услышано до конца.
Состояние транса — это состояние, β котором мы все в той или иной
степени пребываем. Это не гипнотический сон с каталептической
атрибутикой, а бодрствование с некоторой заторможенностью сознания. Если
заторможенность превышает определённый порог, адекватность
поведения и восприятия нарушается. Это и происходит часто при изучении
математики, что препятствует пониманию происходящего.
Например, доказывая что-то, мы предполагаем противное и ведём
рассуждение к противоречию. Но о «предположении противного» надо
помнить, что мешает рассуждению, загружая часть памяти, которую
хорошо было бы использовать для другой надобности. Аналогично
действует гипнотизёр, отвлекая ресурсы нашего мозга на какую-либо
7Гипнотизёр действует обычно, маскируясь, пугая или отвлекая
сознание, играющее роль щита.
8 Эриксон — знаменитый американский гипнотизёр.
9 И это не сказка, а психологический приём, простой как молоток и
эффективный, как противозаконный «двадцать пятый кадр». Примерно тёк,
кстати, действуют некоторые компьютерные вирусы. Сначала переполняет
память компьютера, а потом с парализованным прибором делают, что хотЯт.
260
Глава 13. Проблемы обучения
постороннюю работу, типа бессмысленного счёта, а сам втюхивает в
подсознание какую-нибудь «пейте кока колу».
Яркий пример: определение непрерывной функции. Напомним.
Функция f(x) непрерывна в точке хо, если по любому ε > 0 можно
указать такое δ, что \f(x) — /(яо)| < ε как только10 \х — хо\ < δ.
Две строчки определения, а не даются. В голову не
помещаются. В ту её часть, которая как раз предназначена для
одновременного слежения за несколькими факторами. Двух-
трёх обычно оказывается чересчур много.
Другой пример. Известная задача, в которой математика на уровне
детского сада. В мешок положили 3 чёрных колпака и 2 белых. Трём
участникам игры завязали глаза, и надели им на головы 3 чёрных
колпака. Повязки с глаз сняли. Как они быстро догадались, какого
цвета колпаки у них на головах?
\ «\
Обозначим игроков А, В, С. Каждый, например А, рассуждает так. Если
на мне белый колпак, то В, видя перед собой белый и чёрный, легко понял
бы, что на нём чёрный. Поскольку в противном случае С мгновенно бы
сообразил, видя перед собой два — белых, что на нём чёрный колпак. Но С
мгновенно не реагирует. Значит, на мне чёрный, — решил бы В. Но он пока
молчит. Значит, на мне чёрный, — решает А.
Рассуждение плохо помещается в голову, и его многие далее не могут
воспроизвести. Не любит наш интеллектуальный процессор удерживать
одновременно несколько деталей. И его надо тренировать.
Это, пожалуй, единственный способ для развития и увеличения
своего ментального пространства, чтобы оно было способно вмещать
длинные цепочки рассуждений. Говоря условно, на языке
компьютерных аналогий, необходимо наращивать свою «оперативную память» и
учиться блокировать мысленные посторонние коловращения,
зацикливающие мозговой процессор. Всё это поддаётся тренировке, но требует
упорства и терпения.
10Сначала с потолка появилось ε, для чего неясно, но о нём надо помнить,
чтобы потом понять конец истории. Затем при аналогичных обстоятельствах
возникло δ. В конце концов обе истории заканчиваются, но отключенное
сознание уже ничего не слышит.
Обозначения
Ч и ► — начало и конец рассуждения, темы, доказательства
> — утверждение приводится без доказательства
< — утверждение легко может быть доказано
(?) — предлагает проверить или доказать утверждение в качестве
упражнения, либо довести рассуждение до «логической точки»
(!) — предлагает обратить внимание
«в томм случае» — «в том и только том случае»
п. — пункт либо раздел
А => Б, или А —> В — из А следует В
χ £ X — χ принадлежит X
X U Υ, Χ Π Υ, Χ\Υ — объединение, пересечение и разность множеств
X CY — X подмножество Y, в том числе имеется в виду возможность
X С У, т. е. между X С У и X С У различия не делается
~ — отношение эквивалентности, определяемое контекстом
0 — пустое множество
Ω — замыкание Ω
Ω = ΘΩ — граница Ω
Ν — множество натуральных чисел {1,2,...}
262
Глава 13. Проблемы обучения
Q — множество рациональных чисел (дробей)
К = (—со, со) — вещественная прямая
Шп — n-мерное евклидово пространство
С — комплексная плоскость
3 — квантор существования
V — квантор общности
5П-1 — единичная сфера в Rn
/ — тождественное отображение, 1(х) = х. В Rn
/ =
1 0 ... О
О 1 ... О
О ... О 1
R+ — неотрицательный ортант
г — мнимая единица, г2 = — 1
ζ = χ + гу — комплексное число (КЧ),
ζ = r(cos φ + г sin φ) — его тригонометрическая запись
χ = {χι,...,in} — вектор, х% — его координаты
ху, χ χ у — соответственно скалярное и векторное произведение
векторов хну; для скалярного произведения используется также эквивалентное
обозначение (ж, у) либо (ж, у)
У ' — производная (скорость изменения по х) функции }{х) в точке
ж, эквивалентное обозначение: f'{x)
для производной по времени вместо x'(t) чаще используется ж, а для
второй производной χ
Ф^ — частная производная функции и по переменной χ
V/(a;) — градиент функции /(ж), т.е. вектор
[д]_ д[_\
\dxi''"'dxnJ'
который направлен по нормали к поверхности постоянного уровня функции
f(x) и численно равен скорости максимального роста f(x) в точке χ
Литература
[1] Босс В. Интуиция и математика. Изд. 5-е, М.: УРСС, 2015.
[2] Босс В. Лекции по математике. Т. 1 — Анализ. Т. 2 —
Дифференциальные уравнения. Т. 3 — Линейная алгебра. Т. 4 —
Вероятность, информация, статистика. Т. 5 —
Функциональный анализ. Т. 6 — Алгоритмы, логика, вычислимость.
От Диофанта до Тьюринга и Гёделя. Т. 7 —
Оптимизация. Т. 8. - Теория групп. Т. 9 - ТФКП. Т. 10 - Перебор
и эффективные алгоритмы. Т. 11 — Уравнения
математической физики. Т. 12 — Контрпримеры и парадоксы. Т. 13 —
Топология. Т. 14 — Теория чисел. Т. 15 — Нелинейные
операторы и неподвижные точки. Т. 16 — Теория множеств: от
Кантора до Коэна М.: Книжный дом «JlH6paKOM»/URSS,
2004-2015.
[3] Гелбаум Б., Олмстед Дж. Контрпримеры в анализе. М.:
Мир, 1967.
[4] Колмогоров А.Н., Фомин СВ. Элементы теории функций
и функционального анализа. М.: УРСС, 2006.
[5] Кочин Η. Ε. Векторное исчисление и начала тензорного
исчисления. М.: Наука, 1965.
[6] Постон Т., Стюарт И. Теория катастроф и ее приложения.
М., 1980.
[7] Федорюк М.В. Обыкновенные дифференциальные
уравнения. М., 2003.
[8] Фихтенгольц Г. М. Курс дифференциального и
интегрального исчисления в 3-х томах. М., 2015.
Предметный указатель
Р-отображение 246
ε-окрестность 25
Абсолютно сходящийся ряд 46
активные ограничения 182
амплитуда 103
аналитическое продолжение 205
ахиллесово направление 241
Базис 130, 153, 214
бесконечный предел 28
бесконечный ряд 44
бесконечно большая величина 28
бесконечно малая величина 28
бином Ньютона 20
Вырожденный случай 177
варианта 45
вектор аксиальный 159
вектор полярный 159
векторы коллинеарные 130, 153
векторы компланарные 130, 153
векторное поле 234
векторное произведение 157
включение 23
включение строгое 23
вращение векторного поля 236
вращение линейного поля 243
гармоническое колебание 221
гессиан 175
гиперплоскость 127, 157
главная диагональ 128
гомеоморфизм 131
гомеоморфизм локальный 131
гомеоморфные пространства
131
гомотопический переход 237
гомотопные отображения 238
градиент 114
график функции 25
Двойственная задача 185
декартово произведение 24
дельта-функция 227, 229
детерминант 132
деформация 237
дивергенция 164
дифференцирование 52
дифференцирование оператора
136
длина дуги 86
дополнение 24
допустимое решение 182
Евклидово пространство 106
Гармоническая функция 195
гармонический ряд 44
Замкнутое множество 25
Предметный указатель
265
Игровая площадка 9
инъекция 130
инвариантность формы
дифференциала 58
индекс на бесконечности 248
индекс нуля 247
интеграл 75
интеграл Фурье 222
интеграл Лебега 216
интеграл Римана 78
интеграл двойной 142
интеграл кратный 146
интеграл неопределённый 75
интеграл несобственный 92
интеграл определённый 77
интегральная формула Коши
200
интегрирование 75
интегрирование по частям 83
инфимум 39
Канторова лестница 71
канторово множество 71
касательная плоскость 115
квадрируемая область 142
коэффициент искажения объёма
132
компактность 42
комплексная плоскость 13
комплексное число 13
контурный интеграл 170
конформное преобразование 194
координаты 151, 153
кривая Пеано 70
криволинейный интеграл 168,
169
критерий Коши 43
критическая точка 175
критическая точка
невырожденная 176
круговая частота 103
Лагранжиан 178
лемма Больцано — Вейер-
штрасса 40
лемма Гейне — Бореля 41
лемма Кнастера - Куратов-
ского - Мазуркевича 245
лемма Вейерштрасса 30, 40
лемма о вложенных отрезках 40
линейный оператор 127
линейная гомотопия 239
линейная независимость 130,153
линейно зависимые векторы 129,
153
логарифмический вычет 208
Мажорирующий ряд 46
матрица 128
матрица Якоби 136
матрица кососимметрическая
129
матрица невырожденная 132
матрица симметрическая 129
матрица транспонированная 129
множитель Лагранжа 178
момент инерции 161
момент количества движения
160
момент силы 160
морсовское /-седло 176
Натуральный ряд 9
неявная функция 139, 250
невырожденная деформация
238
нелинейное программирование
182
неподвижная точка 137, 231
непрерывная функция 35, 109
непротивоположная
направленность 239
неравенство Коши-Буняковского
107
266
Предметный указатель
норма вектора 106, 135, 156
норма евклидова 106
норма кубическая 133
норма матрицы 135
норма октаэдрическая 133
норма подчинённая 135
носитель функции 228
нуль векторного поля 234, 242,
247
О -малое 56
обезьянье седло 176
обобщенная функция 228
образ 130
обратимость отображения 249
обратная функция 138
оператор 126
оператор «набла» 167
оператор Гамильтона 167
оператор Лапласа 168
определитель 132
орт 151
ортогональный базис 214
ортогональность 107
особые точки 207
особая точка изолированная 208
особая точка устранимая 208
открытое множество 25
отображение 126
отображение «в» 130
отображение «на» 130
отображение инъективное 130
отображение обратное 130
отображение сюръективное 130
Пассивные ограничения 182
первообразная 75
перестановки 18
перестановки с повторениями 19
площадь кривой 142
плоскость 107
подпоследовательность 40
полярные координаты 14, 155
полюс k-го порядка 208
полином Бернштейна 69
полиномы Лежандра 216
полный дифференциал 112
порядок малости 56
последовательность Коши 43
правило переброски
производной 229
предел 27
предел функции 32, 107
предельная точка 25
преобразование 126
преобразование Фурье 223
преобразование Лапласа 223
преобразование Лапласа
обращение 226
признак Даламбера 47
признак Коши 47
пример Брауэра 72
принцип аргумента 209
принцип максимума модуля 201
принцип сжимающих
отображений 138
продолжение функции 25
проекция на направление 154
производные высших порядков
66
производная 52, 191
производная Фреше 136
производная на бесконечности
249
производная обратной функции
55
производная сложной функции
54
прообраз 130
Ряд Фурье 218
ряд Лорана 204
ряд Тейлора 67
ряд функциональный 210
равенство Парсеваля 215
Предметный указатель
267
равномерная непрерывность 42,
109
равномерная сходимость
интегралов 124
равномерная сходимость ряда
211
радиус сходимости 213
размещения 18
размерность 130
размерность пространства 153
расходящаяся
последовательность 28
регулярная задача 178
регулярная точка 178
регулярность 181
ротор 171
Свойство Коши 73
сечение Дедекинда 38
сжимающее отображение 137
симметрическая разность 24
система координат
ортогональная 151
система координат
правая/левая 154
скалярное произведение 106,155
скалярное произведение
функций 214
собственный вектор 188
собственное значение 188
сопряжённое число 14
сочетания 18
степень отображения 238
степенной ряд 212
столбцовая норма 135
строчная норма 135
сужение функции 25
сумма Дарбу 78
супремум 39
сходимость 27
сходимость равномерная 121
Теорема Абеля 203
теорема Везу 21
теорема Больцано - Коши 36
теорема Брауэра 244
теорема Дарбу 66, 73
теорема Гаусса —
Остроградского 164
теорема Кантора 42
теорема Каруша - Джона 182
теорема Коши 65
теорема Коши-плюс 66
теорема Лагранжа 65
теорема Римана 50
теорема Руше 209
теорема Стокса 171
теорема Штольца 48
теорема Вейерштрасса 36, 41
теорема Вейерштрасса
(аппроксимационная) 69
теорема Виета 23
теорема о среднем 117
теорема сравнения 46
точки второго рода 71
точки первого рода 71
Уравнение теплопроводности
166, 167
ускорение Кориолиса 163
условия Коши — Римана 191
условия дополняющей нежёсткости
183
условие Дини 220
условный экстремум 177
Финитная функция 228
формула Эйлера 15, 68
формула Грина 171
формула Меллина 226
формула Муавра 15
формула Стирлинга 85
формула Тейлора 67
268
Предметный указатель
фундаментальная
последовательность 43
функция Хэвисайда 229
функция Римана 70
функция аналитическая 193
функция гладкая 174
функция голоморфная 203
функция регулярная 203
функция целая 207
функционализация параметра
251
Характеристическое уравнение
188
Циркуляция 170
Частичная сумма 44, 210
частота 221
частота круговая 221
число е 31
числовая последовательность
26,27
Эквивалентность норм 134
экспонента 62
л
π "ц в
Валерии ванович поицев —
доктор физико-математических наук, профе,
Выделяется умением сложное объяснять просто.
Большой известностью пользуются его «Лекции
по математике» (вышло 16 томов под псевдонимом В. Босс).
Читайте также идущую нарасхват популярную книгу
В. Босс. «Интуиция и математика»
В рамках недавно стартовавшего проекта ШКОЛА
ОПОЙЦЕВА планируется выпуск учебных курсов
для студентов и школьников. Все курсы сопровождаются
видео-лекциями на сайте OSCnOol.ru и на yOUtube.COm
Данная книга — первая ласточка в ансамбле печатных
изданий проекта. Изложение матанализа отличается
краткостью и прозрачностью Акцент делается
на понимании существа дела причем с заботой о новичках
Из отзывов читателе":
«Чтобы усвоить предмет, надо освободить его от деталей,
обнажить центральные конструкции. Эту тяжёлую работу
автор берёт на себя».
«Даётся то, чего недостает. Общая картина, мотивация
взаимосвязи И самое главное—легкость вхождения в любую
тему».
«Содержание продум но и хорошо увязано. Доказательств
ужаты до нескольких с рочек. Виртуозное владение языком ·
117335 Μ ква Телефон/
Нахимов к и (многоканал
проспект 56
+7(499)724
От ι щ м и нии а о
опечатки при'· ла те по адр у URSS U
ши мечания и пре эжения будут
и отраж ны w -< е этой книги
1952· ID 213615
Издательская группа
9 "785971
Mill
032953
Каталог издании
в Интернет
http://URSS.ru
- ι URSS<3)URSS ru